Л.И. Ниворожкина, Т.В. Чернова
Теория статистики (с задачами и примерами по региональной экономике)
Учебное пособие. – Ростов н/Д: «Мини Тайп», «Феникс», 2005. – 220 с.
Предыдущая |
Глава 6. Показатели вариации (рассеяния)
6.2. Меры вариации (рассеяния)
Для измерения вариации применяют несколько способов. В статистике используется ряд мер вариабельности (колеблемости), наиболее простые из которых интерквартильный размах и размах вариации.
Интерквартильный размах – разница между первым и третьим квартилями.
Чем больше величина интерквартильного размаха, тем больше рассеяние признака. Интерквартильный размах в ряду I равен 5,5, интерквартильный размах в ряду II равен 2.
Размах вариации – разность между наибольшим и наименьшим значениями признака. Записывается как: . Размах вариации в первом ряду равен 10, во втором ряду - 4.
Размах вариации и интерквартильный размах – меры разброса признаков в наборе данных. В первом ряду разброс выше, чем во втором. Недостаток этих мер в том, что размах вариации содержит информацию только о расстоянии между наибольшим и наименьшим значениями, а интерквартильный размах содержит информацию только о разности между верхним и нижним квартилями. Интерквартильный размах – более устойчив к значениям крайних вариантов.
Существуют и другие более тонкие и чаще используемые меры вариации, которые, подобно средней, арифметической используют всю информацию, содержащуюся в вариационном ряду.
Среднее линейное отклонение. Можно определить вариацию как меру отклонений значений признаков вариационного ряда (х) от центра ряда распределения – средней арифметической. Например, можно взять сумму отклонений значений каждого признака ряда от средней арифметической:
,
где n – число признаков ряда.
Однако, сумма отклонений всех вариантов от их средней арифметической, согласно свойству средней арифметической, всегда равна нулю.
Для нахождения меры вариации можно каждое отклонение от средней взять по абсолютному значению. Эта операция изменяет отрицательные знаки отклонений на положительные, и мера вариации в этом случае не равна нулю.
- среднее линейное отклонение.
Для взвешенных вариант:
.
Другой способ избежать нулевой суммы при исчислении средней суммы отклонений индивидуальных значений признака от среднего арифметического – возвести в квадрат каждую разность:
- дисперсия.
Для взвешенных вариант дисперсия определяется выражением:
.
Дисперсия вариационного ряда есть средняя арифметическая квадрата отклонения (средний квадрат отклонения) значений признаков ряда от их средней арифметической.
(Поскольку s - греческая буква, то дисперсию часто просто называют сигма-квадрат, а заглавная греческая буква сигма S используется нами как символ, обозначающий суммирование)
Определим теперь стандартное отклонение (среднее квадратическое отклонение). Стандартное отклонение вариационного ряда есть арифметическое значение корня квадратного из дисперсии σ2:
.
Для чего мы используем стандартное отклонение, если уже имеем такую меру вариации признаков как дисперсия? Желательно, чтобы показатель рассеяния выражался в тех же единицах измерения, что и значение признака (дисперсия этим свойством не обладает). Извлекая квадратный корень из дисперсии, мы получаем показатель, имеющий ту же единицу измерения, что и анализируемый признак.
В чем смысл дисперсии и среднего квадратического отклонения? Как мы можем интерпретировать их значения? По определению s2 (средний квадрат отклонений вариантов от средней арифметической) – это мера рассеяния всех значений вариантов относительно средней арифметической. Чем больше вариация, тем дальше от средней находятся возможные значения признаков. Если сравнивают два вариационных ряда, то тот из них, который имеет большую дисперсию и среднее квадратическое отклонение, более вариабелен.
Риск, ассоциируемый с инвестициями, часто измеряют стандартным отклонением возврата инвестиций. Если сравниваются два типа инвестиций с одинаковой ожидаемой средней возврата, то инвестиции с более высоким средним квадратическим отклонением считаются более рискованными (хотя более высокое стандартное отклонение предполагает возврат более вариабельный с обеих сторон – как ниже, так и выше средней).
В научном анализе предпочтительно использование дисперсии, так как она имеет ряд полезных математических свойств, на практике же лучше работать со стандартным отклонением, поскольку эта мера легко интерпретируется.
Предыдущая |