Составной частью сводной обработки данных статистического наблюдения является построение рядов распределения. Цель его – выявление основных свойств и закономерностей исследуемой статистической совокупности. Ряды распределения, построенные по количественному признаку, называются вариационными.
Вариацией признака называется его изменение у единиц совокупности.
Рассмотрим данные о страховом рынке, представленные в таблице 1.
Таблица 1.
I. Состоит в Едином Государственном реестре страховщиков и объединений страховщиков: |
|
1. По организационно-правовой форме: |
|
закрытые акционерные общества |
607 |
открытые акционерные общества |
382 |
товарищества с ограниченной ответственностью |
63 |
общества с ограниченной ответственностью |
450 |
иные формы |
31 |
2. По уставному капиталу: |
|
менее 50 тыс. руб. |
122 |
от 50 тыс. руб. до 100 тыс. руб. |
60 |
от 100 тыс. руб. до 600 тыс. руб. |
271 |
от 600 тыс. руб. до 2086 тыс. руб. |
116 |
ИТОГО |
569 |
Рассчитаем показатели вариации по данным о распределении страховых компаний по организационно-правовой форме такие, как: размах вариации, среднее линейное отклонение, среднее квадратическое отклонение, дисперсия, коэффициент вариации.
Таблица 2.
страховые компании по организационно- правовой форме |
число страховых компаний |
|
|
|
закрытые акционерные общества |
607 |
300,4 |
300,4 |
90240,16 |
открытые акционерные общества |
382 |
75,4 |
75,4 |
5685,16 |
товарищества с ограниченной ответственностью |
63 |
-243,6 |
243,6 |
59340,96 |
общества с ограниченной ответственностью |
450 |
143,4 |
143,4 |
20563,56 |
иные формы |
31 |
-275,6 |
275,6 |
75955,36 |
ИТОГО |
1533 |
0 |
1038,4 |
251785,20 |
Наиболее простым показателем вариации является размах вариации:
R = xmax – xmin – разность между наибольшим и наименьшим значением признака. В нашем примере R = 607 – 31 = 576
Для того, чтобы рассчитать следующие показатели, необходимо найти среднюю. В нашем случае это будет средняя арифметическая простая (взвешенная), равная сумме отдельных значений признака, деленной на число этих значений:
x = x1 + x2 + x3…… + xn / n = åx/n
x = 306,6
Среднее линейное отклонение d = å| x – x | / ån рассчитывается поэтапно. Сначала рассчитывается средняя арифметическая; затем определяются отклонения каждой варианты от средней: x – x ; рассчитывается сумма абсолютных отклонений: å|x – x|; сумма абсолютных отклонений делится на число значений.
В нашем примере d = 1038,4/5 = 207,68
Дисперсия ?² = å(x – x)²/n также рассчитывается поэтапно: после расчета отклонения вариант от средней они возводятся в квадрат: (x – x)²; затем суммируются квадраты отклонений: å(x – x)²; полученная сумма делится на число вариант: å(x – x)²/n.
В нашем случае ?² = 43157,04
Среднее квадратическое отклонение ? = ?²
? = 207,74
Коэффициент вариации V = ?/x * 100%
V = 207,74/306,6 *100% = 67,8%
Среднее линейное и среднее квадратическое отклонения показывают на сколько в среднем колеблется величина признака у единиц совокупности. В нашем случае средняя величина колеблемости страховых компаний по среднему линейному отклонению 207,68 единиц, а по среднему квадратическому отклонению 207,74. Как мы видим, величина среднего линейного, среднего квадратического отклонений, а также дисперсии достаточно велики.
Наиболее частый показатель относительной колеблемости – коэффициент вариации. Его используют не только для сравнения оценки вариации, но и для характеристики однородной совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33%. Поэтому мы можем сказать, что по организационно-правовой форме совокупность страховых компаний неоднородна, также колеблемость достаточно высока – 67,8%.
Для сравнения рассчитаем показатели вариации по данным о распределении страховых компаний по размеру уставного капитала.
Таблица 3.
Размер уставного капитала, тыс. руб. |
число страховых компаний, f |
серединный интервал, x |
xf |
|
|
|
|
менее 50 |
122 |
25 |
3050 |
-426,12 |
51986,64 |
181578,25 |
22152546 |
от 50 до 100 |
60 |
50 |
3000 |
-401,12 |
24067,20 |
160897,25 |
9653835 |
от 100 до 600 |
271 |
350 |
94850 |
-101,12 |
27403,52 |
10225,25 |
2771042,70 |
от 600 до 2086 |
116 |
1343 |
155788 |
891,88 |
103458,08 |
795449,93 |
92272191 |
ИТОГО |
569 |
256688 |
206915,44 |
106912324,7 |
В отличие от предыдущего ряда, где данные индивидуальны, этот ряд распределения является дискретным, так как одни и те же значения повторяются несколько раз. Число одинаковых значений признака в рядах распределения называется частотой или весом и обозначается f.
Рассчитаем вышеперечисленные показатели.
В данном случае, вместо средней арифметической простой нужно использовать среднюю арифметическую взвешенную, которая вычисляется по формуле: x = åxf / åf.
В нашем примере x = 256688/569 = 451,12
Среднее линейное отклонение d = å| x – x |f / åf
d = 206915,44/569 = 363,65 (тыс.руб.)
Дисперсия ?² = å(x – x)²f/åf
? = 187895,12
Среднее квадратическое отклонение ? = ?²
? = 433,47
Коэффициент вариации V = ?/x * 100%
V = 433,47/451,12 *100% = 96%
В этом случае средняя величина колеблемости размера уставного капитала страховых компаний по среднему линейному отклонению 363,65 тыс. руб., а по среднему квадратическому отклонению 433,47 тыс. руб. Величина среднего линейного, среднего квадратического отклонений и дисперсии также велики.
Коэффициент вариации в данном случае равен 96%, то есть приблизительно в 1,5 раза больше, чем в предыдущем ряду. Коэффициент очень близок к 100%, тем самым, показывая очень высокую колеблемость. Поскольку величина коэффициента велика, можно сказать о том, что достаточно велик разброс значений признаков вокруг средней (как и видно на практике) и совокупность практически не однородна по своему составу.