4 задача
Данные по региону об уровне потребления картофеля в отчётном году:
NN | Уровень потребления, кг/чел/год (x) | Число районов (m) | Центры (середины) интервалов |
Менее 40 | |||
40-60 | |||
60-80 | |||
80-100 | |||
100-120 | |||
Свыше 120 | |||
ИТОГО | --- |
При расчёте среднего значения возникает проблема: что использовать в качестве вариантов значений признака X? Существует правило, согласно которому таковыми считаются центры (середины) интервалов, которые рассчитываются как полусумма их границ. Однако в ряду имеются первый и последний интервалы с одной границей. В этом случае вводится условие, что величина таких открытых интервалов равна величине соседнего. Величина интервала – разница между его границами.
Отсюда:
Первый интервал считаем равным второму, соседнему, имеющему величину 20 (60 - 40). Значит, первый интервал обретает вторую границу, и получаем следующие значения: 20-40. Центр будет равен (20+40)/2=30.
Второй интервал: (40+60)/2=50.
Третий интервал: (60+80)/2=70.
Четвёртый интервал: (80+100)/2=90.
Пятый интервал: (100+120)/2=110.
Шестой интервал приравниваем по величине к пятому, то есть соседнему (величина 20 = 120-100), и имеем: 120-140, отсюда центр: (120+140)/2=130.
Средний уровень потребления по области:
= = = 84,4 кг/чел/год.
NN | Уровень потребления, кг/чел (X) | Число районов (m) | Накопленные частоты (S) |
Менее 40 | |||
40-60 | |||
60-80 | |||
80-100 | |||
100-120 | |||
Свыше 120 | |||
ИТОГО | --- |
Расчёт моды и медианы в интервальном ряду распределения имеет особенности, связанные с применением специальных формул. Эти формулы справедливы для рядов с равными интервалами.
Mo = X0 + h* , где:
- нижняя граница модального интервала;
- величина модального интервала;
- частоты (соответственно) предмодального, модального и потсмодального интервалов.
Модальный интервал – это интервал с наибольшей частотой. В данном случае это будет интервал 80-100 с частотой m=7.
Mo = 80 + 20* = 86,7 кг/чел.
Вывод: наиболее часто встречаются районы с уровнем потребления картофеля 86,7 кг/чел.
Me = X0 + h* , где:
- нижняя граница медианного интервала;
- величина медианного интервала;
- накопленная частота предмедианного интервала;
- частота медианного интервала.
Медианный интервал – это интервал, в котором находится середина ранжированного ряда (в данной задаче ряд ранжирован). В данном случае это будет 13-й район (25/2=12,5) по ранжиру. По ряду накопленных частот S найдём интервал, в котором накопленная частота впервые превышает число 13. Это интервал N 4, то есть 80-100.
Me = 80 + 20* = 84,3 кг/чел.
Вывод: половине районов уровень потребления картофеля менее 84,3 кг/чел, в другой половине – более 84,3.
Показатели вариации
Логичным продолжением анализа рядов распределения является расчёт показателей вариации. Вариация (колеблемость), как уже было отмечено, является важным и характерным свойством массовых явлений. Она представляет собой различие значений признака у отдельных единиц совокупности в один и тот же момент времени. Большинство показателей вариации характеризуют разброс отдельных значений признака вокруг средней величины .
Вернёмся к ранее рассмотренной задаче N 3.
Данные о сумме начисленных штрафов за административные правонарушения в районе:
Штраф, руб. (X) | ИТОГО | |||||
Число правонарушителей, чел. (m) |
Средний размер штрафа был рассчитан по формуле средней арифметической взвешенной, так как данные сгруппированы в виде ряда распределения:
= = = 122,9 руб.
Рассчитаем основные показатели вариации.
1) Размах (амплитуда) вариации представляет собой разницу наибольшего и наименьшего значений изучаемого признака:
R = = 250 – 50 = 200 руб.
Этот показатель прост в расчётах, но малоинформативен.
2) Дисперсия – средний квадрат отклонений индивидуальных значений признака от средней арифметической. Рассчитывается, как и средняя арифметическая, по двум формулам. Если данные несгруппированы (см. случай 1), то используется простая формула:
σ2 = .
Если данные сгруппированы в виде рядов распределения (см. случаи 2 и 3), то используется взвешенная формула:
σ2 = =
= 2477,6.
3) Среднее квадратическое отклонение:
σ = = = 49,8 руб.
Вывод: штраф каждого правонарушителя отличается от среднего штрафа в среднем на 49,8 руб.
4) Коэффициент вариации – критерий однородности совокупности. Если его значение менее 33 %, совокупность считается однородной, то есть без резких отклонений от среднего значения, а если более 33 % - то неоднородной (с резкими отклонениями).
V = * 100 % = * 100 % = 40,5 %, то есть неоднородная совокупность.
[1] m называется частотой.