Третья ситуация – сгруппированные данные (интервальный ряд распределения)




4 задача

Данные по региону об уровне потребления картофеля в отчётном году:

NN Уровень потребления, кг/чел/год (x) Число районов (m) Центры (середины) интервалов
  Менее 40    
  40-60    
  60-80    
  80-100    
  100-120    
  Свыше 120    
ИТОГО   ---

При расчёте среднего значения возникает проблема: что использовать в качестве вариантов значений признака X? Существует правило, согласно которому таковыми считаются центры (середины) интервалов, которые рассчитываются как полусумма их границ. Однако в ряду имеются первый и последний интервалы с одной границей. В этом случае вводится условие, что величина таких открытых интервалов равна величине соседнего. Величина интервала – разница между его границами.

Отсюда:

Первый интервал считаем равным второму, соседнему, имеющему величину 20 (60 - 40). Значит, первый интервал обретает вторую границу, и получаем следующие значения: 20-40. Центр будет равен (20+40)/2=30.

Второй интервал: (40+60)/2=50.

Третий интервал: (60+80)/2=70.

Четвёртый интервал: (80+100)/2=90.

Пятый интервал: (100+120)/2=110.

Шестой интервал приравниваем по величине к пятому, то есть соседнему (величина 20 = 120-100), и имеем: 120-140, отсюда центр: (120+140)/2=130.

Средний уровень потребления по области:

= = = 84,4 кг/чел/год.

NN Уровень потребления, кг/чел (X) Число районов (m) Накопленные частоты (S)
  Менее 40    
  40-60    
  60-80    
  80-100    
  100-120    
  Свыше 120    
ИТОГО   ---

Расчёт моды и медианы в интервальном ряду распределения имеет особенности, связанные с применением специальных формул. Эти формулы справедливы для рядов с равными интервалами.

Mo = X0 + h* , где:

- нижняя граница модального интервала;

- величина модального интервала;

- частоты (соответственно) предмодального, модального и потсмодального интервалов.

Модальный интервал – это интервал с наибольшей частотой. В данном случае это будет интервал 80-100 с частотой m=7.

Mo = 80 + 20* = 86,7 кг/чел.

Вывод: наиболее часто встречаются районы с уровнем потребления картофеля 86,7 кг/чел.

Me = X0 + h* , где:

- нижняя граница медианного интервала;

- величина медианного интервала;

- накопленная частота предмедианного интервала;

- частота медианного интервала.

Медианный интервал – это интервал, в котором находится середина ранжированного ряда (в данной задаче ряд ранжирован). В данном случае это будет 13-й район (25/2=12,5) по ранжиру. По ряду накопленных частот S найдём интервал, в котором накопленная частота впервые превышает число 13. Это интервал N 4, то есть 80-100.

Me = 80 + 20* = 84,3 кг/чел.

Вывод: половине районов уровень потребления картофеля менее 84,3 кг/чел, в другой половине – более 84,3.

 

Показатели вариации

 

Логичным продолжением анализа рядов распределения является расчёт показателей вариации. Вариация (колеблемость), как уже было отмечено, является важным и характерным свойством массовых явлений. Она представляет собой различие значений признака у отдельных единиц совокупности в один и тот же момент времени. Большинство показателей вариации характеризуют разброс отдельных значений признака вокруг средней величины .

Вернёмся к ранее рассмотренной задаче N 3.

Данные о сумме начисленных штрафов за административные правонарушения в районе:

Штраф, руб. (X)           ИТОГО
Число правонарушителей, чел. (m)            

 

Средний размер штрафа был рассчитан по формуле средней арифметической взвешенной, так как данные сгруппированы в виде ряда распределения:

= = = 122,9 руб.

Рассчитаем основные показатели вариации.

1) Размах (амплитуда) вариации представляет собой разницу наибольшего и наименьшего значений изучаемого признака:

R = = 250 – 50 = 200 руб.

Этот показатель прост в расчётах, но малоинформативен.

2) Дисперсия – средний квадрат отклонений индивидуальных значений признака от средней арифметической. Рассчитывается, как и средняя арифметическая, по двум формулам. Если данные несгруппированы (см. случай 1), то используется простая формула:

σ2 = .

Если данные сгруппированы в виде рядов распределения (см. случаи 2 и 3), то используется взвешенная формула:

σ2 = =

= 2477,6.

3) Среднее квадратическое отклонение:

σ = = = 49,8 руб.

Вывод: штраф каждого правонарушителя отличается от среднего штрафа в среднем на 49,8 руб.

4) Коэффициент вариации – критерий однородности совокупности. Если его значение менее 33 %, совокупность считается однородной, то есть без резких отклонений от среднего значения, а если более 33 % - то неоднородной (с резкими отклонениями).

V = * 100 % = * 100 % = 40,5 %, то есть неоднородная совокупность.

 


[1] m называется частотой.



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2017-12-29 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: