Особый вид средних величин – структурные средние – применяется для изучения внутреннего строения рядов распределения значений признака, а также для оценки средней величины (степенного типа), если по имеющимся статистическим данным её расчет не может быть выполнен.
Структурные средние, в отличие от степенных средних, которые в значительной степени являются абстрактной характеристикой совокупности, выступают как конкретные величины, совпадающие с вполне определёнными вариантами совокупности. Это делает их незаменимыми при решении ряда практических задач.
Наиболее широко применяются в статистике такие разновидности структурных средних, как мода и медиана.
1). Мода (Мо) представляет собой значение признака (варианты), повторяющееся в изучаемой совокупности с наибольшей частотой.
В дискретном ряду мода – это варианта с наибольшей частотой.
В интервальном ряду модой считают центральную варианту модального интервала. В пределах интервала надо определить то значение признака, который обладает наибольшей частотой. Для определения моды используют следующую формулу:
, где:
- нижняя граница модального интервала;
- величина модального интервала;
- частота модального интервала;
- частота, следующая за модальным интервалом;
- частота, предшествующая модальному интервалу.
Мода обладает определённой устойчивостью к вариации признака. Если в совокупности первичных признаков нет повторяющихся значений, то для определения моды проводят группировку.
Модальные показатели широко используются в экономическом анализе. Например, при изучении рыночной конъюнктуры обычно рассчитывается модальная цена, т. е. цена, по которой продаётся максимальное количество товаров того или иного вида.
|
2). Медианой (Ме) называют значение признака, приходящееся на середину упорядоченной (ранжированной в возрастающем или убывающем порядке) совокупности. Медиана делит ряд на две одинаковые части таким образом, чтобы по обе её стороны находилось одинаковое число единиц совокупности. В итоге у одной половины единиц совокупности значение признака больше медианного уровня, а у другой – меньше его.
В ранжированных рядах несгруппированных данных нахождение медианы сводится к отысканию порядкового номера и значения варианты у этого номера.
В дискретном ряду с нечётным числом членов медианой является варианта, расположенная в центре ряда. Её порядковый номер определяется по формуле:
.
В дискретном ряду с чётным числом членов медианой будет являться среднее значение между двумя вариантами, определёнными по формуле:
.
Нахождение медианы в интервальных вариационных рядах требует предварительного определения интервала в котором находится медиана, т. е. медианного интервала – этот интервал характеризуется тем, что его накопленная частота равна или превышает половину общей суммы всех частот совокупности.
В зависимости от этого медиану определяют по формуле:
где - нижняя граница (начальное значение) медианного интервала;
- величина медианного интервала;
- сумма частот ряда;
- сумма накопленных частот до частоты медианного интервала;
- частота медианного интервала.
Также в интервальных вариационных рядах медиана может быть найдена с помощью кумуляты как значение признака, для которого
|
или .
Главное свойство медианы заключается в том, что сумма абсолютных отклонений значений признака от медианы всегда меньше, чем сумма отклонений вариант от любой другой величины: .
В симметричных рядах имеет место следующее соотношение моды, медианы и средней арифметической: .
В случае, если , имеет место левосторонняя асимметрия ряда.
В случае, если , имеет место правосторонняя асимметрия ряда.
1 2 3
1 – распределение с левосторонней асимметрией
2 – распределение с правосторонней асимметрией
3 – нормальное (симметричное) распределение
Мода и медиана,в отличие от степенных средних, являются конкретными характеристиками совокупности. Медиана – характеризует центр, вычисляется проще и не чувствительна к концам интервала. Мода – наиболее вероятное значение в изучаемой совокупности (например, наиболее возможные результаты).
Графически отобразить моду по гистограмме можно следующим образом: нужно взять столбец, имеющий наибольшую высоту и из его левого верхнего угла провести отрезок в угол последующего столбца, а из правого угла – в верхний правый угол предыдущего столбца, абсцисса точки пересечения отрезков и будет соответствовать модальному значению признака в изучаемой совокупности. Медиану приближенно можно определить графически – по кумуляте. Для этого высоту наибольшей ординаты, которая соответствует общей численности совокупности, делят пополам. Через полученную точку проводят прямую, параллельную оси абсцисс, до пересечения ее с кумулятой. Абсцисса точки пересечения и есть медиана (рисунок 1).
|
Рис. 1. Графическое отображение интервального вариационного ряда
3). Квартили – значения признака, делящие ранжированную совокупность на четыре равные части.
Различают нижний квартиль отделяющий ¼ часть совокупности с наименьшими значениями признака, и верхний квартиль , отсекающий ¼ часть с наибольшими значениями признака. Средний квартиль совпадает с медианой.
Квартили рассчитываются аналогично медиане, только сумма часто берётся с другими коэффициентами – или .
- нижняя граница интервала, содержащего нижний (верхний) квартиль;
h - величина интервала;
- накопленная частота интервала, предшествующего интервалу, содержащему нижний (верхний) квартиль;
- частота интервала, содержащего нижний (верхний) квартиль.
4). Квинтили – значения признака, делящие ряд на пять равных частей.
5). Децили – варианты, делящие ранжированный ряд на десять равных частей.
6). Перцентили – значения признака, делящие ряд на 100 равных частей.
Схема вычисления приведённых показателей аналогична схеме расчёта квартилей.
Пример 3.1.
Определить медиану, если:
Стаж рабочих, лет | Численность рабочих, чел. | Накопленные частоты |
0-5 | ||
5-10 | ||
10-15 | ||
15-20 | ||
20 и более | ||
Всего: |
Вывод: из 1000 рабочих 500 чел. имеет стаж работы меньше 8,57 лет.
Пример 3.2.
Имеются данные о распределении работников предприятия по уровню среднемесячной заработной платы:
№ группы | Заработная плата, ден. ед. | Число работников, чел. | Сумма накопленных частот |
500-600 600-700 700-800 800-900 900-1000 свыше 1000 | - - - |
Определить модальный размер и медианный интервал заработной платы.
Решение: Первоначально по наибольшей частоте признака определим модальный интервал. Наибольшее число работников (70 человек) имеют заработную плату в интервале 700-800 ден. ед., который и является модальным.
ден. ед.
Модальный доход показывает, что большинство работников получали заработную плату в размере 780 ден. ед.
Определяем медианный интервал, в котором находится порядковый номер медианы. Для этого подсчитаем сумму частот накопленным итогом до числа, превышающего половину объема совокупности (200/2=100).
В графе «сумма накопленных частот» значение 110 соответствует интервалу 700-800. Это и есть медианный интервал, в котором находится медиана.
ден. ед.
Из расчета видно, что половина работников предприятия имеют заработную плату до 785,7 ден. ед., а половина – выше этой суммы.
Пример 3.3
По результатам зимней экзаменационной сессии студентов экономического факультета очной формы обучения было получено следующее распределение оценок:
Балл оценки знаний студентов | Итого | ||||
Число оценок, полученных студентами |
Определить:
1) средний балл оценки знаний студентов;
2) модальный балл успеваемости;
3) медианное значение балла успеваемости.
Сделать вывод о характере данного распределения баллов.
Решение:
1). Средний балл оценки знаний студентов рассчитывается по формуле средней арифметической взвешенной, где в качестве весов выступает количество полученных оценок:
2). Модальным баллом успеваемости является 4, так как именно эта оценка в дискретном ряду распределения имеет наибольшую частоту – 120.
3). Так как данный ряд распределения является дискретным с чётным количеством единиц (300), то медиана расположена между 150 и 151 единицей совокупности. Медианный балл успеваемости равен 4, так как количество студентов, сдавших сессию на 2 и 3, равно 81 чел., что меньше 150, а количество студентов, сдавших сессию на 2, 3 и 4, равно 201 чел., что больше 151.
Поскольку значения средней, моды и медианы оказались равными друг другу, то распределение оценок студентов является симметричным.
Пример 3.4.
Дано следующее распределение студентов факультета по росту:
Рост, см. | Численность студентов, чел. |
До 162 162 – 166 166 – 170 170 – 174 174 – 178 178 – 182 182 и более | |
Итого: |
Определить среднюю величину, моду и медиану роста студентов.
Решение:
1). Данный ряд распределения является интервальным с величиной интервала, равной 4 см. Тогда нижняя граница первого интервала составляет: 162 – 4 = 158 см, а верхняя граница последнего интервала равна: 182 + 4 = 186 см.
Для расчёта среднего роста студентов будем брать середины каждого из интервалов: 160, 164, 168, 172, 176, 180 и 184 см. Подставляем данные значения в формулу средней арифметической взвешенной:
2). Модальный интервал – 174 – 178 см, так он имеет наибольшую частоту по сравнению с остальными интервалами – 130 чел.
Рассчитываем значение моды:
3). Для определения медианного интервала рассчитаем накопленные частоты:
Рост, см. | Накопленная частота численности студентов, чел. |
До 162 162 – 166 166 – 170 170 – 174 174 – 178 178 – 182 182 и более | 30+55=85 85+90=175 175+125=300 300+130=430 430+50=480 480+20=500 |
Полусумма частот – 250, значит медианный интервал – 170 – 174, так как его накопленная частота 300 больше 250.
Рассчитываем значение медианы:
Так как , то имеет место левосторонняя асимметрия ряда распределения.