ТАБЛИЧНОЕ И ГРАФИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ РЯДОВ РАСПРЕДЕЛЕНИЯ




Табличное представление рядов распределения –важный шаг в "добыче" информации из исходных данных. Построение таблиц распределения реализуется по правилам группировок.

Общий вид таблицы ряда распределения представлен в таблице 2.6.

Таблица 2.6 - Общий вид таблицы ряда распределения

         
X1
X2
X3
…. …. …. …. ….
Xn

Первая графа: - варианты (значения) признака, если ряд строится по атрибутивному признаку или по дискретному количественному; если же ряд строится по непрерывному количественному признаку, графа содержит интервалы значений признака. В этом случае ряд называется интервальным вариационным рядом.

Вторая графа: - частоты, характеризующие, как часто встречается данное значение признака в изучаемой совокупности, т.е. количество единиц совокупности, обладающим значением признака, зафиксированным в конкретной группе.

Третья графа: - накопленные частоты, которые рассчитываются путем последовательного суммирования частот каждой группы. В последней строке сумма частот отражает объем совокупности ( = n).

Четвертая графа: - частости или относительные частоты, или статистическая вероятность. Рассчитываются частости, как отношение частоты каждой группы к сумме частот (общему числу единиц совокупности), т.е. характеризует долю единиц каждой группы в общем объеме изучаемой совокупности. Иными словами, частость – это относительный показатель структуры, выраженный в процентах.

Пятая графа: - накопленные частости, в последней строке сумма равна единице (или 100 %), поскольку суммируются все части одной совокупности (целого).

При построении таблиц распределения необходимо добиваться одновершинности (мономодальности), т.е. по обе стороны от максимальной частоты должно наблюдаться закономерное убывание частот. Путь к достижению одновершинности распределения - поэтапное сокращение числа выделяемых групп, но число групп должно быть не менее трех (это необходимое условие при расчете критерия – хи квадрат). Если, выполнив все шаги, не удается получить одновершинного распределения, значит, мы имеем дело с бимодальным (полимодальным) распределением.

Важным требованием к таблице распределения также является отсутствие пустых и мало наполненных групп, т.е. не должно быть групп с нулевыми и единичными частотами.

Рассмотрим, как содержательно можно интерпретировать данныетаблицы распределения. Для этого обратимся к таблице 2.7.

Таблица 2.7 - Распределение регионов России по величине СДДН в 2013 г.

Первая графа таблицы содержит интервалы значений среднедушевых денежных доходов населения в регионах России в 2013 году. Для рассмотрения характеристик, содержащихся в других графах, выберем группу (строку), которой соответствует максимальная частота. Цифры 33 в графе Count (частота) и 42,86 в графе Percent (частость) означают: в 2013 году в 33 регионах России, что составляет почти 43 процента от совокупности изучаемых регионов, уровень СДДН находился в интервале от 18304 руб. до 23136 руб.

По данным, содержащимся в графах CumulativeCount (накопленная частота) и CumulativePercent (накопленная частость), можно сказать, что в 54 регионах, что составляет более 70 процентов от общего числа изучаемых регионов, значение показателя СДДН не превышало 23136 руб., т.е. значения верхней границы данного интервала. Цифра, например, в предпоследней строке последней графы свидетельствует, что в 2013 году доля регионов, в которых СДДН превышали 37632 руб. составляла всего 2,6 процента.Таким образом, таблица несет достаточно подробную информацию о структуре и характере изучаемого распределения.

Для графического представления рядов распределения традиционно используются три вида графиков:

- полигон распределения;

- гистограмма распределения;

- кумулята распределения.

При построении графиков по оси Х откладывают значения показателя, по оси Y – соответствующие значения частот либо частостей.

Полигон распределения целесообразнее использовать для рядов, построенных по дискретному или атрибутивному признакам. Если полигон строится по интервальному вариационному ряду, то в качестве значения признака берется величина, соответствующая середине каждого интервала. Полигон, построенный по данным сквозного примера, представлен на рисунке 2.2.

 

Рисунок 2.2 - Полигон распределения регионов России по величине СДДН в 2013 г.

Координатами точек на графике являются: значения СДДН, соответствующие середине каждого интервала и число регионов, зафиксированное в конкретном интервале, либо может быть использована их доля. Поскольку рассматриваемый признак (СДДН) - количественный непрерывный, то был построен интервальный вариационный ряд, для графического представления которого предпочтительнее гистограмма, см. рисунок 2.3.

 

 

Рисунок 2.3 - Гистограмма распределения регионов России по величине СДДН в 2013 г.

Гистограмма - столбиковая диаграмма, которая строится преимущественно для интервальных вариационных рядов. Основаниями столбиков гистограммы являются интервалы значений варьирующего признака по каждой группе, а высота столбиков соответствует частоте (частости) каждого интервала.

Глядя на графики распределения регионов России по величине СДДН, можно видеть, в каком интервале значений сконцентрировано максимальное число регионов, а также можно предположить наличие в распределении существенной правосторонней асимметрии (о методике статистического подтверждения существенности асимметрии речь пойдет ниже).

Особое место занимает график кумуляты. Кумулята распределения строится с использованием накопленных абсолютных или относительных частот. Используя кумуляту, можно получить ответ на вопрос, какой процент единиц совокупности имеют значения признака больше или меньше данного, т.е. по кумуляте можно определить значения показателей структуры распределения (медианы, квартилей и пр.).

Кумулята по данным рассматриваемого примера представлена на рисунке 2.4.

Рисунок 2.4 - Кумулята распределения регионов России по величине СДДН в 2013 г.

 

Нижней границе первого интервала на кумуляте соответствует нулевая частость (частота), верхней границе первого интервала соответствует значение частости (частоты) первого интервала, верхней границе второго интервала – накопленная частость (частота) второго интервала и т.д.

Далее перейдем к рассмотрению методики расчета и интерпретации статистических характеристик распределений.



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2018-01-08 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: