Понятие группировки статистических данных




Статистическая группировка - первый этап статистической сводки, позволяющий выделить из массы исходного статистического материала одно­родные группы единиц, обладающих общим сходством по одному или нескольким существенным качественным или количественным признакам.

Группировка – разбиение совокупности на группы, однородные по какому-либо признаку. С точки зрения отдельных единиц совокупности группировка – объединение отдельных единиц совокупности в группы, однородные по каким-либо признакам.

Метод группировки основывается на следующих категориях – это группировочный признак, интервал группировки и число групп.

Группировочный признак – признак, по которому происходит объединение отдельных единиц совокупности в однородные группы.

Интервал очерчивает количественные границы групп. Как правило, он представляет собой промежуток между максимальными и минимальными значениями признака в группе. Интервал очерчивает количественные границы групп и представляет собой промежуток между максимальным и минимальным значениями признака в группе. Интервалы бывают равные, неравные, закрытые (когда имеется верхняя и нижняя граница) и открытые (когда одна из границ отсутствует).

Среди группировок особо выделяют ряды распределения.

Ряд распределения это группировка, в которой для характеристики групп (упорядоченно расположенных по значению признака) применяется один показатель – численность группы, т.е. это ряд чисел, показывающий, как распределяются единицы некоторой совокупности по изучаемому признаку.

Ряды, построенные по атрибутивному признаку, называются атрибутивными рядами распределения.

Ряды распределения, построенные по количественному признаку, называются вариационными рядами.

Примером атрибутивных рядов могут служить распределения населения по полу, занятости, национальности, профессии и т.д.

Примером вариационного ряда распределения могут служить распределения студентов по возрасту, спортсменов – по виду спорта и квалификации и т.д. Вариационные ряды состоят их двух элементов вариантов и частот.

Числовые значения количественного признака в вариационном ряду распределения называется вариантами, и располагаются в определенной последовательности.

Частоты – численности отдельных вариантов или каждой группы вариационного ряда. Сумма всех частот называется объемом совокупности и определяет число элементов всей совокупности.

Вариационные ряды делятся на дискретные и интервальные.

Дискретные вариационные ряды характеризуют распределение единиц совокупности по дискретному (прерывному) признаку, т. е. принимающему целые значения. В случае непрерывной вариации величина признака может принимать любые значения в определенном интервале.

 

Построение статистического ряда распределения. Характеристика каждого этапа.

 

Если в основание группировки положен атрибутивный признак, то количество групп будет столько, сколько существует градаций (уровней) данного признака. Если основание группировки — количественный признак, то при определении количества групп в каждом случае следует исходить не только из степени колеблемости признака, но и из особенностей объекта и цели исследования. Полученные данные в ходе экспериментальной работы представлены в виде неупорядоченного набора чисел. Для того чтобы по ним можно было делать какие-то выводы, необходима первичная их обработка – группировка.

Пример 1. В эксперименте получены данные результатов прыжка вверх с места студентов, посещающих секцию баскетбола (65 человек): 59, 48, 53, 47, 57, 64, 62, 62, 65, 57, 57, 81, 83, 48, 65, 76, 53, 61, 60, 37, 51,51, 63, 81, 60, 77, 71, 57, 82, 66, 54, 47, 61, 76, 50, 57, 58, 52, 57, 40, 53, 66, 71, 61, 61, 55, 73, 50, 70, 59, 50, 59, 83, 69, 67, 66, 47, 56, 60, 43, 54, 47, 81, 76, 69 см.

Рассмотрим пошагово процедуру группировки полученных результатов выполнения контрольного физупражнения.

Определение объёма выборки n.

В примере объем выборки, т.е. число наблюдений составило 65 измерений (результатов прыжка) n = 65. Для группировки данных необходимо весь диапазон (размах) варьирования признака между наибольшими и наименьшими значениями разбить на ряд интервалов или классов.

 

Выбор числа классов (промежутков равной протяжённости, на которые разбивается размах вариации).

Число классов m выбирается с учётом объёма выборки n (7 – 10 интервалов при объёме выборки 60 - 100) или определяется по формулe Стерджесса [6, 7]:

 

m= log2n + 1 = 3,321· lg n + 1

 

В данном примере m= 3,321· lg 65 + 1 ≈ 1,813·3,321 + 1 = 7,02.

Число классов можно выбрать, руководствуясь таблицей 1 [6].

 

Таблица 1

Выбор числа классов группировки в зависимости от объема выборки

Объем выборки, n 30 - 60 60 - 100 100 - 200 200 – 500
Число классов, m 5 - 8 7 - 10 9 - 12 11 – 16

 

Число наблюдений n = 65, тогда число классов принимаем m = 10.



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2016-02-16 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: