Все признаки, на основе которых могут производиться группировки, можно классифицировать:
1. По форме выражения:
- атрибутивные;
- количественные;
- дискретные (прерывные) – значения выражаются только целыми числами (например, количество человек, число комнат в квартире и т.д.);
- непрерывные – принимают как целые, так и дробные значения (например, цена товара, возраст человека, показатели длины, веса и т.д.).
2. По характеру колеблемости:
- альтернативные;
- имеющие множество значений.
3. По роли во взаимосвязи изучаемых явлений:
- факторные (воздействующие на другие признаки);
- результативные (испытывающие на себе влияние других признаков);
После определения группировочного признака необходимо распределить единицы совокупности по группам. Здесь встает вопрос о количестве групп и величине интервала.
Основные правила образования групп по количественным признакам. При группировке по количественным признакам часто возникают вопросы о числе групп и величине интервала. Эти показатели взаимосвязаны: чем больше групп, тем меньше интервал.
При решении данного вопроса во внимание принимают размах варьирования, т.е. разность между максимальным и минимальным значениями признака. Чем он больше, тем больше можно образовать групп.
Также должна быть принята во внимание численность изучаемой совокупности: если она невелика, то нельзя организовать большое число групп. Ориентировочное число групп (n) в зависимости от численности единиц совокупности (N) определяется по формуле американского ученого Стерджесса (Sturges):
n= 1 + 3,322 LgN
На основании этой формулы можно составить следующую номограмму:
N | 6-11 | 12-22 | 23-45 | 46-90 | 91-180 | 181-361 | 362-723 | 724-1446 | 1448-2895 |
n |
Номограмму несложно запомнить, обратив внимание на то, что с третьего интервала начало каждого последующего определяется удвоенным значением начала предыдущего интервала.
Зная размах колеблемости значений изучаемого признака во всей совокупности и намечаемое число групп, можно определить величину интервала - i:
Пример 5. Произвести группировку продавцов по данным об их выработке.
Наибольшая производительность труда составила 180 тыс. руб., наименьшая 40 тыс. руб. Общее число продавцов 200 человек.
Решение:
Объем совокупности N=200
n=1+3.322*Ig200=9
i = (180-40)/9 = 15,55 (округляем до 15)
т.е. мы получаем интервалы:
40-55; 55-70; 70-85; 85-100; 100-115; 115-130; 130-145; 145-160; 160-175; 175-190.
В экономической практике очень часто применяются неравные интервалы, прогрессивно убывающие или возрастающие. Такая необходимость возникает в тех случаях, когда колеблемость признака осуществляется неравномерно и в больших пределах.
Статистические ряды распределения
Результаты сводки и группировки материалов статистического наблюдения оформляются в виде статистических рядов распределения и таблиц.
Ряд распределения – это группировка, в которой для характеристики групп (упорядочено расположенных по значению признака) применяется только один показатель - численность группы.
Ряды распределения, образованные по качественным признакам, называют атрибутивными.