1. Для выделения социально экономических типов явлений.
2. Для изучения структуры явления и структурных сдвигов, происходящих в нем.
3. Для выявления связей и зависимостей между отдельными признаками явления.
Исходя из этого разделяют виды группировок.
Виды группировок:
1. Типологическая группировка.
2. Структурная группировка.
3. Аналитическая или факторная группировка.
Типологическая группировка. Производится путем разделения качественно разнородной совокупности на типы или однородные группы единиц (группировка населения по социальным группам, группировка хозяйствующих субъектов по форме собственности).
Структурная группировка. Происходит распределение однородной совокупности по значениям варьирующего признака (группировка населения по полу, возрасту, по признаку – городское, сельское). Структура явления – части из 100% целого. Структурные сдвиги в том или ином явлении.
Аналитическая группировка или факторная. В основе этой группировки лежит факторный признак. И каждая выделенная группа характеризуется средним значением результативного признака (независимый от других признак, квалификация рабочего, стаж. От этого признака зависит другой, связанный от него, признак. Выработка – это факторный признак, от выработки зависит зарплата).
Группировки могут производиться по одному или нескольким признакам:
1. По одному признаку – это простая группировка (группировка населения по полу, по формам собственности – типологическая и простая).
2. По двум или нескольким признакам – это сложная группировка.
3. Если же группы, образованные по одному признаку, делятся затем на подгруппы по второму или третьему признакам, то такая группировка называется комбинационной. (если группировку по полу дополним группировкам по городскому или сельскому, то это комбинационная).
|
При построении одной или нескольких группировок, обязательно определить для себя группировочный признак. Если этот признак атрибутивный (неколичественный), то этот вопрос решается автоматически, по смыслу, соотносим по признаку в ту или иную группу (пол, национальность, образование, профессия…). Но если необходимо произвести группировку по количественному признаку, то тогда это требует определенных расчетов.
Группировка по количественному признаку.
Помимо определения самого количественного признака, необходимо определить интервалы группировки и количество групп.
Интервал – это количественное значение, отделяющее один от другого.
Оптимальное количество групп с равными интервалами можно рассчитать по формуле Стерджесса:
n= 1+3,322 × lg N
n – число групп,
N – число единиц совокупности.
Распределение единиц совокупности на группы
N (x) | 15-24 | 25-44 | 45-89 | 90-179 | 180-359 | 360-719 |
n |
Для группировок с равными интервалами, величина интервала определяется по следующей формуле:
i= x max-x min Величина равного интервала
n
где x max и x min - максимальное и минимальное значение признака,
n - число групп.
Пример:
Требуется произвести группировку по данным об уровне среднемесячной заработной платы 20 работников фирмы, которая колебалась в отчетном году в пределах от 90 до 190 у.е. для того,чтобы произвести группировку, первым, что необходимо сделать – это определить величину интервала.
|
i= 190-90 =20 у.е. N=20 чел.
Прибавляя к минимальному значению признака найденное значение интервала, и получаем верхнюю границу первой группы. Далее аналогично. Образовали 5 групп. Минимум зарплата 90 и количество человек 20. Прибавляем одно значение к другому. 110 ровно – это относится к первой группе. 111 – это уже ко второй.
90 – 110 |
110 - 130 |
130 - 150 |
150 - 170 |
170 - 190 |
Интервалы могут быть закрытыми, как в данном примере, и открытыми, когда указана лишь одна из границ. В практических расчетах открытые интервалы закрываются по величине интервалов, связанных с ними.
До – 110 |
110 – 130 |
130 – 150 |
150 - 170 |
170 и выше |
Это открытый интервал. Закрываем его по величине имеющихся данный, то есть 20 до и 20 выше.
Любая группировка должна быть выражена в виде таблицы.
Как правильно составлять таблицу.
В статистике заголовок обязательно должен отвечать на вопрос: Что? Где? Когда?
Макет статистической таблицы.
Таблица 1
Заголовок
№ п/п | Сказуемое Подлежащее | Наименование граф | ||||
А (І) | ||||||
Условные обозначения в графоклетке:
... |
Событие имело место, но данные отсутствуют;
_ |
Явление отсутствует;
0,0 |
Явление имеет место, но его величина значительно меньше заданной единицы измерения.
26.09.2011
Группировка и сводка – продолжение.
|
Ряды распределения.
Статистический ряд распределения – это упорядоченное распределение единиц совокупности на группы по определенному варьирующему признаку.
Ряды распределения, построенные по атрибутивному признаку, называются атрибутивными рядами распределения.
Ряды распределения, построенные по количественному признаку (чаще всего по порядку возрастаний) называются вариационными рядами распределения.
Вариационные ряды распределения состоит ид двух элементов: Вариантов (х) варианта (ж.р.) – это сами значения признаков, и частот (f) – это числа, показывающие, как часто встречаются те или иные варианты в ряду распределения.
Сумма всех частот называется объемом совокупности и обозначается буквой (N). N= ∑ f
Есть еще сумма частот – Частости – это частоты, выраженные в виде относительных величин, долей от единицы или же процентах.
Вариационные ряды подразделяются на дискретные и интервальные.
Дискретные ряды основаны на дискретных, прерывных, целых признаках, не имеющих дробных значений. (число детей в семье…)
Интервальные ряды основаны на признаках, представленных любыми, в том числе и дробными значениями, то есть основаны на непрерывных признаках.
С чего начинается построение ряда распределения?
1. Ранжирование, то есть расположение всех вариант в возрастающем порядке (иногда в убывающем).
2. Подсчитывается частота повторения вариант. В верхней строке указывается признак (варианта) во второй строке частота.
Пример: Распределение сотрудников фирмы по стажу работы.
Всего 22 сотрудника фирмы. 1 признак – стаж работы.
Стаж работы, лет хі | Итого | ||||||||||
Число сотрудников f |
Дискретный ряд распределения принято графически представлять линейной диаграммой.
Строится ординатнтое поле.
Ось ординат вертикальное на ней откладываются частоты то есть f. Максимальное значение на оси ординат должно соответствовать значению частоты (4 человека), а не количество, к примеру всех человек (22).
Ось абсцисс откладываем значение х, то есть признаки.
Линейная диаграмма