Лекция. Сводка и группировка статистических данных




Сводка – научно организованная обработка материалов наблюдения (по заранее разработанной программе), включающая в себя кроме обязательного контроля собранных данных, систематизацию, группировку материалов, составление таблиц, получение итогов по группам и в целом. Программа сводки включает определение групп и подгрупп, системы показателей и видов таблиц. По технике и способу выполнения сводка может быть ручной либо механизированной.

Проведение сводки включает 3 этапа:

· предварительный контроль материалов, т. е. проверку исходных данных;

 

· группировку данных по заданным признакам. определение производных показателей;

 

· оформление результатов сводки в виде статистических таблиц, удобных для восприятия информации.

Предварительный контроль включает логическую проверку данных. т. е. смысловую согласованность сведений. исключение «нелогичных» данных и арифметическую согласованность.

Пример. Рассогласованные данные.

При переписи населения в документах указан мальчик 8 лег. состоящий в браке.

В документах на предприятии обнаружены арифметическая и логическая рассогласованности:

№ п/п Заработная плата Возраст Общий стаж Непрерывный стаж
         
         
         
         
Итого        

 

Арифметическая -неправильно определена сумма заработной платы.

В 3-й строке имеется логическая ошибка: человек 25-ти лет не может иметь общего стажа 45 лет и, кроме того, непрерывный стаж, как часть общего, не может его превосходить.

Группировка данных производится в соответствии с программой сводки для того, чтобы впоследствии представить полученную информацию в доступном для восприятия виде.


Группировка – разбиение совокупности на группы, однородные по какому-либо признаку или объединение отдельных единиц совокупности в группы, однородные по каким-либо признакам. Устойчивое разграничение объектов называется классификацией или стандартом, в котором каждая атрибутивная запись может быть отнесена лишь к одной группе или подгруппе. Метод группировки основывается на двух категориях – группировочном признаке и интервале.

Группировочный признак – признак, по которому происходит объединение отдельных единиц совокупности в однородные группы. Он может носить как количественный, так и качественный характер. В ряде случаев группировка, которая представляется чисто качественной, в конечном итоге оказывается основанной на количественном признаке. Такова, например, классификация промышленных предприятий по отраслям. Поскольку одно и то же предприятие выпускает продукцию разных видов, статистика решает этот вопрос по количественному преобладанию того или иного вида.

Интервал очерчивает количественные границы групп и представляет собой промежуток между максимальным и минимальным значениями признака в группе. Интервалы бывают равные, неравные, закрытые (когда имеется верхняя и нижняя граница) и открытые (когда одна из границ отсутствует).

Статистические группировки и классификации преследуют цели выделения качественно однородных совокупностей, изучения структуры совокупности, исследования взаимосвязи факторных и результативных признаков. Каждой из этих целей соответствует особый вид группировки: типологическая, структурная и аналитическая.

В зависимости от числа положенных в основание группировки признаков различают простые и многомерные группировки.

Простая группировка выполняется по одному признаку. Среди простых группировок особо выделяются ряды распределения. Ряд распределения – группировка, в которой для характеристики групп, упорядоченно расположенных по значению признака применяется один показатель – численность группы.

Возьмем условный пример дискретного ряда распределения студентов заочного отделения по росту:

№ п/п                                        
Рост, см                                        

Данный ряд является ранжированным, так как значения роста упорядочены по возрастанию.

Построим интервальный ряд распределения студентов по росту, для чего необходимо выбрать оптимальное число групп (интервалов признака) и установить длину (размах) интервала. Поскольку при дальнейшем анализе ряда распределения сравнивают частоты в разных интервалах, необходимо, чтобы длина интервалов была постоянной (иначе для сопоставимости придется частоты делить на единицу интервала - полученное значение называется плотностью).

Оптимальное число групп выбирается так, чтобы в достаточной мере отразилось разнообразие значений признака в совокупности и в то же время закономерность распределении, его форма не искажалась случайными колебаниями частот. Если групп будет слишком мало, то не проявится закономерность вариации; если групп будет чрезмерно много, то случайные скачки частот исказят форму распределения.

Чаще всего число групп в ряду распределения определяют по формуле Стерждесса:

или

где k – число групп (округляемое до ближайшего целого числа); N – численность совокупности.

В нашем примере про студентов по формуле Стерждесса определим число групп: k = 1 + 3,322lg20 = 5,32. Так как число групп не может быть дробным, то округляем k = 5,32 до ближайшего целого числа по правилам округлений - 5.

Зная число групп, рассчитывают длину (размах) интервала по формуле:

Если необходимо построить интервальный ряд по признаку, который варьируется в некоторых границах, то находят величину интервала (шаг) по формуле:

 

h = ,

где xмакс, xмин – соответственно максимальное и минимальное значение признака;

к – число групп, на которое расчленяется совокупность.

В нашем примере про студентов h = (184 - 152)/5 = 6,4 (см). То есть для построения интервального ряда распределения нужно 20 студентов разбить на 5 групп с интервалом по 6,4 см. Представим интервальный ряд распределения студентов по росту в виде таблицы:

Рост, см 152 - 158,4 158,4 - 164,8 164,8 - 171,2 171,2 - 177,6 177,6 - 184 Итого
Число студентов            

Многомерная группировка производится по двум и более признакам. Частным случаем многомерной группировки является комбинационная группировка, базирующаяся на двух и более признаках, взятых во взаимосвязи.

По отношениям между признаками выделяют: иерархические группировки, выполняемые по двум и более признакам, при этом значения второго признака определяются областью значений первого (например, классификация отраслей промышленности по подотраслям); неиерархические группировки, когда строгой зависимости значений второго признака от первого не существует.

По очередности обработки информации группировки бывают первичными, составленные на основе первичных данных, и вторичные, являющиеся результатом перегруппировки ранее уже сгруппированного материала.

В соответствии со временным критерием различают статические группировки, дающие характеристику совокупности на определенный момент или за определенный период, и динамические, показывающие переходы единиц из одних групп в другие.


Пример. Группировочная таблица.

Отношение студентов одного из факультетов к понижению размера стипендии (по результатам исследования в январе 2020 г.).

Сказуемое

  Поддерживаю Не поддерживаю Безразлично
Студенты 1-го курса      
Студенты 2-го курса      
Студенты 3-го курса      
Студенты 4-го курса -   -
Студенты 5-го курса -   -
Итого      

 

Подлежащее

Таким образом, группировка -это разделение единиц совокупности на группы по выбранным варьирующим признакам.

Группировки различают:

 

· по задачам систематизации данных;

· по числу группировочных признаков;

·. по используемой информации.

Метод группировок применяется для решения задач, возникающих в ходе научного статистического исследования:.

· выделения социально-экономических типов явлений;

 

· ' изучения структуры явления и структурных сдвигов, происходящих в нем;

 

·. выявления связей и зависимостей между отдельными признаками явления.


Для решения этих задач применяют (соответственно) 3 вида группировок: типологические, структурные и аналитические (факторные).

Типологические группировки предназначаются для выявления качественно однородных трупп совокупностей, т. е. объектов, близких друг к другу одновременно по всем группировочным признакам. Например. группировка предприятий города по формам собственности.
Структурные -разделение однородной совокупности на группы, характеризующие ее структуру по определенному труппировочному признаку. Например, группировка рабочих цеха по квалификации.
Аналитические -предназначены для выявления зависимости между признаками. Строят аналитические группировки, выделив результирующие, которые изменяются, и факторные, зависимость от которых исследуется.
По числу группировочных признаков различают простые (но одному признаку) и сложные (по нескольким признакам -комбинированные и многомерные).
Комбинированные группировки строятся путем разбивки каждой группы на подгруппы в соответствии с дополнительными признаками.

Многомерные - строятся с помощью специальных алгоритмов, когда осуществляется поиск скопления в n-мерном пространстве, где каждый объект -точка, т. е. построить многомерную группировку -найти скопление точек.
По используемой информации различают первичные и вторичные группировки.
Первичные группировки производятся на основе исходных данных, полученных в результате статистических наблюдений.
Вторичные -результат объединения или расщепления первичной группировки.

 



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2021-03-24 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: