Кубанский государственный университет
Кафедра экономического анализа, статистики и финансов
Методический материал
По дисциплине
«Теория статистики»
Составитель – к.э.н., доцент Бабенко И.В.
Краснодар 2016
ТЕМА 1 «Статистическое изучение вариационных рядов»
Общие сведения о вариационных рядах, их построение
Статистические ряды подразделяются на два вида: ряды распределения и ряды динамики.
Ряды распределения представляют собой ряды чисел, характеризующих состав или структуру какого-либо явления или процесса после группировки статистических данных. Ряды распределения подразделяются на атрибутивные и вариационные. Вариационные ряды, в свою очередь, могут быть дискретными и интервальными. В дискретном ряду группировочный признак изменяется прерывно, как правило, целыми числами.
В интервальном ряду группировочный признак принимает любые числовые значения в пределах интервала. Интервалы, в свою очередь, могут быть равновеликими и неравновеликими.
Вариационный ряд представляет собой две строки (или две колонки), в одной из которых приводятся отдельные значения варьирующего признака, которые называются вариантами и обозначаются символом x, а в другой строке – абсолютные числа, показывающие, сколько раз встречается тот или иной вариант. Эти показатели второй строки (колонки) называются частотами и обозначаются обычно через m(f).
Во второй строке могут использоваться и относительные показатели, характеризующие долю частоты отдельных вариантов в общей сумме частот. Их именуют частостями и обозначают w . Сумма всех частостей равна 1 (или 100%).
Пример атрибутивного ряда:
|
Крупнейшие производители мобильных телефонов в 2012 г., доля на мировом рынке в процентах
Samsung | Nokia | Apple | ZTE | LG | Прочие | Итого |
23,7 | 19,6 | 8,0 | 3,8 | 3,3 | 41,6 |
Несгруппированные данные:
Ежедневный товарооборот, тыс. руб. (Величина уплаченных штрафов)
20 20 15 20 17 18 23 20 24 25 17
Дискретный вариационный ряд:
x | Итого | |||||||
m | ||||||||
S | 1+2=3 | 3+1=4 | 4+4=8 | 8+1=9 | 9+1=10 | 10+1=11 | – |
Интервальный вариационный ряд (равновеликий):
x | 13-15 | 16-18 | 19-21 | 22-24 | свыше 24 | Итого |
m | ||||||
w | (9%) | (27%) | (37%) | (18%) | (9%) | 1,00 (100%) |
Для целых чисел признака границы интервалов могут не пересекаться, а для дробных – пересекаются во всех случаях.
Основные характеристики вариационного ряда
Средняя арифметическая. Для несгруппированных данных средняя арифметическая рассчитывается по формуле:
, где n – число значений признака (вариантов)
и называется средней арифметической простой.
Для дискретного вариационного ряда (где данные уже сгруппированы) рассчитывается средняя арифметическая взвешенная:
, где m, f – веса.
Понятие «вес» не всегда связано с подсчётом частот вариантов, и, следовательно, с вариационными рядами.
Для интервального вариационного ряда для исчисления предварительно в каждом интервале определяется его середина, которая принимается за конкретное значение признака и умножается на соответствующую частоту. Середина интервала определяется как полусумма нижней и верхней границ интервала. Если у первого интервала нет нижней границы, а у последнего – верхней, то эти границы устанавливаются условно, полагая, что первый интервал по величине равен следующему за ним, а последний – предшествующему.
|
Важнейшее свойство средней арифметической: сумма отклонений вариантов от своей средней арифметической равна нулю
.
Средняя гармоническая.
Средняя гармоническая простая , где – обратные значения вариантов.
Средняя гармоническая взвешенная , где M – веса.
Применение средней арифметической или средней гармонической определяется наличием данных и исходным статистическим соотношением (ИСС).
Кроме вышеуказанных средних, рассчитываются и структурные средние:
Мода (Мо) – это наиболее часто встречающееся значение признака у единиц совокупности. Для дискретных рядов – это вариант, имеющий наибольшую частоту (для наших данных Мо=20 тыс. руб.).
В интервальных вариационных рядах вначале по наибольшей частоте определяют интервал, в котором находится мода – модальный интервал. Для рядов с равными интервалами мода определяется по следующей формуле:
,
где – нижняя граница модального интервала; i – величина модального интервала; – частота (частость) предмодального интервала; – частота модального интервала; – частота послемодального интервала.
.
В ряду с неравными интервалами Мо определяется в интервале, имеющем наибольшую плотность распределения, и в формуле вместо частот принимаются соответствующие плотности распределения. Плотность распределения рассчитывается делением количества единиц в интервале на величину интервала.
|
Медиана (Ме) – это значение признака у средней единицы ранжированного ряда. Ранжированным называется ряд, у которого значения признака расположены в порядке возрастания или убывания.
Для нахождения медианы в случае несгруппированных данных вначале определяют её порядковый номер: . Если n – нечётное число, то в центре ряда находится одно значение признака, и оно будет являться медианой; если же n – чётное число, то в центре ряда стоят два варианта, и медиану нужно определять как среднюю из величин этих вариантов.
№1 | №2 | №3 | №4 | №5 | №6 | №7 | №8 | №9 | №10 | №11 |
Для определения медианы в дискретном ряду также находят её порядковый номер: . Далее рассчитывают накопленные частоты (частости) S путём последовательного суммирования частот всех вариантов, начиная с первого и заканчивая данным. Медианой является тот вариант, накопленная частота которого впервые больше или равна медианного номера: .
x | Итого | |||||||
m | ||||||||
S | 1+2=3 | 1+2+1=4 | 1+2+1+4=8 | 1+2+1+4+1=9 | 1+2+1+4+1+1=10 | 1+2+1+4+1+1+1=11 | – |
8>6 Ме=20 тыс. руб.
В интервальном ряду, прежде всего, находят медианный интервал; им считается тот, накопленная частота которого впервые больше или равна половины всей суммы частот .
Медиана в этом случае находится по формуле:
,
где – нижняя граница медианного интервала; d – величина медианного интервала; – сумма частот (частостей) ряда; – накопленная частота до медианного интервала; – частота медианного интервала.