Вариация – это различие в значениях какого-либо признака у разных единиц данной совокупности в один и тот же период или момент времени. Исследование вариации в статистике имеет большое значение, помогает познать сущность изучаемого явления. Показатели вариации характеризуют колеблемость отдельных значений вариант около средних величин. Показатели вариации определяют различия индивидуальных значений признака внутри изучаемой совокупности.
Существует несколько видов показателей вариации:
а) Размах вариации R представляет собой разность между максимальным и минимальным значениями признака:
R = Xmax – Xmin
Размах вариации показывает лишь крайние отклонения признака и не отражает отклонений всех вариантов в ряду.
б) Среднее линейное отклонение
(7) - невзвешенное;
(8) - взвешенное,
где: Х - варианты;
`Х - средняя величина;
n - число признаков;
f - частоты.
Линейное отклонение учитывает различия всех единиц изучаемой совокупности.
в) Дисперсия - показатель вариации, выражающий средний квадрат отклонений вариант от средних величин в зависимости от образующего вариационного фактора.
(9) - невзвешенная;
(10) - взвешенная.
Показатель дисперсии более объективно отражает меру вариации на практике.
г) Среднее квадратическое отклонение
(11) - взвешенное;
(12) - невзвешенное.
Среднее квадратическое отклонение является показателем надежности средней: чем меньше среднее квадратическое отклонение, тем лучше средняя арифметическая отражает собой всю статистическую совокупность.
д) Показатель вариации.
(13)
Показатель вариации отражает тенденцию развития явления, т.e. действие главных факторов. Показатель вариации выражается в % или коэффициентах.
Рассмотрим методику построения интервального ряда распределения и его применение на примере, представленном в расчетной части данной работы.
Расчетная часть
По результатам 10%-ого выборочного обследования торговых предприятий района, проведенного на основе случайной бесповторной выборки, получены следующие данные за отчетный месяц (тыс. руб.):
Табл. 1
№ п/п | Товарооборот | Средние товарные запасы |
Задание 1
По исходным данным постройте статистический ряд распределения организации по признаку товарооборот, образовав заданное число групп с равными интервалами.
Число групп – 5.
1) а) Распределим исходные данные по возрастанию по признаку Товарооборот.
Табл. 2
№ п/п | Товарооборот | Средние товарные запасы |
б) При построении ряда с равными интервалами величина интервала i определяется по формуле:
,
где – наибольшее и наименьшее значения признака в исследуемой совокупности, n - число групп интервального ряда.
тыс. руб.
Таким образом, границы интервалов ряда распределения имеют следующий вид:
1 группа: 375 – 459 (xmin – x1, где x1 = xmin+ i)
2 группа: 459 – 543 (x1 – x2, где x2 = x1 + i)
3 группа: 543 – 627 (x2 – x3, где x3 = x2 + i)
4 группа: 627 – 711 (x3 – x4, где x4 = x3 + i)
5 группа: 711 – 795 (x4 – x5, где x5 = x4 + i)
в) Строим интервальный ряд распределения предприятий выборочной совокупности по объему товарооборота, тыс. руб. (если значение показателя соответствует значению верхней границы интервала одной группы и нижнему значению границы интервала другой группы, то эту организацию мы относим к последнему).
Табл. 3
№ группы | Группы по объему товарооборота | Кол-во предприятий в группе |
375-459 | ||
459-543 | ||
543-627 | ||
627-711 | ||
711-795 | ||
Итого |
Вывод: Ряд распределения показывает, что наибольшее кол-во предприятий в выборочной совокупности имеют объем товарооборота от 543 до 627 тыс. руб.
2) Рассчитайте характеристики интервального ряда распределения: среднее арифметическое, среднее квадратическое отклонение, коэффициент вариации, моду и медиану. Сделайте выводы по результатам выполненного задания.
а) Среднее арифметическое определяется по следующей формуле:
где - сумма произведений средних показателей товарооборота предприятий в группе на количество предприятий в группе, - общее число предприятий.
Для характеристики средних величин определяем середину интервала и численности накопленных частот.
Табл. 4
№ группы | Группы предприятий по объему товарооборота | Кол-во предприятий в группе | Середина интервала | Накопленные частоты |
375-459 | ||||
459-543 | ||||
543-627 | ||||
627-711 | ||||
711-795 | ||||
Итого |
(тыс. руб.)
Вывод: в среднем объем товарооборота на предприятиях составляет 585 тыс. руб.
б) Среднее квадратическое отклонение:
(тыс. руб.)
Вывод: объем товарооборота выборочной совокупности отклоняется в среднем от среднего значения на ±98,9948 тыс. руб.
в) Коэффициент вариации:
Вывод: коэффициент вариации составляет < 33%, следовательно, совокупность считается однородной, а средняя типичной для этой совокупности.
г) Мода:
Для определения моды графическим методом строим по данным табл. 4 (графы 2 и 3) гистограмму распределения предприятий по изучаемому признаку.
Рис. 1. Гистограмма распределения предприятий по объему товарооборота, тыс. руб.
Расчет конкретного значения модыдля интервального ряда распределения производится по формуле:
где хМo – нижняя граница модального интервала,
i – величина модального интервала,
fMo – частота модального интервала,
fMo-1 – частота интервала, предшествующего модальному,
fMo+1 – частота интервала, следующего за модальным.
Согласно табл. 4 модальным интервалом построенного ряда является интервал 543 – 627 руб., т.к. он имеет наибольшую частоту (f3=11).
(тыс. руб.)
Вывод: мода, равная 593,4 тыс. руб. показывает, что наиболее часто в выборочной совокупности предприятий объем товарооборота будет составлять 593,4 тыс. руб.
д) медиана: для определения медианы графическим методом строим по данным табл. 4 (графы 2 и 5) кумуляту распределения предприятий по изучаемому признаку.
Рис. 2. Кумулята распределения предприятий по объему
товарооборота, тыс. руб.
Расчет конкретного значения медианы для интервального ряда распределения производится по формуле:
,
где хМе – нижняя граница медианного интервала,
i – величина медианного интервала,
∑ f - сумма всех частот,
fМе – частота медианного интервала,
SMе-1 – кумулятивная (накопленная) частота интервала, предшествующего медианному.
Определяем медианный интервал, используя графу 5 табл. 4. Медианным интервалом является интервал 543 – 627 тыс. руб., т.к. именно в этом интервале накопленная частота S3=20 впервые превышает полусумму всех частот .
(тыс. руб.)
Вывод: медиана показывает, что половина выборочной совокупности предприятий имеет значение по объему товарооборота <588,82 тыс. руб., а другая половина >588,82 тыс. руб.
Задание 2
1) Установите наличие и характер корреляционной связи между признаками товарооборот (факторный) и средние товарные запасы (результативный) методом аналитической группировки, образовав по факторному признаку заданное число групп с равными интервалами.
а) Построим разработочную таблицу.
Разработочная таблица Табл. 5
№ группы | Группы предприятий по объему товарооборота | № предприятия | Товарооборот | Средние товарные запасы |
375 - 459 | ||||
Итого по 1ой группе | ||||
459 - 543 | ||||
Итого по 2ой группе | ||||
543 - 627 | ||||
Итого по 3ей группе | ||||
627 - 711 | ||||
Итого по 4ой группе | ||||
711 - 795 | ||||
Итого по 5ой группе |
б) Построим аналитическую группировку, используя данные разработочной таблицы.
Аналитическая группировка выборочной совокупности предприятий по объему
товарооборота, тыс. руб. Табл. 6
№ группы | Группы по объему товарооборота | Кол-во предприятий в группе | Товарооборот в группе, тыс. руб. | Средние товарные запасы | ||
всего | в среднем по группе | всего | в среднем по группе | |||
375 – 459 | ||||||
459 – 543 | ||||||
543 – 627 | ||||||
627 – 711 | ||||||
711 – 795 | 763,67 | |||||
Итого и в среднем |
Вывод: аналитическая группировка предприятий по объему товарооборота показывает, что с увеличением в среднем по группам группировочного признака также увеличивается и среднее значение товарооборота (результативного признака).
2) Измерьте тесноту корреляционной связи между названными признаками (товарооборот и средние товарные запасы) с использованием коэффициента детерминации η2 и имперического корреляционного отношения η.
Для расчета η и η2 построим промежуточную таблицу.
Расчетная таблица. Табл. 6
№ группы | Группы по объему товарооборота, тыс. руб. | № предприятия | Средние товарные запасы | ||
375 – 459 | |||||
Итого | |||||
459 – 543 | |||||
Итого | 318,8 | ||||
543 – 627 | |||||
Итого | 260,7273 | ||||
627 – 711 | |||||
Итого | |||||
711 – 795 | |||||
Итого | 28,6667 |
По результатам таблицы:
Коэффициент детерминации характеризует силу влияния факторного (группировочного) признака Х на результативный признак Y и рассчитывается как доля межгрупповой дисперсии признака Y в его общей дисперсии :
где – общаядисперсия признака Y,
– межгрупповая (факторная) дисперсия признака Y.
Рассчитываем межгрупповую дисперсию:
Рассчитываем общую дисперсию:
,
где
Т. о.
Корень квадратный из коэффициента детерминации – есть эмпирическое корреляционное отношение.
Вывод: эмпирическое корреляционное отношение η = 0,9014 показывает наличие сильной связи между размером товарооборота (тыс. руб.) и размером средних товарных запасов.
Коэффициент детерминации η2 = 0,8126 показывает, что только на 81,26% изменение размеров товарооборота обусловливает изменение средних товарных запасов, а на остальные 18,74% другими факторами.
Задание 3
По результатам выполнения задания 1 с вероятностью 0,954 определите:
а) ошибку выборки средней величины товарооборота торгового предприятия и границы, в которых будет находиться средняя величина товарооборота предприятия по району в целом.
Предельная ошибка выборки определяет границы, в пределах которых будет находиться генеральная средняя:
,
где – выборочная средняя,
– генеральная средняя.
Предельная ошибка выборки Δ определяется по формуле:
где – общая дисперсия изучаемого признака,
N – число единиц в генеральной совокупности,
n – число единиц в выборочной совокупности,
t – коэффициент кратности.
Выборка 10%-ая, механическая, следовательно, n/N=0,1.
Вероятность р =954, следовательно, t =2.
Значения параметров, необходимых для решения задачи (определены в задании 1):
= 585 тыс. руб.
= ± 96,9948
= 9407,9912
(тыс. руб.)
585 - 33,6 ≤ ≥ 585 + 33,6
551,4 ≤ ≥ 618,6
Вывод: с вероятностью 0,954 можно утверждать, что средний объем товарооборот предприятия в генеральной совокупности будет находиться в пределах от 551,4 до 618,6.
б) ошибку выборки доли торговых предприятий района с объемом товарооборота 627 и более тыс. руб. и границы, в которых будет находиться генеральная доля.
Предельная ошибка выборки определяет границы, в пределах которых будет находиться генеральная доля р единиц, обладающих исследуемым признаком:
w – ≤ p ≤ w +
Доля единиц выборочной совокупности, обладающих тем или иным заданным свойством, выражается формулой:
,
где m – число единиц совокупности, обладающих заданным свойством;
n – общее число единиц в совокупности.
Предельная ошибка выборки доли единиц, обладающих заданным свойством, рассчитывается по формуле:
,
где w – доля единиц совокупности, обладающих заданным свойством;
(1- w) – доля единиц совокупности, не обладающих заданным свойством,
N – число единиц в генеральной совокупности,
n – число единиц в выборочной совокупности.
По условию Задания 3 исследуемым свойством фирм является равенство или превышение объема товарооборота 627 тыс. руб.
Число предприятий с данным свойством определяется из табл. 5: m=10.
Рассчитаем выборочную долю:
Рассчитаем предельную ошибку выборки для доли:
Определим доверительный интервал генеральной совокупности:
w – Δw ≤ p ≥ w + Δw
0,3333 - 0,1633 ≤ р ≥ 0,3333 + 0,1633
0,17 ≤ р ≥ 0,4966
Вывод: с вероятностью 0,954 можно утверждать, что доля предприятий с объемом товарооборота 627 и более тыс. руб. в генеральной совокупности будет находиться в пределах от 0,17 до 0,4966.
Задание 4
Аналитическая часть
В результате обобщения итогов выборочного бюджетного обследования населения РФ построен вариационный интервальный ряд, отражающий распределение жителей Российской Федерации по величине среднедушевого дохода.*
Среднедушевой доход в месяц, руб. | Население | |
В млн. чел. | В % | |
До 500 | 4,5 | 3,1 |
500-750 | 10,5 | 7,2 |
750-1000 | 14,3 | 9,8 |
1000-1500 | 30,1 | 20,7 |
1500-2000 | 24,7 | 17,0 |
2000-3000 | 30,7 | 21,1 |
3000-4000 | 14,9 | 10,2 |
Свыше 4000,0 | 15,9 | 10,9 |
Итого | 145,6 |
*Российский статистический ежегодник. Статистический сборник 2001.
Задание:
Рассчитайте характеристики интервального ряда распределения: среднее арифметическое, среднее квадратическое отклонение, коэффициент вариации, моду и медиану. Сделайте выводы по результатам выполненного задания.
Решение:
а) Среднее арифметическое определяется по следующей формуле:
где - сумма произведений средних показателей среднедушевого дохода в группе на численность населения в группе, - общее число численности населения.
Для характеристики средних величин определяем середину интервала и численности накопленных частот.
Табл. 1
№ группы | Среднедушевой доход в месяц, руб. | Население, млн. чел. | Середина интервала | Накопленные частоты |
250 – 500 | 4,5 | 4,5 | ||
500 – 750 | 10,5 | |||
750 – 1000 | 14,3 | 29,3 | ||
1000 – 1500 | 30,1 | 59,4 | ||
1500 – 2000 | 24,7 | 84,1 | ||
2000 – 3000 | 30,7 | 114,8 | ||
3000 – 4000 | 14,9 | 129,7 | ||
4000 – 5000 | 15,9 | 145,6 | ||
Итого | 145,6 |
Вывод: в среднем размер среднедушевого дохода в месяц составляет 2033,9 руб.
б) Среднее квадратическое отклонение:
Вывод: размер среднедушевого дохода в месяц отклоняется в среднем от среднего значения на ±940,24 руб.
в) Коэффициент вариации:
Вывод: коэффициент вариации составляет > 33%, следовательно, совокупность считается однородной, а средняя типичной для этой совокупности.
г) Мода:
Для определения моды графическим методом строим по данным табл. 1 (графы 2 и 3) гистограмму распределения населения по изучаемому признаку.
Рис. 1. Гистограмма распределения населения по среднедушевому доходу в месяц.
Расчет конкретного значения модыдля интервального ряда распределения производится по формуле:
где хМo – нижняя граница модального интервала,
i – величина модального интервала,
fMo – частота модального интервала,
fMo-1 – частота интервала, предшествующего модальному,
fMo+1 – частота интервала, следующего за модальным.
Согласно табл. 1 модальным интервалом построенного ряда является интервал 2000 – 3000 руб., т.к. он имеет наибольшую частоту (f3=30,7).
(руб.)
Вывод: мода, равная 2275,2294 руб. показывает, что наиболее часто в выборочной совокупности размер среднедушевого дохода в месяц будет составлять 2275,2294 руб.
д) медиана: для определения медианы графическим методом строим по данным табл. 1 (графы 2 и 5) кумуляту распределения населения по изучаемому признаку.
Рис. 2. Кумулята распределения населения по среднедушевому доходу в месяц.
Расчет конкретного значения медианы для интервального ряда распределения производится по формуле:
,
где хМе – нижняя граница медианного интервала,
i – величина медианного интервала,
∑ f - сумма всех частот,
fМе – частота медианного интервала,
SMе-1 – кумулятивная (накопленная) частота интервала, предшествующего медианному.
Определяем медианный интервал, используя графу 5 табл. 1. Медианным интервалом является интервал 1500 - 2000 руб., т.к. именно в этом интервале накопленная частота S5=84,1 впервые превышает полусумму всех частот .
(руб.)
Вывод: медиана показывает, что половина выборочной совокупности населения имеет значение по размеру среднедушевого дохода в месяц <1771,2551 руб., а другая половина >1771,2551 руб.
Заключение
Итак, статистические ряды распределения представляют собой один из наиболее важных элементов статистического исследования.
Статистические ряды распределения являются базисным методом для любого статистического анализа.
Статистический ряд распределения представляет собой упорядоченное распределение единиц изучаемой совокупности на группы по определенному варьирующему признаку, характеризует структуру изучаемого явления. Анализируя рассчитанные показатели статистического ряда распределения, можно делать выводы об однородности или неоднородности совокупности, закономерности распределения и границах варьирования единиц совокупности. Изучив основные приемы исследования и практики применения рядов распределения, а также методику вычисления наиболее важных статистических величин, необходимо отметить, что конечная цель изучения статистики в целом - анализ изучаемого явления - крайне важен для всех сфер человеческой жизни. Анализ отображает явления в целом и вместе с этим учитывает влияние каждого фактора в отдельности. На основании проведенного анализа можно учитывать и прогнозировать факторы, негативно влияющие на развитие событий.
Социально-экономическая статистика обеспечивает предоставление важной цифровой информации об уровне и возможностях развития страны: ее экономическом положении, уровне жизни населения, его составе и численности, рентабельности предприятий, динамике безработице и т.д. Статистическая информация является одним из решающих ориентиров государственной экономической политики.
Статистические методы используют комплексно (системно). Выделяют три основные стадии экономико-статистического исследования: сбор первичной статистической информации, статистическая сводка и обработка первичной информации, обобщение и интерпретация статистической информации.
Качество, достоверность статистической информации определяют эффективность использования статистики на любом уровне и в любой сфере.
В настоящее время ведется работа по совершенствованию статистической методологии и завершению перехода Российской Федерации на принятую в международной практике систему учета и статистики в соответствии с требованиями развития рыночной экономики.
Список использованной литературы
1. Ефимова М.Р., Петрова Е.В., Румянцев В.Н. Общая теория статистики: Учебник. - М.: «Инфра-М» 1998г.
2. Гусаров В.М. Теория статистики: - М.: «Аудит», «ЮНИТИ» 1998г.
3. Теория статистики: Учебник под редакцией профессора Шамойловой Р.А. -М.: «Финансы и статистика» 1998г.
4. Практикум по статистике: Учебное пособие для вузов/ под редакцией В.М. Симчеры/ВЗФЭИ.-М.: ЗАО «Финстатинформ», 1999.
5. Общая теория статистики:/Статистическая методология в коммерческой деятельности: учебник для вузов/под редакцией А.С. Спирина и О.Е. Башиной. – М.: Финансы и статистика, 1994.
6. Российский статистический ежегодник 2002. Статистический сборник. Госкомстат
7. Сироткина Т.С., Каманина А.М. Основы теории статистики: учебное пособие. – М.: АО «Финстатинформ», 1995.
8. Ряузов Н.Н. Общая теория статистики: Учебник для вузов.-М.: Финансы и статистика, 1984.
9. Сайт: www.gks.ru