Вариация (лат.) колеблемость или различия.
Вариация в статистике – это различие в значениях какого-либо признака у разных единиц совокупности в один и тот же период или момент времени.
Средняя величина, как обобщающая характеристика признака не показывает строение совокупности, то есть не дает представления о том, как отдельные значения изучаемого признака отклоняются от среднего (насколько близко примыкают или насколько далеко).
Показателей вариаций пять:
1. Размах вариации – R
2. Среднее линейное отклонение – (d̅)
3. Дисперсия – Ơ2
4. Среднее квадратическое отклонение – Ơ
5. Коэффициент вариаций – V
1. Размах вариации R – это разность между максимальном и минимальном значении признака
R= Хmах – Хmin
где Хmах – наибольшее значение признака
Хmin – наименьшее значение признаков
2. Среднее линейное отклонение (d̅)
Бывает двух видов:
а) для не сгруппированных признаков среднее линейное отклонение выглядит так:
d̅ = ∑| х - х̅ |
n
где n – число ряда
б) для сгруппированных признаков
d̅ взв = ∑| х - х̅ | f
∑ f
где ∑ f – сумма частот вариационного ряда распределений
3. Дисперсия (Ơ 2)(Сигма в квадрате)
а) простая (для не сгруппированных признаков)
Ơ2 пр = ∑ (х - х̅)
n
б) взвешенная (для сгруппированных признаков)
Ơ2 взв = ∑ (х - х̅) 2 f
∑ f
сигма
4. Среднее квадратическое отклонение(Ơ)
_____ ______
Ơпр = √ ơ2 пр; Ơвзв = √ ơ2 взв
простая взвешенная
Часто возникает необходимость сравнения вариаций различных признаков, например вариация признака возраста, стажа работы и т.д. Для подобных сравнений предыдущие показатели не подходят.
Это может сделать только относительный показатель – это показатель Коэффициент вариаций.
5. Коэффициент вариаций (V) (%)
V= Ơ × 100
х
где Ơ – среднее квадратичное отклонение
х – средняя арифметическая
При V≤ 33% средняя считается типичной надежной
Совокупность считается количественно однородной, если коэф. вариаций не превышает 33%, то есть меньше или равно 33%. Среднее является типичной или надежной.
Если коэф. вариаций больше 40% - это говорит о большой колеблемости признака и следовательно средней мы не может доверять, средняя не является надежной для анализа.
Пример расчета показателей вариации
По данным ряда распределения 60 сотрудников фирмы по стажу работы, необходимо рассчитать показатели вариации.
| Стаж работы, лет х | Количество сотруников, чел. f | Расчетные значения | ||
| | х - х̅ | (| х – 3,9|) | | х - х̅ | f | (х - х̅)2 f | ||
| 1,9 | 15,2 | 28,88 | ||
| 0,9 | 14,4 | 12,96 | ||
| 0,1 | 1,7 | 0,17 | ||
| 1,1 | 13,2 | 14,52 | ||
| 2,1 | 14,7 | 30,87 | ||
| Итого | - | 59,2 | 87,4 |
сумма лет чел Средняя арифметическая взвешенная
х̅ взв = ∑х f = 2×8 + 3×16 + 4×17 + 5×12 + 6×7 = 3,9 года
∑ f 60 чел.
сумма чел
1) Размах вариаций (мах – мin годы) = R = Хmах – Хmin = 6-2 = 4 года
2 ) Среднее линейное отклонение взвешенное
d̅ взв = ∑ | х - х̅ | f = | 2-3,9|×8+|3–3,9|×16+|4–3,9|×17+|5–3,9|×12+|6–3,9|×7 = 15,2+14,4+1,7+13,2+14,7 =
∑ f 60 60
= 59,2 = 0,987 Прямая скобка – мода – то же, что и круглая, но знак минус не учитывается
3) Ơ2пр = ∑ | х - х̅ | f = 87,4 = 1,46
∑ f 60
1,92×8=28,88 1,12×12=14,52
0,92×16=12,96 2,12×7=30,87
0,12×17=0,17 всего: 87,4
___ _____
4) Ơ = √ Ơ2 = √ 1,46 = 1,21
5) V= Ơ × 100 = 1,21 ×100 =31%
х 3,9
Среднее арифметическое число типично (не превышает)
Определение дисперсии (отклонение от среднего) и среднего квадратического отклонения альтернативного признака
Условные обозначения:
1 – наличие признака
0 – отсутствие признака
р – доля единиц, обладающих данным признаком
q (ку) – доля единиц, не обладающих данным признаком р +q =1
Дисперсия (отклонение от среднего) альтернативного признака
Ơ2р = р×q = р (1-р)
Среднее квадратическое отклонение альтернативного признака
___ ____ ______
Ơр = √Ơ2р = √ р×q = √ р (1-р)
Пример: На 10 тыс. человек населения района приходится 4500 мужчин и 5500 женщин
Р = 4500 = 0,45; q = 5500 = 0,55
10000 10000
Ơ2р = 0,45×0,55 = 0,2475;
______
Ơр = √ 0,2475 = 0,49.
Предельное значение дисперсии альтернативного признака = 0,25, при р = 0,5
Дисперсия максимальная.
5.12.2011
Выборочное наблюдение
Выборочное наблюдение (Выборка) – это несплошное наблюдение, при котором осуществляется отбор части единиц совокупности. Отобранная часть изучается, а результаты распространяются на всю исходную совокупность. Часть отобранных единиц, в результате, представляет совокупность в целом.
Совокупность, из которой производится отбор – называется Геренальной., а все обобщающие показатели называются Генеральными. А совокупность отобранных единиц называется Выборочной и все ее обобщающие показатели называются Выборочными.
Для того, чтобы выборка была репрезентативной, отображала совокупность в целом, нужно следовать определенным правилам:
1. Число взятых в выборку единиц совокупности, должно быть достаточно велико.
2. Выборка должна производиться из всех частей генеральной совокупности.
3. Все единицы совокупности должны иметь одинаковый шанс попасть в выборку.
Принципы образования Выборочной совокупности:
1. Бесповторный, когда отобранная единица в дальнейшей выборке не участвует.
2. Повторный, в этом случае отобранная единица возвращается в генеральную совокупность и вновь участвует в отборе.
Виды выборки (Модели выборки):
1.Собственно – случайная выборка. Это такая выборка, когда наугад выбираются единицы из совокупности. Жеребьевка или лотерея.
2. Механическая выборка. Из всех единиц совокупности, расположенных в определенном порядке (например по алфавиту, возрасту), отбираются единицы, находящиеся на равном расстоянии друг от друга. (Так при 2%-ой выборке, отбирается каждая 50-тая единица, то есть 1:0,02. А при 5% выборке, каждая 20 единица 1:0,05).
3. Типическая выборка. Совокупность разбивается на однородные группы по определенному признаку. Чаще всего, атрибутивные (неколичественные) признаки (по полу, соц. происхожд., формы собственности…), и затем осуществляется из каждой из групп отбор единиц в случайном порядке.
4. Серийная выборка. Отбираются не единицы совокупности, а целые серии, связанных между собой, единиц. (В цехе работает несколько бригад. Отбирается одна бригада. И в рамках этой совокупности рассматриваются все единицы совокупности, то есть все рабочие).
5. Комбинированная выборка. Комбинируются различные модели выборки. Чаще всего типическая и механическая выборка.