Критерий Колмогорова.
На практике кроме критерия часто используется критерий Колмогорова, в котором в качестве меры расхождения между теоретическим и эмпирическим распределениями рассматривают максимальное значение абсолютной величины разности между эмпирической функцией распределения и соответствующей теоретической функцией распределения
, (1)
называемой статистикой критерия Колмогорова.
Доказано, что какова бы ни была функция распределения непрерывной случайной величины , при неограниченном увеличении числа наблюдений вероятность неравенства стремится к пределу
. (2)
Задавая уровень значимости , из соотношения
(3)
можно найти соответствующее критическое значение .
Схема применения критерия Колмогорова следующая:
- Строятся эмпирическая функция распределения и предполагаемая теоретическая функция распределения .
- Определяется мера расхождения между теоретическим и эмпирическим распределением по формуле (1) и вычисляется величина
. (4)
- Если вычисленное значение окажется больше критического , определенного на уровне значимости , то нулевая гипотеза о том, что случайная величина имеет заданный закон распределения, отвергается (односторонний критерий). Если , то считают, что гипотеза не противоречит опытным данным.
Замечание
Можно отметить, что решение подобных задач можно было бы найти с помощью критерия . Потенциальное преимущества критерия Колмогорова в том, что он не требует группирования данных (с неизбежной потерей информации), а дает возможность рассматривать индивидуальные наблюдаемые значения. Этот критерий можно успешно применять для малых выборок. Считается, что его мощность, вообще говоря, выше, чем у критерия .
Пример Получена случайная выборка объема . Построим вариационный ряд и эмпирическую функцию распределения:
-1.0 | -0.6 | 0.2 | 1.3 | 2.1 | 3.0 | > 3 | |
1 \ 6 | 1 \ 6 | 1 \ 6 | 1 \ 6 | 1 \ 6 | 1 \ 6 | ||
1 \ 6 | 2 \ 6 | 3 \ 6 | 4 \ 6 | 5 \ 6 |
Проверим гипотезу, что эти наблюдения образуют случайную выборку из распределения с уровнем значимости . Затем мы можем определить графически либо аналитически, причем эти значения должны появиться в точке , соответствующей одной из наблюдаемых величин. С этой целью необходимо вычислить пары величин и (см. рис. 1) для каждого значения выборки.
Для вычисления вспомним: , где - функция стандартного нормального распределения. Результаты всех вычислений представим в виде таблицы:
-1.0 | 0.1667 | 0.0228 | 0.1439 | 0.0228 |
-0.6 | 0.3333 | 0.0548 | 0.2785 | 0.1119 |
0.2 | 0.5 | 0.2119 | 0.2881 | 0.1214 |
1.3 | 0.6667 | 0.6179 | 0.0488 | 0.1179 |
2.1 | 0.8333 | 0.8643 | 0.0310 | 0.1976 |
3.0 | 1.0000 | 0.9772 | 0.0228 | 0.1439 |
Из таблицы результатов следует: . Из статистических таблиц получим . Поскольку , то принимается гипотеза , т.е. можно считать, что данные подчиняются распределению .
Проверка гипотез об однородности выборок
Гипотезы об однородности выборок – это гипотезы о том, что рассматриваемые выборки извлечены из одной и той же генеральной совокупности.
Пусть имеются две независимые выборки, произведенные из генеральных совокупностей с неизвестными теоретическими функциями распределения и .
Проверяемая нулевая гипотеза имеет вид против конкурирующей . Будем предполагать, что функции и непрерывны.
Критерий Колмогорова-Смирнова использует ту же самую идею, что и критерий Колмогорова, но только в критерии Колмогорова сравнивается эмпирическая функция распределения с теоретической, а в критерии Колмогорова-Смирнова сравниваются две эмпирические функции распределения.
Статистика критерия Колмогорова-Смирнова имеет вид:
,
где и – эмпирические функции распределения, построенные по двум выборкам c объемами и .
Гипотеза отвергается, если фактически наблюдаемое значение статистики больше критического , т.е. , и принимается в противном случае.
При малых объемах выборок критические значения для заданных уровней значимости критерия можно найти в специальных таблицах. При (а практически при ) распределение статистики сводится к распределению Колмогорова для статистики . Поэтому гипотеза отвергается на уровне значимости , если фактически наблюдаемое значение больше критического , т.е. , и принимается в противном случае.