КРИТЕРИЙ ПИРСОНА
При обработке статистического ряда выполняется группировка данных.
Для дискретной случайной величины мы записываем статистическое распределение выборки в виде перечня вариант и их частот (или относительных частот):
x i | x 1 | x 2 | ... | x k | ||
n i | n 1 | n 2 | ... | n k | ||
w i | w 1 | w 2 | ... | w k | ||
Для непрерывной случайной величины данные группируются по интервалам
(x i;x i+1) | (x1;x2) | (x2;x3) | ... | (xk;xk+1) | ||
n i | n 1 | n 2 | ... | n k | ||
w i | w 1 | w 2 | ... | w k | ||
Так или иначе, при группировке все варианты разбиваются на группы и для каждой группы подсчитывается частота n i попадания в эту группу (или относительная частота w i). Для проверки применимости предполагаемого закона распределения надо подсчитать по теоретическим формулам этого закона вероятности pi попаданий в каждую группу и сравнить их с относительными частотами w i - т.е., вероятностями, найденными экспериментальным путем.
Если отличие между ними окажется незначительным, гипотезу о виде закона
распределения надо принимать. Если различие существенно, гипотезу надо отвергать.
Но сравнивать надо много чисел p i и w i одновременно и объединить их в одну общую формулу для подсчета критерия.
В критерии Пирсона сравниваются не вероятности, а частоты: экспериментальные частоты n i и так называемые теоретические частоты n i’. Это частоты попаданий в группы, которые предсказываются предполагаемой теоретической формулой и они равны: n/ i = p i × n.
Величина, характеризующая отличие теоретических частот от эксперименталь-ных, подсчитывается по формуле:
(1)
Это и есть так называемый Критерий Пирсона.
У этой случайной величины закон распределения приблизительно совпадает с распределением c2 с числом степеней свободы, равным: k = s - r - 1;. Здесь s - число групп, r -число параметров распределения, оцениваемых по выборке.
Замечание: при пользовании критерием Пирсона группы с малочисленными теоретическими частотами (для которых n i /£ 5) следует объединять.
2. КРИТЕРИЙ КОЛМОГОРОВА.
В критерии Пирсона сравниваются теоретические и экспериментальные ряд распределения (для дискретной случайной величины) или плотность распределения (для непрерывной случайной величины).
В критерии Колмогорова сравниваются функции распределения, теоретическая F(x) и эмпирическая (статистическая) F*(x). Если они отклоняются друг от друга незначительно, то гипотезу о виде закона распределения принимаем; если отклонение значительное, то гипотезу отвергаем.
Замечание: при пользовании критерием Колмогорова параметры распределения не оцениваются по выборке, а предполагаются уже известными величинами.
По имеющейся выборке (x 1 , x 2 , x 3 ,... x n) строится эмпирическая функция распределения F*(x). Вы знаете, что в точках x i она имеет скачок, равный относительной частоте w i. Т. е., в каждой экспериментальной точке x i следует брать два значения - предел слева F*(xi - 0) и предел справа F*(xi + 0).
В этих же экспериментальных точках x i подсчитывается значение теоретической функции распределения F(x i) по предполагаемой формуле. Понятно, что теоретические и эмпирические значения не совпадают. Если они различаются незначительно, то гипотезу о предполагаемом законе распределения следует принять. Если различие значительно, то гипотезу надо отвергать. В критерии Колмогорова величина, характеризующая различие между F*(x) и F(x) - это наибольшая из разностей
D i = ½ F*(x i) - F(x i) ½
Наибольшая из этих разностей как раз и служит мерой отклонения между двумя функциями. Если она не превосходит критического значения ea, n (a,n), определяемого по специальным таблицам, то гипотеза принимается. Если превосходит, то отвергается.