Известно несколько критериев определения близости теоретического распределения к статистическому, построенному по данным выборки ..
На практике чаще в качестве меры отмеченного отклонения используется критерий Пирсона, для которого
, (3.3.1)
где m – число интервалов, по которым расклассифицированы значения данных выборки ,
- (3.3.2)
статистическая вероятность попасть в j-ый интервал,
- (3.3.3)
теоретическая вероятность попасть в тот же интервал, рассчитанная по соответствующему предполагаемому теоретическому распределению, параметры которого оценены по данной выборке; - границы j-го интервала, j=1,…,m – номера интервалов. Для наработки на отказ обычно принимают t0= 0.
Чаще всего интервалы принимают одинаковой длины, то есть
, (3.3.4)
где - минимальное и максимальное значение в выборке
.
Число интервалов m рекомендуется выбирать таким, чтобы число данных в каждом интервале было не меньше 8, то есть .
Если имеется несколько подходящих распределений для описания опытных данных, то для каждого из них по отмеченной выборке оцениваются параметры распределений и определяется рассогласование U по формуле (3.3.1). То распределение, для которого это рассогласование минимально и является предпочтительным.
Но этого еще недостаточно, чтобы сказать однозначно, что выборка соответствует случайной величине T с выбранным распределением, так как это рассогласование является тоже случайной величиной и может принять полученное значение случайно. Для ответа на вопрос, являются ли это рассогласование случайными, или закономерным, связанным с тем, что в действительности случайная величина T имеет другое распределение, следует определить вероятность такого рассогласования при условии, что принятая гипотеза о виде распределения верна. Если эта вероятность мала, то это значит, что скорее всего рассогласование связано с ошибочностью принятой гипотезы. Обычно эту вероятность сравнивают с величиной q, называемой уровнем значимости, которая задается заранее. Например, возможны такие значения q=(0.05, 0.1, 0.2, 0.3). Чем меньше уровень значимости, тем меньше вероятность отвергнуть правильную гипотезу.
К.Пирсон показал, что U как случайная величина с ростом N имеет асимптотическое распределение с плотностью
. (3.3.5)
Это распределение называется хи-квадрат распределением () и является частным случаем гамма распределения с параметрами
и α=r/2. Единственный параметр
распределения r называется числом степеней свободы и определяется по формуле
, (3.3.6)
где m – число интервалов, по которым сгруппированы данные выборки, а s – число условий, накладываемых на частоты . Такими условиями являются: условие нормировки вероятностей
и условия для оценки параметров распределений типа (3.1.15-3.1.19) по числу оцениваемых параметров. Так для показательного распределения (3.1.1) s =2, а для двухпараметрических распределений (3.1.3, 3.1.5, 3.1.7, 3.1.9) s=3.
По заданному уровню значимости q можно вычислить по формуле (3.3.7) допустимое рассогласование такое, что если , то гипотеза о законе распределения принимается как не противоречащая опытным данным, и если
, то гипотеза отвергается.
. (3.3.7)