Гипотезу, выдвинутую для проверки ее согласия с выборочными данными, называют нулевой гипотезой и обозначают H 0. Вместе с гипотезой H 0 выдвигается альтернативная или конкурирующая гипотеза, которая обозначается H 1. Например:
1) | H 0: Mx= 0 | 2) | H 0: Mx= 0 | 3) | H 0: Mx= 0 |
H 1: Mx¹ 0 | H 1: Mx> 0 | H 1: Mx= 2 |
Пусть случайная величина K – статистический критерий проверки некоторой гипотезы H 0. При справедливости гипотезы H 0 закон распределения случайной величины K характеризуется некоторой известной нам плотностью распределения pk (x).
Выберем некоторую малую вероятность a, равную 0,05, 0,01 или еще меньшую. Определим критическое значение критерия K кр как решение одного из трех уравнений, в зависимости от вида нулевой и конкурирующей гипотез:
P (K> K кр) = a (1)
P (K< K кр) = a (2)
P ((K< K кр1)Ç(K> K кр2)) = a (3)
Возможны и другие уравнения, но они встречаются значительно реже, чем приведенные.
Решение уравнения (1) (то же самое для уравнений (2) и (3)) заключается в следующем: по вероятности a, зная функцию pK (x), заданную как правило таблицей, нужно определить K кр.
Что означает условие (1)?
Если гипотеза H 0 справедлива, то вероятность того, что критерий K превзойдет некоторое значение K кр очень мала – 0,05, 0,01 или еще меньше, в зависимости от нашего выбора. Если K в – значение критерия K, рассчитанное по выборочным данным, превзошло значение K кр, это означает, что выборочные данные не дают основания для принятия нулевой гипотезы H 0 (например, если a= 0,01, то можно сказать, что произошло событие, которое при справедливости гипотезы H 0 встречается в среднем не чаще, чем в одной из ста выборок). В этом случае говорят, что гипотеза H 0 не согласуется с выборочными данными и должна быть отвергнута. Если K в не превосходит K кр, то говорят, что выборочные данные не противоречат гипотезе H 0, и нет оснований отвергать эту гипотезу.
Для уравнения (1) область K> K кр называется критической областью. Если значение K в попадает в критическую область, то гипотеза H 0 отвергается.
Для уравнения (1) область K < K кр называется областью принятия гипотезы. Если значение K в попадает в область принятия гипотезы, то гипотеза H 0 принимается.
Рисунок 1. иллюстрирует решение уравнения (1). Здесь pK (x) – известная плотность распределения случайной величины K при условии справедливости гипотезы H 0.
Пусть выбрано некоторое малое значение вероятности a, по нему определено значение K кр и по выборочным данным определено значение K в, которое попало в критическую область. В этом случае гипотеза H 0 отвергается, но она может оказаться справедливой, просто случайно произошло событие, которое имеет очень малую вероятность a. В этом смысле a есть вероятность отвержения правильной гипотезы H 0.
Отвержение правильной гипотезы называется ошибкой первого рода. Вероятность a называется уровнем значимости. Таким образом уровень значимости – это вероятность совершения ошибки первого рода.
Критическая область, полученная для уравнения (1) и приведенная на рисунке 1., называется правосторонней.
Уравнение (2) определяет левосторонюю критическую область. Ее изображение приводится на рисунке 2.
Отметим, что каждая из заштрихованных фигур на рисунках 1. и 2. имеет площадь, равную a.
Уравнение (3) определяет двустороннюю критическую область. Такая область изображена на рисунке 3. Здесь критическая область состоит из двух частей. В случае двусторонней критической области границы ее частей K кр1 и K кр2 определяются таким образом, чтобы выполнялось условие:
P (K £ K кр) = P (K ³ K кр) = a / 2.
На рисунке 3. площадь каждой из заштрихованных фигур равна a / 2.
Вид критической области зависит от того, какая гипотеза выдвинута в качестве конкурирующей.
Чем меньше уровень значимости, тем меньше вероятность отвергнуть проверяемую гипотезу H 0, когда она верна, то есть совершить ошибку первого рода. Но с уменьшением уровня значимости расширяется область принятия гипотезы H 0 и увеличивается вероятность принятия проверяемой гипотезы, когда она неверна, то есть когда предпочтение должно быть отдано конкурирующей гипотезе.
Пусть при справедливости гипотезы H 0 статистический критерий K имеет плотность распределения p 0(x), а при справедливости конкурирующей гипотезы H 1 – плотность распределения p 1(x). Графики этих функций приведены на рисунке 4. При некотором уровне значимости находится критическое значение K кр и правосторонняя критическая область. Если значение K в, определенное по выборочным данным, оказывается меньше, чем K кр, то гипотеза H 0 принимается. Предположим, что справедлива на самом деле конкурирующая гипотеза H 1. Тогда вероятность попадания критерия в область принятия гипотезы H 0 есть некоторое число b, равное площади фигуры, образованной графиком функции p 1(x) и полубесконечной частью горизонтальной координатной оси, лежащей слева от точки K кр. Очевидно, что b – это вероятность того, что будет принята неверная гипотеза H 0.
Принятие неверной гипотезы называется ошибкой второго рода. В рассмотренном случае число b – это вероятность ошибки второго рода. Число 1 – b, равное вероятности того, что не совершается ошибка второго рода, называется мощностью критерия. На рисунке 4 мощность критерия равна площади фигуры, образованной графиком функции p 1(x).и полубесконечной частью горизонтальной координатной оси, лежащей справа от точки K кр. Выбор статистического критерия и вида критической области осуществляется таким образом, чтобы мощность критерия была максимальной.