Статистическая проверка гипотез

Под статистической гипотезой H понимают любое предположение о генеральной совокупности (случайной величине), проверяемое по выборке. Это может быть предположение о виде распределения генеральной совокупности, о равенстве двух выборочных дисперсий, о независимости выборок, об однородности выборок, что закон распределения не меняется от выборки к выборке и др.

Гипотеза называется простой, если она однозначно определяет какое-либо распределение или какой-либо параметр; в противном случае гипотеза называется сложной. Например, простой гипотезой является предположение о том, что случайная величина X распределена по стандартному нормальному закону N (0;1); если же высказывается предположение, что случайная величина X имеет нормальной распределение N (m;1), где a £ m £ b, то это сложная гипотеза.

Проверяемая гипотеза называется основной или нулевой гипотезой и обозначается символом H ₀. Наряду с основной гипотезой рассматривают и противоречащую ей гипотезу, которую обычно называют конкурирующей или альтернативной гипотезой и обозначают символом H ₁. Если основная гипотеза будет отвергнута, то имеет место альтернативная гипотеза. Например, если проверяется гипотеза о равенства параметра q некоторому заданному значению q₀, т.е. H ₀:q=q₀, то в качестве альтернативной гипотезы можно рассмотреть одну из следующих гипотез: H ₁:q>q₀, H ₂:q<q₀, H ₃:q¹q₀, H ₄:q=q₁. Выбор альтернативной гипотезы определяется конкретной формулировкой задачи.

Выдвинутая гипотеза может быть правильной или неправильной, поэтому возникает необходимость ее проверки. Поскольку проверка осуществляется статистическими методами, то в связи с этим с определенной долей вероятности может быть принято неправильное решение. Здесь могут быть допущены ошибки двух видов. Ошибка первого рода состоит в том, что будет отвергнута правильная гипотеза. Вероятность ошибки первого рода обозначают буквой a, т.е.

Ошибка второго рода состоит в том, что будет принята неправильная гипотеза. Вероятность ошибки второго рода обозначают буквой b, т.е.

Последствия указанных ошибок неравнозначны. Первая приводит к более осторожному, консервативному решению, вторая – к неоправданному риску. Что лучше или хуже – зависит от конкретной постановки задачи и содержания нулевой гипотезы. Например, если H ₀ состоит в признании продукции предприятия качественной и допущена ошибка первого рода, то будет забракована годная продукция. Допустив ошибку второго рода, мы отправим потребителю брак. Очевидно, что последствия ошибки второго рода более серьезны с точки зрения имиджа фирмы и ее долгосрочных перспектив.

Исключить ошибки первого и второго рода невозможно в силу ограниченности выборки. Поэтому стремятся минимизировать потери от этих ошибок. Отметим, что одновременное уменьшение вероятностей данных ошибок невозможно, т.к. задачи их уменьшения являются конкурирующими. И снижение вероятности допустить одну из ошибок влечет за собой увеличение вероятности допустить другую ошибку. В большинстве случаев единственный способ уменьшения обеих вероятностей состоит в увеличении объема выборки.

Правило, в соответствие с которым принимается или отклоняется основная гипотеза, называется статистическим критерием. Для этого подбирается такая случайная величина K, распределение которой точно или приближенно, известно и которая служит мерой расхождения между опытными и гипотетическими значениями.

Для проверки гипотезы по данным выборки вычисляют выборочное (или наблюдаемое) значение критерия K _набл. Затем, в соответствии с распределением выбранного критерия, строится критическая область K _крит. Это такая совокупность значений критерия, при которых нулевую гипотезу отвергают. Оставшуюся часть возможных значений называют областью принятия гипотезы. Если ориентироваться на критическую область, то можно совершить ошибку
1-го рода, вероятность которой задана заранее и равна a, называемой уровнем значимости гипотезы. Отсюда вытекает следующее требование к критической области K _крит:

Уровень значимости a определяет "размер" критической области K _крит. Однако ее положение на множестве значений критерия зависит от вида альтернативной гипотезы. Например, если проверяется нулевая гипотеза H ₀:q=q₀, а альтернативная гипотеза имеет вид H ₁:q>q₀, то критическая область будет состоять из интервала (K₂, +¥), где точка K₂ определяется из условия P (K>K₂)=a (правосторонняя критическая область). Если альтернативная гипотеза имеет вид H ₂:q<q₀, то критическая область будет состоять из интервала (–¥;K₁), где точка K₁ определяется из условия P (K<K₂)=a (левосторонняя критическая область). Если альтернативная гипотеза имеет вид H ₃:q¹q₀, то критическая область будет состоять из двух интервалов (–¥;K₁) и (K₂, +¥), где точки K₁ и K₂ определяются из условий: P (K>K₂)=a/2 и P (K<K₂)=a/2 (двухсторонняя критическая область) (рис.3.2).

Основной принцип проверки статистических гипотез можно сформулировать следующим образом. Если K _набл попадает в критическую область, то гипотеза H ₀ отвергается и принимается гипотеза H ₁. Однако поступая таким образом, следует понимать, что здесь можно допустить ошибку 1-го рода с вероятностью a. Если K _набл попадает в область принятия гипотезы – то нет оснований, чтобы отвергать нулевую гипотезу H ₀. Но это вовсе не означает, что H ₀ является единственно подходящей гипотезой: просто расхождения между выборочными данными и гипотезой H ₀ невелико. Однако таким же свойством могут обладать и другие гипотезы.

Критерии, используемые для проверки гипотез о параметрах распределения, называются критериями значимости. В частности, построение критической области аналогично построению доверительного интервала. Критерии, используемые для проверки согласия между выборочным распределением и гипотетическим теоретическим распределением, называются критериями согласия.

Общая схема статистической проверки гипотез:

1. Формулируется основная H ₀ и альтернативная H ₁ гипотезы.

2. Выбирается соответствующий уровень значимости a.

3. Определяется объем выборки n.

4. Выбирается критерий K для проверки H ₀.

5. Определяется критическая область и область принятия решения (в соответствии с выбранной альтернативной гипотезой).

6. Вычисляется наблюдаемое значение критерия K _набл (по данным выборки).

7. Принимается статистическое решение. Если K _набл попадает в область принятия решений, то нет оснований отклонять основную гипотезу, и она принимается. Если K _набл попадает в критическую область, то основная гипотеза отвергается.

Пример 3.5. Утверждается, что шарики, изготовленные станком-автоматом, имеют средний диаметр d ₀=10 мм. В выборке из n =16 шариков средний диаметр оказался равным мм. Проверить нулевую гипотезу H ₀: , считая, что дисперсия известна и равна s²=1 мм ². Считать уровень значимости a=0,05.

Решение. Введем статистический критерий:

который при справедливости нулевой гипотезы H ₀, имеет стандартное нормальное распределение N (0;1). Пусть альтернативная гипотеза имеет вид H ₁: , то критическая область будет иметь двухсторонний вид: (–¥;– Z_крит)È(Z_крит;+¥), где Z_крит определяется из условия

или

Критическое значение Z_крит находится из таблиц значений функции Лапласа (см. приложение 2).

Поскольку

не попадает в критическую область, то нет оснований отклонять нулевую гипотезу, т.е. что шарики, изготовленные станком-автоматом, имеют средний диаметр 10 мм.

Пример 3.6. Анализируются доходы X фирм в отрасли, имеющих нормальное распределение. Предполагается, что средний доход в данной отрасли составляет не менее 1 млн $. По выборке из 49 фирм получены следующие данные: млн $ и s =0,15 млн $. Не противоречат ли эти результаты выдвинутой гипотезе при уровне значимости a=0,01?

Решение. Сформулируем основную и альтернативную гипотезы:

, .

Для проверки гипотезы H ₀ строим критерий

Критическая область будет левосторонней, поэтому

Поскольку T_набл =–4,67<–2,404= T_крит, то H ₀ должна быть отклонена в пользу H ₁, что дает основание считать, что средний доход в отрасли меньше, чем 1 млн $.

Часто функция распределения случайной величины бывает заранее неизвестна, и возникает необходимость ее определения по эмпирическим данным. Во многих случаях из некоторых дополнительных соображений могут быть сделаны предположения о виде функции распределения F (x). На практике часто используют нормальное распределение, однако в некоторых случаях может возникнуть вопрос о законности использования нормального распределения в том или ином конкретном случае. В таких случаях нужно использовать статистические критерии, которые обосновывали бы тот или иной выбор распределения.

Наиболее распространенным является c²–критерий Пирсона. Рассмотрим этот критерий. Для этого разобьем множество значений случайной величины X на r интервалов S ₁, S ₂, …, S_r. Пусть p_i – вероятность того, что величина X принадлежит интервалу S_i; n_i – количество величин из числа наблюдаемых X ₂, …, X_n, принадлежащих интервалу S_i. Далее рассматривается величина

, (3.22)

При достаточно больших n эта величина будет описываться c²–распределением Пирсона с n = r– 1 -m, где m – число параметров распределения (для нормального распределения m =2).

Отметим, что критерий Пирсона применяется только при достаточно больших выборках (n t50) и достаточно больших частотах (n_i ³5). Если последнее условие не выполняется для какого-либо интервала вариационного ряда, то его объединяют с соседним интервалом, соответственно уменьшая общее число интервалов.

Схема применения критерия согласия Пирсона:

1. Вычисляются параметры предполагаемого закона распределения.

2. Вычисляются теоретические частоты .

3. Вычисляют величину

4. .

5. По вычисленному числу степеней свободы n= r –1– m, где r – число интервалов выборки, m – число параметров распределения и по выбранному уровню значимости a по таблицам распределения c², находят .

6. Если , то нет оснований отклонять нулевую гипотезу, если – нулевая гипотеза отвергается.

Пример 3.7.: Используя коэффициенты асимметрии и эксцесса, сделать соответствующие предположения о виде функции распределения генеральной совокупности по данным примера 3.1. Используя критерий Пирсона, проверить гипотезу о нормальности распределения генеральной совокупности при уровне значимости a=0,05.

Решение. Определим значимость коэффициентов асимметрии и эксцесса, вычисленных в примере 1. Для этого вычислим погрешность вычислений по формулам

Посмотрим теперь, попадают ли найденные значения в «трехсигмовый» интервал:

, .

Из полученных неравенств следует, что коэффициент асимметрии и эксцесс не значимо отличаются от нуля и есть все основания полагать, что распределение генеральной совокупности является нормальным.

В соответствии с критерием Пирсона сначала вычисляется величина

где p_i – вероятности, полученные по предполагаемому закону распределения. Ёще раз повторим, что c²-распределение можно применять только при достаточно большом объеме выборки (n t50) и достаточно больших частотах (n_i ³5). Ту группу вариационного ряда, для которых последнее условие не выполняется, объединяют с соседней и, соответственно, уменьшают число интервалов. В рассматриваемом случае мы должны объединить интервалы 1 и 2, а также 9 и 10 (см. таблицу).

i	x_i – x_i ₊₁	n_i
1	582-589		–0,4131	–0,4887	0,0756	6,804	0,709
	589-596
	596-603		–0,3159	–0,4131	0,0972	8,748	0,863
	603-610		–0,1700	–0,3159	0,1459	13,131	0,097
	610-617		0,0080	–0,1700	0,1780	16,020	1,562
	617-624		0,1844	0,0080	0,1764	15,876	0,080
	624-631		0,3264	0,1844	0,1420	12,780	1,118
	631-638		0,4192	0,3264	0,0928	8,352	0,219
9	638-645
	645-652		0,4898	0,4192	0,0706	0,0706	1,102
					0,9785	88,065	5,750

В предположении, что имеет место нормальное распределение, были оценены два параметра этого распределения: и . Если изучаемое распределение подчинено нормальному распределению, то вероятность того, что случайная величина X примет значение из интервала (x_i < X < x_i ₊₁), находится по формуле

где – функция Лапласа, значения которой табулированы и приводятся в таблицах.

Из расчетной таблицы видно, что

Теперь найдем критическое значение . Поскольку у предполагаемой модели были неизвестны оба параметра, поэтому m =2; при расчете критерия использовались восемь интервалов r =8. Таким образом, число степеней свободы n= r –1– m =5. При заданном уровне значимости из таблиц для c²-распределения находим

Поскольку , то нет оснований отвергать нулевую гипотезу, т.е. что исходное распределение является нормальным.

Статистическая проверка гипотез

Поиск по сайту