Лабораторная работа №2
Статистическая проверка гипотез
Цель работы
Освоение методов статистической проверки гипотез о равенстве математических ожиданий в Пакете анализа Microsoft Excel.
Общие сведения
Двухвыборочный z-тест для средних
Это средство применяется для проверки гипотезы о равенстве (неравенстве) математических ожиданий двух независимых генеральных совокупностей (большие независимые выборки), имеющих нормальное распределение, при известных дисперсиях этих распределений. Пусть имеются две независимые выборки х1, х2,..., хп и у1, у2 , … уm объемом соответственно п и т, извлеченные из совокупностей, имеющих нормальные распределения с известными дисперсиями σ12 и σ22 и неизвестными математическими ожиданиями соответственно μ1 и μ2. Проверяется нулевая гипотеза Но: μ1 - μ2 = δ (δ задано). Z-тест позволяет проверить гипотезу Но против разных конкурирующих гипотез: Н1: μ1 ≠ μ2 + δ или Н1: μ1 > μ2 + δ, либо Н1: μ1 < μ2 + δ. Критериальная статистика вычисляется по формуле
,
где и — выборочные средние соответственно первой и второй выборок.
Для выборок из нормально распределенных генеральных совокупностей критериальная статистика z имеет стандартное нормальное распределение. Поэтому при заданном уровне значимости α критическая область строится на основе стандартного нормального распределения — вычисляется квантиль t порядка (1 — α) для проверки гипотезы о равенстве, либо квантиль t порядка (1 - α/2) для проверки гипотез неравенства. Нулевая гипотеза о равенстве принимается, если (в противном случае отвергается); гипотеза Но при конкурирующей гипотезе Н1: μ1 > μ2 + δ принимается, если ; и при конкурирующей гипотезе Н1: μ1 < μ2 + δ нулевая гипотеза принимается при выполнении неравенства .
|
Рассмотрим пример. Имеется две выборки[1] объемом соответственно 50 и 20 значений, показанные на рис. 2.1. Обе имеют нормальное распределение, первая — стандартное (т.е. μ1 = 0 и σ12= 1), а для второй μ2 = 1 и σ22=2. Проверим с помощью средства Двухвыборочныи z-тест для средних нулевую гипотезу, что μ2 — μ1 = 1,5 для разных случаев конкурирующих гипотез. Заполненное диалоговое окно для этого примера также показано на рис.2.1а.
Рис.2.1а Исходные данные и диалоговое окно Двухвыборочныи z-mecm для средних
Отметим, что средство требует, чтобы δ, значение которого задается в поле Гипотетическая средняя разность, было неотрицательно. Поэтому первым (в поле ввода Интервал переменной 1) задается адрес диапазона ячеек, содержащий выборку с большим математическим ожиданием, а затем в поле Интервал переменной 2 указывается адрес второй выборки. В полях ввода Дисперсия переменной 1 и Дисперсия переменной 2 вводятся значения дисперсий соответственно первой и второй выборок. В поле Альфа вводится значение уровня значимости α.
Для удобства анализа результатов сформируем исходные данные таким образом, чтобы выборка с большим математическим ожиданием расположилась в первом столбце. В нашем примере необходимо поменяем местами исходные выборки. Итак, имеем две выборки объемом соответственно 20 и 50 значений, показанные на рис. 2.1б. Обе имеют нормальное распределение, параметры первой — μ2 = 1 и σ22=2; вторая имеет стандартное распределение (т.е. μ1 = 0 и σ12= 1). Проверим с помощью средства Двухвыборочныи z-тест для средних нулевую гипотезу, что μ1 — μ2 = 1,5 для разных случаев конкурирующих гипотез. Заполненное диалоговое окно для этого примера также показано на рис.2.1б. Результат вычислений средства Двухвыборочный z-тест для средних показан на рис.2.2.
|
Рис.2.1б Исходные данные и диалоговое окно Двухвыборочныи z-mecm для средних
Рис.2.2. Результат вычислений
В итоговой таблице приводятся следующие данные:
• Среднее — выборочные средние выборок.
• Известная дисперсия — дисперсии выборок, которые указаны в диалоговом окне.
• Наблюдения — объемы выборок.
• Гипотетическая разность средних — значение δ, которое задано в диалоговом окне.
• z — значение критериальной статистики.
• P(Z<=z) одностороннее — вероятность P(X≤z), где X — случайная величина, распределенная по стандартному нормальному закону, z — подсчитанное значение критериальной статистики.
• zкритическое одностороннее — значение квантиля порядка (1 - α/2).
• P(Z<=z) двухстороннее — вероятность P(|X|≤|z|), где X — случайная величина, распределенная по стандартному нормальному закону, z — подсчитанное значение критериальной статистики.
• z критическое двухстороннее — значение квантиля порядка (1 - α).
Как видно из результатов расчета, в данном примере нет оснований отвергать нулевую гипотезу при любых конкурирующих гипотезах.
Статистическая функция ZTECT вычисляет вероятность P(Z ≤ z)двухстороннее.