§1. Понятие о дисперсионном анализе.
Пусть генеральные совокупности X1, X2, …, Xp имеют нормальное распределение, их дисперсии неизвестны, но одинаковы. Требуется при заданном уровне значимости по выборочным средним проверить нулевую гипотезу о равенстве математических ожиданий.
H0: M(X1) = M(X2) =…= M(Xp)
Для сравнения нескольких средних принимается метод, который основан на сравнении дисперсий и поэтому называется дисперсионным анализом. На практике дисперсионный анализ применяют, чтобы оценить влияние некоторого качественного фактора F, имеющего p постоянных уровней на случайную величину X. Конкретные значения фактора называются его уровнями.
Например:
X – вес урожая
F – виды удобрений
Идея дисперсионного анализа заключается в сравнении факторной дисперсии, т.е. дисперсии, обусловленной воздействием фактора F c остаточной дисперсией, которая вызвана случайными причинами. Если различие между этими дисперсиями значимо, то фактор оказывает существенное влияние на случайную величину X. В этом случае групповые средние на каждом уровне будут отличаться от общей средней. В более сложных случаях исследуют воздействие нескольких факторов на нескольких уровнях и выясняют влияние отдельных уровней и их комбинаций (многофакторный анализ). Мы рассмотрим случай однофакторного анализа, когда на случайную величину X действует один фактор F, имеющий p постоянных уровней.
§2. Общая факторная и остаточная суммы квадратов отклонений.
Пусть на нормально распределённую случайную величину X действует фактор F, имеющий p постоянных уровней, на каждом уровне q наблюдений, всего наблюдений xij, i – номер испытания (i =1,2,…, q), j – номер уровня фактора (j =1,2,…, p).
xij – наблюдение на j -м уровне с номером i.
№ наблю-дения | Уровни фактора F | |||
F 1 | F 2 | … | Fp | |
… q | x11 x21 … Xq1 | X12 x22 … Xq2 | X1p X2p … Xqp | |
Групповые средние | ![]() | ![]() | ![]() |
Будем называть общей суммой квадратов отклонения вариант от общей средней .
Факторная сумма квадратов отклонений групповых средних от общей средней.
Остаточной суммой квадратов отклонений вариант группы от своей групповой средней.
Можно доказать, что .
§3. Общая факторная и остаточная дисперсии.
Общую выборочную дисперсию найдём, разделив на число наблюдений
:
. Эта оценка является смещённой.
Чтобы получить несмещённую оценку общей выборочной дисперсии: .
Разделив и
на соответствующее число степеней свободы, получим факторную и остаточную дисперсии:
и
.
§4. Сравнение нескольких средних методом дисперсионного анализа.
Пусть требуется при заданном уровне значимости проверить нулевую гипотезу о равенстве нескольких средних (p >2), нормальных в совокупности с неизвестными, но одинаковыми дисперсиями. Решение этой задачи сводится к сравнению факторной и остаточной дисперсии по критерию Фишера.
1. Пусть нулевая гипотеза о равенстве нескольких групповых средних верна, в этом случае факторная и остаточная дисперсии являются несмещёнными оценками неизвестной генеральной дисперсии и поэтому различаются незначимо. Если сравнить эти оценки по критерию Фишера, то очевидно, критерий укажет, что нулевую гипотезу о равенстве факторной и остаточной дисперсий следует принять.
Вывод: если гипотеза о равенстве групповых средних верна, то верна и гипотеза о равенстве факторной и остаточной дисперсий.
2. Пусть нулевая гипотеза о равенстве групповых средних неверна, т.е. групповые средние отличаются друг от друга значимо, тогда с возрастанием расхождения между групповыми средними будет увеличиваться факторная дисперсия, и будет увеличиваться отношение .
. В итоге F > Fкр и, следовательно, гипотеза о равенстве факторной и остаточной дисперсий будет отвергнута.
Вывод: если гипотеза о равенстве групповых средних неверна, то неверна и гипотеза о равенстве факторной и остаточной дисперсий. Справедливо и обратное утверждение: если верна (неверна) гипотеза о дисперсиях, то верна (неверна) гипотеза о равенстве средних.
Чтобы проверить нулевую гипотезу о равенстве групповых средних нормальных совокупностей с одинаковыми дисперсиями, достаточно проверить по критерию Фишера нулевую гипотезу о равенстве факторной и остаточной дисперсий. В этом и состоит метод дисперсионного анализа.