Условия применения дисперсионного анализа ANOVA




Множественные сравнения.

 

Довольно часто возникает задача сравнения не двух групп (выборок), а нескольких – так называемая задача множественных сравнений. Например, различных возрастных, профессиональных, социальных слоев населения, или влияния различных доз препарата, методов диагностики и т.д.

При исследовании нового лекарственного препарата нас может интересовать не только вопрос о достоверности влияния препарата на величину некоторого параметра Х (например, систолического давления или уровня холестерина), но и значимо ли воздействие различных доз препарата. То есть нам надо изучить влияние фактора Дозы(F1), а выборки (группы) составленные из значений параметра Х для различных доз называются – уровни фактора дозы. Так же нас может интересовать фактор Времени (F2), когда применяют препарат (утро, день вечер или более мелкая градация – это уровни фактора Времени) и влияние фактора Возраста пациента (F3) и т.д.

В этом случае рекомендуется на начальном этапе провести факторный дисперсионный анализ, который позволяет ответить на вопрос, значимо ли хотя бы одно отличие между сравниваемыми группами. Нулевая гипотеза о равенстве всех средних (медиан) проверяется по параметрическому критерию Фишера или непараметрическому аналогу – критерию Краскела-Уолиса.

Казалось бы зачем нужен дисперсионный анализ если существует такой прекрасный и понятный статистический критерий, как т -критерий Стьюдента?

Главное ограничение т -критерия перед дисперсионным анализом состоит в том, что первый предназначен для парных сравнений, то есть ситуации, когда у нас есть только две выборки и он нуждается в поправках на множественные сравнения, в случае, если у нас более двух групп (выборок). Во-вторых, представим, если у нас 6 групп и мы ищем статистически значимые различия между ними, сколько попарных сравнений в таком случае нужно сделать?

Много ().

 

Проблема множественных сравнений.

Если на одном и том же наборе данных выполняется многократная проверка гипотез, то при проверке каждой статистической гипотезы закладывается возможность ошибки первого рода (т.е. отклонение верной нулевой гипотезы). Чем больше гипотез мы проверяем на одних и тех же данных, тем больше будет вероятность допустить как минимум одну такую ошибку. Это явление называют эффектом множественных сравнений (multiple testing)...

Пусть имеем три выборки А, В и С. Сравнение по критерию Стьюдента, Уровень значимости – a=0,05.

При сравнении групп A и В риск ошибиться с вероятностью 5%.(α=0,05) Точно такая же вероятность ошибки будет иметь место и при сравнении В с С и А с С. Соответственно, вероятность ошибиться хотя бы в одном из этих трех сравнений составит:

 

Это гораздо выше 0,05.

 

Очевидно, что дальнейшее увеличение числа проверяемых гипотез будет неизбежно сопровождаться и возрастанием в каждом отдельном тесте ошибки 2 рода (снижение мощности критерия).

 

В таком случае необходимо использоваться критерий, который предназначен для ситуаций, когда сравнивается большое число групп и который нам даст единый ответ на все изучаемые группы — дисперсионный анализ.

 

Дисперсионный анализ.

 

В зарубежной литературе дисперсионный анализ часто обозначается как ANOVA, что переводится как анализ вариативности (Analysis of Variance).

Дисперсионный анализ был разработан английским математиком – статистиком Р. Фишером в 1918 г. для обработки результатов агрономических опытов по выявлению условий получения максимального урожая различных сортов сельскохозяйственных культур.

Дисперсионный анализэто статистический метод, предназначенный для оценки влияния различных факторов на результат эксперимента, а также для последующего планирования аналогичных экспериментов. То есть в результате проведения эксперимента мы получаем несколько выборок для каждого фактора (уровни фактора), которые мы и должны сравнивать.

Условия применения дисперсионного анализа ANOVA

Перед тем как приступить к применению дисперсионного анализа, который предназначен для минимизации риска неправильной оценки ошибки 1 рода в случае множественных сравнений необходимо убедиться в соблюдении ряда условий:

1. Непрерывный тип данных, дискретные данные менее желательны.

2. Независимые между собой выборки.

3. Нормальное распределение признака в статистических совокупностях, из которых извлечены выборки. (Дисперсионный анализ – это параметрический критерий)

4. Равенство дисперсий изучаемого признака в статистических совокупностях, из которых извлечены выборки.

5. Независимые наблюдения в каждой из выборок.

Если данные не подчиняются нормальному распределению, то при анализе можно использовать два способа: применением различных арифметических преобразований до достижения нормальности распределения и дальше уже применять дисперсионный анализ, или использовать критерий Краскела-Уоллиса (Kruskal-Wallis H-test), иногда его также называют непараметрическим дисперсионным анализом.

 

Метод дисперсионного анализа базируется на предположении о том, что если на объект (группу испытуемых) влияет несколько независимых факторов и их влияние складывается, то общую дисперсию значений признака, характеризующую объект (группу испытуемых) можно разложить на сумму дисперсий, возникающих в результате воздействия каждого отдельного фактора, а также обусловленных случайными влияниями (остаточная дисперсия). Сравнение дисперсий обусловленных влиянием различных факторов со случайной (остаточной) дисперсией позволяет оценить значимость вклада каждого из факторов, то есть оценить достоверность этих влияний.

Иногда дисперсионный анализ применяется, чтобы установить однородность нескольких совокупностей. А именно: если дисперсии этих совокупностей одинаковы (по предположению) и если математические ожидания одинаковы то можно считать, что совокупности однородны. Однородные совокупности можно объединить в одну и тем самым упростить исследования и получить более полную информацию, более надёжные выводы.

С помощью дисперсионного анализа исследователи из детской больницы в городе Питсбурге (США) получили первые доказательства того, что при ОРВИ повышается уровень гистамина, что проявляется в моче на 2-5 сутки вирусной инфекции, вызванной вирусом А. (Гистамин – основной эндогенный (внутренний) медиатор (фактор)аллергических реакций).

По числу факторов влияние которых исследуется, различают однофакторный и многофакторный дисперсионный анализ.

 

 



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2018-12-21 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: