Сначала формулируется нулевая гипотеза, то есть предполагается, что исследуемые факторы не оказывают никакого влияния на значения результативного признака и полученные различия случайны.
Затем определяем, какова вероятность получить наблюдаемые (или более сильные) различия при условии справедливости нулевой гипотезы.
Если эта вероятность мала*, то мы отвергаем нулевую гипотезу и заключаем, что результаты исследования статистически значимы. Это еще не означает, что доказано действие именно изучаемых факторов (это вопрос, прежде всего, планирования исследования), но все же маловероятно, что результат обусловлен случайностью.
__________________________________
* Максимальную приемлемую вероятность отвергнуть верную нулевую гипотезу называют уровнем значимости и обозначают α = 0,05.
При выполнении всех условий применения дисперсионного анализа, разложение общей дисперсии математически выглядит следующим образом:
Doбщ. = Dфакт + D ост.,
Doбщ . - общая дисперсия наблюдаемых значений (вариант), характеризуется разбросом вариант от общего среднего. Измеряет вариацию признака во всей совокупности под влиянием всех факторов, обусловивших эту вариацию. Общее разнообразие складывается из межгруппового и внутригруппового;
Dфакт - факторная (межгрупповая) дисперсия, характеризуется различием средних в каждой группе и зависит от влияния исследуемого фактора, по которому дифференцируется каждая группа. Например, в группах различных по этиологическому фактору клинического течения пневмонии средний уровень проведенного койко-дня неодинаков — наблюдается межгрупповое разнообразие.
D ост. - остаточная (внутригрупповая) дисперсия, которая характеризует рассеяние вариант внутри групп. Отражает случайную вариацию, т.е. часть вариации, происходящую под влиянием неуточненных факторов и не зависящую от признака — фактора, положенного в основание группировки. Вариация изучаемого признака зависит от силы влияния каких-то неучтенных случайных факторов, как от организованных (заданных исследователем), так и от случайных (неизвестных) факторов.
|
Поэтому общая вариация (дисперсия) слагается из вариации, вызванной организованными (заданными) факторами, называемыми факториальной вариацией и неорганизованными факторами, т.е. остаточной вариацией (случайной, неизвестной).
Классический дисперсионный анализ проводится по следующим этапам:
1) Построение дисперсионного комплекса.
2) Вычисление средних квадратов отклонений.
3) Вычисление дисперсии.
4) Сравнение факторной и остаточной дисперсий.
5) Оценка результатов с помощью теоретических значений распределения Фишера-Снедекора (приложение N 1).
АЛГОРИТМ ПРОВЕДЕНИЯ ДИСПЕРСИОННОГО АНАЛИЗА ПО УПРОЩЕННОМУ ВАРИАНТУ
Алгоритм проведения дисперсионного анализа по упрощенному способу позволяет получить те же результаты, но расчеты выполняются значительно проще:
I этап. Построение дисперсионного комплекса
Построение дисперсионного комплекса означает построение таблицы, в которой были бы четко разграничены факторы, результативный признак и подбор наблюдений (больных) в каждую группу.
Однофакторный комплекс состоит из нескольких градаций одного фактора (А). Градации — это выборки из разных генеральных совокупностей (А1, А2, АЗ).
|
Двухфакторный комплекс — состоит из нескольких градаций двух факторов в комбинации между собой. Этиологические факторы заболеваемостью пневмонией те же (А1, А2, АЗ) в сочетании с разными формами клинического течения пневмонии (Н1 — острое, Н2 — хроническое).
II этап. Вычисление общей средней (Мобш)
Вычисление суммы вариант по каждой градации факторов: Σ Vj = V1 + V2 + V3
Вычисление общей суммы вариант (Σ Vобщ) по всем градациям факторного признака: Σ Vобщ = Σ Vj1 + Σ Vj2 + Σ Vj3
Вычисление средней групповой (Мгр.) факторного признака: Мгр. = Σ Vj / N,
где N — сумма числа наблюдений по всем градациям факторного I признака (Σn по группам).
III этап. Расчет дисперсий:
При соблюдении всех условий применения дисперсионного анализа математическая формула выглядит следующим образом:
Doбщ. = Dфакт + D ост.
Doбщ. - общая дисперсия, характеризуется разбросом вариант (наблюдаемых значений) от общего среднего;
Dфакт. - факторная (межгрупповая) дисперсия, характеризует разброс групповых средних от общего среднего;
Dост . - остаточная (внутригрупповая) дисперсия, характеризует рассеяние вариант внутри групп.
1) Вычисление факториальной дисперсии (Dфакт.): Dфакт. = Σ h - H
2) Вычисление h проводится по формуле: h = (Σ Vj) / N
3) Вычисление Н проводится по формуле: H = (Σ V)2 / N
4) Вычисление остаточной дисперсии: Dост. = (Σ V)2 - Σ h
5) Вычисление общей дисперсии: Doбщ. = (Σ V)2 - Σ H
IV этап. Расчет основного показателя силы влияния изучаемого фактора Показатель силы влияния (η2) факторного признака на результат определяется долей факториальной дисперсии (Dфакт.) в общей дисперсии (Doбщ.), η2(эта) — показывает какую долю занимает влияние изучаемого фактора среди всех других факторов и определяется по формуле:
|
V этап. Определение достоверности результатов исследования методом Фишера проводят по формуле:
F - критерий Фишера;
Fst. - табличное значение (см.приложение 1).
σ2факт, σ2ост. - факториальная и остаточная девиаты (от лат. de — от, via - дорога) — отклонение от средней линии, определяются по формулам:
r - число градаций факторного признака.
Сравнение критерия Фишера (F) со стандартным (табличным) F проводят по графам таблицы с учетом степеней свободы:
v1 = n — 1
v2 = N — 1
По горизонтали определяют v1 по вертикали — v2, на их пересечении определяют табличное значение F, где верхнее табличное значение р ≥ 0,05, а нижнее соответствует р > 0,01, и сравнивают с вычисленным критерием F. Если значение вычисленного критерия F равно или больше табличного, то результаты достоверны и Н0 не отвергается.
Вывод. В выборочном комплексе выявлено, что сила влияния стажа работы на уровень травматизма составляет 80% в общем числе других факторов. Для всех цехов завода можно с вероятностью 99,7% (13,3 > 8,7) утверждать, что стаж работы влияет на уровень травматизма.
Таким образом, нулевая гипотеза (Н0) не отвергается и влияние стажа работы на уровень травматизма в цехах завода А считается доказанным.