Применяется для оценки различий в случаях, когда члены сравниваемых выборок связаны попарно некоторыми общими условиями.
Т – критерий определяют следующим образом:
1. Находят разность значений изучаемого признака для каждой сравниваемой сопряженной пары (до и после эксперимента). Пары наблюдений, которым соответствует нулевое изменение, из дальнейшего анализа исключают.
2. Присваивают ранги полученным разностям по возрастанию их абсолютной величины (без учета знака). Рангами одинаковых величин являются средние тех рангов (мест), которые они должны занять в упорядоченном ряду.
3. Присваивают каждому рангу знак в соответствии с направлением изменения: если значение увеличилось – «+», если уменьшилось – «-».
4. Определяют суммы рангов, имеющих одинаковые знаки и берут наименьшую из них. Эта сумма и является критерием Уилкоксона.
5. Сравнивают полученную величину критерия Уилкоксона с критическим значением его в таблице. Если , то нулевая гипотеза принимается. Если , то нулевая гипотеза отвергается.
4 пример. У 10 больных изучалось количество билирубина в желчи до и после введения антибиотиков. Определить существенность различий количества билирубина.
Нулевая гипотеза: нет статистического различия между двумя выборками, (нет статистического различия в количестве билирубина в желчи до и после введения антибиотиков).
Альтернативная гипотеза: есть статистическое различие между двумя выборками, (есть статистическое различие в количестве билирубина в желчи до и после введения антибиотиков).
Больные | Количество билирубина | Разность | Ранги | |
до введения антибиотиков | после введения антибиотиков | |||
А | +42 | |||
Б | +18 | |||
В | +50 | |||
Г | +80 | |||
Д | -10 | |||
Е | ||||
Ж | +60 | 6,5 | ||
З | +60 | 6,5 | ||
И | -40 | |||
К | +90 |
1) сумма рангов значений с плюсовым изменением Т(+)=4+2+5+8+6,5+6,5+9=41, сумма рангов со значением минус Т(-)=1+3=4.
|
2) оценивается меньшая из сумм (Т=4) при числе пар наблюдений, равном 9.
3) Оценочная таблица приводится в специальной литературе: по строчке для n=9 Т(α=0,05)= 6, для Т(α=0,01)=2. В нашем примере Т=4.
4) Следовательно, с вероятностью, большей 95% и меньшей 99%, можно утверждать о достоверном влиянии введения антибиотиков на увеличение билирубина в желчи.
2. Проверка гипотезы о виде распределения
Во многих случаях закон распределения изучаемой случайной величины неизвестен, но есть основания предположить, что он имеет вполне определенный вид (назовем его вид А). В таких случаях нулевая гипотеза Н0 формулируется следующим образом: Н0- генеральная совокупность распределена по закону А, под альтернативной гипотезой Н1 будем понимать в данном случае то, что не выполнена основная.
Для проверки согласованности результатов наблюдений с высказанным предположением используют специально подобранную величину- критерий согласия.
ОПРЕДЕЛЕНИЕ: Критерием согласия называют статистический критерий проверки гипотезы о предполагаемом законе неизвестного распределения.
Существуют различные критерии согласия: Пирсона (Хи-квадрат), Колмогорова, Фишера, Смирнова. Критерий согласия Пирсона- наиболее часто употребляемый критерий для проверки простой гипотезы о законе распределения.
|
Критерий согласия χ2 (хи-квадрат) Пирсона.
Пусть дано n измерений. Важно установить, можно ли описать эти n значений с помощью принятой теоретической модели. В качестве теоретической модели может выступать любая уже известная модель (нормального распределения, равномерного распределения или распределения Пуассона).
Для проверки выдвигают нулевую гипотезу – Н0: «между эмперическим распределением и теоретической моделью нет никакого различия».
Для проверки гипотезы Н0 поступают следующим образом.
Разбивают всю область значений случайной величины Х на κ интервалов. и подсчитвают вероятности Рі (і=1,2,...,к) попадания случайной величины Х (то есть наблюдения) в интервал , используя формулу Р(α≤Χ≤β)=F0(β)-F0(α). Тогда теоретическое число значений случайной величины Х попавших в интервал , можно рассчитать по формуле . Таким образом, имеем статистический ряд распределения случайной величины Х (1) и теоретический ряд распределения:
… | |||
… |
(2)
Если эмпирические частоты () сильно отличаются от теоретических (),то проверяемую гипотезу Но следует отвергнуть; в противном случае-принять.
Критерием, характеризующим степень расхождения между эмпирическими и теоретическими частотами предложил К. Пирсон (1857-1936 г.г., английский математик, статик, биолог, философ) , О –фактически наблюдаемое число, Е – теоретически ожидаемое число или ,(3) где n-объем выборки, k-число интервалов разбиения выборки, -число значений выборки, попавших в і-й интервал (обычно это число не должно быть меньше 5), - теоретическая частота попадания значений в і-й интервал.
|
Для распределений признаков, которые принимают всего 2 значения в формулу расчета критерия соответствия Хи-квадрат вносится поправка Йейтса
Согласно теореме Пирсона, статистика (3) имеет распределения с m=k-r-1 степениями свободы, где r-число параметров предполагаемого распределения. Если распределение нормально, то оценивают два параметра (а и ), поэтому число степеней свободы m=k-2-1.
Правило применения критерия
- Н0: «между эмперическим распределением и теоретической моделью нет никакого различия». Н1: «между эмперическим распределением и теоретической моделью есть различие».
- Выбираем уровень значимости α критерия.
- По формуле или вычисляют -выборочное значение статистики критерия.
- По таблице -распределения находим критическую точку
- Если ≤ , то гипотеза Н0 принимается; если > , то гипотеза Н0 отвергается.
Неоходимым условием применения критерия Пирсона является наличие в каждом из интервалов не менее 5 наблюдений (то есть ≥5). Если в отдельных интервалах их меньше, то число интервалов надо уменьшить путем объединения (укрепления) соседних интервалов.
АНАЛИЗ КАЧЕСТВЕННЫХ ПРИЗНАКОВ.
Задачи анализа.
Различные статистические процедуры, с которыми мы знакомились на предыдущих лекциях, предназначены для анализа количественных признаков. Примером таких признаков служат артериальное давление или продолжительность госпитализации. Единицей их измерения могут быть миллиметры ртутного столба или дни. Над значениями количественных признаков можно было проводить различные арифметические действия, их можно было упорядочить или расположить в возрастающем порядке.
Однако очень многие признаки невозможно измерить числом. Например, можно быть мужчиной или женщиной, врачом, юристом и т.д. Здесь мы имеем дело с качественными признаками. Эти признаки не связанны между собой никакими арифметическими соотношениями, упорядочить их тоже нельзя. Единственный способ описания качественных признаков состоит в том, чтобы подсчитать число объектов, имеющих одно и то же значение. Кроме того можно подсчитать какая доля от общего числа объектов приходится на то или иное значение.
Существует еще один вид признаков. Это порядковые признаки. Их можно упорядочить, но производить над ними арифметические действия нельзя. Например, категории тяжести состояния (легкая, средняя, тяжелая, крайне тяжелая степени).
Определение: Данные о частотах наблюдения изучаемого признака и уровнях неколичественных переменных называются категорированными. Такие данные сводятся в таблицы, получившие название частотных таблиц или таблиц сопряженности. Когда эта таблица имеет 2 ряда и 2 колонки, она называется таблицей 2х2.
встречаемость признака | не встречаемость признака | итого | |
1 метод лечения | a | b | a+b |
2 метод лечения | c | d | c+d |
всего | a+c | b+d | a+b+c+d=n |
При наличии частотной таблицы можно решить основные задачи исследования:
- определение относительных величин частоты наблюдений исследуемого признака и оценка их точности и надежности,
- проверка гипотез о значимости различия относительных величин частоты в различных группах, т.е. для различных категорий сочетаний уровней факторов.