Тема: «Методы сравнительной статистики»




МЕТОДИЧЕСКИЕ РЕКОМЕНДАЦИИ

ДЛЯ ПРЕПОДАВАТЕЛЯ

К ПРАКТИЧЕСКОМУ ЗАНЯТИЮ №5

Тема: «Методы сравнительной статистики»

 

Утверждены на заседании кафедры

№ протокола …………….

«___»____________ 2011 г.

 

Заведующий кафедрой_________________________к.м.н., доцент Шульмин А.В.

 

Составитель_________________________________к.ф.-м.н., доцент Аршукова И.Л.

 

 

Красноярск


 

 

1. Тема занятия: «Методы сравнительной статистики»

2. Форма организации учебного процесса: практическое занятие.

3. Значение темы: Наиболее часто встречающейся и достаточно сложной математико-статистической задачей является сравнение выборочных распределений, полученных в процессе наблюдений или экспериментов. При получении численных различий в характеристиках сравниваемых рядов, возникает вопрос: какова вероятность, что эти различия неслучайны. Выбор подходящего метода сравнения определяется числом сопоставляемых групп, зависимостью или независимостью выборок, а также видом распределения исследуемого признака. Для решения задачи сравнения двух выборок требуется применение специальных математико-статистических критериев, которые делятся на два типа – параметрические и непараметрические.

4. Цели обучения:

Общая цельовладеть следующими компетенциями:

общекультурными:

способностью и готовностью анализировать социально значимые проблемы и процессы, использовать на практике методы гуманитарных, естественнонаучных, медико-биологических и клинических наук в различных видах профессиональной и социальной деятельности (ОК-1);

профессиональными:

способностью и готовностью выявлять естественнонаучную сущность проблем, возникающих в ходе профессиональной деятельности, использовать для их решения соответствующий физико-химический и математический аппарат (ПК-2);

способностью и готовностью к формированию системного подхода к анализу медицинской информации, опираясь на всеобъемлющие принципы доказательной медицины, основанной на поиске решений с использованием теоретических знаний и практических умений в целях совершенствования профессиональной деятельности(ПК-3);

способностью и готовностью проводить патофизиологический анализ клинических синдромов, обосновывать патогенетически оправданные методы (принципы) диагностики, лечения, реабилитации и профилактики среди взрослого населения и подростков с учетом их возрастно-половых групп (ПК- 6);

способностью и готовностью применять современные социально-гигиенические методики сбора и медико-статистического анализа информации о показателях здоровья взрослого населения и подростков на уровне различных подразделений медицинских организаций (акушерско-гинекологический, педиатрический сельский врачебный участок) в целях разработки научно-обоснованных мер по улучшению и сохранению здоровья мужчин и женщин (ПК-11);

способностью и готовностью управлять средним и младшим медицинским персоналом для обеспечения эффективности лечебного процесса; к анализу показателей деятельности медицинских организаций, к использованию современных организационных технологий профилактики, диагностики, лечения, реабилитации при оказании медицинских услуг в основных типах медицинских организаций (ПК-45);

способностью и готовностью изучать научно-медицинскую информацию, отечественный и зарубежный опыт по тематике исследования (ПК-50);

способностью и готовностью к освоению современных теоретических и экспериментальных методов исследования в медицине (ПК-51);

способностью и готовностью к участию в организации работ по практическому использованию и внедрению результатов исследований (ПК-52).

Учебная цель: Обучающиеся должны знать абсолютные и относительные показатели вариации признака в совокупности, уметь оценить достоверность результатов исследования.

5. Место проведения практического занятия: учебная комната.

6. Оснащение занятия: ноутбук, мультимедийный проектор.

7. Структура содержания темы (хронокарта, план занятия).

Схема хронокарты практического занятия

 

№ п/п Этапы практического занятия Продолжитель-ность (мин) Содержание этапа и оснащенность
1. Организация занятия   Проверка посещаемости и внешнего вида обучающихся
2. Формулировка темы и цели   Постановка темы, объяснение ее актуальности, целей занятия
3. Контроль исходного уровня знаний, умений   Тестирование, индивидуальный устный опрос, фронтальный опрос
4. Раскрытие учебно-целевых вопросов по теме занятия   Изложение теоретического материала по теме занятия
5. Работа на практических занятиях   Разбор учебных примеров и задач
6. Итоговый контроль знаний (письменно или устно)   Решение ситуационных задач по изучаемой теме
7. Задание на дом (на следующее занятие)   Учебно-методические разработки следующего занятия и методические разработки для внеаудиторной работы по теме
Всего:    

8. Аннотация (краткое содержание) темы.

Наиболее часто встречающейся и достаточно сложной математико-статистической задачей является сравнение выборочных распределений, полученных в процессе наблюдений или экспериментов. Будь то эксперимент или наблюдение, исследователь старается описать его результаты количественными методами и «на выходе» получает числовой массив тех или иных доступных ему измерений - вариационный ряд. Однако, как правило, содержащаяся в результатах измерений содержательная информация, представляя, несомненно, и самостоятельный интерес, имеет гораздо большую ценность при сравнении ее с аналогичной информацией, но полученной некоторым иным образом. Например, это может быть ситуация сравнения опытных данных (когда мы как-то повлияли на изучаемый объект или явление) с «контролем». Возможно и сравнение двух вариантов опытов. Возможно сравнение двух серий наблюдений, разделенных в пространстве и времени и т.п.

Допустим, что удается заметить какие-либо численные различия в характеристиках сравниваемых рядов. Первым делом возникает вопрос: какова вероятность, что эти различия неслучайны и имеют место не только «здесь и сейчас», но и будут систематически повторяться в дальнейшем при воспроизведении условий эксперимента или наблюдения.

Выбор подходящего метода сравнения выборочных совокупностей определяется несколькими факторами: числом сопоставляемых групп, зависимостью или независимостью выборок, а также видом распределения признака.

Выборки являются независимыми, если набор объектов исследования в каждую из групп осуществлялся независимо от того, какие объекты исследования включены в другую группу. Так, в частности, происходит при рандомизации, когда распределение объектов происходит случайным образом. Группы являются зависимыми (связанными), например, в следующих случаях: в исследованиях случай-контроль или в динамических исследованиях, когда изучаются одни и те же объекты в разные моменты времени.

От вида распределения и типа исследуемого признака зависит выбор подходящего математико-статистического критерия. Критерии делятся на два типа – параметрические и непараметрические.

Параметрические критерии – критерии, основанные на оценке параметров распределения. Они применимы только в том случае, если численные данные подчиняются нормальному распределению. Если распределение отличается от нормального, следует пользоваться так называемыми непараметрическими критериями.

Непараметрические критерии не основаны на оценке параметров распределения и вообще не требуют, чтобы данные подчинялись какому-то определенному типу распределения. Непараметрические критерии дают более грубые оценки, чем параметрические. А параметрические методы более точны, но лишь в случае, если правильно определено распределение совокупности.

 

Перед тем как перейти к рассмотрению статистических критериев, введем понятия нулевой и альтернативной гипотез, которые нам потребуются в дальнейшем.

На каждом шаге процесса анализа данных выдвигаются две гипотезы. Первая обозначается и называется нулевой гипотезой. Вторая гипотеза обозначается и носит название альтернативной,т.е. противоположной по смыслу. Под «нулевой гипотезой» подразумевается допущение об отсутствии того или иного интересующего исследователя события, явления или эффекта, а под «альтернативной» - о его наличии. Обе гипотезы, как бы они не были сформулированы, обязательно должны иметь взаимоисключающее содержание.

Нулевая гипотеза не можетбыть отвергнута, если ее вероятность окажется выше некого наперед заданного уровня α, достаточно близкого к 0, т.е. . Эта величина α носит название уровень значимости нулевой гипотезы.

Альтернативная гипотеза может быть принята лишь в том случае, если ее вероятность достигнет некого наперед заданного уровня β или превзойдет его, т.е. . Эта величина β – уровень доверительной вероятности. И соответствует «уровням безошибочных прогнозов», т.е. вероятностям 0.95, 0.99 и 0.999 – это область практически достоверных событий. Соответственно, α очерчивает область событий практически невозможных с порогами вероятностей 0.05, 0,01 и 0.001.

Поскольку и – альтернативные гипотезы, то их суммарная вероятность равна единице. Следовательно, рост вероятности одной из гипотез автоматически приводит к снижению вероятности другой. Например, если , это означает то, что будет выполняться условие . И в этом случае нулевая гипотеза может быть отвергнута как событие практически невозможное, а альтернативная должна быть принята как событие практически достоверное. Если же , то . И в этой ситуации нулевая гипотеза не может быть отвергнута, а альтернативная не может быть принята.

 

Рассмотрим параметрические критерии. Заключение о случайности или неслучайности наблюдаемых различий между выборочными распределениями в этом случае осуществляется на основании сравнения их параметров, т.е. сводных числовых характеристик. Параметров всего несколько, и каждый из них компактно в виде одного единственного числа отражает некие характерные свойства распределения данной случайной величины. Они являются количественными мерами этих свойств. На практике, как правило, рассматривают лишь два параметра - среднее значение, являющееся «мерой положения математического центра» полученного вариационного ряда, и дисперсию, но чаще всего корень из нее - стандартное отклонение, являющиеся мерой вариации. Именно для этих параметров еще в первой четверти XX века были разработаны два наиболее популярных критерия: критерий Стьюдента и критерий Фишера.

Критерий Стьюдента (t -критерий) – критерий, основанный на сравнении средних значений выборок. Критерий Стьюдента является наиболее известным. С одной стороны, анализ средних значений сравнительно прост для вычислений. С другой стороны, средние величины наиболее наглядны и понятны.

Наиболее часто t -критерий используется в двух случаях. В первом случае его применяют для проверки гипотезы о равенстве генеральных средних двух независимых, несвязанных выборок (так называемый двухвыборочный t -критерий). В этом случае есть контрольная группа и опытная группа, состоящая из разных пациентов, количество которых в группах может быть различно. Во втором же случае используется так называемый парный t-критерий, когда одна и та же группа объектов порождает числовой материал для проверки гипотез о средних. Поэтому эти выборки называют зависимыми, связанными. Например, измеряется содержание лейкоцитов у здоровых животных, а затем у тех же самых животных после облучения определенной дозой излучения. В обоих случаях должно выполняться требование нормальности распределения исследуемого признака в каждой из сравниваемых групп.

Рассмотрим выборку объемом - пусть среднее вариант этой выборки равно , среднеквадратичное отклонение . И выборку объемом со средним , среднеквадратичным отклонением . При этом , а выборки подчиняются нормальному закону распределения. Обозначим разницу средних значений выборок .

Нулевая гипотеза в данном случае гласит: «Наблюдаемая разница между выборочными средними была получена случайным образом. не выходит за пределы своих собственных случайных колебаний». Как говорилось выше, нулевая гипотеза не может быть отвергнута, если ее вероятность превысит некоторый порог , называемый уровнем значимости.

Альтернативная гипотеза утверждает противоположное: «Наблюдаемая разница между выборочными средними не могла быть получена случайным образом. Наблюдаемая разница средних выходит за пределы возможных случайных колебаний». Альтернативная гипотеза может быть принята, если ее вероятность сравняется с некоторым порогом или превысит его.

Проверка гипотез производится при помощи критерия Стьюдента, обозначаемого символом :

где - стандартная ошибка или мера отклонения наблюдаемой разницы выборочных средних от теоретически возможной, «генеральной». Формально величина t показывает, во сколько раз разница выборочных средних превышает свою собственную случайную вариацию.

В случае независимых выборок критерий t рассчитывается следующим образом:

Полученное значение критерия t сравнивают со стандартным табличным значением t-критерия Стьюдента для выбранного уровня значимости и числа степеней свободы . Если , нулевая гипотеза не может быть отвергнута и различие выборочных средних считается «статистически незначимым» (при этом обязательно указывается, при каком уровне значимости это имеет место). Если , то это означает что величина d оказалась за пределами своих собственных случайных колебаний. Такое различие называют «статистически значимым». Достоверность в статистическом смысле обозначает, что полученное различие предсказуемо: при повторении эксперимента или наблюдения в тех же условиях оно будет воспроизводиться с вероятностью β или более.

Рассмотрим теперь случай зависимых выборок. Это такие массивы данных, в которых каждому числовому значению одной выборки обязательно соответствует парное, причинно и следственно связанное значение другой выборки. Это имеет место, когда какие-либо характеристики состояния организма регистрируются до некоторого воздействия на него и после или при разных вариантах воздействия, но обязательно у одних и тех же людей. Простейший пример, когда у некой группы людей измерили частоту пульса и величину артериального давления, потом попросили сделать, скажем, 20 приседаний, и провели те же измерения повторно. Понятно, что реакция сердечно-сосудистой системы каждого человека будет весьма индивидуальной, причем результаты измерений, полученные «после того», будут находиться в причинной и «исторической» связи с исходным состоянием «до того», т.е. в зависимости от них.

В этом случае при обнаружении ненулевой разницы выборочных средних результатов «до того» и «после того» также рассчитывается критерий

Однако, величина рассчитывается иным образом:

- это разница парных вариант: , квадрат которой, как видно из формулы, суммируется по всем парам.

Хорошо заметно, что величина в данном случае зависит от того, насколько однородно будет изменяться измеряемая характеристика у разных объектов исследуемой группы. Действительно, если различие в каждой паре значений, полученных «до» и «после», будет нестабильно ( примерно с одинаковой вероятностью будет иметь то положительный, то отрицательный знак) или малосущественно (достаточно часто будут появляться нулевые парные разницы), то разница выборочных средних , естественно, будет стремиться к нулю. При этом непременно окажется больше нуля, даже в том крайнем случае, когда среди всех сравниваемых пар будет только одна единственная ненулевая разница. Напротив, если все парные различия будут иметь один и тот же знак (будут однонаправленными), то выборочные средние «до» и «после» существенно разойдутся на числовой оси и, соответственно, величина d окажется достаточно велика. Это приведет к снижению и, следовательно, увеличению критерия Стьюдента.

Проверка справедливости гипотез при этом производится так же, как и для независимых выборок:

- если , то различие выборочных средних признается статистически значимым;

- если , разница признается незначимой.

Различие лишь в том, что число степеней свободы для определения табличного значения в данном случае составляет , где n – число сравниваемых пар.

Упомянем также о ситуации, когда для установления достоверности различия средних результатов никаких расчетов с применением критерия Стьюдента просто не требуется. Это возможно в ситуации, когда максимальное значение одного из сравниваемых выборочных вариационных рядов заведомо меньше минимального значения другого вариационного ряда. Иными словами, значения обоих выборок занимают совершенно разные, не накладывающиеся друг на друга даже частично области на числовой оси. Если такое имеет место, то критерий Стьюдента лишь подтвердит заведомую (притом крайне высокую) достоверность различий средних значений сравниваемых выборок. Однако, такая «экспресс-оценка» достоверности возможна лишь в том случае, если сравниваемые выборки достаточно представительны -имеют объем порядка полутора десятков значений или более. Понятно также, что если числовые области сравниваемых выборок в той или иной степени пересекаются, накладываются друг на друга, т.е. верхняя граница (максимум) одной из них перекрывает нижнюю границу(минимум) другой, то применение критерия Стьюдента для оценки достоверности различий средних значений таких выборок просто неизбежно.

 

Критерий Фишера – критерий сравнения выборочных дисперсий.

 
 

На практике часто встречается ситуация, когда факторы, влияющие на состояние изучаемых объектов и, соответственно, отражающие это состояние через те или иные количественные характеристики, вызывают не только и даже не столько сдвиг этих характеристик на числовой оси, сколько усиливают или ослабляют их межиндивидуальное разнообразие. Внешне это выражается в различиях сравниваемых выборок по уровню дисперсии, как раз и являющейся мерой вариации (случайного разнообразия). Схематически эти ситуации представлены на рисунке.

 

В левой его части изображена ситуация, когда распределения занимают разные области числовой оси и, следовательно, имеют разные средние значения, но, кроме того, обладают разной вариабельностью и, соответственно, разной по величине дисперсией. В правой части рисунка приведен пример того случая, когда распределения имеют одинаковые или очень близкие средние значения, но совершенно разный уровень вариации.

Особенно «коварной» является ситуация, изображенная в правой части рисунка. Если исследователь располагает только выборочными средними или ориентируется только на них, а эти параметры в данном случае совпадают, либо достоверно не различаются, то может быть сделано заключение о том, что исследуемый фактор не оказывает никакого влиянияна состояние изучаемого свойства объектов. Однако, на самом деле, влияние имеет место, но выражается оно в изменении межиндивидуального (внутригруппового) разнообразия, т. е. объекты по изучаемому в данном случае свойству становятся либо более однородными, либо более разнородными, непохожими друг на друга. Следовательно, существуют некие факторы, либо «загоняющие» объекты в узкие рамки очень близких состояний, либо, напротив, усиливающие разнообразие их ин­дивидуальных состояний. Обнаружение подобных эффектов позволяет глубже понять механизм изучаемого явления.

Количественным индикатором этих изменений является различие выборочных дисперсий. Однако, как всякая выборочная числовая характеристика, выборочная дисперсия величина случайная. Следовательно, наблюдаемое различие дисперсий тоже может оказаться случайным. Таким образом, к выборочным оценкам дисперсии полностью приложимы все те рассуждения, о которых шла речь при обсуждении источников различия выборочных средних. Насколько бы «большой» или «малой» не казалась нам наблюдаемая разница выборочных дисперсий, необходимо доказать, что она является либо статистически достоверной (устойчивой и прогнозируемой), либо незначимой существующей лишь «здесь и сейчас», практически не воспроизводимой и не прогнозируемой.

Дисперсия имеет распределение c2 (распределение Пирсона), поэтому для ее анализа критерий Стьюдента неприменим. Для того, чтобы приблизить распределение к нормальному рассматривают разность логарифмов сравниваемых дисперсий, которая обозначается символом Z:

Величина Z имеет нормальное распределение и, соответственно, к ней может быть применен критерий Стьюдента.

На практике часто рассматривают отношение F большей из сравниваемых дисперсий к меньшей (следуя свойствам логарифмов):

Полученная величина критерия сравнивается с критическим табличным значением. И также как в предыдущих рассуждениях, нулевая гипотеза либо отвергается и различие выборочных дисперсий считается статистически достоверным, либо делается вывод, что нулевую гипотезу отвергнуть нельзя и разница выборочных дисперсий находится в границах практически возможных случайных колебаний.

Если на независимых выборкахбыла обнаружена достоверность различия дисперсий, то их средние значения нельзя сравнивать по t - критерию Стьюдента!

Рассмотренный метод сравнения мер вариации и его модификации являются основой чрезвычайно мощного и информативного метода математико-статистического анализа данных, получившего название дисперсионный анализ – он будет изучаться на следующих занятиях.

 

Критерии согласия позволяют определить степень соответствия эмпирических и теоретических распределений вероятностей, а также двух эмпирических распределений, полученных, например, в «контроле» и «опыте» или в различных вариантах «опыта» или «наблюдения». Математиками были разработаны несколько таких критериев, однако мы рассмотрим наиболее известный из них – критерий согласия Пирсона (критерий c2).

Этот критерий позволяет проверить гипотезу о схожести фактического, полученного на практике, распределения вероятностей случайной величины и теоретического (например, нормального распределения).

Критерий записывается следующим образом:

c2

где k – число классов гистограммы или ряда распределения, - фактические (наблюдаемые) частоты встречаемости случайной величины в каждом i-ом классе (в виде целых чисел), - теоретически ожидаемые (вычисленные) частоты для данного класса, разница между ними.

Таким образом, c2 представляет собой вовсе не квадрат какого-то числа, а сумму по всем классам распределения данной случайной величины (от 1-го до k-го), величины квадратов разницы фактических и теоретических частот в каждом классе, отнесенных к теоретическим частотам для этих же классов.

Допустим, что по каждому классу распределения ,т.е. фактические (наблюдаемые) и ожидаемые (вычисленные) частоты идеально совпадают. Тогда и, соответственно, c2= 0. Понятно, что такого рода ситуация может иметь место только в том случае, когда форма эмпирического распределения абсолютно идентична форме теоретической модели, рассчитанной по эмпирическим данным, идеально согласуется с ней.

Допустим теперь, что хотя бы для одного из сравниваемых классов эмпирического и теоретического распределений, то есть для какого-то одного из них . Нетрудно догадаться, что поскольку мы имеем дело с «суммой квадратов», то c2 автоматически станет больше нуля. Понятно также, что чем больше будет таких различий для разных классов и чем значительнее сами различия, тем больше будет «набегать» сумма квадратов. Следовательно, в принципе, при различии наблюдаемых и ожидаемых частот сравниваемых распределений c2 может принимать любые положительные значения, вплоть до бесконечности. Очевидно, что за всем этим стоит различие фактически наблюдаемого и теоретически ожидаемого законов распределения данной случайной величины, которое внешне проявляется в различии формы распределения вероятностей появления отдельных значений этой величины в реальности и в теоретической модели. Нетрудно представить, что чем менее схожей будет форма сравниваемых распределений, тем большие числовые значения будет принимать c2 и, само собой, наоборот. Иными словами, c2 является мерой сходства/различия формы сравниваемых распределений вероятностей.

Технология использования критерия «Хи-квадрат» чрезвычайно проста. По приведенной выше формуле подсчитывается «экспериментальное» значение «Хи-квадрат» cэ2, которое сравнивают с табличным или «критическим» значением cкр2, взятым сообразно наличному числу степеней свободы и, как правило, для всех трех уровней значимости (или доверительной вероятности). Далее, как всегда, проверяется выполнение двух неравенств:

- если cэ2 < cкр2, то разница наблюдаемых (фактических) и ожидаемых (теоретических) частот сравниваемых распределений незначительна и не выходит за рамки ее собственных случайных колебаний, не превышает критического порога «возможного». Это не позволяет отвергнуть «нулевую гипотезу», согласно которой имеющие место различия частот носят случайный, несистематический характер. Следовательно, данное эмпирическое распределение можно рассматривать как одну из модификаций («здесь и сейчас») абстрактной теоретической модели распределения вероятностей, возникшую вследствие случайных искажений, неизбежно имеющих место на числовом массиве конечного и ограниченного объема - выборке. В этом случае говорят, что «распределения согласуются по формепри таком-то уровне значимости».

- если cэ2 cкр2, то разница наблюдаемых (фактических) и ожидаемых (теоретических) частот сравниваемых распределений столь велика, что выходит за рамки ее собственных случайных колебаний. Самопроизвольное появление такого значения «Хи-квадрат» относится к разряду невозможных событий. Следовательно, различие форм эмпирического и теоретического распределений обусловлено действием некого систематически действующего фактора, и эмпирическое распределение на принятом уровне значимости не может рассматриваться в качестве случайной модификации избранной нами теоретической модели. Возможна и иная интерпретация: избранная теоретическая модель не может рассматриваться в качестве эталона наблюдаемого рас­пределения вероятностей данной случайной величины. Короче говоря, придется подыскивать какие-то иные теоретические модели.

Однако, при использовании критерия Пирсона существуют следующие ограничения:

· во-первых, объем выборочной совокупности должен быть не менее 50

· во-вторых, допускается сравнение только абсолютных, а не относительных частот, т.е. количества значений случайной величины, попадающей в каждый класс распределения «в штуках»

· в-третьих, если в теоретическом (вычисленном) распределении встречается класс, в котором число значений менее пяти, то его еще до начала вычисления критерия объединяют с соседним, складывая их частоты и двигаясь при этом к центру распределения. При этом такое же сокращение числа классов, независимо от фактического количества частот в них, производят и в эмпирическом распределении.

 

Параметрические критерии обладают высокой информативностью, поскольку позволяют не только обнаружить достоверность различий, но и точно, конкретно демонстрируют их характер и степень. Однако, при всех несомненных достоинствах параметрические критерии обладают и рядом существенных недостатков - ограничениями их применимости. Самый серьезный из них - допущение о нормальности распределения сравниваемых величин. Втрое ограничение - непригодность таких критериев к выборкам малого объема (<10-15 измерений). На таких выборках параметры распределения (средние, дисперсии) могут резко измениться от добавления или убавления даже одного единственного числа. Третье – высокая чувствительность к артефактам, которые оказывают сильное слияние на параметры распределения, вызывая сдвиг средних значений в ту или иную сторону. В результате может «всплыть» различие, которого на самом деле нет или наоборот - оказаться «зашумленной» действительная разница. Влияние артефактов особенно велико на малых выборках. Специфика же медицинской работы состоит в том, что из-за сложности исследуемых процессов и явлений они, как правило, имеют дело именно с выборками малого объема, имеющими неизвестный закон распределения, часто полученными в результате достаточно грубых измерений, «нашпигованными» артефактами.

Для извлечения содержательной информации из числовых массивов такого рода были разработаны непараметрические критерии. Это критерии, применение которых не требует пересчета массивов исходных данных в компактно заменяющие их параметры распределения - средние значения, дисперсии или стандартные отклонения и т.д. - и их последующее сравнение. Сопоставлению в данном случае прямо или косвенно подвергаются непосредственно сами исходные значения («варианты», «даты») сравниваемых числовых массивов.

Как следствие, не только теряет силу требование «нормальности» генеральной совокупности, но и, более того, закон распределения сравниваемых величин вообще не играет никакой роли. Особые, достаточно простые, способы преобразования исходных данных делают эту группу критериев еще и практически нечувствительными или слабо чувствительными к артефактам. В результате, непараметрические критерии успешно работают даже на чрезвычайно малых выборках при наличии грубых измерений и грубых ошибок. За преимущества непараметрических методов анализа данных часто приходится расплачиваться меньшей конкретностью получаемых на их основании выводов. Однако, во многих практических случаях это не так важно, а возможность извлекать полезное содержание из нечетких данных, которые принципиально не поддаются обработке параметрическими критериями, компенсирует этот недостаток.

Поскольку создатели непараметрических критериев сообразно конкретным задачам пытались разными способами сбалансировать их преимущества и недостатки, критериев такого рода возникло довольно много. Рассмотрим лишь два из них: Манна-Уитни и Вилкоксона.

 

Критерий Манна-Уитни и критерий Вилкоксона – критерии ранговые, т.е. основанные на сравнении сумм рангов, полученных тем или иным образом из сравниваемых выборочных распределений. В данном конкретном случае рангом называется порядковый номер числа в ранжированном (расставленном в порядке возрастания) массиве данных – чем больше число, тем выше его ранг.При этом, если числа не повторяются, то их ранги в точности соответствуют их порядковым номерам. Если же некое число повторяется несколько раз, то всем им приписывается средний ранг. Продемонстрируем, как все это происходит и выглядит. Допустим, мы получили следующий вариационный ряд данных x:

5.6 11.7 -3.5 6.3 8 7.4 0.5 8 3 3.1 15.2 3.1 8 6.7 111 4.4

Здесь числа представлены в том порядке, как они были получены.

Расставим их в порядке возрастания и припишем порядковые номера, а также ранги R:

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
x -3.5 0.5 3 3.1 3.1 4.4 5.6 6.3 6.7 7.4 8 8 8 11.7 15.2 111
R 1 2 3 4.5 4.5 6 7 8 9 10 12 12 12 14 15 16

Из приведенного примера хорошо видно, что при ранжировании происходит «линеаризация данных» - сглаживание их резких колебаний за счет того, что ранг числа не зависит от его абсолютной величины и разницы с соседними вариантами. Например, последнее число 111 чуть ли не на порядок превышает ближ



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2016-04-27 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: