Алгоритм расчета ранговой корреляции.




РАНГОВАЯ КОРРЕЛЯЦИЯ

Метод линейной корреляции применяется для определения меры соответствия двух признаков, выраженных количественно, т.е. для числовых величин. Это параметрический метод, который требует соответствия распределения данного исследуемого признака закону нормального распределения. В отличие от этого метода, метод ранговой корреляции (корреляция Спирмена) применим к любым количественно измеренным или ранжированным данным. Этот метод способен, в отличие от других, измерять согласованность изменения разных признаков у одного испытуемого или выявлять совпадения индивидуальных ранговых показателей у двух испытуемых; или у испытуемого и усредненный показатель некой группы; или какие-либо показатели в сравнении двух групп. Мощность коэффициента ранговой корреляции Спирмена несколько уступает мощности параметрического коэффициента корреляции.

Коэффициент ранговой корреляции Спирмена - это непараметрический метод, который используется с целью статистического изучения связи между явлениями.

Данный метод может быть использован не только для количественно выраженных данных, но также и в случаях, когда регистрируемые значения определяются описательными признаками различной интенсивности. Для подсчета ранговой корреляции необходимо располагать двумя рядами значений, которые могут быть проранжированы.

При использовании коэффициента ранговой корреляции условно оценивают тесноту связи между признаками, считая значения коэффициента равные 0,3 и менее, показателями слабой тесноты связи; значения более 0,4, но менее 0,7 - показателями умеренной тесноты связи, а значения 0,7 и более - показателями высокой тесноты связи.

Ограничения метода ранговой корреляции. По каждой переменной должно быть представлено не менее 5 наблюдений. Верхняя граница выборки – меньше или равна 40. Помимо этих ограничений, следует так же помнить об ограничениях корреляционного метода вообще – невозможность обнаружения причинной связи между явлениями.

Алгоритм расчета ранговой корреляции.

1. Определить, какие два признака будут участвовать в сопоставлении как переменные А и В.

2. Проранжировать значения переменной А, начисляя ранг 1 наибольшему значению, в соответствии с правилами ранжирования, данные занести в таблицу.

3. Проранжировать значения переменной В и занести в третий столбец таблицы по порядку номеров, в соответствии с правилами ранжирования, данные занести в таблицу.

4. Подсчитать разности d между рангами А и В по каждой строке таблицы и результаты занести в таблицу.

5. Возвести каждую разность из столбца 5 в квадрат, и результаты занести в столбец №6.

6. Подсчитать сумму квадратов из столбца №6.

Образец таблицы для внесения данных:

 

Наименование (значение) признака А Наименование (значение) признака В Ранги переменной А (xi) Ранги переменной В (yi) Разница между значениями двух предыдущих столбцов №3 и №4 (d= xiyi) Квадрат значений предыдущего столбца №5 (d2)
           

 

7. При наличии одинаковых рангов рассчитать поправки: и , где a и b - объем каждой группы рангов в соответствующем ранговом ряду А и В.

8. Рассчитать коэффициент ранговой корреляции при отсутствии одинаковых рангов – по формуле ; при наличии – по формуле ,
где: Sd2 – сумма квадратов разностей между рангами; Тa и Тb – поправки на одинаковые ранги; n – число парных наблюдений, участвовавших в ранжировании.

 

9. Определить по специальной таблице критические значения для данного n. И сделать вывод о значимости ранговой корреляционной связи.

Критическую точку вычисляем по формуле , коэффициент ранговой корреляции - коэффициент ранговой корреляции Спирмена, n – объем выборки, - число степеней свободы, - уровень значимости, - критическая точка двусторонней критической области, которую находят по таблице критических точек распределения Стьюдента при данных и k. Если коэффициент превышает критическое значение или, по крайней мере, равен ему, то между исследуемыми признаками существует значимая ранговая корреляционная связь, если коэффициент меньше критического значения, то корреляционная связь не значима.

Пример 1: Вычисление коэффициента корреляции между абсолютным числом лейкоцитов (L) и моноцитов (M) в крови здоровых людей после баночной пробы по экспериментальным данным:

 

Абсолютное число лейкоцитов 6,8 9,1 9,6 10,1 10,5   17,1 19,1 22,7 27,4 29,6 32,9
Абсолютное число моноцитов 0,52 1,04 0,67 2,83 1,37 1,95 4,1 3,82 1,59 1,64 2,09 2,96

 

1. Заполняем вспомогательную расчетную таблицу:

 

Абсолютное число лейкоцитов (признак L) Абсолютное число моноцитов (признак М) Ранги переменной L (xi) Ранги переменной М (yi) (d = xiyi) (d2)
           
6,8 0,52        
9,1 1,04        
9,6 0,67     -1  
10,1 2,83        
10,5 1,37     -1  
  1,95        
17,1 4,1        
19,1 3,82        
22,7 1,59     -4  
27,4 1,64     -4  
29,6 2,09     -3  
32,9 2,96     -2  
Сумма квадратов разностей рангов  

 

2. Вычисляем коэффициент ранговой корреляции

Вывод: По величине коэффициента корреляции рангов Спирмена делаем вывод о наличии достаточно (умеренно) тесной положительной связи между количеством лейкоцитов и моноцитов в крови обследованных людей после баночной пробы

 

3. Находим:

число степеней свободы для данной выборки: ;

критическую точку распределения Стьюдента при стандартном уровне значимости 0,05 .

Вычисляем критическую точку .

Вывод: Коэффициент корреляции , поэтому делаем вывод о значимости (достоверности) полученного коэффициент корреляции рангов Спирмена.

Пример 2: Вычисление коэффициента корреляции между cреднемесячной температурой воздуха (t) и показателем заболеваемости инфарктом миокарда (на 10 000 жителей) по экспериментальным данным:

 

Cредне-месячная температура воздуха -7,1 -7,6 -5,8 -4,1   14,9 18,8 15,6     -1 -7,7
Показатель заболеваемости инфарктом миокарда (на 10000 жителей) 1,6 1,23 1,14 1,13 1,12 1,02 0,91 0,82 1,06 1,22 1,33 1,4

 

1. Заполняем вспомогательную расчетную таблицу:

 

Cредне-месячная температура воздуха (t) Показатель заболеваемости инфарктом миокарда (К) Ранги переменной t (xi) Ранги переменной К (yi) (d= xiyi) (d2)
           
-7,1 1,6        
-7,6 1,23        
-5,8 1,14        
-4,1 1,13        
  1,12     -4  
14,9 1,02     -7  
18,8 0,91     -10  
15,6 0,82     -10  
  1,06     -4  
  1,22        
-1 1,33        
-7,7 1,4        
Сумма квадратов разностей рангов  

 

2. Вычисляем коэффициент ранговой корреляции

Вывод: Полученный коэффициент корреляции рангов Спирмена свидетельствует о наличии высокой отрицательной связи между cреднемесячной температурой воздуха и заболеваемостью инфарктом миокарда.

 

3. Находим:

число степеней свободы для данной выборки: ;

критическую точку распределения Стьюдента при стандартном уровне значимости 0,05 .

Вычисляем критическую точку .

Вывод: Коэффициент корреляции , поэтому делаем вывод о значимости (достоверности) полученного коэффициент корреляции рангов Спирмена.

Пример 3: Два психолога А и В проверили 12 водителей на быстроту реакции и расположили их в порядке ухудшения реакции. Психолог А выявил одинаковые реакции у нескольких водителей, у психолога В все водители показали разную реакцию (звездочками * и ** отмечены водители, показавшие одинаковую реакцию):

 

Быстрота реакции водителей при проверке психологом А   2* 3* 4*   6** 7** 8**        
Быстрота реакции водителей при проверке психологом В                        

 

Найти выборочный коэффициент ранговой корреляции Спирмена между рангами водителей, присвоенными им двумя психологами, и сделать вывод о его значимости.

 

  1. Заполняем вспомогательную расчетную таблицу:

 

Быстрота реакции водителей при проверке психологом А Быстрота реакции водителей при проверке психологом В Ранги переменной А (xi) Ранги переменной В (yi) (d= xiyi) (d2)
           
        -2  
2*          
3*          
4*       -4  
        -1  
6**       -1  
7**       -3  
8**       -4  
        -6  
        -4  
        -2  
        -4  
Сумма квадратов разностей рангов  

 

2. Вычисляем коэффициент ранговой корреляции

Так как в первой группе данных имеются одинаковые ранги, предварительно требуется рассчитать поправки: и , где a и b - объем каждой группы рангов в соответствующем ранговом ряду А и В.

Ранг 1 имеет только одна варианта, поэтому ;
ранг 2 имеют три варианты, поэтому и т.д., имеем

, т.к. повторяющихся рангов нет.

Тогда

Вывод: Полученный коэффициент корреляции рангов Спирмена свидетельствует о наличии умеренной тесной положительной связи между рангами водителей, присвоенными им двумя психологами.

 

3. Находим:

ü число степеней свободы для данной выборки: ;

ü критическую точку распределения Стьюдента при стандартном уровне значимости 0,05 .

Вычисляем критическую точку .

Вывод: Коэффициент корреляции , поэтому делаем вывод о не значимости (не достоверности) полученного коэффициент корреляции рангов Спирмена, т.е при данном 5% -ом уровне значимости мы не можем утверждать об отличии в присвоении рангов водителям, сделанными двумя психологами при исследовании быстроты реакции.

 


ЗАДАЧИ ДЛЯ САМОСТОЯТЕЛЬНОГО РЕШЕНИЯ
по теме «РАНГОВАЯ КОРРЕЛЯЦИЯ»

 

1. Знания 10 студентов проверены по двум тестам А и В. Оценки по 100 балльной системе оказались следующими:

Результат сдачи теста А                    
Результат сдачи теста В                    

Найти выборочный коэффициент ранговой корреляции Спирмена между оценками по двум тестам. Сделать вывод о тесноте и значимости корреляционной зависимости.

 

2. Два преподавателя оценили знания 12 студентов по 100-бальной системе и выставили им следующие оценки:

Оценки выставленные преподавателем А                        
Оценки выставленные преподавателем В                        

Найти выборочный коэффициент ранговой корреляции Спирмена между оценками двух преподавателей. Сделать вывод о тесноте и значимости корреляционной зависимости.

 

3. Тринадцать цветных полос расположены в порядке убывания окраски от темной к светлой и каждой полосе присвоен номер (ранг):

хi                          

При проверке способности различать оттенки цветов, испытуемый расположил полосы в следующем порядке:

yi                          

Найти и оценить коэффициент ранговой корреляции Спирмена между «правильными» рангами хi и рангами yi, которые присвоены полосам испытуемым.

 

4. Три врача-интерна А, В и С оценили состояние здоровья 10 человек, прошедших диспансерный осмотр, в итоге были получены три последовательности рангов:

Ранги интерна А хi                    
Ранги интерна В yi                    
Ранги интерна С zi                    

Используя коэффициент ранговой корреляции Спирмена, определить пару врачей-интернов, оценки которых наиболее согласуются.

 

5. Два врача А и В расположили образцы БАДов, производимых девятью фирмами, в порядке ухудшения качества (звездочками * и ** отмечены БАДы, получившие одинаковую оценку):

Ранги врача А     3* 4* 5* 6** 7** 8** 9**
Результат врача В           6* 7*    

Найти выборочный коэффициент ранговой корреляции Спирмена между оценками БАДов, сделанными двумя врачами. Сделать вывод о тесноте и значимости корреляционной зависимости.

 


КАЛЕНДАРНО – ТЕМАТИЧЕСКИЙ ПЛАН ЛЕКЦИЙ ПО ДИСЦИПЛИНЕ «МАТЕМАТИЧЕСКИЕ МЕТОДЫДОКАЗАТЕЛЬНОЙ МЕДИЦИНЫ»
для студентов 2 курса специальностей Лечебное дело и педиатрия

«УТВЕРЖДАЮ»:

заведующий кафедрой

_____________ В.А. Кудрявцев

«11» февраля 2013г.

№ лекции Факультет / поток Дата лекции Время/ кабинет Тема лекции
  Лечебный/ 1 поток 11.02.2013 8.30 – 10.05 час. 3 - 803 Корреляция и регрессия
Лечебный/ 1 поток 18.02.2013 12.30 – 14.05 час. 1 - 411
Педиатрический 27.02.2013 12.25 – 14.00 час. 3 - 819
  Лечебный/ 1 поток 11.03.2013 8.30 – 10.05 час. 3 - 803 Статистические гипотезы и критерии. Параметрические критерии сравнения значений параметров
Лечебный/ 1 поток 18.03.2013 12.30 – 14.05 час. 1 - 411
Педиатрический 27.03.2013 12.25 – 14.00 час. 3 - 819
  Лечебный/ 1 поток 08.04.2013 8.30 – 10.05 час. 3 - 803 Критерии соответствия закону распределения. Непараметрические критерии
Лечебный/ 1 поток 15.04.2013 12.30 – 14.05 час. 1 - 411
Педиатрический 24.04.2013 12.25 – 14.00 час. 3 - 819
  Лечебный/ 1 поток 06.05.2013 8.30 – 10.05 час. 3 - 803 Дисперсионный анализ
Лечебный/ 1 поток 13.05.2013 12.30 – 14.05 час. 1 - 411
Педиатрический 22.05.2013 12.25 – 14.00 час. 3 - 819

Лектор – старший преподаватель кафедры О.Л. Короткова


КАЛЕНДАРНО – ТЕМАТИЧЕСКИЙ ПЛАН ПРАКТИЧЕСКИХ ЗАНЯТИЙ ПО ДИСЦИПЛИНЕ «МАТЕМАТИЧЕСКИЕ МЕТОДЫДОКАЗАТЕЛЬНОЙ МЕДИЦИНЫ»
для студентов 2 курса специальностей Лечебное дело и педиатрия

«УТВЕРЖДАЮ»:

заведующий кафедрой

_____________ В.А. Кудрявцев

«11» февраля 2013г.

№ занятия Дата занятия Тема занятия Примечание
  11.02 – 23.02 Корреляционный и регрессионный анализ  
  25.02 – 09.03 Ранговая корреляция  
  11.03 – 23.03 Лабораторная работа «Определение корреляционной зависимости и нахождение регрессии»  
  25.03 – 06.04 Контрольная работа № 2: Решение задач по темам «Выборочный метод в статистике» и «Корреляционный и регрессионный анализ»  
  08.04 – 20.04 Параметрические критерии  
  22.04 – 04.05 Непараметрические критерии  
  06.05 – 18.05 Критерии распределения  
  20.05 – 01.06 Однофакторный дисперсионный анализ  
  03.06 – 15.06 Зачетное занятие: Тест «Основные методы математической статистики» График сдачи теста в компьютерных классах будет представлен отдельно

 


Критические значения t крит(α, f) распределения Стьюдента

f Уровень значимости (двусторонняя критическая область) f Уровень значимости (двусторонняя критическая область)
0,1 (0,9) 0,05 (0,95) 0,01 (0,99) 0,1 (0,9) 0,05 (0,95) 0,01 (0,99)
  6,31375 12,70615 63,65590   1,73406 2,10092 2,87844
  2,91999 4,30266 9,92499   1,72913 2,09302 2,86094
  2,35336 3,18245 5,84085   1,72472 2,08596 2,84534
  2,13185 2,77645 4,60408   1,72074 2,07961 2,83137
  2,01505 2,57058 4,03212   1,71714 2,07388 2,81876
  1,94318 2,44691 3,70743   1,71387 2,06865 2,80734
  1,89458 2,36462 3,49948   1,71088 2,0639 2,79695
  1,85955 2,30601 3,35538   1,70814 2,05954 2,78744
  1,83311 2,26216 3,24984   1,70562 2,05553 2,77872
  1,81246 2,22814 3,16926   1,70329 2,05183 2,77068
  1,79588 2,20099 3,10582   1,70113 2,04841 2,76326
  1,78229 2,17881 3,05454   1,69913 2,04523 2,75639
  1,77093 2,16037 3,01228   1,69726 2,04227 2,74998
  1,76131 2,14479 2,97685   1,68385 2,02107 2,70446
  1,75305 2,13145 2,94673   1,67065 2,00030 2,66027
  1,74588 2,11990 2,92079   1,65765 1,97993 2,61742
  1,73961 2,10982 2,89823 ¥ 1,64484 1,95996 2,57583
f 0,05 (0,95) 0,025 (0,975) 0,005 (0,995) f 0,05 (0,95) 0,025 (0,975) 0,005 (0,995)
Уровень значимости (односторонняя критическая область) Уровень значимости (односторонняя критическая область)

 

В Microsoft Excel для расчёта критических значений распределения Стьюдента используется функция СТЬЮДРАСПОБР(; f), где =1- p (р – доверительная вероятность)

Для расчёта уровня значимости по критическому значению коэффициента Стьюдента следует пользоваться функцией СТЬЮДРАСП(t крит; f; 2).


 



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2017-06-30 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: