Тема 4. Корреляционный анализ




Задача 16

В результате исследования получены показатели систолического и диастолического давления у группы юношей 18 лет. Определите с помощью коэффициента Пирсона корреляционную зависимость,

Систолическое давление Диастолическое давление
   
   
   
   
   
   
   
   
   

 

 

Ответ к задаче 16) 1) Высчитываем средние значения АД систолического (Мх) и диастолического (Му): Мх = 117,8, Му = 69,4

2) Определяем отклонения коррелируемых рядов (dx, dy), их проивзедения и квадраты, а также суммы произведений и квадратов.

3)

Систола Диастола dx dy dx*dy Dx^2 Dy^2
    -7,8 -9,4 73,32 60,84 88,36
    -7,8 -4,4 34,32 60,84 19,36
    -2,8 -4,4 12,32 7,84 19,36
    -2,8 -4,4 12,32 7,84 19,36
    -2,8 0,6 -1,68 7,84 0,36
    2,2 0,6 1,32 4,84 0,36
    2,2 5,6 12,32 4,84 31,36
    7,2 5,6 40,32 51,84 31,36
    12,2 10,6 129,32 148,84 112,36
        313,88 355,56 322,24

3) Определяем коэффициент корреляции:

r= Σdx*dy * = 0,927, что соответствует прямой сильной корреляци

√Σdx^2*Σdy^2

 

Задача 17

В результате исследования получены показатели систолического и диастолического давления у группы юношей 18 лет. Определите с помощью коэффициента Спирмена корреляционную зависимость.

Систолическое давление (х) Диастолическое давление (у)
   
   
   
   
   
   
   
   
   

 

 

Ответ к задаче 17) 1) Строим таблицу с рангами, разностями рангов (d) и квадратами разницы (d^2), сумму квадратов

Систола Диастола     Разница рангов d D^2
X’ Y’
    1,5   0,5 0,25
    1,5 2,5 -1  
    3,5 2,5    
    3,5   -1,5 2,25
           
           
      7,5 -1,5 2,25
      7,5 0,5 0,25
           
           

2) Определяем коэффициент корреляции по формуле:
p=1- 6 Σd^2 = 0,925, что соответствует прямой сильной

n*(n^2-1) корреляции

 

Задача 18

В результате исследования получены показатели исследования специфических антигенов методом фазово-контрастной микроскопии и серологическим методом. Определите с помощью четырехпольного метода коэффициент корреляции.

Результат серологических методов Результат контрастных методов Всего
Положительный Отрицательнный
Положительный      
Отрицательный      
Итого      

 

Ответ к задаче 18)

Ответ: 1) определяем критерий соответствия:

х= (ad*-bc)^2*n =18,7,

(a+b)*(c+d)*(a+c)*(b+d)

2) определяем коэффициент корреляции по формуле r=√x^2/n = 0,46 – средневыраженная прямая связь.

 

Задача 19

В результате исследования получены показатели жесткости воды. Определите с помощью коэффициента Пирсона корреляционную зависимость жесткости от количества кальция

Жесткость воды Количество кальция
   
   
   
   
   
   

 

Ответ к задаче 19) 1) Высчитываем средние значения жесткости воды (Мх) и количество кальция (Му): Мх = 20, Му = 142

2) Определяем отклонения коррелируемых рядов (dx, dy), их проивзедения и квадраты, а также суммы произведений и квадратов.

 

Жесткость воды Количество кальция dx dy dx*dy Dx^2 Dy^2
    -16 -114      
    -12 -86      
    -9 -66      
             
             
             
             

3) Определяем коэффициент корреляции:

r= Σdx*dy * = 0,99, что соответствует прямой сильной корреляци

√Σdx^2*Σdy^2

 

Задача 20

В результате исследования получены показатели числа травм на 100 работающих в зависимости от стажа работы. Оцените направление и силу корреляции.

Стаж работы в годах Число травм на 100 работающих
До 1 года  
1-2  
3-4  
5-6  
7 и более  

 

 

Ответ к задаче 20) 1) Строим таблицу с рангами, разностями рангов (d) и квадратами разницы (d^2), сумму квадратов

Стаж работы в годах   Число травм на 100 работающих       Разница рангов d D^2
X’ Y’  
До 1 года          
1-2          
3-4     2,5 0,5 0,25
5-6     2,5 1,5 2,25
7 и более          
          2,5

2) Определяем коэффициент корреляции по формуле:
p=1- 6 Σd^2 = 0,875, что соответствует прямой сильной

n*(n^2-1) корреляции

 

Задача 21

При изучении общественного здоровья населения субъектов РФ возникла необходимость провести анализ зависимости показателей общей смертности и общей заболеваемости. Исходные статистические данные представлены в таблице.

Показатель Федеральный округ
Центральный Северо-Западный Южный Приволжский Уральский Сибирский Дальневосточный
               
Общая заболеваемость, xt 1480,9 1724,65 1289,73 1763,09 1478,96 1643,47 1465,38
               
               
Общая смертность, yt 16,1 15,7 12,1 15,1 13,3 14,4 13,6

Для оценки эффективности проведенной вакцинации была изучена заболеваемость среди привитых мальчиков и девочек. Были взяты две группы вакцинированных. В 1-й группе (мальчики) из 81 вакцинированного заболели 5. Во 2-й группе (девочки) из 96 вакцинированных заболели 3. Полученные данные приведены в таблице.

Таблица. Распределение вакцинированных по полу и эффективности прививки (абсолютные числа)

1-й признак (пол) 2-й признак (исход) Всего
заболели не заболели
Мальчики 5 (a) 76 (b) 81 (a+b)
Девочки 3(c) 93 (d) 96 (с + d)
Итого 8 (a+c) 169 (b + d) 177 (a+b+c+d)
 

На основании исходных данных, представленных в таблицах: оценить степень зависимости показателей общей смертности и общей заболеваемости с помощью коэффициента корреляции; оценить эффективность прививок среди мальчиков и девочек с использованием непараметрических методов (коэффициентов ассоциации Юла и контингенции Пирсона).

Ответ к задаче 21) 1. Высчитываем средние значения заболеваемости (Мх) и смертности (Му): Мх = 1549,5, Му = 14,3

Определяем отклонения коррелируемых рядов (dx, dy), их проивзедения и квадраты, а также суммы произведений и квадратов.

 

Заболеваемость Смертность dx dy dx*dy Dx^2 Dy^2
1480,9 16,1 68,6 -1,8 -123,48 4705,96 3,24
1724,65 15,7 -175,15 -1,4 245,21 30677,52 1,96
1289,73 12,1 259,77 2,2 571,494 67480,45 4,84
1763,09 15,1 -213,59 -0,8 170,872 45620,69 0,64
1478,96 13,3 70,54   70,54 4975,89  
1643,47 14,4 -93,97 -0,1 9,397 8830,36 0,01
1465,38 13,6 84,12 0,7 58,884 7076,17 0,49
        1002,917 169301,04 12,18

Определяем коэффициент корреляции:

r= Σdx*dy * = 0,698, что соответствует прямой заметной корреляци

√Σdx^2*Σdy^2

2. Коэффициент ассоциации Юла высчитывается по формуле

Ka = ad-bc = 5*93-76*3 =0,34

ad+bc 5*93+76*3

Уонтингенция Пирсона высчитывается по формуле

Kk = ad-bc_____ = 0,07

√((a+b)(c+d)(a+c)(b+d))

Что соответствует слабой корреляции

 

Задача 22

Для изучения факторов, оказывающих влияние на рождаемость в субъектах РФ, была изучена зависимость между числом браков и количеством родившихся. Статистические данные представлены в таблице.

Показатель Федеральный округ
Центральный Северо-Западный Южный Приволжский Уральский Сибирский Дальневосточный
               
Количество родившихся, xt              
               
               
Число браокв, yt              

Для углубленного изучения влияния стажа работы на возможность возникновения профессионального заболевания работающие были разделены на 2 группы: 1-я - со стажем работы до 10 лет, 2-я - свыше 10 лет. В 1-й группе из 125 работающих профессиональные заболевания выявлены у 5, во 2-й - из 132 работающих - у 8. Полученные данные приведены в таблице.

1-й признак (стаж работы) 2-й признак (исход) Всего
выявлен не выявлены
До 10 лет 5 (a) 120 (b) 125 (a+b)
Свыше 10 лет 8(c) 124 (d) 132 (с + d)
Итого 13 (a+c) 244 (b + d) 257 (a+b+c+d)
 

На основании исходных данных, представленных в таблицах:

1) оценить степень зависимости между количеством родившихся и числом браков с помощью коэффициента корреляции;

2) оценить корреляционную зависимость между стажем работы и наличием профессионального заболевания с использованием непараметрических методов (коэффициента ассоциации Юла и коэффициента контингенции Пирсона).

Ответ к задаче 22) 1. Высчитываем средние значения количества родившихся (Мх) и количества браков (Му): Мх = 230024,6, Му = 180357,1

Определяем отклонения коррелируемых рядов (dx, dy), их проивзедения и квадраты, а также суммы произведений и квадратов.

 

Родившихся Браков dx dy dx*dy Dx^2 Dy^2
    -129860 -147808      
    92002,6 59650,1      
    -66184,4 -21782,9      
    -105855 -78768,9      
    78910,6 65158,1      
    -18907,4 1233,1 -23314714,9    
    149944,6 122318,1      
             

Определяем коэффициент корреляции:

r= Σdx*dy * = 0,16, что соответствует слабой корреляци

√Σdx^2*Σdy^2

2. Коэффициент ассоциации Юла высчитывается по формуле

Ka = ad-bc = 5*124-120*8 = -0,2

ad+bc 5*124+120*8

Контингенция Пирсона высчитывается по формуле

Kk = ad-bc_____ = -0,04

√((a+b)(c+d)(a+c)(b+d))

Что соответствует обратной слабой корреляции

 

Задача 23

Для изучения факторов, оказывающих влияние на смертность в субъектах РФ, была изучена зависимость между числом больных злокачественными новообразованиями и числом умерших. Статистические данные представлены в таблице.

 

Показатель Федеральный округ
Центральный Северо-Западный Южный Приволжский Уральский Сибирский Дальневосточный
               
Число больных, xt              
               
               
Число умерших, yt              

Для углубленного изучения летальности больные, доставленные в стационар для оказания экстренной медицинской помощи, были разделены на 2 группы: в 1-ю включены больные, доставленные в стационар до 24 ч после обострения, во 2-ю - позже 24 ч. В 1-й группе из 72 больных умерли 8, во 2-й - из 54 больных умерли 15. Полученные данные приведены в таблице.

1-й признак (время доставки) 2-й признак (исход) Всего
живы умерли
До 24 часов 64 (a) 8 (b) 72 (a+b)
Позже 24 часов 39(c) 15 (d) 54 (с + d)
Итого 103 (a+c) 23 (b + d) 120 (a+b+c+d)
 

На основании исходных данных, представленных в таблицах:

1) оценить степень зависимости числа пенсионеров и числа умерших с помощью коэффициента корреляции;

2) оценить корреляционную зависимость между сроком доставки больных для оказания экстренной помощи и числом умерших с использованием непараметрических методов (коэффициента ассоциации Юла и коэффициента контингенции Пирсона).

Ответ к задаче 22) 1. Высчитываем средние значения количества числа больных (Мх) и числа умерших (Му): Мх = 204406,7, Му = 297206,4

Определяем отклонения коррелируемых рядов (dx, dy), их проивзедения и квадраты, а также суммы произведений и квадратов.

 

Болело Умерло dx dy dx*dy Dx^2 Dy^2
    -167622 -301483     358428518721,00
    68157,7 85956,4      
    28649,7 18107,4 518771577,8    
    -134193 -162165     211021715641,00
    88614,7 134814,4      
    -27267,3 15108,4 -411965275,3    
    143660,7 209660,4      
        120328503903,86 373280555947,00  

Определяем коэффициент корреляции:

r= Σdx*dy * = 0,21, что соответствует слабой корреляци

√Σdx^2*Σdy^2

2. Коэффициент ассоциации Юла высчитывается по формуле

Ka = ad-bc = 64*15-39*8 = 0,51

ad+bc 64*15+39*8

Контингенция Пирсона высчитывается по формуле

Kk = ad-bc_____ = 0,31

√((a+b)(c+d)(a+c)(b+d))

Что соответствует умеренной корреляции

 



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2016-03-24 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: