Последовательность расчётов при корреляционном анализе
Рассчитываются следующие показатели:
r – коэффициент корреляции
dу/х – коэффициент детерминации
Sd– ошибка коэффициента корреляции
tr факт.–критерий существенности (значимости) корреляции
r – коэффициент корреляции служит для измерения силы (тесноты, степени) и направления линейной связи. Изменяется от -1 до +1.
считается, что при:
r = 0 линейная (прямолинейная) связь между изучаемыми признаками отсутствует (может быть, криволинейная связь).
r = 0 – 0,3 – связь слабая
r = 0,3 = 0,7 – связь средняя
r = 0,7 = 1,0 – связь сильная (тесная)
Для положительных (или прямых) связей, коэффициент корреляции (r), со знаком (+) будет означать, что с увеличением суммы осадков, увеличивается урожай.
Для отрицательных (обратных) связей знак (–) означает, что при увеличении суммы осадков, снижается урожай.
При полных связях, когда корреляционная связь превращается в функциональную, r – для прямых (положительных) связей равен (+1), а для обратных (отрицательных) связей равен (– 1)
Чем ближе r к (+1) или к (-1), те сильнее (теснее) линейная (прямолинейная) корреляционная связь.
Ход работы:
Задание.
Проведите корреляционный и регрессионный анализы линейной зависимости.
Для этого:
Составьте таблицу корреляционной зависимости.
Пример, Таблица 1
Корреляционная зависимость между произведением длинны листьев яблони наих ширину (Х) и площадью листьев (Y)
Номер листа | Х, см | Y | Отклонение от средней | Квадрат отклонений | Произведение | ||
X– | Y– | (X– )2 | (Y– )2 | ∑(X– )·(Y– ) | |||
1 | 15,8 | 7,2 | -21,6 | -16,8 | 466,56 | 285,24 | 362,88 |
2 | 18,8 | 11,8 | -18,6 | -12,2 | 345,96 | 148,84 | 226,92 |
3 | 27,0 | 18,6 | -10,4 | -5,4 | 108,16 | 29,16 | 56,16 |
4 | 28,8 | 19,1 | -8,6 | -4,9 | 73,96 | 24,01 | 42,14 |
5 | 28,8 | 19,4 | -8,6 | -4,6 | 73,96 | 21,16 | 39,56 |
6 | 29,6 | 19,5 | -7,8 | -4,5 | 60,84 | 20,25 | 35,10 |
7 | 32,5 | 21,6 | -4,9 | -2,4 | 24,01 | 5,76 | 11,16 |
8 | 32,8 | 22,1 | -4,6 | -1,9 | 21,16 | 3,61 | 8,74 |
9 | 36,5 | 23,1 | -0,9 | -0,9 | 0,81 | 0,81 | 0,81 |
10 | 38,5 | 23,2 | 1,1 | -0,8 | 1,21 | 0,64 | 0,88 |
11 | 39,6 | 23,6 | 2,2 | -0,4 | 4,84 | 0,16 | 0,88 |
12 | 39,7 | 26,5 | 2,3 | 2,5 | 5,29 | 6,25 | 5,75 |
13 | 39,7 | 27,3 | 2,3 | 3,3 | 5,29 | 10,89 | 7,59 |
14 | 44,5 | 28,6 | 7,1 | 4,6 | 50,41 | 21,16 | 32,66 |
15 | 46,2 | 29,3 | 8,8 | 5,3 | 77,44 | 28,09 | 46,64 |
16 | 46,4 | 29,7 | 9,0 | 5,7 | 81,00 | 32,49 | 51,30 |
17 | 48,0 | 30,4 | 10,6 | 6,4 | 112,36 | 40,96 | 67,84 |
18 | 49,8 | 30,8 | 12,4 | 6,8 | 153,76 | 46,24 | 84,32 |
19 | 51,0 | 34,4 | 13,6 | 10,4 | 184,96 | 108,16 | 141,44 |
20 | 53,9 | 34,4 | 16,5 | 10,6 | 272,25 | 112,36 | 174,90 |
=37,4 | =24,0 | ∑(X– )=-0,1 | ∑(Y– )=0,8 | Σ(X– )2=2124,23 | Σ(Y– )2=943,24 | ∑(X– )·(Y– )=1397,67 |
Число пар n=20
1. Вычислить коэффициент корреляции (r) для выборочных наблюдений по формуле:
2. Степень связи между признаками более точно измеряется коэффициентом детерминации , равным квадрату коэффициента корреляции () и показывающим долю тех изменений (%), которые зависят от изучаемого фактора. В нашем примере при =0,987 не 99 %, а только 97 % изменчивости признака. У обусловлена действием факториального признака Х (), остальная часть корреляционной связи (1–0,974=0,026) обусловлена другими факторами.
3. Ошибку коэффициента корреляции (Sr). Коэффициент корреляции выборочных наблюдений подвержен случайным колебаниям, которые зависят как от особенностей образования выборки, так и от точности наблюдений. Поэтому для оценки надёжности определяют его ошибку и критерий существенности :
,где – ошибка коэффициента корреляции;
– число сопоставляемых пар (объём выборки).
4.Критерий достоверности коэффициента корреляции (tr). С увеличением объёма выборки уменьшается, а точность определения возрастает. Критерий существенности коэффициента корреляции определяют по формуле:
ели , то корреляционная связь существенна, а при < – несущественна. находят по табл. приложения для 5%-ного, а при более строгом подходе – 1%-ного уровня значимости. Теоретическое значение критерия t находят по таблице Стьюдента (приложение) при числе степеней свободы υr = n – 2 = 20-2 = 18; t0,95 = 2,1; t0,99 = 2,88 корреляционная связь существенна при 5%-ном и 1%-ном уровне значимости, так как .
При достаточно большом числе наблюдений (не менее 100) коэффициент корреляции считается существенным, если он превышает свою ошибку в три и более раза, т.е. когда .
Для выводов о силе корреляционной связи между площадью листьев яблони и произведением их длины на ширину пользуются следующей условной шкалой: если r находится в пределах от 0 до 0,33, то связь слабая, от 0,33 до 0,66 – средняя, от 0,66 до 0,99 – сильная, если r равно 1 – связь полная. Вывод о направлении связи делают по знаку коэффициента корреляции: при знаке «+» корреляция прямая, «-» – обратная.