Множественная линейная корреляция и регрессия




 

Корреляция называется множественной, если на величину результативного признака (урожайность) одновременно влияют несколько факторов. Простой формулой множественной связи является линейная зависимость между тремя и более признаками, когда один из них, например, урожайность, рассматривается как функция (У), а два другие – как аргументы (Х и Z).

Вычисление коэффициентов множественной корреляции и уравнения регрессии более сложно, чем при простой линейной корреляции, требует большого внимания и аккуратности в расчётах. Ход вычислений коэффициентов множественной корреляции рассмотрим на примере с урожайностью яровой пшеницы (У), содержанием нитратного азота в почве перед посевом (Х) и содержанием белка в зерне (Z). Расчёты следует проводить в следующем порядке:

1. Находят отклонения от средних значений, отклонения возводят в квадрат и суммируют: å(У – )2 = 212,2; å(Х – )2 = 12,4; å(Z – )2 = 2,0;

2. Находят произведения отклонений и их суммы: å(У – )(Х – ) = 48,8; å(Х – )(Z – ) = 1,8; å(У – )(Z – ) = 12,6;

3. Как и при вычислении простой линейной корреляции находят коэффициенты корреляции между У и Х, У и Z, Х и Z и их квадраты:

r2ух = 0,91;

r2уz = 0,38;

r2уz = 0,14.

1. В качестве меры тесноты линейной связи трёх признаков используют частные коэффициенты корреляции, обозначаемые rху∙z; rxz∙у; rуz∙х. Частный коэффициент корреляции – это показатель, измеряющий степень сопряжений двух признаков из множества (в приведённом примере из трёх) и позволяет установить корреляцию между двумя признаками при постоянном значении третьего. Частные коэффициенты корреляции рассчитываются по формулам:

r2xy∙z = 0,98;

r2yz∙x = 0,86;

r2xz∙y = 0,80.

В индексах буквы перед точкой указывают, между какими признаками изучается зависимость, а буква после точки – влияние, какого признака исключается;

2. Частные коэффициенты детерминации находят путём возведения в квадрат частных коэффициентов корреляции: dху∙z = 96 %; dyzx = 74 %; dxzy = 64 %;

3. Ошибку и критерии значимости частной корреляции определяют аналогично, что и при парной корреляции:

tфакт. =

Теоретическое значение t берётся из таблицы приложения.

tфакт. =

tфакт. =

9. Вычисляют по формулам множественные коэффициенты корреляции трёх переменных, то есть показатели тесноты линейной связи между одним из признаков (буква индекса перед точкой) и совокупностью двух других (буквы индекса после точки);

;

R2x∙yz = 0,98; dxyz = 96 %.

;

R2y∙xz = 0,98; dyxz = 96 %.

;

R2xy = 0,88; dz·xy = 88 %.

Квадрат коэффициента множественной корреляции называется коэффициентом множественной детерминации. Он показывает долю вариации зависимой переменной под воздействием изучаемых факторов;

;

R2x∙yz = 0,98; dxyz = 96 %.

;

R2y∙xz = 0,98; dyxz = 96 %.

;

R2xy = 0,88; dz·xy = 88 %.

Теоретическое значение F-критерия берут из таблицы 2, 3 приложений (в зависимости от принятого уровня значимости).

Математическое уравнение для прямолинейной зависимости между тремя переменными называется множественным линейным уравнением плоскости регрессии и имеет следующий вид: У = а + b1Х + b2Z.

где У (функция) – зависимая переменная;

Х, Z (аргументы) – независимые переменные;

а – общее начало отсчёта;

b1 и b2 – коэффициенты частной регрессии.

Коэффициент b1 показывает, на какую величину увеличивается У при каждом увеличении на одну единицу Х при постоянном значении Z; коэффициент b2 показывает, на какую величину увеличивается У при увеличении Z на единицу при постоянном значении Х. Коэффициенты b1 и b2 вычисляют по следующим формулам:

b1 =

.

b2 =

.

Общее начало а = – b1 – b2 = 20,9 – 3,5 · 3,24 – 3,2 · 14,2 = – 34,5.

Уравнение регрессии: У = а + b1X + b2Z = – 34,5 + 3,5Х + 3,2Z.

Подставляя в уравнение регрессии значение Х и Z, получаем координаты точек (урожайности) для построения линий.

Математические уравнения парной и множественной регрессии, построение графиков возможно тогда, когда корреляционная связь более 0,7, при слабой тесноте связи между функцией и аргументом уравнение регрессии рассчитывать нет смысла.

Урожайность яровой пшеницы (ц/га), рассчитанная по уравнению

У = -34,5 + 3,5Х + 3,2Z

Значения Z, % Значения Х: N-NO3, мг/кг почвы
1,8 1,8 2,6 4,1 5,9
13,4 14,7 14,7 17,8 22,7 29,0
13,5 15,0 15,0 21,8 23,0 29,3
14,8 19,2 19,2 22,0 27,2 33,5
14,9 19,3 19,3 22,3 27,5 33,8
14,0 16,6 16,6 19,4 24,6 30,9

 



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2017-12-07 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: