Корреляция и регрессия в агрохимических исследованиях




Дисперсионный анализ урожайных данных позволяет определить точность опыта и достоверность (доказуемость) испытываемых вариантов. Не менее важной задачей в исследованиях является установление взаимосвязи урожайности с факторами, повлиявшими на неё. Множественной корреляцией называется такая, когда исследуется связь урожайности с несколькими факторами, например, содержанием азота, фосфора, калия и других элементов в почве.

По форме корреляционная связь может быть прямолинейной и криволинейной, по направлению – прямой и обратной. Под прямолинейной корреляцией понимают такую зависимость, когда с увеличением средней величины результативного признака (урожайности) увеличивается средняя величина другого (содержание азота в почве), или, наоборот, с увеличением одного признака уменьшается средняя величина другого. В первом случае величина называется прямой или положительной, во втором – обратной или отрицательной.

При определении тесноты связи в агрохимических исследованиях результативный признак (урожайность) принимают за У (функция), а признаки, с которыми устанавливается связь, обозначают индексами Х (аргумент). Связь между функцией и аргументом выражается уравнением регрессии или корреляционным уравнением. При простой регрессии уравнение имеет вид У = f (x), а при множественной У = f (x, z, v).

Для оценки тесноты (силы) связи вычисляют коэффициент корреляции и корреляционное отношение.

При высокой тесноте связи рассчитывается уравнение регрессии, по которому можно предсказать значение результативного признака (урожайности) в зависимости от факториальных признаков.

Ниже приводится пример установления прямолинейной зависимости между урожайностью яровой пшеницы (У) и содержанием нитратного азота в почве перед посевом (Х):

1. Составляют таблицу, куда вносят средние значения урожайности (функция, У) и средние значения содержания нитратного азота в почве (аргумент, Х);

2. Суммируют значения У и Х, получая åУ и åХ.;

3. Вычисляют средние значения и , разделив åУ на l и åХ на l. В данном примере = 104,8: 5 = 20,96, = 16,44: 5 = 3,29;

4. Вычисляют отклонения урожайности и содержания азота от средних величин. Сумма положительных и отрицательных величин должна равняться нулю. å(У – ) = 0, å(Х – ) = 0;

5. Отклонения от средней возводят в квадрат, освобождаясь от знаков + и –, получая (У – )2 и (Х – )2;

6. Суммируют квадраты отклонений, получая å(У – )2 = 212,18 и å (Х – )2 = 12,37;

7. Находят произведения средних отклонений и их сумму å(У – )(Х – ) = 48,92.

Коэффициент корреляции, обозначаемый индексом r, находят по формуле

Коэффициент корреляции является безмерной величиной, изменяющейся в области – 1 < r < + 1. Считается что при r < 0,3 корреляционная зависимость между признаками (функцией и аргументом) слабая, при r = 0,3-0,7 – средняя, а при r > 0,7 – сильная.

 

Установление корреляционной зависимости между урожайностью яровой пшеницы и содержанием нитратного азота в почве

Варианты опыта Урожайность, ц/га (У) Содержание N-NO3, мг/кг (Х) Отклонение от средней Квадраты отклонений Произведение (У – )∙ (Х – )
У – Х – (У – )2 (Х – )2
1 – 0 (без удобрений) 12,7 1,82 - 8,26 - 1,47 68,22 2,16 12,14
2 – Р60К60 (фон) 15,2 1,87 - 5,76 - 1,42 33,17 2,01 8,17
3 – Фон + N30 20,4 2,65 - 0,56 - 0,64 0,31 0,40 0,35
4 – Фон + N60 26,8 4,15 5,84 0,86 34,10 0,73 5,02
5 – Фон + N90 29,7 5,95 8,74 2,66 76,38 7,07 23,24
Сумма (Σу)= 104,8 (Σх)=16,44     212,18 12,37 48,92
Среднее ()= 20,9 ()=3,3          

 

В нашем примере связь между урожайностью яровой пшеницы и содержанием нитратного азота сильная.

Для оценки надёжности выборочного коэффициента корреляции вычисляют его ошибку и критерий существенности.

Стандартную ошибку коэффициента корреляции определяют по формуле

где Sr – ошибка коэффициента корреляции;

r – коэффициент корреляции;

n – число выборки, то есть пар значений (5).

Критерий существенности коэффициента корреляции рассчитывают по формуле

Если trфакт. ≥ trтеор., то корреляционная связь существенна и, наоборот, trфакт. < trтеор. – несущественна.

Теоретическое значение критерия t находят по таблице Стьюдента, принимая 5 %-ный уровень значимости (приложение). Число степеней свободы принимают равным n – 2 = 3.

В приведённом примере tтеор. = 3,18, то есть меньше, чем tфакт., следовательно, связь существенна.

Не менее важным показателем при корреляционном анализе является коэффициент детерминации (∂ух), который получают возведением в квадрат коэффициента корреляции (r2). Он показывает долю в процентах тех изменений, которые зависят от изучаемого фактора. В приведённом примере коэффициент детерминации ∂ух = 90 %. Урожайность яровой пшеницы на 90 % зависела от содержания азота в почве и на 10 % – от других факторов.

Коэффициент корреляции указывает на тесноту связи между изучаемыми признаками, но не позволяет судить, как изменяется функция (У) при изменении аргумента на единицу измерения. Это можно решить с помощью регрессионного анализа.

Уравнение линейной регрессии У на Х имеет вид У = + bух(Х – ), где и – средние арифметические для ряда Х и У, bух – коэффициент регрессии У по Х.

Коэффициент регрессии вычисляют по формулам:

Произведение коэффициентов регрессии равняется квадрату коэффициента корреляции: bух · bху = r2 = 3,95 · 0,23 = 0,9.

Ошибку коэффициента регрессии вычисляют по формулам:

;

.

Подставив выше найденные значения в уравнение линейной регрессии, вычисляют уравнение прямой линии У = 20,9 + 3,95(Х – 3,29) = 7,96 + 3,95Х.

По уравнению линейной регрессии корреляционная связь может быть изображена графически. На графике откладываются точками значения аргументов (х) без учёта каких-либо поправок на ошибки, полученные при расчётах коэффициента регрессии. Точечная диаграмма при коэффициенте корреляции > 0,7 может показать сильный разброс индивидуальных значений аргумента и не даёт возможность провести прямую линию по ним, а следовательно, точно определить результативность признака У. Теоретическое значение линии регрессии находят по рассчитанному уравнению регрессии, подставляя значения признака Х в формулу, в приведённом примере У = 7,96 + 3,95Х.

Х (факт.) 1,82 1,87 2,65 4,15 5,95

У (теор.) 15,6 15,8 18,9 24,8 31,9.

Построив график уравнения простой линейной корреляции и имея цифровые показатели аргумента (х), можно рассчитать ожидаемую урожайность культуры; однако не следует при этом не учитывать другие факторы, одновременно влияющие на неё.

 



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2017-12-07 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: