Теоретическая линия регрессии представляет собой такую математически правильную кривую (либо прямую) линию, которая проходит наиболее близко к точкам эмпирической линии регрессии выражает общую закономерность средних изменений признака в связи со средними изменениями фактора.
В нашем примере характер размещения точек на корреляционном поле делает весьма вероятной гипотезу о линейной связи y от x y = a 0 + a 1 x.
Параметры искомой прямой (ао,а1) находим из системы уравненной по способу наименьших квадратов:
ì na ¢ | + a ¢S x ¢ = S y ¢ | |||||
í | o | (5) | ||||
S x ¢ + a ¢S(x ¢)2 | ||||||
ï a ¢ | = S y ¢ x ¢ | |||||
î o | i |
Исходную информацию для решения системы(5) получаем из таблицы 11, которая основана на результатах таблицы 10.
Для получения упрощенных вариантов по факторному признаку также используем метод отсчета от условного нуля. В нашем примере примем cx =307
тыс.руб, ix =9 тыс.руб
Результатов расчетов по нашему примеру приведены в таблице11.
Расчет эмпирической линии регрессии для зависимости y от x
y ¢ | x | Численность рабочих, чел. | ||||||||||||||||||||
y | ||||||||||||||||||||||
о | ||||||||||||||||||||||
16 | 16 | 16 | ||||||||||||||||||||
б | ||||||||||||||||||||||
ъ | ||||||||||||||||||||||
м | 13 | |||||||||||||||||||||
12 | ||||||||||||||||||||||
С | 11 | 11 | ||||||||||||||||||||
М | 10 | |||||||||||||||||||||
Р | -1 | 1-1 | 1-1 | |||||||||||||||||||
-2 | 1-2 | |||||||||||||||||||||
тыс. | -3 | 1-3 | ||||||||||||||||||||
руб. | -4 | 2-8 | ||||||||||||||||||||
№ | Итого | |||||||||||||||||||||
hi | ||||||||||||||||||||||
стро- | å | m | y ¢ | -12 | -2 | |||||||||||||||||
i | i | |||||||||||||||||||||
ки | 3,5 | -3 | -0,67 | |||||||||||||||||||
y ¢ | ||||||||||||||||||||||
22,7 | ||||||||||||||||||||||
y | ||||||||||||||||||||||
|
|
Расчет теоретической линии регрессии для зависимости y | |||||||||||||||||
О | Численность рабочих, чел. | ||||||||||||||||
б | y ¢ | ||||||||||||||||
x ¢ | |||||||||||||||||
ъ | x ¢ | -5 | -4 | -3 | -2 | -1 | li | ||||||||||
е | x | ||||||||||||||||
м | y | ||||||||||||||||
С | |||||||||||||||||
М | |||||||||||||||||
Р, | |||||||||||||||||
т | |||||||||||||||||
ы | |||||||||||||||||
с. | |||||||||||||||||
р | -1 | ||||||||||||||||
у | -2 | ||||||||||||||||
б | -3 | ||||||||||||||||
-4 | |||||||||||||||||
№ | Итого | n=15 | |||||||||||||||
hi | |||||||||||||||||
с | S hix ¢ | -5 | -6 | -2 | -2 | ||||||||||||
т | |||||||||||||||||
р | S h x ¢2 | ||||||||||||||||
о | i | ||||||||||||||||
к | S m y ¢ | -12 | -2 | -4 | |||||||||||||
i i | |||||||||||||||||
и | S m y ¢ x | ¢ | -30 | -18 | -4 | -7 | -2 | -20 | |||||||||
i i | |||||||||||||||||
|
В качестве проверки правильного составление таблицы 6 должно соблюдаться равенство итогов четвертой строки и второго столбца. Если это условие не соблюдается, то в расчетах допущена ошибка, которая может привести к существенным искажениям величины параметров теоретической линии регрессии.
В систему уравнений (5) подставим результаты, полученные в табл. 6.
ì15 a ¢ | - 5 a ¢ = 6 | |||
í | o | (6) | ||
-5 a ¢ | + 81 a ¢ = -75 | |||
î | ||||
o |
В качестве метода решения системы (6) принимаем метод Гаусса, который позволяет находить решения последовательно, исключая неизвестные. Для этого 1-ое уравнение системы (6) делим на 5, а 2-ое уравнение -
на 81:
ì3 a ¢ | - a ¢ =1,2 | |||||||
í | o | (7) | ||||||
-0,062 a ¢ | + a ¢ = -0,926 | |||||||
î | ||||||||
o | ||||||||
Сложим уравнения системы (7): | ||||||||
2,938 a ¢ =0,274 | ||||||||
o | ||||||||
откуда | a ¢=0,093. | |||||||
o | ||||||||
Затем в 1-ое уравнение системы (7) подставляем значение | a ¢ | и находим | ||||||
o | ||||||||
величину a ¢: | ||||||||
× 0,093- a ¢ =1,2 | ||||||||
a 1¢=-0,921.
Параметры ao ¢ и a 1¢ необходимо преобразовать исходя из фактических
значений x и y.
Формулы перевода из упрощенных в реальные координаты:
a | = a ¢ × | iy | (8) | |||||||
i | ||||||||||
x | ||||||||||
a | = c + i | a ¢ | - a ¢ | iy | c | (9) | ||||
o | y | y o | 1 i | x | ||||||
x |
где iy - интервал группивровки по функции; ix -интервал группировки по аргументу; сy -новое начало отсчета по функции;
сx -новое начало отсчета по аргументу.
По формулам (8), (9) находим:
? 1= -0,2; a 0=86,9.
Уравнение теоретической линии регрессии в реальных коэффициентах имеет вид y=86,9-0,2x.
В уравнении регрессии первое слагаемое носит название свободного члена, второе слагаемое называется коэффициентом регрессии. Он показывает, на сколько натуральных единиц изменяется в среднем результативный признак при изменении факторного признака на единицу.
В нашем примере из уравнения теоретической линии регрессии видно, что объем СМР понижается на 0,2% при увеличении численности на 1%.
Объем СМР,не зависящий от рассматриваемых факторов, равен 86,9 тыс.руб.
Для графического изображения линии регрессии, рассчитанной по линейной гипотезе, достаточно определить две точки, через которые можно провести прямую.
В нашем примере по x1=302 тыс.руб; y1=26,5 и x2=347,5; y2=17,4 проводим на поле корреляции прямую линию.
Графическое изображение теоретической линии регрессии в виде уравнения прямой еще раз подтверждает наличие корреляционной связи между изучаемыми признаками.
Измерение тесноты связи
Коэффициент корреляции ry является одним из наиболее совершенных
x
методов измерения тесноты связи. Коэффициент корреляции отвечает на вопрос, в какой мере соблюдается строгая пропорциональность в изменениях функционального и факториального признаков.
Коэффициент корреляции может принимать как положительные, так и
отрицательные значения, т.е.
-1 £ r £1.
При выполнении корреляционных расчетов, когда связь между признаками x и y выражается прямой линией, соблюдается условие, при котором знак при коэффициенте корреляции ry должен совпадать со знаком при коэффициенте
x
регрессии а1.
Для расчета коэффициента корреляции существует формула, представленная в упрощенных координатах признаков x и y.
& | & | |||||||||||||||||||||
ry | = | n S x ¢ y ¢ - S x ¢S y ¢ | . | (7) | ||||||||||||||||||
& | & | & | & | |||||||||||||||||||
x | ||||||||||||||||||||||
n S(x ¢) | - (S x ¢) | n S(y ¢) | - (S y ¢) | |||||||||||||||||||
В нашем примере исходную информацию для нахождения ry | принимаем | |||||||||||||||||||||
x | ||||||||||||||||||||||
из таблицы 11. | ||||||||||||||||||||||
ry = | 15 × (-75) + (-5) × 6 | = -0,6. | (8) | |||||||||||||||||||
15 × 81 | - 25 | 15 ×186 | - 36 | |||||||||||||||||||
x | ||||||||||||||||||||||
Выполненные расчеты показывают, что между объемом СМР и численностью рабочих существует отрицательная корреляция, которая говорит о том, что с увеличением факторного признака x функциональный признак y уменьшается.
Знак при коэффициенте корреляции совпадает со знаком регрессии a1, что свидетельствует о правильности произведенных вычислений. Случайные факторы оказывают большое влияние на функцию, так как r=-0,6, следовательно имеем по соотношению Чэддока заметную связь между изучаемыми явлениями.
Имеются и другие формулы линейного коэффициента корреляции, Линейный коэффициент корреляции r представляет собой среднюю
величину из произведений нормированных отклонений для x и у:
æ | æ | ö | |||||||||||||||||||||||||||||
ö | |||||||||||||||||||||||||||||||
x - x ç | y - y ÷ | ||||||||||||||||||||||||||||||
ç | ÷ | ||||||||||||||||||||||||||||||
åç | ÷ | ÷ | å | (x - x)(y - y) | |||||||||||||||||||||||||||
è | s x | ç | s y | , | (9) | или | . | (10) | |||||||||||||||||||||||
ø | |||||||||||||||||||||||||||||||
r = | è | ø | r = | ns s | |||||||||||||||||||||||||||
n | y | ||||||||||||||||||||||||||||||
x | |||||||||||||||||||||||||||||||
Числитель формулы Ошибка! Источник ссылки не найден., деленный на n, | |||||||||||||||||||||||||||||||
т.е. å | (x - x)(y - y) | ||||||||||||||||||||||||||||||
= (x - x)(y - y), | представляет | собой среднее | произведение | ||||||||||||||||||||||||||||
n | |||||||||||||||||||||||||||||||
отклонений значений двух признаков от их средних значений, именуемое ковариацией. Поэтому можно сказать,что линейный коэффициент корреляциипредставляет собой частное от деления ковариации между х и у на произведение их средних квадратических отклонений. Путем несложных математических преобразований можно получить и другие модификации формулы линейного коэффициента корреляции, например:
r = | xy - x y | . | (11) |
s xs y
Линейный коэффициент корреляции может принимать значения от –1 до +1, причем знак определяется в ходе решения. Например, если xy > x y, то r по формуле Ошибка! Источник ссылки не найден. будет положительным, что характеризует прямую зависимость между х и у, в противном случае (r< 0) – обратную связь. Если xy = x y, то r= 0, что означает отсутствие линейной зависимости между х и у, а при r= 1 – функциональная зависимость между х и у. Следовательно, всякое промежуточное значение r от 0 до 1 характеризует степень приближения корреляционной связи между х и у к функциональной. Таким образом, коэффициент корреляции при линейной зависимости служит как мерой тесноты связи, так и показателем, характеризующим степень приближения корреляционной зависимости между х и у к линейной. Поэтому близость значения r к 0 в одних случаях может означать отсутствие связи между х и у, а в других свидетельствовать о том, что зависимость не линейная.
В нашей задаче для расчета r построить вспомогательную таблицу 12.
Таблица 12
. Вспомогательные расчеты линейного коэффициента корреляции
i | xi | yi | (x - x)2 | (y - y)2 | xy | ||||||||||||||
(x - x)(y - y) | |||||||||||||||||||
Пользуясь данными табл.12 рассчитать линейный коэффициент корреляции по формулам 10 и11.