Парная регрессия характеризует связь между двумя признаками: факторным (как правило обозначается через «х ») и результативным (обозначается через «у »)
Простейшие типы кривых, используемые при количественной оценке связей, представлены на рисунке _.
Рисунок__ - Простейшие типы кривых, используемых при количественной оценки связей в уравнениях парной регрессии
а) уравнение прямой; б) уравнение гиперболы; в) уравнение параболы;
г) уравнение показательной функции.
При этом аналитическая форма связи между факторным и результативным признаками ними описывается уравнениями:
Оценка неизвестных параметров уравнений регрессии () производится на основе метода наименьших квадратов, который изучается в курсе высшей математики.
Для парной линейной регрессии система нормальных уравнений, полученная на основе метода наименьших квадратов имеет вид
()
где n – объем исследуемой совокупности число единиц наблюдения)
В уравнениях регрессии параметр b0 показывает усредненное влияние на результативный признак неучтенных (не выделенных для исследования) факторов, а параметры b1, …bnпоказывают насколько изменяется в среднем значение результативного признака при увеличении факторного признака на единицу.
Пример. Имеются исходные данные, приведенные в таблице __. В предположении наличия линейной связи между факторными и результативным признаками построить уравнение парной линейной регрессии.
Таблица __ - Исходные данные
№ п.п | Область | Доля денежных доходов, направленных на прирост сбережений во вкладах, займах, сертификатах и на покупку валюты, в общей сумме среднедушевого денежного дохода, % | Среднемесячная начисленная заработная плата, у.д.е. |
yi | xi | ||
1. | Калужская | 8,4 | |
2. | Костромская | 6,1 | |
3. | Орловская | 9,4 | |
4. | Рязанская | 11,0 | |
5. | Смоленская | 6,4 | |
ИТОГО: | 41,3 |
Для решения системы нормальных уравнения () вначале необходимо определить значения величин ∑ х, ∑у, ∑ х2 и ∑ ху. Эти значения определяем из таблицы исходных данных, дополняя ее соответствующими колонками (таблица)
Таблица 5 – К расчету коэффициентов регрессии
№ п.п | yi | xi | ![]() | ![]() |
1. | 8,4 | 2881,2 | ||
2. | 6,1 | 2171,6 | ||
3. | 9,4 | 2716,6 | ||
4. | 11,0 | 3751,0 | ||
5. | 6,4 | 2092,8 | ||
Итого | 41,3 | 13613,2 |
Тогда система () приобретает вид:
Выражая из первого уравнения b0 и подставляя полученное выражение во второе уравнение, получим:
Производя почленное умножение и раскрывая скобки, получим:
Откуда
Тогда
Окончательно уравнение парной линейной регрессии связывающее величину доли денежных доходов населения, направленных на прирост сбережений (у) с величиной среднемесячной начисленной заработной платы (х) имеет вид:
()
Оценка адекватности моделей построенных на основе уравнений регрессии начинается с проверки значимости коэффициентов регрессии с помощью t - критерия Стьюдента
, ()
где - дисперсия коэффициента регрессии.
Параметр модели признается статически значимым, если выполняется условие
tр > t кр (α; n =n-k -1), ()
где α - уровень значимости критерия проверки гипотезы о равенстве нулю параметров, измеряющих связь, т. е. статистическая существенность связи, утверждается при отклонении нулевой гипотезы об отсутствии связи;
n = (n -k - 1) - число степеней свободы, которое характеризует число свободно варьирующих элементов совокупности.
Дисперсию можно определить по зависимости
, ()
где - дисперсия результативного признака;
k - число факторных признаков в уравнении.
Проверка адекватности регрессионной модели в целом осуществляется с помощью расчета F - критерия ФИШЕРА и величины средней ошибки аппроксимации . (Примечание! Аппроксимировать значит описать приблизительно)
Расчетное значение критерия Фишера Fр определяется по зависимости
()
Если Fр>Fa при a = 0,05 или a = 0,01, то H0 - гипотеза о несоответствии заложенных в уравнении регрессии связей реально существующим отвергается. Величина Fa определяется по специальным таблицам, входом в которые являются величины a = 0,05 или a = 0,01 и числа степеней свободы: v1 =k -1, v2 =n -k, где n - число наблюдений, k - число факторных признаков в уравнении.
Значение средней ошибки аппроксимации, определяется по зависимости
. ()
и не должно превышать (12…15)%
Важным с практической точки зрения является количественная оценка степени связи объясняющей переменной х с зависимой переменной у на основании расчета коэффициента эластичности.
Коэффициент эластичности показывает, на сколько процентов изменится значение зависимой переменной при изменении объясняющей переменной на 1 процент.
Для уравнения парной линейной регрессии коэффициент эластичности определяется по формуле
. ()