Оценка уравнения регрессии




Лекция №3. Нелинейные регрессии и их линеаризация

 

Соотношения, существующие между социально-экономическим явлениями и процессами, далеко не всегда можно выразить линейными функциями. В таких случаях используют нелинейные регрессии. Наиболее часто встречаются следующие виды уравнений нелинейной регрессии:

-степенная ,

-показательная ,

-обратная ,

-гиперболическая ,

-полулогарифмическая .

Для определения параметров нелинейных регрессий используют линеаризацию моделей с последующей заменой переменных, что позволяет применить МНК. Рассмотрим подробно каждую модель.

1.Степенная модель .

Прологарифмируем обе части равенства:

и произведем замену переменных:

.

Получим линейную модель:

, параметры которой A и b можно определить МНК (используя массивы X и Y).

Находим модельное значение:

.

2.Показательная модель .

Прологарифмируем обе части равенства:

и произведем замену переменных:

.

Получим линейную модель: , параметры которой A и В можно определить МНК (используя массивы х и Y).

Находим модельное значение: .

3.Обратная модель .

Произведем замену переменной:

, получим линейную модель:

, параметры которой а и b можно определить МНК (используя массивы х и Y).

Находим модельное значение: .

4.Гиперболическая модель .

Произведем замену переменной:

, получим линейную модель: , параметры которой а и b можно определить МНК (используя массивы Х и у). Находим модельное значение: .

5.Полулогарифмическая модель .

Произведем замену переменной:

, получим линейную модель: , параметры которой а и b можно определить МНК (используя массивы Х и у).

Находим модельное значение: .

Оценка уравнения регрессии

 

После того как уравнение регрессии построено, выполняется проверка значимости построенного уравнения, качества и точности модели.

Качество модели регрессии связывают с адекватностью модели наблюдаемым (эмпирическим) данным. После построения уравнения регрессии можем разбить значение у в каждом наблюдении на две составляющих и :

,

где - расчетное значение у в наблюдении i (то значение, которое имел бы у при условии, что уравнение регрессии было правильным, и отсутствии случайного фактора);

- расхождение между фактическим и спрогнозированным значениями величины y (та часть у, которую мы не можем объяснить с помощью уравнения регрессии).

Для оценки качества регрессионных моделей используют индекс корреляции R:

.

Коэффициент R является универсальным, он отражает тесноту связи и точность модели. При построении линейной модели он равен коэффициенту линейной корреляции.

Индекс корреляции, возведенный в квадрат (), называется коэффициентом детерминации. Он определяет, какая доля вариации признака Y учтена в модели и обусловлена влиянием на него факторов. Чем ближе R 2 к 1, тем лучше качество модели.

Оценить значимость уравнения регрессии – означает установить, соответствует ли математическая модель, выражающая зависимость между Y и Х, фактическим данным и достаточно ли включенных в уравнение объясняющих переменных Х для описания зависимой переменной Y.

Рассмотрим сумму квадратов отклонений зависимой переменной от средней:

,

где - сумма квадратов отклонений, объясненная регрессией;

- остаточная сумма квадратов отклонений, характеризующая влияние неучтенных факторов.

Уравнение регрессии считается значимым, если: , где - критическое значение F -критерия Фишера на уровне значимости при числе степеней свободы .

Для модели парной регрессии:

.

В качестве меры точности применяют несмещенную оценку дисперсии остаточной компоненты, которая представляет собой отношение суммы квадратов уровней остаточной компоненты к величине (n- 2 ).

Квадратный корень из этой величины () называется стандартной ошибкой оценки.

.

Для оценки точности регрессионных моделей используют среднюю относительную ошибку аппроксимации:

.

Чем меньше рассеяние эмпирических точек вокруг теоретической линии регрессии, тем меньше средняя ошибка аппроксимации. Ошибка аппроксимации меньше 7% свидетельствует о хорошей точности модели.

Интервальный прогноз:

где определяется по таблице распределения Стьюдента для уровня значимости a и числа степеней свободы k = n - 2; – стандартная ошибка зависимой переменной; х= значения фактора Х, используемое для прогноза; n – число наблюдений.

Из формулы для расчета доверительного интервала видно, что в точке границы интервала наиболее близки друг к другу. По мере удаления x от ее среднего значения , приводит к увеличению ширины доверительного интервала.

Прогноз значений зависимой переменной по уравнению регрессии хорош только в случае, если значение фактора Х не выходит за пределы выборки. Иными словами, экстраполяция по уравнению регрессии может привести к значительным погрешностям.

Пример

По семи предприятиям легкой промышленности региона получена информация (см. табл.), характеризующая зависимость объема выпуска продукции (Y, млн. руб.) от объема капиталовложений (Х, млн. руб.):

Y              
X              

Для характеристики Y от Х построить линейную и степенную модели, оценить каждую модель, определив: индекс корреляции, среднюю относительную ошибку аппроксимации, коэффициент детерминации, F -критерий Фишера. Составить сводную таблицу вычислений, выбрать лучшую модель, дать интерпретацию рассчитанных характеристик. Сделать точечный прогноз объема выпуска продукции по лучшей модели, если объем капиталовложений составит 89,573 млн. руб. Результаты расчетов отобразить на графике.

1)Построение линейной модели парной регрессии: уравнение линейной модели имеет вид: .

Значения параметров a и b линейной модели определим, используя функцию ЛИНЕЙН:

.

С увеличением объема капиталовложений на 1 млн. руб. объем выпускаемой продукции уменьшится в среднем на 550 тыс. руб. Это свидетельствует о неэффективности работы предприятий, и необходимо принять меры для выяснения причин и устранения этого недостатка. Рассчитаем коэффициент детерминации:

= = 0,822 (применяем функцию КОРРЕЛ).

Вариация результата Y (объема выпуска продукции) на 82,2 % объясняется вариацией фактора Х (объемом капиталовложений).

Оценку значимости уравнения регрессии проведем с помощью F -критерия Фишера:

,

Уравнение регрессии с вероятностью 0,95 в целом статистически значимое.

Определим среднюю относительную ошибку:

.

Таким образом, в среднем расчетные значения для линейной модели отличаются от фактических значений на 5,69 %.

2)Построение степенной модели парной регрессии: уравнение степенной модели имеет вид:

.

Для построения этой модели необходимо произвести линеаризацию переменных. Для этого произведем логарифмирование обеих частей уравнения регрессии:

ln ŷ = ln a + b ln x.

Обозначим Y = ln ŷ, X = ln x, A = ln a. Тогда уравнение регрессии будет иметь вид: Y = A + b ּ X. Определим его параметры, используя данные второго и четвертого столбцов таблицы и функцию ЛИНЕЙН. Получим уравнение степенной модели регрессии:

.

Определим индекс корреляции:

.

Связь между показателем y и фактором x можно считать достаточно сильной.

Коэффициент детерминации рассчитываем как квадрат индекса корреляции:

.

Вариация результата Y (объема выпуска продукции) на 83,6 % объясняется вариацией фактора Х (объемом капиталовложений).

Проверим F -критерий Фишера:

у равнение регрессии с вероятностью 0,95 статистически значимое.

Средняя относительная ошибка аппроксимации для данной модели в пределах нормы:

.

То есть в среднем расчетные значения ŷ для степенной модели отличаются от фактических значений на 6,04 %.

Для удобства анализа построенных моделей результаты регрессионного анализа отобразим в таблице

Модель R2 F-критерий Фишера Индекс корреляции Средняя относительная ошибка, %
1.Линейная 0,822 23,15 0,907 5,69
2.Степенная 0,836 25,44 0,914 6,04

Вывод: модели имеют примерно одинаковые характеристики, но большее значение F – критерия Фишера и большее значение коэффициента детерминации R2 имеет степенная модель. Ее можно взять в качестве оптимальной для построения прогноза.

Прогнозное значение результативного признака (объема выпуска продукции) определим по уравнению степенной модели, подставив в него планируемую (заданную по условию) величину объема капиталовложений:

млн. руб.

 



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2018-12-21 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: