Средняя ошибка аппроксимации




Оценку качества построенной модели дает коэффициент детерминации, а также средняя ошибка аппроксимации.

Средняя ошибка аппроксимации – среднее отклонение расчетных значений зависимой переменной от фактических:

Допустимый предел значений A – не более 8-10 %.

Пример 2.5. Построим регрессионные зависимости: а) расходов на питание (y) и личным доходом (x); б) расходов на питание (y) и временем (t) по следующим данным (усл. ед.):

Год          
X          
Y          

 

и оценим качество подгонки.

а) Пусть истинная модель описывается выражением y = a + b x + e.

По выборочным наблюдениям определяем оценки (a; b).

Исходные данные и расчетные показатели представим в виде следующей расчетной таблицы:

Год X Y X 2 Xy
          -0,2   38,44 1,44
          2,9   9,61 0,81
                 
          9,1   9,61 3,61
          12,2   38,44 0,04
Итого             96,1 9,9
Сред.       84,8   21,2 19,22 1,98

 

Окончательно имеем:

Cледовательно, .

Коэффициент b = 0,775 показывает, что при увеличения дохода на 1 усл. ед расходы на питание увеличиваются в среднем на 0,775 усл. ед.

Замечание. В Excel оценки (a, b) можно также определить с помощью функций:

а = ОТРЕЗОК (массив y; массив x), b = НАКЛОН (массив y; массив x).

Условие выполняется.

Качество подгонки оцениваем коэффициентом детерминации:

, т.е. 90,7 % вариации зависимой переменной (расходы на питание) объясняется регрессией.

Значимость коэффициента R 2 проверяем по F -тесту

.

Произведем проверку значимости R 2 двумя способами.

1. При α = 0,05, n 1= 1 и n 2 = 3 по таблице или с помощью функции FРАСПОБР(α; n 1; n 2)[1] находим F кр = 10,13. Поскольку F = 29,2 > F кр = 10,13, то R 2 = 0,952 значим при 5 % уровне.

2. Наблюдаемому (расчетному) значению критерия F = 29,2 соответствует значимость F =0,0124, которую можно определить в Excel с помощью функции FРАСП(F; n 1; n 2)[2].

Поскольку значимость F = 0,0124 < 0,05, то R 2 значим при уровне 5 %.

б) Пусть истинная модель y = a + b t + e, (модель временного ряда). Выборочная регрессия , где t – время, определяемое как t = 1 для 1990 г., t = 2 для 1991 г. и т.д.

Представим исходные и расчетные показатели в виде расчетной таблицы:

Год t Y t 2 ty
          –0,2
          2,9
           
          9,1
          12,2
Итого          
Среднее       24,2  

 

Окончательно имеем

, следовательно, .

Коэффициент b = 3,1 показывает, что за год расходы на питание в среднем возрастают на 3,1 единиц.

Пример 2.6. Покажем, что в модели регрессии без свободного члена

Y = b X + e оценка МНК для b есть:

.

Выборочная регрессия для этой модели есть . Наблюдаемые значения зависимой переменной связаны с расчетными уравнением . Оценку b найдем из минимизации величины:

.

Запишем необходимые условия экстремума:

, откуда .

Вычисление R 2 при отсутствии свободного члена некорректно; при этом не выполняется условие .

Пример 2.7. Покажем, что в модели регрессии Y = a + e оценка МНК для a есть: .

Выборочная регрессия для заданной модели есть . Наблюдаемые значения зависимой переменной связаны с расчетными значениями уравнением: . Оценку a найдем из минимизации величины

.

Запишем необходимые условия экстремума:

откуда

Выборочная регрессия .


[1] F.ОБР.ПХ

[2] F.РАСП.ПХ



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2019-02-11 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: