Лабораторная работа №3. Оценка значимости уравнения линейной регрессия и прогнозирование




 

Задание 1. Определить зависимость ввода в действие жилых домов от инвестиции в жилищное строительство по регионам РК. Оцените значимость уравнения регрессии и его параметров.

 

Таблица 5 – Данные для построения уравнения линейной регрессии

Области Инвестиции, млн.тг, х Введено, тыс.кв.м., у (х-хср) (у-уср) у-ỹ Аi
  Акмола   16,04          
  Актобе   43,37          
  Алматы   75,09          
  Атырау   54,94          
  Восточный Казакстан   25,36          
  Жамбыл   27,36          
  Западный Казакстан   33,73          
  Караганды   9,83          
  Костанай   14,70          
  Кызылорда   21,79          
  Мангыстау   45,77          
  Павлодар   11,65          
  Северный Казакстан   3,07          
  Южный Казакстан   73,85          
  Среднее              
  σ2              
  r              
  R2              
  a              
  b              

Требуется:

1. Построить линейное уравнение парной регрессии у от x, определяющее зависимость ввода в действие жилых домов от инвестиции в жилищное строительство.

2. На основе исходных и расчетных значений построить корреляционное поле и тренд уравнения линейной регрессии.

3. Рассчитать линейный коэффициент парной корреляции, коэффициент детерминации.

4. Оценить адекватность модели. Сред­няя ошибка аппроксимации и коэффициент эластичности.

5. Оценить статистическую значимость параметров регрессии и корреляции.

6. Выполнить прогноз ввода жилья y при прогнозном среднем значении инвестиции x на 20%, Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал.

7. Добавить в график уравнения линейной регрессии прогнозное значение результативного признака y.

8. С помощью пакета анализа данных (Сервис–Анализ данных–Регрессия) получить параметры линейной регрессии, корреляции, доверительные интервалы, т.е. вывести итоги по регрессионной статистике, дисперсионному анализу и выводу остатков.

 

Решение:

1. Построить линейное уравнение парной регрессии методом наименьших квадратов.

Используя расчетные формулы:

 

получить уравнение регрессии: ỹ = 16,65 + 0,055 • х.

Вывод: С увеличением инвестиции в строительство жилья на 1млн.тенге ввод жилья незначительно возрастет в среднем на 0,055 кв.м.

 

3. На диаграмме корреляционного поля зависимости переменных х, у построить ряд точек, используя расчетные значения и линию линейного тренда.

 

Рисунок 5 – Тренд уравнения линейной регрессии у = 16,65 + 0,055 • х

 

3. Рассчитать линейный коэффициент парной корреляции и коэффициент детерминации.

Вывод: Связь прямая положительная. Коэффициент детерминации показывает, что 64% вариации ввода жилья (у) объясняется вариацией инвестиции в строительство х.

 

4. Оценить качество уравнения регрессии в целом с помощью F-критерия Фишера. Если F< Fтаб, то R2 незначим; если F> Fтаб, то R2 значим.

Фактическое значение F-критерия:

сравнивается с табличным значением Fтабл=4,75 из таблицы F-критерия Фишера.

Вывод: Уравнение регрессии значимо при уровне значимости α = 0,05.

 

5. Оценку адекватности модели определить средней ошибкой аппроксимации:

Рассчитать коэффициент эластичности:

Показатель эластичности свидетельствует об увеличении на 0,49% ввода кв.м. жилья при увеличении на 1% инвестиции в строительство.

 

6. Оценку статистической значимости параметров регрессии провести с помощью t-статистики Стьюдента.

Выдвигается основная гипотеза о статистически незначимых показателей

Но: a=b=0.

Определить среднеквадратические отклонения Sa, Sb параметров а и b от своих оценок:


Рассчитать фактические значения t-статистики:


Для числа степеней свободы df=n-2=12 и α=0 tтабл=2,178.

Если tфакт>tтабл, то гипотеза Но отклоняется, т.е. a, b не случайно отличаются от нуля и статистически значимы.

Опре­делить предельную ошибку для каждого показателя:

Доверительные интервалы рассчитать с помощью следующих формул:

 

Витоге получить аÎ[5.3; 28.0] и b Î[0.03; 0.08]

Вывод: Анализ верхней и нижней границ доверительных интервалов приводит к выводу о том, что с вероятностью р = 1-a = 0,95, где a=0,05, пара­метры а и b, находясь в указанных границах, не принимают нулевых значений, т.е. не являются статистически незначимыми и сущест­венно отличны от нуля.

 

7. Выполнить прогноз ввода жилья у при прогнозном среднем значении инвестиции х на 20%. Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал.

Если прогнозное значение инвестиции составит: , то прогнозное значение ввода жилья составит:

Среднеквадратичное отклонение (ошибка) прогноза:


Предельная ошибка прогноза, которая в 95% случаевне будет превышена, составит:

Доверительный интервал прогноза : [3,09; 68,51]

Добавить в график уравнения линейной регрессии прогнозное значение результативного признака у.

 


Рисунок 6 – Прогнозное значение на основе линейного уравнения регрессии

 

8. Вывести итоги по регрессионной статистике, дисперсионному анализу и выводу остатков с помощью команды Сервис–Анализ данных–Регрессия. Получить параметры линейной регрессии, корреляции, доверительные интервалы и остатки.

 

Задание 2. По данным проведенного опроса восьми групп семей известны данные связи расходов населения на продукты питания с уровнем доходов семьи. Оцените значимость построенного уравнения регрессии и его параметров.

 

Таблица 6 – Данные для построения уравнения линейной регрессии

№   Доходы семьи, тыс.тг, х Расходы на питание, тыс.тг, у (х-хср) (у-уср) у-ỹ Аi
  1,2 0,9          
  3,1 1,2          
  5,3 1,8          
  7,4 2,2          
  9,6 2,6          
  11,8 2,9          
  14,5 3,3          
  18,7 3,8          
Среднее              
σ              
r              
R2              
a              
b              

 

Требуется:

1. Предположим, что связь между доходами семьи и расходами на питание линейная. Построить корреляционное поле.

 

Рисунок 7 – Корреляционное поле зависимости

 

2. Расчитать параметры линейного уравнения парной регрессии и получить уравнение

3. Рассчитать линейный коэффициент парной корреляции и коэффициент детерминации

4. Оценить качество уравнения регрессии в целом с помощью F-критерия Фишера. Табличное значение Fтабл =4,75 при k1=1, k2=n-2=6, α = 0,05.

Если F> Fтаб, то уравнение регрессии значимо в целом

5. Качество уравнения регрессии определить средней ошибкой аппроксимации.

6. Для оценки статистической значимости коэффициентов регрессии и корреляции рассчитать t- критерий Стьюдента и доверительные интервалы параметров.

Фактические значения t- статистик:

tтабл=2,447 для числа степеней свободы df=n-2=6 и α=0,05.

Для tфакт>tтабл a, b, r статистически значимы.

Рассчитать доверительный интервал для а и b:

В итоге получить: аÎ[0,597; 1,075] и b Î[0,145; 0,191]

7. Найти прогнозное значение результата при значении фактора, составляющем 110% от среднего уровня. Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал.

Если прогнозное значение доходов семьи: ,

то прогнозное значение расходов на питание составит:


Ошибка прогноза:

Предельная ошибка прогноза, которая в 95% случаевне будет превышена, составит:

Вывод: Доверительный интервал прогноза [2,113; 2,867] является статистически надежным.

8. Добавить в график корреляционного поля тренд уравнения линейной регрессии и прогнозное значение результативного признака у.

9. Проверить параметры линейной регрессии, корреляции с помощью пакета Анализ данных командой Сервис– Анализ данных–Регрессия.

 



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2016-04-11 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: