Построение линейной регрессионной модели

ОПИСАНИЕ ЗАДАНИЯ

На основании данных нижеприведенной таблицы построить линейное и степенное уравнения регрессии.

Для построенных уравнений вычислить:

1) коэффициент корреляции;

2) коэффициент детерминации;

3) дисперсионное отношение Фишера;

4) стандартные ошибки коэффициентов регрессии;

5) t — статистики Стьюдента;

6) доверительные границы коэффициентов регрессии;

7) усредненное значение коэффициента эластичности;

8) среднюю ошибку аппроксимации.

На одном графике построить исходные данные и теоретическую прямую.

Дать содержательную интерпретацию коэффициента регрессии построенной модели. Все расчеты провести в Excel с использованием формул и с помощью «Пакета анализа». Результаты, полученные по формулам и с помощью «Пакета анализа», сравнить между собой.

По нижеприведенным данным исследуются данные по среднедневной заработной плате yi, (усл.ед.) и среднедушевому прожиточному минимуму в день одного трудоспособного xi, (усл.ед.):

а) Выполнить прогноз заработной платы yi при прогнозном значении среднедушевого прожиточного минимума xi, составляющем 117% от среднего уровня.

б) Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал.

2 ОПИСАНИЕ РЕШЕНИЯ ЛАБОРАТОРНОЙ РАБОТЫ

Построение линейной регрессионной модели

Линейное уравнение регрессии:

где

Чтобы рассчитать значения , мы добавляем к таблице дополнительные столбцы x*y, х², рассчитываем их общую сумму по 36 регионам и их среднее значение.

При вычислении b₁и b₀получены результаты:

b₁= 0,991521606,

b₀= 54,33774319

Значит линейное уравнение регрессии примет вид:

= 54,33774319 + 0,991521606x

Индекс b₁= 0,991521606 говорит нам о том, что при увеличении заработную плату на 1 ед. прожиточный минимум увеличивается на 0,991521606.

Зная линейное уравнение регрессии, заполняем соответствующую колонку для каждого из регионов. В результате мы можем посчитать общую сумму для 36 регионов. Она равна 2320 (усл.ед.). Эта сумма равна общей сумме y для 36 регионов, т.е. , следовательно, коэффициенты регрессии b₁и b₀рассчитаны, верно.

1. Рассчитаем коэффициент корреляции:

, где

Для этого надо еще добавить в таблицу значения y²и рассчитать общую сумму по 36 регионам и его среднее значение.

При вычислении и получены результаты:

=9,765812498

= 93,87081405

Следовательно, r_xy = 0,103152553. Значит можно сделать вывод, что между х и у, то есть между постоянными расходами и объемом выпускаемой продукции не наблюдается никакой связи.

Рассчитаем коэффициент детерминации:

D = r²_xy * 100

D = 1,064044912%

Следовательно, величина постоянных расходов только на 1,064044912% объясняется величиной объема выпускаемой продукции.

2. Рассчитаем дисперсионное отношение Фишера:

, где n – число регионов

Следовательно, n = 36

F _расч= 0,150568403

Найдем F_{табличное}: k₁= m, m = 1(т.к. на y влияет только один фактор х),

k₂ = n- m-1. Значит k₁= 1, k₂ = 36-1-1= 34. Находим табличное значение F на пересечении k₁ и k_2.Получаем, что F_{табличное}= 2,145.

Так как F_{расчетное} < F_{табличное}значит уравнение статистически не значимо.

3. Рассчитаем стандартные ошибки коэффициентов регрессии:

где

Для этого надо еще добавить в таблицу значения y - , (y - )², и рассчитать общую сумму по 36 регионам и их среднее значение.

При вычислении S_ост было получено, что

S_ост= 382,9325409.

Следовательно,

S_b1= 27,7984546,

S_b0 = 918,3564058

4. Рассчитаем доверительные границы коэффициентов регрессии:

, где

t_табл находится по таблице t-критерия Стьюдента при уровне значимости 0,05 и числе степенной свободы равной 34.

Значит t_табл=2,145.

= 1969,87449

= 59,62768512

Следовательно, можно рассчитать доверительные границы коэффициентов регрессии:

Значит можно сделать вывод, что коэффициенты b₁и b₀значимы, так как они лежат в этих интервалах, то есть модель адекватна.

5. Рассчитаем t — статистики Стьюдента:

Получается, что = 0,05916847, = 0,035668228. Значит коэффициент t_b1не значим, т.к. t_b1меньше t_табли t_b0 не значим, так как меньше t_табл,.

Рассчитаем индекс корреляции:

В результате получаем, что I_r =0,103152553=r_xy. Следовательно, индекс корреляции и коэффициент корреляции рассчитаны, верно.

6. Рассчитаем значение коэффициента эластичности:

В результате Э = 0,625256944. Коэффициента эластичности показывает, что на 0,625256944% изменится среднедневная заработная плата (у) при изменении на 1% среднедушевой прожиточный минимум(х).

7. Оценить качество модели можно с помощью коэффициента аппроксимации:

Для этого надо еще добавить в таблицу значения |(y - )/y| и рассчитать общую сумму по 36 регионам.

В результате получаем, что А = 3,100451368, следовательно, коэффициент аппроксимации не принадлежит интервалу [0,7;1]. Значит можно сделать вывод о том, что модель не качественная.

Рассчитаем точность прогноза:

, где

х_р= 10698,1875

=-46434,55

Значит точность прогноза удельных постоянных расходов при прогнозном значении объема выпускаемой продукции, составляющей 119% от среднего уровня составляет 46434.

Рассчитаем ошибку прогноза:

= 6907,6

Значит, ошибка прогноза составляет 6907,6. Вычислим теперь на основе выше рассчитанного доверительный интервал:

Построение линейной регрессионной модели

Поиск по сайту