Отчет по лабораторной работе №1 «Парная линейная регрессия»
по эконометрике
Вариант 117
Выполнила Н. В. Захарова
группа: 7307
Проверил А.П. Котенко
оценка дата
Самара 2015
Исходные данные:
№ | Y | X | X*Y | X^2 | Y^2 | Улр=a+b*x | Y-Yлр | abs((Y-Yлр)/y)*100 |
106,2 | 2442,6 | 11278,44 | 20,190165 | 2,809835 | 12,21667372 | |||
16,32 | 107,94 | 1761,581 | 11651,04 | 266,3424 | 21,415017 | -5,09502 | 31,21946718 | |
17,81 | 113,17 | 2015,558 | 12807,45 | 317,1961 | 25,096612 | -7,28661 | 40,91303998 | |
17,81 | 113,17 | 2015,558 | 12807,45 | 317,1961 | 25,096612 | -7,28661 | 40,91303998 | |
23,74 | 116,65 | 2769,271 | 13607,22 | 563,5876 | 27,546316 | -3,80632 | 16,03334633 | |
15,58 | 121,87 | 1898,735 | 14852,3 | 242,7364 | 31,220872 | -15,6409 | 100,3907087 | |
7,42 | 125,35 | 930,097 | 15712,62 | 55,0564 | 33,670576 | -26,2506 | 353,7813533 | |
57,13 | 127,09 | 7260,652 | 16151,87 | 3263,837 | 34,895428 | 22,23457 | 38,91925711 | |
41,55 | 127,09 | 5280,59 | 16151,87 | 1726,403 | 34,895428 | 6,654572 | 16,01581609 | |
54,16 | 128,83 | 6977,433 | 16597,17 | 2933,306 | 36,12028 | 18,03972 | 33,30819717 | |
46,74 | 130,58 | 6103,309 | 17051,14 | 2184,628 | 37,352172 | 9,387828 | 20,08521225 | |
48,22 | 130,58 | 6296,568 | 17051,14 | 2325,168 | 37,352172 | 10,86783 | 22,53800955 | |
50,45 | 132,32 | 6675,544 | 17508,58 | 2545,203 | 38,577024 | 11,87298 | 23,53414511 | |
50,45 | 134,06 | 6763,327 | 17972,08 | 2545,203 | 39,801876 | 10,64812 | 21,10629179 | |
37,84 | 134,06 | 5072,83 | 17972,08 | 1431,866 | 39,801876 | -1,96188 | 5,184661184 | |
42,29 | 142,76 | 6037,32 | 20380,42 | 1788,444 | 45,926136 | -3,63614 | 8,598098341 | |
54,16 | 149,73 | 8109,377 | 22419,07 | 2933,306 | 50,832583 | 3,327417 | 6,143679533 | |
44,51 | 151,47 | 6741,93 | 22943,16 | 1981,14 | 52,057435 | -7,54744 | 16,95671796 | |
44,55 | 153,21 | 6825,506 | 23473,3 | 1984,703 | 53,282287 | -8,73229 | 19,60109352 | |
154,95 | 7127,7 | 24009,5 | 54,507139 | -8,50714 | 18,49378079 | |||
55,64 | 156,69 | 8718,232 | 24551,76 | 3095,81 | 55,731991 | -0,09199 | 0,165332786 | |
∑ | 795,37 | 2757,77 | 107823,7 | 366949,7 | 35146,13 | 795,37 | 4,19E-12 | 846,1179224 |
Ср.знач. | 37,87476 | 131,3224 | 5134,463 | 17473,79 | 1673,625 | 37,874762 | 2E-13 | 40,29132964 |
Метод определителей для решения системы нормальных уравнений
Параметры a и b рассчитываются в результате решения системы нормальных уравнений относительно a и b:
|
Решим систему методом определителей и получим:
Δ= 100648,3
Δa= -5492182
Δb= 70850,18
a= Δa/ Δ= -54,56804
b= Δb/ Δ= 0,70394
Получаем уравнение линейной регрессии:
Yлр.= -54,56804+0,70394X
Вывод. Величина коэффициента b= 0,70394 означает, что с ростом заработной платы на 1 тыс. руб. доля расходов на покупку продовольственных товаров повышается в среднем на 0,70394 %.
0,687713
15,10714
15,46375
Вывод. Значение rxy=0,687713, т.е. достаточно близок к (1) и существует сильная корреляция y и x.
Коэффициент детерминации составит:
R2 yx= 0,472949
Вывод. Коэффициент детерминации 0<=rxy2 <=(+1), ближе к 0, т.е. регрессия плохо аппроксимирует эмпирические данные.
F-критерий Фишера будет равен:
F= 17,04963
Табличное значение критерия Фишера при числе степеней свободы 1 и 19 и уровне значимости 0,05 равно 4,38.
Вывод: фактическое значение F-критерия Фишера превышает табличное, и можно сделать вывод, что уравнение регрессии статистически значимо.
Ошибки аппроксимации для каждого наблюдения определяются как:
Средняя ошибка аппроксимации находится как средняя арифметическая простая из индивидуальных ошибок:
40,29133
Вывод: величина средней ошибки аппроксимации показывает плохое соответствие.
Решение системы методом определителей: | |||
Значение коэффициента b | 0,703946 | -54,5691 | Значение коэффициента a |
Среднеквадратическое отклонение b | Среднеквадратическое отклонение a | ||
Коэффициент детерминации r2 | 0,472949 | Среднеквадратическое отклонение y | |
F-статистика | 17,04963 | Число степеней свободы | |
Регрессионная сумма квадратов | Остаточная сумма квадратов |
Метод решения системы нормальных уравнений с помощью стандартной функции ЛИНЕЙН(Y,X,1,1)
|
Получаем параметры линейного приближения по методу наименьших квадратов, используя стандартную функцию ЛИНЕЙН(y,x,1,1).
Функция ЛИНЕЙН(y,x,1,1) | |||
Значение коэффициента b | 0,703946 | -54,5691 | Значение коэффициента a |
Среднеквадратическое отклонение b | 0,170483 | 22,53594 | Среднеквадратическое отклонение a |
Коэффициент детерминации r2 | 0,472949 | 11,8025 | Среднеквадратическое отклонение y |
F-статистика | 17,04963 | Число степеней свободы | |
Регрессионная сумма квадратов | 2374,997 | 2646,682 | Остаточная сумма квадратов |
Метод решения системы нормальных уравнений с помощью функции Регрессия
Параметры a и b линейной регрессии y=a+b*x рассчитываются в результате решения системы нормальных уравнений относительно a и b:
Параметры a и b линейной регрессии у=a+b*x получаются с помощью функции Регрессия ППП EXCEL анализа данных.
ВЫВОД ИТОГОВ | ||||||||||||||||
Регрессионная статистика | ||||||||||||||||
Множественный R | 0,670367 | |||||||||||||||
R-квадрат | 0,449392 | |||||||||||||||
Нормированный R-квадрат | 0,418802 | |||||||||||||||
Стандартная ошибка | 12,10386 | |||||||||||||||
Наблюдения | ||||||||||||||||
Дисперсионный анализ | ||||||||||||||||
df | SS | MS | F | Значимость F | ||||||||||||
Регрессия | 2152,296931 | 2152,296931 | 14,69110832 | 0,001218687 | ||||||||||||
Остаток | 2637,060724 | 146,5033736 | ||||||||||||||
Итого | 4789,357655 | |||||||||||||||
Коэффициенты | Стандартная ошибка | t-статистика | P-Значение | |||||||||||||
Y-пересечение | -57,08910588 | 25,11628708 | -2,272991453 | 0,035513609 | ||||||||||||
x | 0,721893866 | 0,18834152 | 3,832898162 | 0,001218687 | ||||||||||||
Получаем уравнение линейной регрессии yлр=b*x+a, где а и b взяты из столбца Коэффициенты:
|
улр=-57,0891+0,721894 *x.
Вывод. Величина коэффициента b= 0,721894 означает, что с ростом заработной платы на 1 тыс. руб. доля расходов на покупку продовольственных товаров повысится в среднем на 0,721894 %.
Сводную таблицу основных статистических характеристик для одного или нескольких массивов данных можно получить с помощью инструмента ППП EXCEL анализа данных Описательная статистика
x | y | ||
Среднее | 38,6185 | Среднее | 132,5785 |
Стандартная ошибка | 3,550151 | Стандартная ошибка | 3,296749 |
Медиана | 44,53 | Медиана | 130,58 |
Мода | 17,81 | Мода | 113,17 |
Стандартное отклонение | 15,87676 | Стандартное отклонение | 14,74351 |
Дисперсия выборки | 252,0715 | Дисперсия выборки | 217,3711 |
Эксцесс | -0,95151 | Эксцесс | -0,89592 |
Асимметричность | -0,73924 | Асимметричность | 0,204746 |
Интервал | 49,71 | Интервал | 48,75 |
Минимум | 7,42 | Минимум | 107,94 |
Максимум | 57,13 | Максимум | 156,69 |
Сумма | 772,37 | Сумма | 2651,57 |
Счет | Счет | ||
Уровень надежности(95,0%) | 7,430552 | Уровень надежности(95,0%) | 6,900176 |
Линейное уравнение регрессии дополняется расчетом линейного коэффициента корреляции:
14,74351
15,87676
ryx = 0,670367
Вывод. Значение ryx=0,670367, т.е. достаточно близко к 1 и существует сильная корреляция y и x.
Вывод. Коэффициент регрессии b=0,721894, т.е. b>0 и
0< ryx <1. –это прямая корреляционная связь. При прямой связи увеличение одной из переменных ведет к увеличению в 0,72 раз условно средней другой.
Коэффициент детерминации составит:
R2yx =0,472949
Вывод. Вариации y на 47,3% объясняется вариацией x. На долю прочих факторов, не учитываемых в регрессии, приходится 52,7%.
Вывод. Коэффициент детерминации ryx2 =0,472949, т.е. 0<=ryx2 <=(+1) и ближе к 0, чем к 1, значит, регрессия плохо аппроксимирует эмпирические данные.
F-критерий Фишера будет равен:
F=17,04963
Табличное значение F-критерия Фишера при числе степеней свободы k1=1 и k=19 и уровне значимости 0,05 составит Fтабл=4,38.
фактическое значение F-критерия Фишера превышает табличное, и можно сделать вывод, что уравнение регрессии статистически значимо.
Вывод: в данной лабораторной работе были применены три метода:
· метод определителей,
· с помощью стандартной функции ЛИНЕЙН(Y,X,1,1),
· с помощью функции Регрессия.
Следовательно, любой из названных методов можно использовать для получения уравнения регрессии.