Вариант 4.3
Номер предприятия | Валовый доход за год, млн.руб. | Среднегодовая стоимость, млн.руб. | |
Основных фондов | Оборотных средств | ||
Х1 прогн = 100, Х2 прогн =80, = 0,03.
1. По МНК необходимо определить коэффициенты линейной регрессии I, I = 0,1, 2.
Для того, чтобы оценить коэффициенты множественной регрессии, представим в матричном виде известные значения X и Y и рассчитаем необходимые оценки b0,b1,b2.
Y |
Матрица X | ||
Воспользуемся следующей формулой: B = (XT X)-1 XT Y, для этого найдем промежуточные значения:
XT
XT X
(XT X)обр
0.76349 | -0.00363 | -0.00514 |
-0.00363 | 0.00007 | -0.00005 |
-0.00514 | -0.00005 | 0.00016 |
XTY
b0,b1,b2
-24.77946071 |
0.401205926 |
1.623284246 |
Таким образом, получили следующее уравнение множественной регрессии:
Y= -24.77946071+0.401205926X1+1.623284246X2
Данное уравнение описывает влияние стоимости основных и оборотных средств на величину валового дохода торговых предприятий.
2. Необходимо оценить статистическую значимость найденных эмпирических коэффициентов регрессии b i, i =0, 1, 2.
Воспользуемся критерием Стьюдента и вычислим, для начала, все необходимое, используя следующие формулы:
Т bi = b i / Sbi
,
S2 = ( (еi2))/(n – m – 1)
Z-1 = (XT X)-1.
Yi | Yоцен | ei | ei2 | ei - ei-1 | (ei - ei-1)2 | Yi - Yср | (Yi - Yср) 2 | |
168.2572148 | -6.257214772 | 39.152737 | 44.58333 | 1987.674 | ||||
101.7579423 | -10.75794231 | 115.73332 | -4.500728 | 20.25655 | -26.4167 | 697.8403 | ||
107.3932858 | 3.606714182 | 13.008387 | 14.364656 | 206.3434 | -6.41667 | 41.17361 | ||
96.79578686 | -38.79578686 | 1505.1131 | -42.4025 | 1797.972 | -59.4167 | 3530.34 | ||
63.60645826 | -19.60645826 | 384.41321 | 19.189329 | 368.2303 | -73.4167 | 5390.007 | ||
82.6428162 | 0.357183798 | 0.1275803 | 19.963642 | 398.547 | -34.4167 | 1184.507 | ||
90.8330796 | -14.8330796 | 220.02025 | -15.19026 | 230.7441 | -41.4167 | 1715.34 | ||
160.1592541 | -4.159254084 | 17.299395 | 10.673826 | 113.9306 | 38.58333 | 1488.674 | ||
216.3699308 | 23.63006919 | 558.38017 | 27.789323 | 772.2465 | 122.5833 | 15026.67 | ||
48.79383408 | 74.20616592 | 5506.5551 | 50.576097 | 2557.942 | 5.583333 | 31.17361 | ||
195.0321746 | 4.96782544 | 24.67929 | -69.23834 | 4793.948 | 82.58333 | 6820.007 | ||
77.35822299 | -12.35822299 | 152.72568 | -17.32605 | 300.192 | -52.4167 | 2747.507 | ||
∑ | -0.0000004 | 8537.2082 | 40660.92 | |||||
Ср.знач. | 117.41667 | 117.4166667 | 0.0000000 | 711.43401 |
s2 | s2b0 | s2b1 | s2b2 |
948.57868 | 724.2348259 | 0.068829047 | 0.1558893 |
s | sb0 | sb1 | sb2 |
30.799005 | 26.91161136 | 0.262352905 | 0.3948282 |
tкр | tb0 | tb1 | tb2 |
2.9982034 | -0.920772093 | 1.529260468 | 4.1113684 |
По таблице Стьюдента определим Tкр, при значении α/2=0,03/2, и ν=9:
Tкр=2.9982, таким образом, получается, что коэффициенты b0 и b1 не значимы, а b2 – значим.
3. В соответствие с заданным значением построим доверительные интервалы для найденных коэффициентов;
Воспользуемся следующими формулами:
Тb0 = ;
Tb1 = ;
Tb1 = ;
Tкр=2,9982.
Интервальные оценки находим по следующим формулам:
b0 – tкр*Sb0 < β0 < b0 + tкр*Sb0
b1 – tкр*Sb1 < β1 < b1 + tкр*Sb1
b2– tкр*Sb2< β2< b2+ tкр*Sb2
Получаем такие результаты:
нижняя граница | верхняя граница | |
b0 | -105.4659461 | 55.90702467 |
b1 | -0.385381452 | 1.187793304 |
b2 | 0.439508944 | 2.807059548 |
Очень большой разброс в интервальной оценке b0 подтверждает предыдущую оценку о его не значимости.
4,6. Вычислим коэффициент детерминации R2 и оценим его статистическую значимость при заданном значении ; сравним полученный коэффициент со скорректированным коэффициентом детерминации.
Для проверки общего качества уравнения регрессии вычислим сначала коэффициент детерминации, а затем скорректированный коэффициент детерминации, чтобы нивелировать рост данного коэффициента, обусловленный увеличением количества объясняющих переменных X. Естественно, что скорректированный коэффициент детерминации будет меньше обычного коэффициента детерминации.
R2 = 1 - еi2 / (Уi - )2
R2 = 0.790039
По величине R2 можно только предполагать насколько значимо или не значимо уравнение регрессии. Для того, чтобы быть более уверенными, проверим статистическую значимость самого коэффициента детерминации. Для этого проверяются гипотезы:
Н0: R2 = 0,
Н0: R2 > 0.
Для проверки используем распределение Фишера. Вычисляем F – статистику:
Fнабл. = 16.932548
При заданном уровне значимости =0,03 по таблице критических точек Фишера находим Fкр, и если F > Fкр, то R2 статистически значим.
Fкр = 5.31, т.е. Fнабл > Fкр, а это говорит о том, что коэффициент детерминации статистически значим.
= 0.743381
Коэффициент детерминации не является достаточно высоким, а скорректированный коэффициент даже ниже 0,75. Полученные результаты позволяют сделать вывод о том, что в целом уравнение множественной регрессии не имеет высокого качества, даже несмотря на статистическую значимость коэффициента детерминации.
5. Определим, какой процент разброса зависимой переменной объясняется данной регрессией;
Значение коэффициента детерминации R2 = 0.790039 не достаточно высоко. Разброс зависимой переменной только на 79,01% объясняется функциональной зависимостью, а значит 20.99% разброса зависимой переменной обусловлен наличием ошибок, возникающих из-за неточности описания данной регрессией настоящей зависимости между величиной валового дохода торговых предприятий и стоимости основных и оборотных средств.
7. Вычислим статистику DW Дарбина-Уотсона и оценим наличие автокорреляции;
Статистика Дарбина – Уотсона DW рассчитывается по формуле:
По таблицам критических точек Дарбина – Уотсона, входными параметрами которых являются: n – число наблюдений; m – количество объясняющих переменных; - уровень значимости, определяются два числа: d1 – нижняя граница; du – верхняя граница.
Выводы осуществляются по следующей схеме.
Если DW < d1, то это свидетельствует о положительной автокорреляции остатков.
Если DW > 4 - d1, то это свидетельствует об отрицательной автокорреляции остатков.
При du < DW < 4 – du принимается гипотеза об отсутствии автокорреляции остатков.
Если d1 < DW < du или 4 – du < DW < 4 – d1, то остается неопределенность по вопросу наличия или отсутствия автокорреляции остатков.
DW = 1.3541138
Подсчитаем приблизительно значения d1, du, так как наших параметров запроса в таблице нет:
d1 ~ 0,85 du ~ 1,53
Таким образом, получается, что d1 < DW < du, что свидетельствует о том, что остается неопределенность по вопросу наличия или отсутствия автокорреляции остатков. Это говорит о том, что данная множественная регрессия недостаточно хорошо описывает существующую зависимость, но позволяет нам не отвергать данное уравнение.
8. Посредством коэффициентов bi, i = 1, 2, оценим в % отношении влияние объясняющих переменных Х1, Х2 на изменение объясняемой переменной;
Для оценки эффективности влияния объясняющих переменных на изменение объясняемой переменной используется коэффициент эластичности, так как эластичность показывает на сколько измениться объясняемая переменная при изменении объясняющей переменной на 1%.
Эластичность рассчитывается по следующей формуле:
Вычислим эластичность для X1 и X2:
b1 | 0.3331518 |
b2 | 0.8778869 |
Таким образом, при увеличении (снижении) среднегодовой стоимости основных фондов (X1) на 1 %, валовой доход торговых предприятий вырастет (упадет) на 0,3331518%, а при увеличении (уменьшении) среднегодовой стоимости оборотных средств на 1 %, валовой доход торговых предприятий вырастет (упадет) на 0,8778869 %. По полученным данным можно сделать вывод о том, что объясняющая переменная X2 влияет на изменении Y сильнее, чем объясняющая переменная X1, т.е. среднегодовая стоимость оборотных средств влияет на валовой доход торговых предприятий сильнее, нежели среднегодовая стоимость их основных фондов.
9. Спрогнозируем значение объясняемой переменной Yпрогн для прогнозных значений Х1 прогн, Х2 прогн и определим доверительный интервал для Yпрогн;
Xпрогн. | |
Yпрогн. |
145.20387 |
Интервальный прогноз для среднего значения вычисляется следующим образом:
р tкр S , (2.15)
где р = b 0 + b 1 x1р + b 2 x2р + …+ b m xmр; tкр – критическое значение, полученное по распределению Стьюдента при количестве степеней свободы = n – m – 1=9 и заданной вероятности /2=0,03/2.
нижняя граница | верхняя граница | |
Yср.пр. | 64.517386 | 225.89036 |
Итак, получилось что среднее значении Y может колебаться в достаточно широких пределах, от 64.517386 до 225.89036. Такие широкие границы опять же свидетельствуют о том, что данное уравнение множественной регрессии не совсем четко описывает зависимость переменных.
10. Сделаем обобщающие выводы по регрессионной модели.
Изучая влияние среднегодовой стоимости основных фондов и среднегодовой стоимости оборотных средств на валовой доход торговых предприятий, была построена множественная регрессионная модель на основе предложенных статистических данных. С помощью метода наименьших квадратов нашли параметры уравнения регрессии и получили следующее уравнение:
Y= -24.77946071+0.401205926X1-1.623284246X2
Вторая часть работы заключалась в оценке качества полученного уравнения и необходимости сделать заключение о возможности или невозможности применения данного уравнения на практике.
Поочередно были оценены на статистическую значимость коэффициенты b0,b1,b2. Получили, что среди этих трех коэффициентов значимым является лишь b2, особенную не значимость коэффициента b0 подтверждает очень большой разброс в его интервальных значениях (от -105.5 до 55.9).
Оценивая общее качество уравнения регрессии, я вычислил коэффициент регрессии и скорректированный коэффициент регрессии. Величина коэффициента регрессии оказалась совсем невелика, что говорит о не совсем высоком качестве данной регрессионной модели, но коэффициент детерминации является статистически значимым.
Оценивая количественное содержание коэффициента регрессии (R2 = 0.790039), необходимо отметить, что, таким образом, получается, что разброс зависимой переменной только на 79,1% объясняется функциональной зависимостью, а значит 20,9% разброса зависимой переменной обусловлен наличием ошибок, возникающих из-за неточности описания данной регрессией настоящей зависимости между величиной валового дохода торговых предприятий и стоимости основных и оборотных средств.
Определив эластичность для переменных X1 и X2, можно заявить о том, что среднегодовая стоимость оборотных средств сильнее влияет на валовой доход торговых предприятий, чем среднегодовая стоимость основных фондов, но вообще зависимость не очень сильная, так как при увеличении (снижении) среднегодовой стоимости основных фондов (X1) на 1 %, валовой доход торговых предприятий вырастет (упадет) на 0,3331518%, а при увеличении (уменьшении) среднегодовой стоимости оборотных средств на 1 %, валовой доход торговых предприятий вырастет (упадет) на 0.8778869%.
Оценивая наличие автокорреляции между ошибками, использую статистику Дарбина-Уотсана, пришли к выводу о том, что продолжает оставаться неопределенность в отношении существования автокорреляции, но это позволило не отвергать полученное регрессионное уравнение.
На конечном этапе было вычислено прогнозное значение Y для прогнозных значений X и интервальные оценки для Y среднего прогнозного. Большие пределы колебаний в доверительном интервале для средних значений Y прогнозного также говорит о невысоком качестве регрессионной модели.
Общий вывод о построенной модели таков: данная модель может описывать зависимость между среднегодовой стоимостью основных фондов и среднегодовой стоимостью оборотных средств и валовым доходом торговых предприятий, но она не отличается высоким качеством. Возможно, что существует другая модель, которая могла бы описать данную зависимость более четко и с менее значимыми ошибками.
Метод 2. Использование «Комплексной» функции.
Y | Матрица X | |||
1.623284 | -0.61104 | -24.7795 |
0.394828 | 0.286234 | 26.91161 |
0.790039 | 30.799 | #Н/Д |
16.93255 | #Н/Д | |
32123.71 | 8537.208 | #Н/Д |
b0 | b1 | b2 | Sb0 | Sb1 | Sb2 |
-24.7795 | -0.61104 | 1.623284 | 26.91161 | 0.286234 | 0.394828 |
Sy | r2 | F -статист | Кол.ст.св | Ss рег | Ss ост |
30.799 | 0.790039 | 16.93255 | 32123.71 | 8537.208 |
Определение Ттабл и Fтабл | |||||
Al = | 0,03 | Выводы:1)Если Тbi > Tтабл, то коэффициенты bi - статистически asdddddddddasdadasdadadadasdasdadas значимы, таким образом, получаем, что b0,b1 - статистически не Dasdasdaasdasdasdasdasdasdasdasdasdasdasdadadasdasdasdasdasdasdasdasdas значимы, а b2 - статистически значим; 2) Если F-статист > sdasdasdasdasdasdasdasdasdasdasdasdadasdasdasdasdasdasdadasdasdasdasds Fтабл,то коэффициент детерминации R2- cтатистически значим sadasdasdsadsadasdasdasdasdadasdsadadadasdsadasdasdasdasdasdasdasdasdasd и общее качество модели высокое, в нашим случае так и sadasdasdasdasdasdasdasdasdasdasdasdasasdasdasdasdasdasdasdasdasdasdasd получается. | |||
Fтабл | Ттабл | ||||
5.31 | 2.9982034 | ||||
Yi | Yоцен | ||||
168.2572148 | |||||
101.7579423 | |||||
107.3932858 | |||||
96.79578686 | |||||
63.60645826 | |||||
82.6428162 | |||||
90.8330796 | |||||
160.1592541 | |||||
216.3699308 | |||||
48.79383408 | |||||
195.0321746 | |||||
77.35822299 |
Определение Т-статистики для коэффициентов bi и доверительных интервалов
bo | b1 | b2 | |
Т-статистика | -0.920772093 | 1.529260468 | 4.1113684 |
Нижн.гран.дов.инт | -105.4659 | -0.385381452 | 0.439508944 |
Верх.гран.дов.инт | 55.90702467 | 1.187793304 | 2.807059548 |
ВЫВОД ИТОГОВ |
| ||||||||
Регрессионная статистика | |||||||||
Множественный R | 0.888841 | ||||||||
R-квадрат | 0.790039 | ||||||||
Нормированный R-квадрат | 0.743381 | ||||||||
Стандартная ошибка | 30.799 | ||||||||
Наблюдения | |||||||||
Дисперсионный анализ | |||||||||
df | SS | MS | F | Значимость F | |||||
Регрессия | 32123.70852 | 16061.85426 | 16.93254818 | 0.00089048 | |||||
Остаток | 8537.208151 | 948.5786835 | |||||||
Итого | 40660.91667 | ||||||||
Коэффициенты | Стандартная ошибка | t-статистика | P-Значение | Нижние 95% | Верхние 95% | Нижние 95.0% | Верхние 95.0% | ||
Y-пересечение | -24.7795 | 26.91161136 | -0.920772093 | 0.381187868 | -85.65775498 | 36.09883356 | -85.65775498 | 36.09883356 | |
Переменная X 1 | 0.401206 | 0.262352905 | 1.529260466 | 0.160553473 | -0.192277576 | 0.994689427 | -0.192277576 | 0.994689427 | |
Переменная X 2 | 1.623284 | 0.394828213 | 4.111368416 | 0.002631629 | 0.730120777 | 2.516447715 | 0.730120777 | 2.516447715 | |
ВЫВОД ОСТАТКА | |||||||||
Наблюдение | Предсказанное Y | Остатки | |||||||
168.2572 | -6.25721474 | ||||||||
101.7579 | -10.75794228 | ||||||||
107.3933 | 3.606714222 | ||||||||
96.79579 | -38.79578682 | ||||||||
63.60646 | -19.60645826 | ||||||||
82.64282 | 0.357183841 | ||||||||
90.83308 | -14.83307957 | ||||||||
160.1593 | -4.159254053 | ||||||||
216.3699 | 23.63006924 | ||||||||
48.79383 | 74.20616594 | ||||||||
195.0322 | 4.967825469 | ||||||||
77.35822 | -12.358223 |