Имеются следующие данные по 21 региону.
| № | Y | X1 | X2 | X3 |
| 55,0 | 27,0 | 63,0 | ||
| 16,0 | 57,0 | 50,0 | ||
| 50,0 | 58,0 | 47,0 | ||
| 49,0 | 53,0 | 50,0 | ||
| 58,0 | 36,0 | 14,0 | ||
| 59,0 | 53,0 | 64,0 | ||
| 38,0 | 16,0 | 54,0 | ||
| 49,0 | 38,0 | 66,0 | ||
| 22,0 | 34,0 | 36,0 | ||
| 43,0 | 19,0 | 43,0 | ||
| 39,0 | 23,0 | 50,0 | ||
| 31,0 | 24,0 | 35,0 | ||
| 57,0 | 29,0 | 12,0 | ||
| 23,0 | 38,0 | 62,0 | ||
| 49,0 | 44,0 | 29,0 | ||
| 31,0 | 53,0 | 16,0 | ||
| 14,0 | 35,0 | 42,0 | ||
| 68,0 | 18,0 | 48,0 | ||
| 39,0 | 50,0 | 59,0 | ||
| 14,0 | 60,0 | 23,0 | ||
| 58,0 | 60,0 | 25,0 |
Задание:
1. Рассчитайте параметры линейного уравнения множественной регрессии с полным перечнем факторов (2 способами: матричным и с помощью функции Excel).
2. Оцените показатели вариации каждого признака и сделайте вывод о возможностях применения МНК для их изучения.
3. Дайте сравнительную оценку силы связи факторов с результатом с помощью средних (общих) коэффициентов эластичности.
4. Оцените статистическую значимость параметров регрессионной модели с помощью t-критерия; нулевую гипотезу о значимости уравнения и показателей тесноты связи проверьте с помощью F- критерия.
5. Оцените качество уравнения через среднюю ошибку аппроксимации.
6. Рассчитайте коэффициент детерминации и скорректированный коэффициент детерминации.
7. Рассчитайте матрицы парных и частных коэффициентов корреляции и на их основе сделайте выводы по модели.
8. Отберите информативные факторы в модель. Постройте модель только с информативными факторами и оцените ее параметры.
9. Рассчитайте прогнозное значение результата, если прогнозные значения факторов составляют 80 % от их максимальных значений.
10. Рассчитайте ошибки и доверительный интервал прогноза для уровня значимости 5 % (
).
11. Оцените полученные результаты, выводы оформите в аналитической записке.
Решение:
1. Рассчитаем параметры линейного уравнения множественной регрессии с полным перечнем факторов:
А) матричным способом:
, где
- матрица, составленная из факторов регрессии, включая столбец 1,
- матрица-столбец, составленная из результирующего фактора.
| х | |||
| хт*х | |||
| обр.хт*х | |||
| 1,23756 | -0,00918 | -0,01168 | -0,00838 |
| -0,00918 | 0,000192 | 3,32E-05 | -4E-08 |
| -0,01168 | 3,32E-05 | 0,000235 | 2,61E-05 |
| -0,00838 | -4E-08 | 2,61E-05 | 0,000174 |
| бетта |
| 629,1271 |
| -0,40261 |
| 1,39136 |
| -0,5974 |
Б) с помощью функции Excel «Регрессия»:
| ВЫВОД ИТОГОВ | ||||||||
| Регрессионная статистика | ||||||||
| Множественный R | 0,396299 | |||||||
| R-квадрат | 0,157053 | |||||||
| Нормированный R-квадрат | 0,008298 | |||||||
| Стандартная ошибка | 65,50267 | |||||||
| Наблюдения | ||||||||
| Дисперсионный анализ | ||||||||
| df | SS | MS | F | Значимость F | ||||
| Регрессия | 13589,8 | 4529,934 | 1,055781 | 0,393688 | ||||
| Остаток | 72940,2 | 4290,6 | ||||||
| Итого | ||||||||
| Коэффициенты | Стандартная ошибка | t-статистика | P-Значение | Нижние 95% | Верхние 95% | Нижние 95,0% | Верхние 95,0% | |
| Y-пересечение | 629,1271 | 72,86889 | 8,633686 | 1,27E-07 | 475,3872 | 782,8671 | 475,3872 | 782,8671 |
| X1 | -0,40261 | 0,907325 | -0,44373 | 0,662833 | -2,3169 | 1,511681 | -2,3169 | 1,511681 |
| X2 | 1,39136 | 1,003219 | 1,386896 | 0,183391 | -0,72525 | 3,507967 | -0,72525 | 3,507967 |
| X3 | -0,5974 | 0,863823 | -0,69158 | 0,498538 | -2,41991 | 1,225103 | -2,41991 | 1,225103 |
Уравнение регрессии с полным перечнем факторов примет вид: 
2. Оценить показатели вариации каждого признака и сделать выводы о возможностях применения МНК для их изучения
,
,
, 
Для расчета составим вспомогательную таблицу:
| Y | X1 | X2 | X3 | ||||
| Среднее | Среднее | 41,04762 | Среднее | 39,28571 | Среднее | 42,28571 | |
| Стандартная ошибка | 14,35353 | Стандартная ошибка | 3,567363 | Стандартная ошибка | 3,253674 | Стандартная ошибка | 3,732191 |
| Медиана | Медиана | Медиана | Медиана | ||||
| Мода | #Н/Д | Мода | Мода | Мода | |||
| Стандартное отклонение | 65,77614 | Стандартное отклонение | 16,34771 | Стандартное отклонение | 14,91021 | Стандартное отклонение | 17,10305 |
| Дисперсия выборки | 4326,5 | Дисперсия выборки | 267,2476 | Дисперсия выборки | 222,3143 | Дисперсия выборки | 292,5143 |
| Эксцесс | -0,63225 | Эксцесс | -1,01202 | Эксцесс | -1,40699 | Эксцесс | -0,97895 |
| Асимметричность | -0,17918 | Асимметричность | -0,32932 | Асимметричность | -0,04594 | Асимметричность | -0,39567 |
| Интервал | Интервал | Интервал | Интервал | ||||
| Минимум | Минимум | Минимум | Минимум | ||||
| Максимум | Максимум | Максимум | Максимум | ||||
| Сумма | Сумма | Сумма | Сумма | ||||
| Счет | Счет | Счет | Счет |
,
,
, 
| Показатели вариации | Y | 10,24550397 | ||
| X1 | 39,82620742 | |||
| X2 | 37,95325529 | |||
| X3 | 40,4463997 |
Вывод: значения коэффициентов вариации для фактора у, невысокие (не превышают 33%), к ним можно применить МНК для оценки коэффициентов регрессии. А вот для фактора Х1, Х2, Х3 этот показатель завышен, совокупность неоднородная для анализа.