Имеются данные по шести показателям (см. таблицу в файле Excel «Пример – двухфакторная регрессия»),
Y | X1 | X2 | X3 | X4 | X5 |
об.реализации | время | реклама | цена | цена конкурента | ИПР |
4.8 | 14.8 | 17.3 | 98.4 | ||
3.8 | 15.2 | 16.8 | 101.2 | ||
8.7 | 15.5 | 16.2 | 103.5 | ||
8.2 | 15.5 | 104.1 | |||
9.7 | |||||
14.7 | 18.1 | 20.2 | 107.4 | ||
18.7 | 15.8 | 108.5 | |||
19.8 | 15.8 | 18.2 | 108.3 | ||
10.6 | 16.9 | 16.8 | 109.2 | ||
8.6 | 16.3 | 110.1 | |||
6.5 | 16.1 | 18.3 | 110.7 | ||
12.6 | 15.4 | 16.4 | 110.3 | ||
6.5 | 15.7 | 16.2 | 111.8 | ||
5.8 | 17.7 | 112.3 | |||
5.7 | 15.1 | 16.2 | 112.9 |
где:
Y – объем реализации товара некоторой фирмы (млн.руб.),
– фактор времени,
– расходы на рекламу (тыс.руб.),
– цена товара (руб.),
– средняя цена товара у конкурентов (руб.),
– индекс потребительских расходов (%).
Требуется:
1) осуществить выбор факторов для построения двухфакторной регрессионной модели;
2) построить двухфакторную модель регрессии, дать экономическую интерпретацию коэффициентов регрессии;
3) для оценки качества определить:
- коэффициент множественной корреляции,
- коэффициент детерминации, в том числе скорректированный,
- стандартную ошибку модели;
4) осуществить оценку значимости:
- уравнения регрессии,
- параметров уравнения;
5) оценить степень влияния факторов на зависимую переменную;
6) осуществить точечный и интервальный прогноз объема реализации на два ближайших периода вперед (табличное значение t-критерия принять равным 2,16);
7) выбрать фактор для построения парной регрессионной модели и построить эту модель;
8) сравнить качественные характеристики двухфакторной и парной моделей, выбрать лучшую модель.
Решение.
1) осуществить выбор факторов для построения двухфакторной регрессионной модели
1 способ.
Корреляционная матрица:
об.реализации | время | реклама | цена | цена конкурента | ИПР | |
об.реализации Y | ||||||
время ![]() | 0.678 | |||||
реклама ![]() | 0.646 | 0.106 | ||||
цена ![]() | 0.233 | 0.174 | -0.003 | |||
цена конкур. ![]() | 0.226 | -0.051 | 0.204 | 0.698 | ||
ИПР ![]() | 0.816 | 0.960 | 0.273 | 0.235 | 0.031 |
Анализ матрицы.
Прямой и достаточно тесной связью с объемом реализации связаны факторы ,
,
. Но факторы
и
коллинеарны, так как
=0,96, что больше 0,7. Таким образом, для двухфакторной регрессии целесообразно выбрать
и
.
2 способ.
Метод исключения статистически незначимых факторов:
фрагмент регрессионного анализа с пятью факторами
Коэффициенты | Стандартная ошибка | t-статистика | |
Y-пересечение | -3017.396 | 1094.485 | -2.757 |
время | -13.419 | 10.378 | -1.293 |
реклама | 6.672 | 3.009 | 2.218 |
цена | -6.477 | 15.779 | -0.410 |
цена конкурента | 12.238 | 14.410 | 0.849 |
ИПР | 30.476 | 11.525 | 2.644 |
,
условие выполняется только для факторов
и
.
Так как другие факторы далее использоваться не будут, обозначим через
, а
через
.
2) построить двухфакторную модель регрессии, дать экономическую интерпретацию коэффициентов регрессии
Коэффициенты | |
Y-пересечение | -1471.314 |
реклама | 9.568 |
ИПР | 15.753 |
Таким образом, уравнение двухфакторной регрессии имеет вид
.
Экономическая интерпретация параметров:
- при изменении затрат на рекламу на 1тысячу рублей объем реализации товара изменится в ту же сторону на 9,568 млн. руб.;
- при изменении ИПР на 1 % объем реализации товара изменится в ту же сторону на 15,753 млн. руб.
3) для оценки качества определить:
- коэффициент множественной корреляции,
- коэффициент детерминации, в том числе скорректированный,
- стандартную ошибку модели
Регрессионная статистика | |
Множественный R | 0.927 |
R-квадрат | 0.859 |
Нормированный R-квадрат | 0.837 |
Стандартная ошибка | 41.473 |
Выводы:
- совокупное влияние факторов на объем реализации сильное (),
- около 84 % случайной вариации объема реализации учтено в построенной модели и обусловлено случайными колебаниями включенных в нее факторов,
- стандартная ошибка модели большая, модель неточная.
4) осуществить оценку значимости:
- уравнения регрессии,
- параметров уравнения
1) значимость уравнения:
F |
39.639 |
– уравнение регрессии статистически значимо.
2) значимость параметров:
Коэффициенты | Стандартная ошибка | t-статистика | |
Y-пересечение | -1471.314 | 259.766 | -5.664 |
реклама | 9.568 | 2.266 | 4.223 |
ИПР | 15.753 | 2.467 | 6.386 |
выполняется для всех параметров, следовательно, все параметры уравнения и все факторы статистически значимы.
5) оценить степень влияния факторов на зависимую переменную
№ п.п. | Y | X1 | X2 | Y-Ycp | (Y-Ycp)^2 | X1-X1cp | (X1-X1cp)^2 | X2-X2cp | (X2-X2cp)^2 |
-180.8 | 32693.160 | -5.294 | 28.024 | -7.231 | 52.291 | ||||
4.8 | 98.4 | -169.8 | 28836.285 | -4.494 | 20.194 | -8.831 | 77.991 | ||
3.8 | 101.2 | -158.8 | 25221.410 | -5.494 | 30.181 | -6.031 | 36.376 | ||
8.7 | 103.5 | -115.8 | 13412.535 | -0.594 | 0.353 | -3.731 | 13.922 | ||
8.2 | 104.1 | -32.81 | 1076.660 | -1.094 | 1.196 | -3.131 | 9.805 | ||
9.7 | 63.188 | 3992.660 | 0.406 | 0.165 | -0.231 | 0.053 | |||
14.7 | 107.4 | 125.19 | 15671.910 | 5.406 | 29.228 | 0.169 | 0.028 | ||
18.7 | 108.5 | 138.19 | 19095.785 | 9.406 | 88.478 | 1.269 | 1.610 | ||
19.8 | 108.3 | 60.188 | 3622.535 | 10.506 | 110.381 | 1.069 | 1.142 | ||
10.6 | 109.2 | 60.188 | 3622.535 | 1.306 | 1.706 | 1.969 | 3.876 | ||
8.6 | 110.1 | 14.188 | 201.285 | -0.694 | 0.481 | 2.869 | 8.230 | ||
6.5 | 110.7 | 0.1875 | 0.035 | -2.794 | 7.805 | 3.469 | 12.032 | ||
12.6 | 110.3 | 24.188 | 585.035 | 3.306 | 10.931 | 3.069 | 9.417 | ||
6.5 | 111.8 | 38.188 | 1458.285 | -2.794 | 7.805 | 4.569 | 20.873 | ||
5.8 | 112.3 | 57.188 | 3270.410 | -3.494 | 12.206 | 5.069 | 25.692 | ||
5.7 | 112.9 | 77.188 | 5957.910 | -3.594 | 12.915 | 5.669 | 32.135 | ||
Сумма | 148.7 | 158718.438 | 362.049 | 305.474 | |||||
Среднее | 306.8 | 9.29 | 107.2 |
–
при изменении факторов и
на 1 % объем реализации изменяется в ту же сторону соответственно на 0,29 % и на 5,51 %;
–
при изменении факторов и
на 1 СКО объем реализации изменяется в ту же сторону соответственно на 0,457 и на 0,691 своего СКО;
–
средняя доля влияния на объем реализации фактора – 0,345, а
– 0,659.
Вывод: влияние фактора ИПР на объем реализации товара превышает влияние стоимости рекламы.
6) осуществить точечный и интервальный прогноз объема реализации на два ближайших периода вперед (табличное значение t-критерия принять равным 2,16)
1) точечный прогноз факторов:
Прогноз факторов в Олимпе | ||
Х1,17 | 3.387 | |
Х1,18 | 2.377 | |
Х1=2,395+1,454t+0,979t^2 | ||
Х2,17 | 112.481 | |
Х2,18 | 112.513 | |
X2=97,008+1,739t-0,049t^2 |
В результате получим столбцы прогнозных значений факторов:
2) точечный прогноз показателя Y:
3) интервальный прогноз показателя Y:
для t=17:
нижняя граница –
верхняя граница –
для t=18:
нижняя граница –
верхняя граница –
7) выбрать фактор для построения парной регрессионной модели и построить эту модель
Фактор – ИПР оказывает более сильное влияние на прибыль Y, чем фактор
– затраты на рекламу. Поэтому парную модель регрессии целесообразно строить с фактором
:
Коэффициенты | |
Y-пересечение | -1687.749 |
ИПР | 18.601 |
.
8) сравнить качественные характеристики двухфакторной и парной моделей, выбрать лучшую модель
Модели | ![]() | F | t-статистика | ![]() |
парная | 0.666 | 27.9 | параметры значимы | 61.5 |
двухфакторная | 0.859 | 39.6 | параметры значимы | 41.5 |
Вывод: лучшим качеством обладает двухфакторная модель.