Комплексный пример решения задачи с использованием корреляционного и множественного регрессионного анализа




Имеются данные по шести показателям (см. таблицу в файле Excel «Пример – двухфакторная регрессия»),

Y X1 X2 X3 X4 X5
об.реализации время реклама цена цена конкурента ИПР
           
    4.8 14.8 17.3 98.4
    3.8 15.2 16.8 101.2
    8.7 15.5 16.2 103.5
    8.2 15.5   104.1
    9.7      
    14.7 18.1 20.2 107.4
    18.7   15.8 108.5
    19.8 15.8 18.2 108.3
    10.6 16.9 16.8 109.2
    8.6 16.3   110.1
    6.5 16.1 18.3 110.7
    12.6 15.4 16.4 110.3
    6.5 15.7 16.2 111.8
    5.8   17.7 112.3
    5.7 15.1 16.2 112.9

где:

Y – объем реализации товара некоторой фирмы (млн.руб.),

– фактор времени,

– расходы на рекламу (тыс.руб.),

– цена товара (руб.),

– средняя цена товара у конкурентов (руб.),

– индекс потребительских расходов (%).

Требуется:

1) осуществить выбор факторов для построения двухфакторной регрессионной модели;

2) построить двухфакторную модель регрессии, дать экономическую интерпретацию коэффициентов регрессии;

3) для оценки качества определить:

- коэффициент множественной корреляции,

- коэффициент детерминации, в том числе скорректированный,

- стандартную ошибку модели;

4) осуществить оценку значимости:

- уравнения регрессии,

- параметров уравнения;

5) оценить степень влияния факторов на зависимую переменную;

6) осуществить точечный и интервальный прогноз объема реализации на два ближайших периода вперед (табличное значение t-критерия принять равным 2,16);

7) выбрать фактор для построения парной регрессионной модели и построить эту модель;

8) сравнить качественные характеристики двухфакторной и парной моделей, выбрать лучшую модель.

Решение.

1) осуществить выбор факторов для построения двухфакторной регрессионной модели

1 способ.

Корреляционная матрица:

  об.реализации время реклама цена цена конкурента ИПР
об.реализации Y            
время 0.678          
реклама 0.646 0.106        
цена 0.233 0.174 -0.003      
цена конкур. 0.226 -0.051 0.204 0.698    
ИПР 0.816 0.960 0.273 0.235 0.031  

Анализ матрицы.

Прямой и достаточно тесной связью с объемом реализации связаны факторы , , . Но факторы и коллинеарны, так как =0,96, что больше 0,7. Таким образом, для двухфакторной регрессии целесообразно выбрать и .

2 способ.

Метод исключения статистически незначимых факторов:

фрагмент регрессионного анализа с пятью факторами

  Коэффициенты Стандартная ошибка t-статистика
Y-пересечение -3017.396 1094.485 -2.757
время -13.419 10.378 -1.293
реклама 6.672 3.009 2.218
цена -6.477 15.779 -0.410
цена конкурента 12.238 14.410 0.849
ИПР 30.476 11.525 2.644

 

,

условие выполняется только для факторов и .

 

Так как другие факторы далее использоваться не будут, обозначим через , а через .

2) построить двухфакторную модель регрессии, дать экономическую интерпретацию коэффициентов регрессии

  Коэффициенты
Y-пересечение -1471.314
реклама 9.568
ИПР 15.753

 

Таким образом, уравнение двухфакторной регрессии имеет вид

.

Экономическая интерпретация параметров:

- при изменении затрат на рекламу на 1тысячу рублей объем реализации товара изменится в ту же сторону на 9,568 млн. руб.;

- при изменении ИПР на 1 % объем реализации товара изменится в ту же сторону на 15,753 млн. руб.

3) для оценки качества определить:

- коэффициент множественной корреляции,

- коэффициент детерминации, в том числе скорректированный,

- стандартную ошибку модели

Регрессионная статистика
Множественный R 0.927
R-квадрат 0.859
Нормированный R-квадрат 0.837
Стандартная ошибка 41.473

 

Выводы:

- совокупное влияние факторов на объем реализации сильное (),

- около 84 % случайной вариации объема реализации учтено в построенной модели и обусловлено случайными колебаниями включенных в нее факторов,

- стандартная ошибка модели большая, модель неточная.

4) осуществить оценку значимости:

- уравнения регрессии,

- параметров уравнения

1) значимость уравнения:

F
39.639

 

– уравнение регрессии статистически значимо.

2) значимость параметров:

  Коэффициенты Стандартная ошибка t-статистика
Y-пересечение -1471.314 259.766 -5.664
реклама 9.568 2.266 4.223
ИПР 15.753 2.467 6.386

выполняется для всех параметров, следовательно, все параметры уравнения и все факторы статистически значимы.

 

5) оценить степень влияния факторов на зависимую переменную

№ п.п. Y X1 X2 Y-Ycp (Y-Ycp)^2 X1-X1cp (X1-X1cp)^2 X2-X2cp (X2-X2cp)^2
        -180.8 32693.160 -5.294 28.024 -7.231 52.291
    4.8 98.4 -169.8 28836.285 -4.494 20.194 -8.831 77.991
    3.8 101.2 -158.8 25221.410 -5.494 30.181 -6.031 36.376
    8.7 103.5 -115.8 13412.535 -0.594 0.353 -3.731 13.922
    8.2 104.1 -32.81 1076.660 -1.094 1.196 -3.131 9.805
    9.7   63.188 3992.660 0.406 0.165 -0.231 0.053
    14.7 107.4 125.19 15671.910 5.406 29.228 0.169 0.028
    18.7 108.5 138.19 19095.785 9.406 88.478 1.269 1.610
    19.8 108.3 60.188 3622.535 10.506 110.381 1.069 1.142
    10.6 109.2 60.188 3622.535 1.306 1.706 1.969 3.876
    8.6 110.1 14.188 201.285 -0.694 0.481 2.869 8.230
    6.5 110.7 0.1875 0.035 -2.794 7.805 3.469 12.032
    12.6 110.3 24.188 585.035 3.306 10.931 3.069 9.417
    6.5 111.8 38.188 1458.285 -2.794 7.805 4.569 20.873
    5.8 112.3 57.188 3270.410 -3.494 12.206 5.069 25.692
    5.7 112.9 77.188 5957.910 -3.594 12.915 5.669 32.135
Сумма   148.7     158718.438   362.049   305.474
Среднее 306.8 9.29 107.2            

при изменении факторов и на 1 % объем реализации изменяется в ту же сторону соответственно на 0,29 % и на 5,51 %;

 

при изменении факторов и на 1 СКО объем реализации изменяется в ту же сторону соответственно на 0,457 и на 0,691 своего СКО;

 

средняя доля влияния на объем реализации фактора – 0,345, а – 0,659.

 

Вывод: влияние фактора ИПР на объем реализации товара превышает влияние стоимости рекламы.

 

6) осуществить точечный и интервальный прогноз объема реализации на два ближайших периода вперед (табличное значение t-критерия принять равным 2,16)

1) точечный прогноз факторов:

 

Прогноз факторов в Олимпе
Х1,17 3.387  
Х1,18 2.377  
Х1=2,395+1,454t+0,979t^2
     
Х2,17 112.481  
Х2,18 112.513  
X2=97,008+1,739t-0,049t^2

 

В результате получим столбцы прогнозных значений факторов:

 

 

 

 

2) точечный прогноз показателя Y:

 

 

3) интервальный прогноз показателя Y:

 

для t=17:

нижняя граница –

верхняя граница –

 

для t=18:

нижняя граница –

верхняя граница –

 

7) выбрать фактор для построения парной регрессионной модели и построить эту модель

Фактор – ИПР оказывает более сильное влияние на прибыль Y, чем фактор – затраты на рекламу. Поэтому парную модель регрессии целесообразно строить с фактором :

  Коэффициенты
Y-пересечение -1687.749
ИПР 18.601

 

.

 

8) сравнить качественные характеристики двухфакторной и парной моделей, выбрать лучшую модель

Модели F t-статистика
парная 0.666 27.9 параметры значимы 61.5
двухфакторная 0.859 39.6 параметры значимы 41.5

 

Вывод: лучшим качеством обладает двухфакторная модель.

 

 



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2017-10-25 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: