Многофакторная регрессия.




Построение линейной многофакторной модели производится с помощью инструментов пакета анализа данных Корреляция и Регрессия. Корреляция используется для расчета матрицы парных коэффициентов корреляции. С помощью Регрессии, помимо результатов регрессионной статистики, дисперсионного анализа и доверительных интервалов, можно получить остатки и графики подбора линии регрессии, остатков и нормальной вероятности. Порядок действий следующий:

1) проверьте доступ к пакету анализа. Пакет анализа представляет собой программу, которая доступна при установке MicrosoftOffice или Excel. Чтобы использовать надстройку в Excel, необходимо сначала загрузить ее. Для версии 2003 в главном меню последовательно выберите Сервис/Надстройки. Установите флажок Пакет анализа, а затем нажмите кнопку ОК.

Для версии 2007 щелкните значок Кнопка MicrosoftOffice , а затем щелкните Параметры Excel. Выберите команду Надстройки и в окне Управление выберите пункт Надстройки Excel. Нажмите кнопку Перейти. В окне Доступные надстройки установите флажок Пакет анализа, а затем нажмите кнопку ОК. Совет: если Пакет анализа отсутствует в списке поля Доступные надстройки, то для проведения поиска нажмите кнопку Обзор.

В случае появления сообщения о том, что пакет статистического анализа не установлен на компьютере и предложения установить его, нажмите кнопку Да.

2) после загрузки пакета анализа в версии 2003 команда Анализ данных становится доступной в пункте Сервис, а в версии 2007 в группе Анализ на вкладке Данные.

3) введите исходные данные или откройте существующий файл, содержащий анализируемые данные;

4) в меню Анализ данных выберите пункт Корреляция;

5) заполните диалоговое окно входных данных и параметров вывода:

Входной интервал – диапазон, содержащий анализируемые данные (все столбцы или строки);

Группирование – по столбцам или по строкам;

Метки – флажок, который указывает, содержит ли первая строка названия столбцов или нет;

Выходной интервал – достаточно указать левую верхнюю ячейку диапазона;

6) результаты вычислений – матрица парных коэффициентов корреляции, анализ которых позволяет выполнить первый этап процесса моделирования, описанный в 2.4;

7) в меню Анализ данных выберите пункт Регрессия;

8) заполните диалоговое окно входных данных и параметров вывода как в пункте 4, только интервал для результативного признака Y и для факторов Х надо задавать отдельно (причем входной интервал Х должен включать все столбцы, содержащие значения факторных признаков);

9) в результате получаем регрессионную статистику, таблицу дисперсионного анализа и таблицу коэффициентов модели, в которой первая строка (Y-пересечение) соответствует коэффициенту а 0, а следующие строки описывают коэффициенты регрессии а i.В 4 столбце находятся коэффициенты t-статистики, определяющие достоверность вычисленных коэффициентов регрессии: t=1 соответствует примерно 70% достоверности, t=2 соответствует примерно 95% достоверности,t=3 соответствует примерно 100% достоверности.

3.6. Практический блок

Примеры

Задача 1. В таблице указаны парные коэффициенты корреляции. Проведите анализ целесообразности включения заданных факторов в уравнение множественной линейной регрессии.

  y x 1 x 2 x 3 x 4
y          
x 1 0,71        
x 2 0,58 0,53      
x 3 0,08 0,2 0,13    
x 4 0,62 0,81 0,3 0,25  

РЕШЕНИЕ. Между y и x 3 связь практически отсутствует. Между y и x 1 связь сильная, между y и x 2, x 4 – умеренная.

Отсюда следует вывод о нецелесообразности включения фактора x 3 в уравнение множественной линейной регрессии (коэффициент парной корреляции с у равен 0,08).

Между факторами x 1 и x 4 существует сильная прямая связь (коэффициент парной корреляции > 0,8). Для того, чтобы избежать явления мультиколлинеарности, один из этих факторов должен быть исключен из анализа. Исключается фактор x 1, умеренно коррелирующий с x 2 (коэффициент их парной корреляции равен 0,53).

Факторы, включенные в модель множественной регрессии: x 2, x 4.

 

Задача 2. Построить линейную множественную регрессию общей суммы налогов и платежей на сумму поступлений по налогу на добавленную стоимость (x1) и налогу на прибыль (доход) (x2).

Время наблюдения y, млрд. руб. x1, млрд. руб. x2, млрд. руб.
январь 38,9 5,6 13,4
февраль 45,3 6,7 15,4
март 61,1 13,1 16,7
I квартал 145,3 25,3 45,5
апрель 70,4 16,9 16,2
май 63,8 18,4  
июнь 67,7 19,1  
II квартал 201,9 54,4 44,2
I полугодие 347,2 79,8 89,7
июль 70,6 16,1 20,8
август 78,9 23,3 16,4
сентябрь 73,2 19,2 17,4
III квартал 222,7 58,6 54,6
9 месяцев 569,9 138,3 144,3
октябрь 78,1 16,1 23,6
ноябрь   31,8 23,9
декабрь 133,4 35,4 34,4
IV квартал 314,5 83,3 81,9
IIполугодие 537,2 141,9 136,5
январь-декабрь 884,4 221,6 226,1
 

а 0=-9.7

а 1=1.84

а 2=2.62

Полученное уравнение

 

Контрольные вопросы

1. Что понимается под множественной регрессией?

2. Какие задачи решаются при построении уравнения регрессии?

3. Какие задачи решаются при спецификации модели?

4. Какие требования предъявляются к факторам, включаемым в уравнение регрессии?

5. Что понимается под коллинеарностью и мультиколлинеарностью факторов?

6. Как проверяется наличие коллинеарности и мультиколлинеарности?

7. Какие подходы применяются для преодоления межфакторной корреляции?

8. Какие функции чаще используются для построения уравнения множественной регрессии?

9. Какой вид имеет система нормальных уравнений метода наименьших квадратов в случае линейной многофакторной регрессии?

10. По какой формуле вычисляется индекс множественной корреляции?

11. Как вычисляются индекс множественной детерминации и скорректированный индекс множественной детерминации?

12. Что означает низкое значение коэффициента (индекса) множественной корреляции?

13. Как проверяется значимость уравнения регрессии и отдельных коэффициентов?

14. Как строятся частные уравнения регрессии?

15. Как вычисляются средние частные коэффициенты эластичности?

16. Что такое стандартизированные переменные?

17. Какой вид имеет уравнение линейной регрессии в стандартизированном масштабе?

18. Как оценивается информативность (значимость) факторов?

19. Как вычисляются частные коэффициенты корреляции?

20. Опишите процедуру метода исключения переменных с использованием частных коэффициентов корреляции.

21. Какой показатель характеризует долю объясненной с помощью регрессии дисперсии в общей дисперсии зависимой переменной?

22. Из каких этапов состоит проверка качества оцененного уравнения регрессии?

23. Как рассчитывается и что показывает коэффициент детерминации R2?

24. В каких задачах эконометрики используется распределение Фишера?

25. Таблицы каких распределений используются при оценке качества линейной регрессии?

26. Какие показатели характеризуют независимость отклонений зависимой переменной от линии регрессии? Как осуществляется проверка этой независимости?

27. В каких случаях возникают трудности использования множественной линейной регрессии в моделировании? В чем реальная ситуация может не соответствовать предпосылкам модели?

28. Когда необходимо выведение из рассмотрения незначимых объясняющих переменных и добавление новых переменных?

Задания и задачи

1. Имеются данные по 10 фирмам, продающим компакт-диски, – объемы продаж, тыс. шт. / мес. (y), цены, руб. (x 1), вложения в рекламу, тыс. руб. / мес. (x 2).

 

y                    
x 1                    
x 2                    

А) Построить регрессионную зависимость

Б) Проверить гипотезу о значимости коэффициентов регрессии при уровнях значимости и .

В) Построить доверительные интервалы для коэффициентов регрессии а 0, а 1, а 2 с вероятностью .

Г) Вычислить множественный коэффициент корреляции, проверить гипотезу о значимости модели при уровнях значимости и .

2. Известны данные: – цена квартиры, x 1 – общая площадь, x 2– площадь кухни.

y x 1 x 2
     
  31,5 6,2
  31,8 5,6
     
     
  48,8 7,9
    5,6
    7,2
     
    6,8
    6,5
     

А) Построить регрессионную зависимость

Б) Проверить гипотезу о значимости коэффициентов регрессии при уровнях значимости и .

В) Построить доверительные интервалы для коэффициентов регрессии а 0, а 1, а 2 с вероятностью .

Г) Вычислить множественный коэффициент корреляции, проверить гипотезу о значимости модели при уровнях значимости и .

3. Имеются данные по ценам на квартиры, тыс.руб. (y) в зависимости от общей площади, м2 (x 1) и площади кухни, м2 (x 2).

А) Построить регрессионную зависимость

Б) Обосновать наличие гетероскедастичности.

В) С помощью обобщенного метода наименьших квадратов построить зависимость с учетом гетероскедастичности.

y                    
x 1                    
x 2                    

 

4. Имеются данные по странам за год.

Страна Душевой доход, долл., y Индекс челове­ческого развития (ИЧР),x1 Индекс челове­ческой бедности (ИЧБ),x2
ОАЭ   0,866 14,9
Таиланд   0,833 11,7
Уругвай   0,883 11,7
Ливия   0,801 18,8
Колумбия   0,848 10,7
Иордания   0,730 10,9
Египет   0,514 34,8
Марокко   0,566 41,7
Перу   0,717 22,8
Шри-Ланка   0,711 20,7
Филиппины   0,672 17,7
Боливия   0,589 22,5
Китай   0,626 17,5
Зимбабве   0,513 17,3
Пакистан   0,445 46,8
Уганда   0,328 41,3
Нигерия   0,393 41,6
Индия   0,446 36,7

Индекс челове­ческого развитияобъединяет три показателя: валовой внутренний продукт на душу населения, уровень грамотности и продолжительность жизни.

Индекс челове­ческой бедности определяется как средневзвешенное абсолютного (<1.5 $ на душу) и относительного (<3 $ на душу) индекса бедности.

Задание:

Постройте линейное уравнение множественной регрессии и поясните экономический смысл его параметров.

Рассчитайте частные коэффициенты эластичности.

Определите коэффициенты регрессии.

Сделайте вывод о силе связи результата и факторов.

Определите парные коэффициенты корреляции, сделайте выводы.

Дайте оценку полученного уравнения на основе коэффициента детерминации.

Тесты

1. Значимость частных и парных коэффициентов корреляции проверяется с помощью:

а) нормального закона распределения;

б) t-критерия Стъюдента;

в) F–критерия;

г) таблицы Фишера – Иейтса.

 

2. В регрессионном анализе x j рассматриваются как:

а) неслучайные величины;

б) случайные величины;

в) любые величины.

 

3.Коэффициент регрессии изменяется в пределах от

a) –1 до 1,

б) 0 до 1,

в) принимает любое значение.

 

4.Квадратичная форма

соответствует

a) методу максимального правдоподобия,

б) методу наименьших квадратов,

в) методу средней связи,

г) двухшаговому методу наименьших квадратов.

 

5.В каких пределах изменяется коэффициент детерминации

a) от 0 до 1,

б) от –1 до 0,

в) от –1 до 1,

г) от 0 до 10.

 

6.В хорошо подобранной модели остатки должны:

a) иметь нормальный закон распределения с нулевым математическим ожиданием и постоянной дисперсией,

б) не коррелировать друг с другом,

в) иметь экспоненциальный закон распределения,

г) хаотично разбросаны,

д) форма и вид распределения не важен.

 

7.Неправильный выбор функциональной формы или объясняющих переменных называется

a) ошибками спецификации,

б) ошибками прогноза,

в) гетероскедастичностью.

 

8.Коэффициент детерминации это

a) квадрат парного коэффициента корреляции,

б) квадрат частного коэффициента корреляции,

в) квадрат множественного коэффициента корреляции.

 

9.Квадрат какого коэффициента указывает долю дисперсии одной случайной величины, обусловленную вариацией другой

a) коэффициент детерминации,

б) парный коэффициент корреляции,

в) частный коэффициент корреляции,

г) множественный коэффициент корреляции.

 

10.Величина, рассчитанная по формуле

является оценкой

a) коэффициента детерминации,

б) парного коэффициента корреляции,

в) частного коэффициента корреляции,

г) множественного коэффициента корреляции.

 

11. Выборочный коэффициент корреляции r по абсолютной величине

a) не превосходит единицы,

б) не превосходит нуля,

в) принимает любые значения.

 

12. Отметьте основные виды ошибок спецификации

a) отбрасывание значимой переменной,

б) добавление незначимой переменной,

в) низкое значение коэффициента детерминации,

г) выбор неправильной формы модели.

 

13. Компоненты вектора

a) независимы между собой,

б) зависимы между собой,

в) имеют нормальный закон распределения с нулевым математическим ожиданием () и неизвестной дисперсией .

 

14. На практике при построении регрессионных моделей рекомендуется, чтобы n превышало т не менее, чем

a) в два раза,

б) в три раза,

в) не имеет значения.

3.7. Самостоятельная работа студентов

Литература для самостоятельной работы

1. Эконометрика: учебник / К. В. Балдин, В. Н. Башлыков, Н. А. Брызгалов и др.; под ред. В. Б. Уткина. -М.: Дашков и К, 2008. -304 с.

2. Афанасьев, В. Н. Эконометрика: учеб. для вузов / В. Н. Афанасьев, М. М. Юзбашев, Т. И. Гуляева; под ред. В. Н. Афанасьева. -М.: Финансы и статистика, 2006. -255 с.

3. Суслов В.И., Ибрагимов Н.М., Талышева Л.П., Цыплаков А.А. Эконометрия. Новосибирск, 2003.

Интернет-ресурсы:

1.https://www.kgtu.runnet.ru/WD/TUTOR/textbook/modules/stmulreg.html

2. https://www.shpargalka.ru/statis.ru/doc/shpr_e31.htm

3.https://dsmu.donetsk.ua/~statbook/modules/stmulreg.html#cunique

4. https://www3.unicor.ac.ru/d024/p011993.htm

5. https://www.gauss.ru/educat/systemat/butenkov/.asp

6.https://crow.academy.ru/econometrics/seminars_/sem_08_/sem_08.htm

7.https://crow.academy.ru/econometrics/lectures_/lect_03_/index.htm

8. https://u-pereslavl.botik.ru/UP/ECON/econometrics/



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2016-02-16 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: