Многофакторный регрессионный анализ в системе MINITAB




МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РФ

ФГАОУ ВО "Севастопольский государственный университет"

Кафедра «Менеджмент организаций»

 

Методические указания

к лабораторной работе №2

«Использование многофакторного регрессионного анализа

В маркетинговых исследованиях»

по дисциплине “Методы маркетинговых исследований”

для студентов всех форм обучения

Севастополь

УДК 658.

Методические указания по выполнению лабораторной работы №2 «Использование многофакторного регрессионного анализа в маркетинговых исследованиях» по дисциплине "Методы маркетинговых исследований" / Сост. И.А. Гребешкова. ¾ Севастополь: Изд-во СевНТУ, 2016. ¾ 12 с.

 

Целью методических указаний является применение теоретических знаний по теме "Методы маркетинговых исследований" при решении ситуаций с помощью лицензионной системы MINITAB. Методические указания предназначены для студентов экономических специальностей.

Методические указания рассмотрены и утверждены на заседании кафедры менеджмент организаций (протокол № от " " __2016 г.)

 

Допущено учебно-методическим центром СевГУ в качестве методических указаний

 

 

Рецензенты:

 

 

 

Содержание

 

1 Многофакторный регрессионный анализ. 4

Мультиколлинеарность. 4

2 Многофакторный регрессионный анализ в системе MINITAB.. 5

3 Задание по выполнению лабораторной работы.. 6

Литература. 11

 

 


Многофакторный регрессионный анализ

Регрессионный анализ объединяет широкий круг задач. связанный с построением функциональных зависимостей между двумя группами числовых переменных: и . Для краткости объединим в многомерную переменную . — в переменную , и будем говорить об исследовании зависимости между и . При этом будем считать независимой переменной. влияющей на значения . В связи с этим будем называть откликом. а =() – факторами, влияющими на отклик.

Многомерная линейная регрессия позволяет построить и проверить модель линейной связи между одной зависимой (эндогенной) и несколькими независимыми (экзогенными) переменными.

Уравнение множественной регрессии (то есть регрессии с двумя и более переменными) имеет вид:

,

где — зависимая переменная, — независимая переменная, — коэффициенты регрессионного уравнения, — ошибка с нормальным законом распределения, средним равным нулю и стандартным отклонением s. Матричная запись модели имеет вид:

,

где — вектор-столбец значений зависимой переменной, — детерминированная матрица объясняющих переменных (регрессоров), — вектор столбец параметров модели, — вектор столбец ошибок.

Статистический подход к задаче построения функциональной зависимости от основывается на предположении, что нам известны некоторые исходные (экспериментальные) данные (), где — значение отклика при заданном значении фактора , изменяется от 1 до n. Пару значений () часто называют результатом одного измерения, а n – числом измерений.

Мультиколлинеарность

Одним из условий регрессионного анализа является независимость объясняющих переменных. При анализе реальных, экономических процессов это условие часто нарушается. Например, в работе оценщика цена продаваемого дома может быть связана со значениями таких независимых переменных, как год постройки дома, его жилая площадь. Количество жилых комнат и прочих помещений, общее количество продаваемых домов, индекс, учитывающий качество конструкции продаваемого дома. В таких случаях жилую площадь, количество жилых комнат и прочих помещений следует рассматривать вместе. Если одно из этих значений возрастает, другие тоже, как правило, увеличиваются.

Линейная зависимость между двумя или более переменными называется мультиколлинеарностью. Степень мультиколлинеарности измеряется фактором роста дисперсии (VIF):

, j=1,2, …,k

Здесь — это коэффициент детерминации из регрессии j-ой независимой переменной по оставшимся (k-1) независимым переменным. Если j-я независимая переменная не связана с остальными , =0 и . Если зависимость имеет место, то .

Значение , близкое к 1, говорит о том, что для этой переменной проблемы мультиколлинеарности не существует. Оценка ее коэффициента и значение t–статистики не изменяется значительно, если другие независимые переменные будут добавлены в уравнение регрессии или удалены из него. Значение , гораздо большее 1, указывает, что оценка коэффициента при этой независимой переменной неустойчива. В сущности, большая величина фактора означает, что имеется избыточная информация о независимых переменных. Информация, предоставляемая переменной с большим , уже присутствует в других независимых переменных. При наличии мультиколлинеарности интерпретировать влияние отдельной независимой переменной на зависимую гораздо сложнее.

Многофакторный регрессионный анализ в системе MINITAB

Для проведения регрессионного анализа необходимо:

1) ввести данные;

2) Stat > Regression > Regression – позволяет выполнить простую или множественную регрессию (построение зависимости между откликом и переменной), и заполнить следующие ячейки:

Response – переменная отклика;

Predictors – независимые переменные;

Options – опции;

Graphs – построение графиков;

Storage – сохранение полученных результатов;

Stat > Regression > Stepwise — позволяет выполнить прямую (включение) и обратную (исключение независимых переменных) пошаговую регрессию;

Stat > Regression > Best Subsets – позволяет осуществить выбор влияющих переменных из потенциального множества переменных на основе R2 критерия.

Stat > Regression > Fitted Line Plot — позволяет построить линейную, квадратическую или кубическую регрессии от одной переменной.Пункты диалогового окна:

Response [Y] — переменная отклика или независимая переменная,

Predictor [X] — независимая переменная.

Type of Regression Model (типы моделей регрессии):

Linear — модель линейной регрессии,

Quadratic — модель квадратичной регрессии,

Cubic — модель кубической регрессии.

3) При проведении многофакторного регрессионного анализа t-критерий Стьюдента обеспечивает эффективную проверку предельного вклада каждой переменной при допущении, что все другие переменные уже включены в уравнение. Если объясняющая способность независимых переменных перекрывается (присутствует мультиколлинеарность), то предельный вклад в объяснение каждой из переменных может быть небольшим (t – статистика для переменных не значима), в то же время, как F-статистика указывает на адекватность.

4) В MINITAB для проверки явления мультиколлинеарности необходимо в команде Stat > Regression > Regression в опции Options отметить Variance inflation factors: — фактором роста дисперсии (VIF). Если значение VIF очень велико, то оно свидетельствует о том, что данная переменная связана с стальными переменными. О наличии связи между переменными может указывать выборочный коэффициент корреляции. На следующем этапе удаляется та переменная из модели, у которой значение t-статистики будет наименьшим.



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2019-11-29 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: