МНОЖЕСТВЕННЫЙ РЕГРЕССИОННЫЙ АНАЛИЗ




ЛАБОРАТОРНАЯ РАБОТА №5

Цель работы: рассчитать параметры линейного уравнения множественной регрессии с помощью MS Excel, а также проанализировать качество построенной модели.

 

ТЕОРИЯ

Множественный регрессионный анализ является развитием парного регрессионного анализа применительно к случаям, когда зависимая переменная гипотетически связана с более чем одной независимой переменной. Большая часть анализа будет непосредственным расширением парной регрессионной модели, но здесь возникают ряд проблем, о которых речь будет идти ниже.

Определение. Зависимость среднего значения какой–либо случайной величины (результативного показателя) от нескольких других величин (регрессоров, независимых переменных, аргументов) называется множественной регрессией.

Можно сказать, что множественная регрессия – это уравнение связи с несколькими переменными:

(1)

зависимая переменная – результативный признак; независимые переменные, факторы, регрессоры, объясняющие переменные.

Если две или несколько объясняющих переменных в уравнении регрессии коррелируют между собой, то такое явление называется мультиколлинеарностью.

Определение. Мультиколлинеарность – это коррелированность двух или нескольких объясняющих переменных в уравнении регрессии.

Мерой общего качества уравнения множественной регрессии является коэффициент (индекс) детерминации:

,

Коэффициент детерминации определяет долю разброса зависимой переменной, объясняемую полученным (эмпирическим) уравнением регрессии. Или формулу (6.1) можно записать в следующем виде:

где – общая дисперсия результативного признака, – остаточная дисперсия для уравнения множественной регрессии.

Независимо от формы связи показатель множественной корреляции может быть найден как индекс множественной корреляции, представляющий собой корень квадратный от коэффициента детерминации:

Скорректированный индекс множественной корреляции содержит поправку на число степеней свободы, а именно остаточная сумма квадратов делится на число степеней свободы остаточной вариации , а общая сумма квадратов отклонений – на число степеней свободы в целом по совокупности . Формула скорректированного индекса множественной детерминации имеет вид:

Поскольку , то величина скорректированного индекса детерминации можно представить в виде:

Для линейной зависимости признаков скорректированный коэффициент множественной корреляции определяется по той же формуле, что и индекс множественной корреляции, т.е. как корень квадратный из . Отличие состоит лишь в том, что в линейной зависимости под подразумевается число факторов, включенных в регрессионную модель, а в криволинейной зависимости – это число параметров при и их преобразованиях (, и т.д.), которое может больше числа факторов как экономических переменных. При заданном объеме наблюдений при прочих равных условий с увеличением числа независимых переменных (параметров) скорректированный коэффициент множественной детерминации убывает. Его величина может стать и отрицательной при слабых связях результата с факторами. В этом случае он должен считаться равным нулю. При небольшом числе наблюдений нескорректированная величина коэффициента множественной детерминации имеет тенденцию переоценивать долю вариации результативного признака, связанную с влиянием факторов, включенных в регрессионную модель.

Чем больше объем совокупности, по которой исчислена регрессия, тем меньше различаются показатели и . В статистических пакетах прикладных программ в процедуре множественной регрессии обычно приводится скорректированный коэффициент (индекс) множественной корреляции (детерминации). Величина коэффициента множественной детерминации используется для оценки качества регрессионной модели. Низкое значение коэффициента (индекса) множественной корреляции означает, что в регрессионную модель не включены существенные факторы – с одной стороны, а с другой стороны – рассматриваемая форма связи не отражает реальные соотношения между переменными, включенными в модель. В этом случае требуются дальнейшие исследования по улучшению качества модели и увеличению ее практической значимости.

Однако увеличение при добавлении новой переменной не всегда означает, что ее коэффициент значимо отличается от нуля. Поэтому увеличение скорректированного индекса множественной корреляции не означает улучшение спецификации регрессионной модели, как можно было бы предположить.



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2019-04-30 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: