отбор факторов при построении модели регрессии




 

Для отбора наиболее значимых факторов xi учитываются следующие условия: 1)связь между результативным признаком и факторным должна быть выше межфакторной связи; 2)связь между факторами должна быть не более 0.7. Если в матрице есть межфакторный коэффициент корреляции rxjxi > 0.7, то в данной модели множественной регрессии существует мультиколлинеарность.;3)при высокой межфакторной связи признака отбираются факторы с меньшим коэффициентом корреляции между ними. 4)Если факторные переменные связаны строгой функциональной зависимостью, то говорят о полной мультиколлинеарности. отбор факторов – 2 этапа –а) логический, выбор зависит от природы взаимосвязи, факторы должны бвть колич измеримы(если необх вкл кач фактор, то придать колич значение), факторы не должны быть интеркоррелированы. Если факторы связаны между собой невозможно определить их влияние на рез-т. при неизменности ост факт если при вкл новых факторов коэфф детерм R2не улучшается, а ост дисп не уменьш то нет смысла вкл фактор в модель. Теорет анализ не дает однознач ответа о колич взаимосвязи поэтому:Б)на осн матрицы показ коррел можно искл дублирующие факторы

  rx1y rx2y
rx1y   rx1x2
rx2y rx1x2  

.

 

параметров регрессии r(xjy) > r(xkxj); r(xky) > r(xkxj).

Если межфакт rxjxi > 0.7,то факт дублируют друг друга и искл тот факт корр кот при довольно тесн связи с у имеет более слаб связь с др факторами. Матрица пок только явную коллинеарн,чтобы посмотреть мультиколлин необх построить матрицу парных коэфф корреляции, если бы факт не корр между союой то матрица была бы единичной с опред =1, если факт нах в полной лин зависим то опред=0 чем ближе к нулю опред тем больше мультиколл. через коэфф мн детерминации определяется какой фактор ответственнен за мультиколл чем ближе к 1 тем больше.и исключается из модели

 

15. Мультиколлинеарность факторов и учет ее при построении моделей регрессии.

По величине парных коэфф-тов корреляции обнаружи­вается явная коллинеарность факторов. Наибольшие труд­ности в использовании множественной регрессии – при наличии мультиколл факторов, когда бо­лее чем 2 фактора связаны между собой линейной зависимос­тью, т. е. имеет место совок возд факт друг на друга. В рез-те вариация в исходных данных перестает быть полно­стью независимой, и нельзя оценить воздействие каждого факто­ра в отдельности. Включение в модель мультиколлинеарных факторов нежелательно в

силу последствий:• затрудняется интерпретация параметров множественной регрессии как

характеристик действия факторов в «чистом» виде, ибо факторы коррелированы;

параметры линейной регрессии теряют экономический смысл;• оценки параметров ненадежны, обнаруживают большие стан­дартные ошибки и

меняются с изменением объема наблюде­ний (не только по величине, но и по

знаку), что делает модель непригодной для анализа и прогнозирования.Для оценки мультиколлинеарности факторов может исполь­зоваться определитель

матрицы парных коэффициентов корреля­ции между факторами Если бы факторы не коррелировали между собой, то матрица парных коэффициентов

корреляции между факторами была бы единичной матрицей, поскольку все недиагональные элементы были бы равны нулю. Если же, наоборот, между факторами существует полная ли­нейная зависимость и все коэффициенты корреляции равны еди­нице, то определитель такой матрицы равен нулю. Чем ближе к нулю определитель матрицы межфакторной корреляции, тем сильнее мультиколлинеарность факторов и ненадежнее результаты множественной регрессии, и наоборот. Через коэфф мн детерминации ^2

можно найти факторы ответственные за мультиколлинеарность. чем ближе к 1 тем сильнее мультиколлинеарность сравнивая коэфф можно увидеть переменн отв за мультиколл и исключить их из модели

 

16. Преодоление мультиколлинеарности при построении модели регрессии.

 

1)исключение одного или нескольких факторов

2.)преобразование факторов при кот уменьш корр между ними (ряды динамики на ур назад для мскл тенденции) 3)переход к совмещенным уравнениям регрессии те к уравн кот отраж не только связь факт с рез-том но и фзаимод факторов f(x1,x2,x3) y=a+b1x1+b2x2+b3x3+b12x1x2+b13x1x3+b23x2x3+e

Проверить значимость по F взаимод факторов и оставить только значимые 4)переход к уравнениям приведен формы – подстановка рассматр фактора через выраж из др уравнения регресс то есть включит еще одно уравнение где фактор будет рассматр как зависимая переменная.

 



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2016-02-16 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: