Для отбора наиболее значимых факторов xi учитываются следующие условия: 1)связь между результативным признаком и факторным должна быть выше межфакторной связи; 2)связь между факторами должна быть не более 0.7. Если в матрице есть межфакторный коэффициент корреляции rxjxi > 0.7, то в данной модели множественной регрессии существует мультиколлинеарность.;3)при высокой межфакторной связи признака отбираются факторы с меньшим коэффициентом корреляции между ними. 4)Если факторные переменные связаны строгой функциональной зависимостью, то говорят о полной мультиколлинеарности. отбор факторов – 2 этапа –а) логический, выбор зависит от природы взаимосвязи, факторы должны бвть колич измеримы(если необх вкл кач фактор, то придать колич значение), факторы не должны быть интеркоррелированы. Если факторы связаны между собой невозможно определить их влияние на рез-т. при неизменности ост факт если при вкл новых факторов коэфф детерм R2не улучшается, а ост дисп не уменьш то нет смысла вкл фактор в модель. Теорет анализ не дает однознач ответа о колич взаимосвязи поэтому:Б)на осн матрицы показ коррел можно искл дублирующие факторы
rx1y | rx2y | |
rx1y | rx1x2 | |
rx2y | rx1x2 |
.
параметров регрессии r(xjy) > r(xkxj); r(xky) > r(xkxj).
Если межфакт rxjxi > 0.7,то факт дублируют друг друга и искл тот факт корр кот при довольно тесн связи с у имеет более слаб связь с др факторами. Матрица пок только явную коллинеарн,чтобы посмотреть мультиколлин необх построить матрицу парных коэфф корреляции, если бы факт не корр между союой то матрица была бы единичной с опред =1, если факт нах в полной лин зависим то опред=0 чем ближе к нулю опред тем больше мультиколл. через коэфф мн детерминации определяется какой фактор ответственнен за мультиколл чем ближе к 1 тем больше.и исключается из модели
15. Мультиколлинеарность факторов и учет ее при построении моделей регрессии.
По величине парных коэфф-тов корреляции обнаруживается явная коллинеарность факторов. Наибольшие трудности в использовании множественной регрессии – при наличии мультиколл факторов, когда более чем 2 фактора связаны между собой линейной зависимостью, т. е. имеет место совок возд факт друг на друга. В рез-те вариация в исходных данных перестает быть полностью независимой, и нельзя оценить воздействие каждого фактора в отдельности. Включение в модель мультиколлинеарных факторов нежелательно в
силу последствий:• затрудняется интерпретация параметров множественной регрессии как
характеристик действия факторов в «чистом» виде, ибо факторы коррелированы;
параметры линейной регрессии теряют экономический смысл;• оценки параметров ненадежны, обнаруживают большие стандартные ошибки и
меняются с изменением объема наблюдений (не только по величине, но и по
знаку), что делает модель непригодной для анализа и прогнозирования.Для оценки мультиколлинеарности факторов может использоваться определитель
матрицы парных коэффициентов корреляции между факторами Если бы факторы не коррелировали между собой, то матрица парных коэффициентов
корреляции между факторами была бы единичной матрицей, поскольку все недиагональные элементы были бы равны нулю. Если же, наоборот, между факторами существует полная линейная зависимость и все коэффициенты корреляции равны единице, то определитель такой матрицы равен нулю. Чем ближе к нулю определитель матрицы межфакторной корреляции, тем сильнее мультиколлинеарность факторов и ненадежнее результаты множественной регрессии, и наоборот. Через коэфф мн детерминации ^2
можно найти факторы ответственные за мультиколлинеарность. чем ближе к 1 тем сильнее мультиколлинеарность сравнивая коэфф можно увидеть переменн отв за мультиколл и исключить их из модели
16. Преодоление мультиколлинеарности при построении модели регрессии.
1)исключение одного или нескольких факторов
2.)преобразование факторов при кот уменьш корр между ними (ряды динамики на ур назад для мскл тенденции) 3)переход к совмещенным уравнениям регрессии те к уравн кот отраж не только связь факт с рез-том но и фзаимод факторов f(x1,x2,x3) y=a+b1x1+b2x2+b3x3+b12x1x2+b13x1x3+b23x2x3+e
Проверить значимость по F взаимод факторов и оставить только значимые 4)переход к уравнениям приведен формы – подстановка рассматр фактора через выраж из др уравнения регресс то есть включит еще одно уравнение где фактор будет рассматр как зависимая переменная.