При наличии МК стандартные ошибки становятся больше, чем они были бы, если бы МК не было, что приводит к меньшей надежности полученных оценок.
МК приводит к увеличению дисперсий оценок коэффициентов, уменьшению значений t-stat. (что приводит к неверным выводам о значимости коэффициента), может выражаться в неверном с точки зрения теории или данных знаке коэффициента. Проявляется в неустойчивости коэффициента и его дисперсии в зависимости от спецификации регрессии, объема выборки. Наличие доминантной переменной (коррелированной с зависимой переменной) делает коэффициенты при остальных объясняющих переменных незначимыми.
Могут ли коэфф. множеств. регрессии быть незначимыми, если уравнение в целом значимо?
Таким образом, может проявляться МК в регрессии с данными объясняющими переменными, даже если модель правильно специфицирована, поскольку происходит занижение t-stat, в то время как общая значимость уравнения и значимость некоррелирующих переменных остаются незатронутыми.
Могут ли некоторые коэффициенты множественной регрессии быть значимыми, если уравнение в целом незначимо?
Да, могут. Например, при оценивании не имеющей смысла регрессии с 40 объясняющими переменными, каждая из которых не является действительным детерминантом зависимой переменной, F-статистика должна оказаться достаточно низкой, чтобы гипотеза H0 (модель не обладает никакой объясняющей способностью) не была отвергнута. Однако при выполнении t-теста для коэффициентов регрессии на 5%-ном уровне, существует 5%-ная вероятность допустить ошибку I рода (коэффициенты значимы - истинная гипотеза H0 (коэффициент при переменной равен 0) отвергается), поэтому в среднем можно ожидать, что 2 из 40 переменных будут иметь «значимые» коэффициенты.
Почему МК часто вызывает появление «неправильного» знака коэффициента регрессии?
При МК коэффициенты становятся неустойчивыми, поскольку становится сложно отделить влияние одной переменной от другой переменной. В результате оценки могут перейти через нуль и оказаться по другую сторону от нуля. Если это происходит, возникает неправильный знак коэффициента.
Из-за увеличения стандартных ошибок коэффициентов (дисперсии оценок коэффициентов) – оценка сильно отклоняется от теоретического значения. Такое явление часто возникает, когда коэффициенты при переменных положительны в теоретической модели, а корреляция между объясняющими переменными сильнее, чем каждой из объясняющих переменных с зависимой.
Как можно обнаружить наличие мультиколлинеарности?
Проблема МК может возникнуть, когда существует корреляция между объясняющими переменными.
Наиболее характерные признаки МК:
ü Небольшое изменение исходных данных (например, добавление новых наблюдений) приводит к существенному изменению коэффициентов модели.
ü Оценки имеют большие стандартные ошибки, малую значимость, в то время как модель в целом является значимой и обладает хорошей объясняющей способностью (хорошие значения F-статистики и R2).
ü Оценки коэффициентов имеют неправильные с точки зрения теории (и логики) знаки или неоправданно большие значения. Коэффициенты, которые по логике должны быть значимы, оказываются незначимыми.
Что следует предпринять в случае наличия МК?
· Можно попытаться уменьшить дисперсию случайного члена: если можем найти важную переменную, которая не включена в модель и, следовательно, вносит вклад в значение u, то мы уменьшим теоретическую дисперсию случайного члена, добавив эту переменную в уравнение регрессии.
· Можно увеличить или изменить выборку.
· увеличении среднеквадратического отклонения объясняющих переменных (возможно на стадии проектирования опроса – например, привлекать к участию в опросе и бедное, и богатое население).
· На стадии опроса нужно приложит все усилия для получения такой выборки, в которой объясняющие переменные было бы как можно меньше связаны между собой
· Исключить одну из переменных Преобразовать мультиколлинеарные переменные:
o Использовать нелинейные формы, Использовать агрегаты (линейные комбинации нескольких переменных)
o Использовать первые разности вместо самих переменных.
Спецификация уравнения регрессии. Выбор переменных.
Что включает в себя понятие «спецификация уравнения регрессии»?
это выбор переменных и выбор формы зависимости.