Лекция 1 Парная регрессия и корреляция
Спецификация модели
Ставя цель дать количественное описание взаимосвязей между экономическими переменными, эконометрика прежде всего связана с такими методами статистики, как регрессия и корреляция.
В зависимости от количества факторов (переменных х), включенных в уравнение регрессии, принято различать парную и множественную регрессии.
Парная регрессия представляет собой модель, где среднее значение зависимой (объясняемой) переменной у рассматривается как функция одной независимой (объясняющей) переменной х, т.е. это модель вида
Множественная регрессия представляет собой модель, где среднее значение зависимой (объясняемой) переменной у рассматривается как функция нескольких независимых (объясняющих) переменных х1,х2, …, т.е. это модель вида
Уравнение простой регрессии характеризует связь между двумя переменными, которая проявляется как некоторая закономерность лишь в среднем по совокупности наблюдений.
В уравнении регрессии корреляционная по сути связь признаков представляется в виде функциональной связи, выраженной соответствующей математической функцией. Практически в каждом отдельном случае величина у складывается их двух слагаемых:
где – фактическое значение результативного признака;
– теоретическое значение результативного признака, найденное исходя из соответствующей математической функции связи у и х, т.е. из уравнения регрессии;
– случайная величина, характеризующая отклонения реального значения результативного признака от теоретического, найденного по уравнению регрессии.
Запишем уравнение зависимости от
в виде регрессионного уравнения:
где – неслучайная (детерминированная) величина;
– случайные величины.
– регрессионные остатки модели (отклонения модельных данных от фактических)
– называется объясняемой (зависимой) переменной [выходной, результирующей, эндогенной переменной, результативным признаком]
– называется объясняющей (независимой) переменной или регрессором [входной,экзогенной переменной, фактором, факторным признаком]
Причины появления в модели случайной величины ε или возмущения:
Ошибки спецификации модели
Неправильный выбор математической функции для и недоучет в уравнении регрессии какого-либо существенного фактора, т.е. использование парной регрессии вместо множественной.
выборочный характер исходных данных
Ошибки выборки имеют место в силу неоднородности данных в исходной статистической совокупности.
3) ошибки измерения переменных
т.о. – случайная величина с некоторой функцией распределения, которой соответствует функция распределения случайной величины
Спецификация модели – формулировка вида модели исходя из соответствующей теории связи между переменными.
Основное внимание в эконометрических исследованиях уделяется ошибкам спецификации модели:
В парной регрессии спецификация модели связана с выбором вида математической функции, а в множественной – также с отбором факторов, включаемых в модель.
В парной регресcии выбор вида математической функции может быть осуществлен тремя методами:
– графическим (базируется на поле корреляции);
– аналитическим, т.е. исходя из теории изучаемой взаимосвязи;
– экспериментальным (путем сравнения величины остаточной дисперсии Dост, рассчитанной при разных моделях).
Результаты многих исследований подтверждают, что число наблюдений должно в 6-7 раз превышать число рассчитываемых параметров при переменной х.