ВВЕДЕНИЕ
Данная работа посвящена оценке взаимосвязи между Валовым региональным продуктом субъектов РФ и факторами, которые могут обуславливать его изменения. Таким образом, цель исследования состоит в исследовании факторов экономического роста субъектов РФ.
Для достижения этой цели автор должен будет выполнить следующие задачи:
• проанализировать факторы, обуславливающие экономический рост регионов РФ
• оценить факторы, влияющие на экономический рост регионов РФ;
• описать значимые взаимосвязи между исследуемыми факторами.
Предметом исследования является социально – экономическое развитие регионов РФ.
Объектом исследования являются регионы РФ.
Статистическая база исследования: статистические данные Федеральной службы государственной статистики по субъектам РФ.
Для выполнения поставленных задач и достижения цели автором будут использоваться следующие методы системного анализа и анализа данных при помощи статистических методов, включая эконометрический анализ панельных данных с использованием множественной регрессии, тестов на гетероскедастичность и инструментов описательной статистики. Анализ будет проводиться с использованием программного обеспечения StataMP 15.
ГЛАВА 2 - МЕТОДИКА ИССЛЕДОВАНИЯ
Определение регрессии
Рассмотрим две непрерывные переменные x=(x1, x2,.., xn), y=(y1, y2,..., yn).
Разместим точки на двумерном графике рассеяния и скажем, что мы имеем линейное соотношение, если данные аппроксимируются прямой линией.
Если мы полагаем, что y зависит от x, причём изменения в y вызываются именно изменениями в x, мы можем определить линию регрессии (регрессия y на x), которая лучше всего описывает прямолинейное соотношение между этими двумя переменными.
|
Статистическое использование слова "регрессия" исходит из явления, известного как регрессия к среднему, приписываемого сэру Френсису Гальтону (1889).
Он показал, что, хотя высокие отцы имеют тенденцию иметь высоких сыновей, средний рост сыновей меньше, чем у их высоких отцов. Средний рост сыновей "регрессировал" и "двигался вспять" к среднему росту всех отцов в популяции. Таким образом, в среднем высокие отцы имеют более низких (но всё-таки высоких) сыновей, а низкие отцы имеют сыновей более высоких (но всё-таки довольно низких).
Математическое уравнение, которое оценивает линию простой (парной) линейной регрессии:
Y=a+bx.
x называется независимой переменной или предиктором.
Y – зависимая переменная или переменная отклика. Это значение, которое мы ожидаем для y (в среднем), если мы знаем величину x, т.е. это «предсказанное значение y »
a – свободный член (пересечение) линии оценки; это значение Y, когда x=0 (Рис.1).
b – угловой коэффициент или градиент оценённой линии; она представляет собой величину, на которую y увеличивается в среднем, если мы увеличиваем x на одну единицу.
a и b называют коэффициентами регрессии оценённой линии, хотя этот термин часто используют только для b.
Парную линейную регрессию можно расширить, включив в нее более одной независимой переменной; в этом случае она известна как множественная регрессия.
Рисунок 2.1 - Линия линейной регрессии, показывающая пересечение a и угловой коэффициент b (величину возрастания Y при увеличении x на одну единицу)
|
Метод наименьших квадратов
Мы выполняем регрессионный анализ, используя выборку наблюдений, где a и b – выборочные оценки истинных (генеральных) параметров, α и β, которые определяют линию линейной регрессии в популяции (генеральной совокупности).
Наиболее простым методом определения коэффициентов a и b является метод наименьших квадратов (МНК).
Подгонка оценивается, рассматривая остатки (вертикальное расстояние каждой точки от линии, например, остаток = наблюдаемое y – предсказанный y, Рис. 2).
Линию лучшей подгонки выбирают так, чтобы сумма квадратов остатков была минимальной.
Рисунок 2.2 - Линия линейной регрессии с изображенными остатками (вертикальные пунктирные линии) для каждой точки.