Иными словами, найденные с помощью МНК оценки a 0, a 1,..., an, обеспечивают минимум следующей квадратичной формы на множестве всех других комбинаций значений таких оценок:
где et – значение фактической ошибки модели в момент t =1,2,..., Т, полученное после подстановки в выражение (1.2) вместо неизвестных истинных значений параметров a 0, a 1,..., an их оценок a 0, a 1,..., an.
Оптимальные по данному критерию значения оценок в этом случае могут быть найдены путем решения следующей системы так называемых “нормальных” уравнений, вытекающей из условия равенства нулю частных производных функции s 2(a 0, a 1,..., an) по своим параметрам в точке минимума:
В системе (2.3) неизвестными являются оценки параметров a 0, a 1,..., an, а ее известные коэффициенты сформированы на основе исходных данных и представлены в виде следующих сумм: i, j =1,2,..., п. Решения, получаемые на основе развернутой формы системы (2.3), достаточно громоздки, и поэтому в дальнейшем в математических выкладках общего характера будем использовать векторно-матричную форму представления ее составляющих.
Векторно-матричная форма записи линейной эконометрической модели (1.2) имеет следующий вид:
у = Х × a + e, (2.4)
где у – вектор-столбец, состоящий из Т компонент; Х – матрица размера Т ´(п +1) (если в модели присутствует “свободный” коэффициент a 0); a =(a 0, a 1,..., an)¢– вектор-столбец параметров, состоящий из п +1-й компоненты; e – вектор-стобец ошибки модели, состоящий, как и вектор у, из Т компонент.
Соответственно векторно-матричный вариант модели, в котором вместо неизвестных истинных коэффициентов a и ошибок e используются их оценки, т. е. вектора а и е, запишем в следующем виде:
у = Х × а + е, (2.5)
где а =(а 0, а 1,..., аn)¢, е =(е 1, е 2,..., еТ)¢– вектора значений оценок коэффициентов линейной эконометрической модели и значений ее фактической ошибки соответственно.
Сумму квадратов значений ошибки s 2 можем представить в виде скалярного произведения вектора-строки е ¢на вектор-столбец е. Проводя несложные преобразования с учетом правил произведения векторов и матриц, получим следующий результат:
s 2 =(е ¢, е)=(у – Х × a)¢(у – Х × a)= у ¢ у – a ¢ Х ¢ у – у ¢ Хa + a ¢ Х ¢ Хa =
= у ¢ у –2 a ¢ Х ¢ у + a ¢ Х ¢ Хa. (2.6)
При проведении преобразований учитывалось правило транспонирования векторно-матричного произведения (z × W)¢=(W ¢ × z ¢).
Условие (2.3) в векторной форме записи приобретает следующий вид:
¶ s 2/¶ a = 0. (2.7)
Заметим, что в выражении (2.7) операция дифференцирования осуществляется по вектору.
С учетом выражения (2.6) уравнение (2.7) приводится к следующему виду:
¶ s 2/¶ a =¶(у ¢ у –2 a ¢ Х ¢ у + a ¢ Х ¢ Хa)/¶ a =–2 Х ¢ у +2 Х ¢ Хa = 0
или
Х ¢ Хa = Х ¢ у.
Откуда следует, что “оптимальный” вектор оценок параметров a определяется на основе следующего векторно-матричного выражения:
a =(Х ¢ Х)–1× Х ¢ у. (2.8)
Все переменные в правой части выражения (2.8) являются известными – это исходные данные, сведенные в матрицу Х и вектор у.
Практика:
Классический подход к оцениванию параметров линейной регрессии основан на методе наименьших квадратов (МНК).
МНК позволяет получить такие оценки параметров a и b, при которых сумма квадратов отклонений фактических значений результативного признака y от расчетных (теоретических) минимальна:
Для того чтобы найти минимум функции, надо вычислить частные производные по каждому из параметров a и b и приравнять их к нулю. Тогда мы получаем следующую систему нормальных уравнений для оценки параметров a и b
Решая систему нормальных уравнений либо методом последовательного исключения переменных, либо методом определителей, найдем искомые оценки параметров a и b. Можно воспользоваться следующими формулами для a и b:
Эта формула получена из первого уравнения системы, если все его члены разделить на n:
, где cov(x,y) — ковариация признаков; σх2— дисперсия признака х. Поскольку , получим следующую формулу расчета оценки параметра b
Таким образом:
Свойства оценок МНК
Свойство несмещенностиоценок состоит в том, что математическое ожидание оценки должно быть равно истинному значению параметра.
Свойство состоятельностиоценок состоит в том, что с увеличением наблюдений оценка становится более надежной в вероятностном смысле.
Оценка называется эффективной, если она имеет минимальную дисперсию по сравнению с любыми другими оценками этого параметра в классе выбранных процедур.
Методы оценивания линейной модели множественной регрессии в Excel.
Модель множественной регрессии имеет вид:
Построение множественной линейной регрессии в MS EXСЕL выполняется так же, как и в случае парной регрессии двумя способами: с помощью функции ЛИНЕЙН и через Сервис, Анализ данных, Регрессия.
В первом случае мы выделяли на определенном шаге 5 строк и 2 столбца для того, чтобы поместить туда выходные параметры (массивы) регрессии. Если для множественной регрессии количество факторов равно m, то нужно соответственно выделять для выходных значений 5 строк и (m+1) столбцов. Заметим, что в первой строке вычисленные коэффициенты регрессии стоят в следующей очередности: bk, bk-1, --, Ь2, b1, b0.
Для второго способа через Сервис, Анализ данных. Регрессия все делается так же, как в случае парной регреcсии. Только в качестве входного интервала X, нужно выделить весь массив данных соответствующих факторам X1, Х2,.... Хk.
Применяется модель наименьших квадратов, если выполняется 4 условия теоремы Гаусса-Маркова:
1. Проверка качества модели
Находим Fкрит. через функцию FРАСПОБР (доверительный интервал 5%, степень свободы 1 = 1, степень свободы 2 = число степеней свободы при использовании функции Линейн). Fкрит сравниваем с числом Фишера (который мы также нашли через функцию линейн(первый столбец, 4 строка)).
2. Проверка качества коэффициентов.
Находим числа Стьюдента путем деления строки коэффициентов на строку ошибок коэффициентов. Находим tкрит. Через функцию СТЬЮДРАСПРОБР (вероятность 5%, степень свободы из функции Линейн (2 столбец, 4 строка)). Сравниваем найденные величины. Коэффициенты являются статистически значимыми, если числа Стьюдента больше tкрит.
2.2.2. Свойства оценок МНК
Рассмотрим основные условия, при которых оценки коэффициентов линейной эконометрической модели, во-первых, могут быть в принципе найдены, а, во-вторых, их “качество” будет “достаточно высоким”, что является определенным свидетельством и достаточного качества построенной модели.
Как было отмечено в разделе 1.5, “качество” оценок, их свойства тесно связаны со “статистической” трактовкой исходных данных и, в первую очередь, независимых переменных. Рассмотрим сначала случай, когда измеренные (наблюдаемые) значения независимых факторов трактуются как детерминированные (неслучайные) величины.
2.2. Особенности проверки качества оценок МНК
Проверка условий, выполнение которых свидетельствует о “высоком” качестве полученных оценок параметров эконометрической модели (а, следовательно, в значительной степени и самой модели), на практике обычно осуществляется с использованием ряда процедур и критериев, на основе исходной и новой, полученной после построения модели, информации. К исходной информации относятся наблюдаемые (измеренные) значения зависимой и независимых переменных yt и хit соответственно. Новую информацию составляют значения , найденные оценки параметров ai, соответствующие им фактические значения ошибки еt, а также ковариационные матрицы оценок и ошибок (в последнем случае возможно только дисперсии), i =0, 1,..., п; t =1, 2,..., Т. Иными словами, значение Т при проверке предполагается конечным.
При этом следует иметь в виду, что новая информация обычно рассматривается как некоторая оценка (заменитель) истинных (но неизвестных) значений соответствующих характеристик. В этой связи совпадение свойств оценок с предполагаемыми теорией априорными свойствами соответствующих характеристик (часто, но не всегда) является определенной гарантией качества модели (оценок ее параметров). Особенно важную роль в определении качества модели играют значения ее фактической ошибки еt, t =1, 2,..., Т; соответствующие полученным оценкам ее параметров.