На основании каких показателей можно судить о качестве регрессионной модели в целом?




При проверке качества модели в первую очередь стоит обращать внимание на то, соответствует ли она логике экономического процесса, т.е. мы должны смотреть, реалистичны ли знаки коэффициентов перед независимыми переменными и реалистична ли их величина. Качество регрессии оценивается с помощью: , t-статистики и F-статистики.

R2 (коэффициент детерминации):

Коэффициент детерминации показывает объясняющую способность регрессии.

Чем выше , тем больше построенная нами линия регрессии соответствует всем наблюдениям. Поэтому если мы хотим по регрессии строить предсказания (т.е. подставлять значения независимых переменных и получать точную, правдивую оценку зависимой), нам необходим высокий .

t-статистика:

t-статистика соизмеряет значение коэффициента с его стандартной ошибкой. Фактически же мы проверяем гипотезу о том, равен нулю коэффициент при рассматриваемой переменной или нет

F-статистика:

F- статистика представляет собой отношение объясненной суммы квадратов (в расчете на одну независимую переменную) к остаточной сумме квадратов (в расчете на одну степень свободы). Фактически проверяем гипотезу:

Но: все коэффициенты при независимых переменных равны нулю () На: хотя бы один из них нулю не равен.

161. Для чего используется F- критерий при оценке качества уравнения множественной регрессии?

F-статистика используется для анализа дисперсии. После получения F-статистики можно провести F-тест, который определит, действительно ли объясненная сумма квадратов больше той, которая может иметь место случайно. Для этого ищем критическое значение F в таблице Фишера с (k; n-k-1) степенями свободы и сравниваем с F-статистикой. Если расчетное значение больше, чем критическое, то уравнение в целом значимо на том уровне, на котором вы смотрели в таблице.

162. Как рассчитать значение F- критерия для множественной регрессии, исходя из знания сумм квадратов остатков?

Прииспользовании регрессионного анализа для деления дисперсии зависимой переменной

на «объясненную» и «необъясненную» составляющие, можно построить F-статистику: где ESS— объясненная сумма квадратов отклонений; RSS— остаточная (необъясненная) сумма квадратов;

к — число степеней свободы, использованное на объяснение. С помощью этой статистики можно выполнить F-тест для определения того, действительно ли объясненная сумма квадратов больше той, которая может иметь место случайно. Для этого нужно найти критический уровень F в колонке, соответствующей к степеням свободы, и в ряду, соответствующем (п-к-1) степеням свободы. Чаще всего F-тест используется для оценки того, значимо ли объяснение, даваемое уравнением в целом.

163. Как рассчитать значение F- критерия для множественной регрессии, исходя из знания коэффициента детерминации R2?

164. Какова особенность расчета числа степеней свободы для F- критерия в множественной регрессии?

В данном случае учитываются две степени свободы v1 и v2. v1 = k v2 = n – k – 1

k – число объясняющих переменных (без константы) Fкрит = (уровень значимости; v1; v2)

165. Каков вид F- распределения? Почему обычно используются только односторонние F- критерии?

F-распределение является асимметричным. Обычно используется односторонние критерии, так как это позволяет спасти значимость коэффициентов регрессии при том же уровне значимости.

Односторонний критерий имеет более высокую мощность, чем двухсторонний критерий — при той же вероятности ошибочного отклонения нулевой гипотезы. Это говорит о предпочтительности одностороннего критерия по сравнению с двухсторонним.

166. Каков содержательный смысл отношения Фишера в определении F -критерия?

F-статистика п редставляет собой отношение объясненной суммы квадратов (в расчете на одну независимую переменную) к остаточной сумме квадратов (в расчете на одну степень свободы), где k - число объясняющих переменных. Улучшение уравнение может происходить за счет добавления переменных, поэтому сумма квадратов остатков – эталонное значение – распределяется по количеству переменных, и сравниваются значения суммы квадратов остатков, объясненных регрессией и остаточных.

167. Каковы общие принципы выбора уровня значимости при использовании F -критерия для оценки качества уравнения в целом?

С одной стороны, большой уровень значимости дает большую уверенность в том, что альтернативная гипотеза значима. Но при этом возрастает риск не отвергнуть ложную нулевую гипотезу (ошибка второго рода). Таким образом, выбор уровня значимости требует компромисса между значимостью и риском ошибки и, следовательно, между вероятностями ошибок первого и второго рода. Обычно гипотезы проверяются на уровне значимости 1% или 5% (тоже самое, что и для уровня значимости при оценки коэффициентов).

168. Для чего используются t -тесты для коэффициентов регрессии и какова интерпретация их результатов?

t-тесты обеспечивают проверку значимости предельного вклада каждой переменной при допущении, что все остальные переменные уже включены в модель. t -тесты нужны для того, чтобы отвергнуть или не отвергнуть гипотезу о равенстве коэффициента перед переменной нулю. Если мы отвергаем гипотезу, значит, коэффициент значим. Сравнивая значение коэффициента с его стандартной ошибкой, можно судить о значимости коэффициента. Однако незначимость коэффициента регрессии не всегда может служить основанием для исключения соответствующей переменной из модели.

169. Какова связь между F- критерием и t- критериями для коэффициентов регрессии? Есть ли связь между соответствующими критическими значениями?

В случае множественного регрессионного анализа. F-статистика = квадрату t-статистики (F = t2).

Между критическими значениями, при любом заданном уровне значимости: F-крит. = t2-крит. (при двустороннем тесте).



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2017-06-11 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: