Выявление эффектов гетероскедастичности




Сущность и последствия гетероскедастичности

Гетероскедастичность – это непостоянство дисперсии ошибок. На практике гетероскедастичность не так уж и редка. Зачастую есть основания считать, что вероятностные распределения случайных отклонений при различных наблюдениях будут различными. Это не означает, что случайные отклонения обязательно будут большими при определенных наблюдениях и малыми – при других, но это означает, что априорная вероятность этого велика. Поэтому важно понимать суть этого явления и его последствия.

Динамика изменения дисперсий (распределений) отклонений проиллюстрирована на рисунке. При гомоскедастичности дисперсии εi постоянны, а при гетероскедастичности дисперсии εi изменяются (на данном рисунке – увеличиваются).

Последствия гетероскедастичности:

1. Оценки коэффициентов по-прежнему остаются несмещенными и линейными.

2. Оценки не будут эффективными (т. е. они не будут иметь наименьшую дисперсию по сравнению с другими оценками данного параметра). Они не будут даже асимптотически эффективными. Увеличение дисперсии оценок снижает вероятность получения максимально точных оценок.

3. Дисперсии оценок будут рассчитываться со смещением.

4. Статистические выводы, получаемые при стандартных проверках качества оценок, могут быть ошибочными и приводить к неверным заключениям по построенной модели.

Выявление эффектов гетероскедастичности

531.0 –истинное значение измерения

0.07 – истинное значение стандарта

Исходные данные:

x
 
554,978
  554,916
  555,006
  555,014
  554,942
  555,059
  555,059
  554,998
  555,016
  555,008
  554,990
  555,036
  554,970
  555,109
  554,993
  555,005
  555,053
  555,002
  554,995
  554,958

 

График линейного тренда:

1) На основе ранговой корреляции Спирмена

При использовании данного теста предполагается, что дисперсия отклонения будет либо увеличиваться, либо уменьшатся с увеличением значения х. Поэтому для регрессии, построенной по МНК, абсолютные величины отклонений и значения будут коррелированы. Значения упорядочиваются по величинам. Затем определяется коэффициент ранговой корреляции:

Для начала вычислим среднее арифметическое, отклонение от него ,для всех элементов ряда и выстроим ряд отклонений в вариационный. Так как ранг номера равен самому номеру, помещаем ранг номеров в колонку 1. Получаем ранг отклонения как номер i-ого элемента исходного ряда отклонений в вариационном ряде.

Вычислим разности рангов:

Из полученных значений вычислим квадраты разностей рангов.

 

i ni v vвариац. d2 vi-vi-1
    -0.04714 -0.13714    
    -0.13714 -0.09714   -0.09
    -0.00714 -0.07714   0.13
    0.00286 -0.05714   0.01
    -0.09714 -0.04714   -0.1
    0.06286 -0.02714   0.16
    0.06286 -0.02714    
    -0.01714 -0.02714   -0.08
    0.00286 -0.01714   0.02
    -0.00714 -0.01714   -0.01
    -0.02714 -0.00714   -0.02
    0.03286 -0.00714   0.06
    -0.05714 -0.00714   -0.09
    0.13286 0.00286   0.19
    -0.02714 0.00286   -0.16
    -0.00714 0.03286   0.02
    0.05286 0.05286   0.06
    -0.01714 0.06286   -0.07
    -0.02714 0.06286   -0.01
    -0.07714 0.13286   -0.05

 

Ранговый коэффициент корреляции:

 

 

Значимость полученного коэффициента:

по критерию Стьюдента, имеем


 

 

tэт = 2.10

 

0,657< 2.1

 

t<tэт

 

Следовательно, значимый коэффициент гетероскедастичностиприсутствует.

 

2)Тест Голдфелда-Квандта

 

В данном случае предполагается, что стандартное отклонение пропорционально значению переменной х в этом наблюдении.Предполагается, что имеет нормальное распределение и отсутствует автокорреляция остатков.

 

Тест Голдфелда – Квандта состоит в следующем:

 

1. Все n наблюдений упорядочиваются по величине хпо возрастающей.

 

2. Вся упорядоченная выборка после этого разбивается на две подвыборки размерностей k, (N – 2k), k соответственно.

 

3. Оцениваются отдельные регрессии для первой подвыборки (k первых наблюдений) и для второй подвыборки (k последних наблюдений). Если предположение о пропорциональности дисперсий отклонений значениям х верно, то дисперсия регрессии по первой подвыборке будет существенно меньше дисперсии регрессии по второй подвыборке.

 

4. Для сравнения соответствующих дисперсий строится следующая F-статистика.

 

Разделяем вариационный ряд исходный величин следующим образом:

 

y1 y2 y3
554.88 554.99 555.05
554.92 555.00 555.07
554.94 555.01 555.08
554.96 555.01 555.08
554.97 555.01 555.15
554.99 555.02 555.17
554.99 555.02 555.22

 

Уравнения регрессии для крайних наборов y1 и y3:

и

 

 

А= = =

 

Вычислим:

 

 

 

 

 

Следовательно

 

 

Получаем отклонения:

 

v1 v3
-0.124 -0.15
-0.024 -0.13
-0.064 -0.12
-0.044 -0.12
-0.034 -0.05
-0.014 -0.03
-0.014 0.02

 

Суммы квадратов откланений:

 

 

Практическое значение статистики Фишера:

 

 

 

Таким образом, по данному критерию отношение мер рассеивания в начале и в конце ряда статистически не значимо с вероятностью 0.95 и таким образом не значима и степень неравноточности результатов измерений, т.е. гетероскедастичность.



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2018-01-08 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: