Автокорреляционные функции.




Автоковариации и автокорреляции (см. (10.12) и (10.13)) весьма полезны при построении АРСС(p, q)-моделей (Box, George and Gwilym Jenkins [22]).

Проиллюстрируем метод автокорреляционных функций на четырех важных примерах встречающихся примерно в 80% приложений: моделях АР(1), АР(2), СС(1), АРСС(1, 1).

Для АР(1) - модели

yt = a0 + a1 yt-1 +et

формулы (10.13), (10.19) дают

gt = s2/[1-(a1)2],

gs = s2(a1)s/[1-(a1)2].

Из (10.13) получаем, что r0 = 1; r1 = а1; r2 = (а1)2,..., rs = (а1)s.

Построим график, на оси абсцисс отложим значение s, а на оси ординат rs. Напомним, что такой график называется коррелограммой. В нашем случае автокорреляционные функции (АКФ) rs сходятся к нулю со скоростью геометрической прогрессии (ïа1ï<1 по условию). Если а1 > 0, то сходимость монотонно убывающая. При а1 < 0 наблюдаются колебания, амплитуда которых затухает со скоростью геометрической прогрессии.

Теперь рассмотрим более сложный АР(2) процесс

yt = a1 yt-1 + a2 yt-2 +et. (10.27)

Мы опустили свободный член, так как он не оказывает влияния на величину АКФ. Напомним, что по условиям стационарности корни характеристического многочлена (1 - a1L - a2L2) лежат вне единичного круга. Выведем расчетные формулы для автокорреляций, используя уравнения Юла - Уокера (Yule - Walker).

Умножим уравнение (10.27) на yt-s, s=0; s=1; s=2 и так далее. После вычисления математического ожидания в левой и правой части равенств получаем систему уравнений

Mytyt = a1Myt-1yt + a2Myt-2yt + M etyt,

Mytyt-1 = a1Myt-1yt-1 + a2Myt-2yt-1 + M etyt-1,

Mytyt-2 = a1Myt-1yt-2 + a2Myt-2yt-2 + M etyt-2, (10.28)

...................................................................

Mytyt-s = a1Myt-1yt-s + a2Myt-2yt-s + M etyt-s.

Согласно определению стационарности

Mytyt-s = Myt-syt = Myt-kyt-k-s = gs.

Далее ясно, что

M etyt = s2,

M etyt-s = 0.

Поэтому (10.28) преобразуется к виду:

g0 = a1g1 + a2g2 + s2, (10.29)

g1 = a1g0 + a2g1, (10.30)

................................

gs = a1gs-1 + a2gs-2. (10.31)

Поделив (10.30) и (10.31) на γ0, получаем

r1 = a1r0 + a2r1, (10.32)

..........................

rs = a1rs-1 + a2rs-2. (10.33)

Так как r0 = 1, то из (10.32) следует, что r1 = a1/(1-a2). Зная r0 и r1, далее последовательно находим остальные АКФ. Например, для s = 2 и s = 3, имеем

r2 = (a1)2/(1-a2) + a2,

r3 = a1[(a1)2/(1-a2) + a2] + a2a1/(1-a2).

Как и в предыдущем случае, последовательность АКФ {rs} должна быть сходящейся. Что условия стационарности yt требуют, чтобы корни характеристического уравнения для разностного уравнения (10.33) лежали внутри единичного круга.

 

АКФ для СС(1)-процесса. Рассмотрим СС(1)-процесс вида yt = et + bet-1. Умножая yt на yt-s и вычисляя математическое ожидание, получаем уравнения Юла-Уокера

g0 = D(yt) = Mytyt = M[(et + bet-1) (et + bet-1)] = (1+b2)s2

g1 = Mytyt-1 = M[(et + bet-1) (et-1 + bet-2)] = bs2

и

gs = Mytyt-s = M[(et + bet-1) (et-s + bet-s-2)] = 0 для s>1.

В качестве примера покажите, что АКФ для СС(2)-процесса yt = et + b1et-1 + b2et-2 имеет два ненулевых значения r1 и r1, а остальные rs = 0, для s>2.

АКФ для АРСС(1, 1)-процесса. Итак, пусть

yt = a1 yt-1 + et + b1et-1.

Используя прием Юла-Уокера, получаем

Mytyt = a1Myt-1yt + M etyt + b1M et-1yt Þ g0 = a1g1 +s2 + b1(a1 + b1)s2, (10.34)

Mytyt-1 = a1Myt-1yt-1 + M etyt-1 + b1M et-1yt-1Þg1 = a1g0 + b1s2, (10.35)

Mytyt-2 = a1Myt-1yt-2 + M etyt-2 + b1M et-1yt-2 Þ g2 = a1g1 (10.36)

.........................................

Mytyt-s = a1Myt-1yt-s + M etyt-s + b1M et-1yt-s Þ gs = a1gs-1. (10.37)

Из (10.34) и (10.35) имеем

= .

 

Следовательно

(10.38)

и далее rs = a1rs-1 для s³2.

Итак, в АРСС(1, 1)-модели величина r1 зависит от а1 и b1. Далее rs АРСС(1, 1) выглядит также как для АР(1), то есть в виде последовательности членов геометрической прогрессии со знаменателем а1. В зависимости от знака а1 эта последовательность либо постоянно убывает, либо осцилирует, затухая.

Задача. В качестве упражнения постройте коррелограмму для АРСС(2, 1)-модели. Для общих АРСС(p, q)-моделей, начиная с запаздывания q, значения ri будут удовлетворять уравнению

ri = a1ri-1 + a2ri-2 +... + apri-p, i>q.

При этом первые р-1 значение ri трактуются как начальные условия, получаемые из уравнений Юла-Уокера.

 

Частные автокорреляционные функции (ЧАКФ). В АР(1)-модели yt и yt-2 коррелируют, хотя yt-2 явно не входит в уравнение модели (r2 = r12). Такая косвенная корреляция присуща АКФ любой авторегрессионной модели. Напротив, частные автокорреляции между yt и yt-s исключают эффекты других запаздываний. Поэтому, для АР(1)-модели ЧАКФ между yt и yt-2 равны нулю.

Большинство статистических пакетов программ имеют возможности для вычисления ЧАКФ. Некоторые из них основаны на методе, связанном с уравнениями Юла-Уокера:

Ф11 = r1, (10.39)

Ф22 = (r2 - r12)/(1 - r12), (10.40)

и далее

Фss = ; j = 1, 2, 3,..., (10.41)

где

Фsj = Фs-1,j - ФssФs-1,s-j, j = 1, 2, 3,..., s-1. (10.42)

Используя правило Крамера, из Юла-Уокера уравнений можно для АR(k)-процесса получить другую формулу для Фkk:

Фkk = . (10.43)

Для s>k, прямой корреляции между yt и yt-s для АР(k) процесса нет. Следовательно, Фss = 0 при s>k.

Рассмотрим теперь СС(1)-модель yt = et + bet-1. Если b ¹ -1, то et=yt/(1+bL). Следовательно, разлагая правую часть равенства в ряд, имеем

yt - byt-1 + b2yt-2 - b3yt-3 +... = et.

Поэтому ЧАКФ для СС(1) не обращаются в ноль, начиная с некоторого номера s, а убывают со скоростью геометрической прогрессии. Если b<0, то убывание монотонное, а при b>0 коэффициенты осцилируют. В более общем случае ЧАКФ стационарных АРСС(p, q)-процессов, начиная с лага p, убывают к нулю. Вид убывания зависит от коэффициентов многочлена

(1 + b1L + b2L2 +... + bqLq).

 

10.6.Построение АРСС-моделей. Первым шагом в подборе АРСС-модели наблюдаемого временного ряда является оценивание среднего - m, дисперсии - (sy)2 и автокорреляций rk. В предположении стационарности и эргодичности (возможности получения оценок по одной реализации процесса) применимы следующие оценки:

, (10.44)

, (10.45)

и

, s = 1, 2,..., Т/4. (10.46)

Выборочные АКФ из (10.46) и ЧАКФ, полученные по формулам (10.39)-(10.43) сравнивают с различными теоретическими функциями в попытке идентифицировать процесс, породивший данную выборочную реализацию.

Бокс и Дженкинс (1976) получили формулу для расчета дисперсии выборочной АКФ rs в предположении, что yt - стационарны с нормально распределенными ошибками. Тогда

D(rs) = T-1 для s = 1, (10.47)

D(rs) = (1 + 2 )T-1 для s>1 (10.48)

при настоящем значении rs = 0. Более того, в большой выборке (Т - велико) rs - нормально распределено с нулевым средним. Для ЧАКФ коэффициентов АР(р)-модели доказано, что D(Фp+i,p+i) » Т-1.

На практике полученные выборочные значения АКФ и ЧАКФ тестируются на значимость, используя (10.47) и (10.48). Например, для 95% доверительного интервала (двух стандартных отклонений) если r1 превышает 2Т , то следует отвергнуть нулевую гипотезу о том, что АКФ первого порядка статистически незначимо отличается от нуля. Это означает, что q>0, где q-показатель числа запаздываний в модели SS(q). Затем, пусть s =2; D(rs) = (1 + 2r12)/T.

Если, например, r1 = 0,5 и Т = 100, то D(r2) = 0,015 и s(r2) » 0,123. Тогда, если вычисленное по выборке значение r2 превышает 2·(0,123) (два стандартных отклонения), то при принятых ограничениях с 95% вероятностью можно утверждать, что гипотезу r2 = 0 надо отвергнуть. Следовательно, q>1. Повторяя процесс проверки гипотез для различных s можно пытаться идентифицировать порядок процесса.

Однако, если просматривать большое число АКФ, то можно обнаружить, что некоторые АКФ превышают 2s(rs), хотя настоящие rs = 0. Это вызвано как 5% ошибками первого рода, так и несоответствием реальных распределений теоретическим предпосылкам нормальности ошибок.

Следующая Q-статистика может быть использована для тестирования, когда группа АКФ значимо отличается от нуля. Q-статистика была создана Боксом и Пирсом (1970) и имеет вид:

. (10.49)

Если данные порождены стационарным АРСС-процессом, то Q ассимптотически c2 распределенная с s степенями свободы. Интуитивно ясно, что большие значения АКФ ведут к большим значениям Q. Если Q-выборочное превышает соответствующее табличное значение Q, то мы отвергаем гипотезу о незначимости группы АКФ. Отметим, что альтернативная гипотеза означает, что хотя бы одна АКФ не равна нулю.

Однако, как оказалось, что даже в средней величины выборках Q-статистика работает плохо. Льюbc и Бокс (1978) для малых выборок применили модифицированную Q-статистику, вычисленную по формуле

Q = T(T + 2) . (10.50)

Если выборочное значение Q-статистики превышает критическое значение c2 распределения с s степенями свободы, то по крайней мере одно значение rk статистически отлично от нуля при данном уровне значимости. Особо полезны эти статистики для проверки гипотезы о том, образуют ли остатки вычисленной АРСС(p, q)-модели белый шум. Поэтому если рассчитывать s АКФ для остатков оцененной АРСС(p, q)-модели, то число степеней свободы уменьшается на число коэффициентов модели. Следовательно, используя остатки для АРСС(p, q)-модели, мы должны проверять Q с помощью c2 распределения с s-p-q степенями свободы (а если включена свободная постоянная, то используем таблицы c2 распределения с s-p-q-1 степенями свободы).

Селекция моделей АРСС.

Наиболее простой и популярный в настоящее время метод селекции моделей состоит в том, что строится множество моделей с различными p и q, а затем выбирается модель минимизирующая выбранный критерий селекции, характеризующий качество модели.

Существующие «внутренние» критерии селекции выражают компромисс между сложностью модели и величиной суммы квадратов остатков. Так наиболее популярными являются Акаике информационный критерий (AIC) и Шварца бестестовый критерий (SBC), вычисляемые по формулам

AIC = T ln(R2) + 2n,

SBC = T ln(R2) + n ln(T),

где R2 - сумма квадратов остатков (ошибок) модели, n - число оцениваемых параметров модели, Т - число используемых наблюдений.

Так как ln(T)>2, то SBC- оптимальная модель будет менее сложной, чем AIC- оптимальная модель. Стоимость «добавки» лишнего слагаемого больше для SBC-критерия, чем для AIC-критерия. Доказано, что с увеличением выборки SBC-модели асимптотически состоятельны, в то время как AIC-модели склоняются в сторону переусложненной модели.

Рассмотренные выше критерии отбора являются «внутренними», то есть используют данные уже ранее использованные для построения моделей.

Если позволяет величина выборки, то гораздо надежнее использовать «внешние» критерии селекции, то есть использовать независимые наблюдения, не вошедшие в первоначальную выборку. Алгоритм построения АРСС(p, q)-модели по внешнему критерию минимизации ошибок на «экзаменующей» выборке предлагается ниже.



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2016-04-15 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: