Алгоритм выбора модели оптимальной сложности для временного ряда в классе АРСС(p, q)-моделей.




Все множество наблюдений yt, t = 1, 2, 3,..., T разбивают на две выборки:

· обучающую с объемом наблюдений T1 (y1, y2,..., yT1);

· экзаменационную (yT1+1,..., yT1+T2) c объемом наблюдений Т2.

Вычисляются числовые характеристики временного ряда на обучающей выборке: среднее, дисперсия, автоковариации и автокорреляционные функции (АКФ):

; ;

, где k = 1, 2,..., Т1/4;

ρk = , k = 1, 2,..., T1/4.

3.Организуются циклы по переменным p - числу параметров авторегрессии и q - числу параметров скользящего среднего. p= 1, 2,..., pmax; q = 1, 2,..., qmax.

4.Для каждой пары (p, q) вычисляются оценки параметров авторегрессии = (Ф1, Ф2,..., Фр) как решения системы р линейных уравнений

,

где А-матрица с элементами Аij = γ |q+i-j|, а вектор = (х1, х2,...,хр) с координатами хi = gq+i; i,j = 1, 2,..., p.

5.По известным автоковариациям gk вычисляется модифицированная последовательность ковариаций gj1:

6.Вычисляем начальные значения ; t10 = t20 =... = tq0 = 0, то есть формируется начальный вектор = (t00,t10 , t20,...,tq0).

7. Далее используется алгоритм Ньютона-Рафсона вида:

, = (t0i,t1i , t2i,...,tqi),

где является решением системы , причем

= (f0i,f1i , f2i,...,fqi),

fji = , а

,

и начальный вектор определен в пункте 6.

8. Если |fji| < E для j = 0, 1,..., q, для некоторого выбираемого заранее малого e, то итерационный процесс завершается.

9. Оценки bi параметров скользящего среднего находятся по формулам

bj = -tj/t0, j = 0, 1,..., q,

где = (t0, t1 , t2,...,tq) получен в результате применения процедуры Ньютона - Рафсона (п.п. 7-8)

10. Вычисляется свободный член модели по формуле

а0 =

 

11. Вычисляется оценка дисперсии белого шума

.

12. Вычисляем остаточные ошибки модели на обучающей выборке. Пусть s = max{p, q}, тогда остаточные ошибки a1об, a2об,..., aТ1об на обучающей выборке (y1, y2,...,yT1) имеют вид:

a1об = a2об = a3об =... = asоб;

akоб = ykоб - а0 - ; k = s+1,..., T1.

13. Найдем остаточные ошибки модели на проверочной последовательности. Полагаем

a0пр = a1об; a-1пр = aТ1-1об;..., a-sпр = aТ1-sоб;

и далее

akпр = ykпр - а0 - ; k = s+1,..., T2.

14. Вычисляем на экзаменационной (проверочной) последовательности среднюю сумму квадратов ошибок

.

15. Оформляется конец циклов на p и q.

16. Выбирается пара pопт и qопт, для которой spq2 принимает минимальное значение

(pопт , qопт) = Argmin spq2

17. Далее производится оценка коэффициентов авторегрессии и скользящего среднего для модели выбранной оптимальной сложности с p = pопт, q = qопт, повторяя описанный в пунктах 1-14 алгоритм для всей выборки Т и получая окончательные значения коэффициентов а0, Ф1,..., Фp, b0,..., bq.

Экономичность модели. Кроме использования «внешнего» критерия при построении модели, можно использовать принцип «экономичности». Включение дополнительных переменных в модель увеличивает адекватность модели (на обучающей выборке), так как средняя ошибка модели убывает. Часто можно заменить одну модель другой - более экономичной. Как, например СС()-модель

yt = et + 0,5et-1 + 0,25et-2 + 0,125et-3 + 0,0625et-4 +...

эквивалентна модели

yt = 0,5yt-1 + et,

что легко проверяется.

Для того, чтобы сделать модель более экономичной считают, что коэффициенты авторегрессии и скользящего среднего должны иметь t-статистики больше или равны 2 (чтобы каждый коэффициент значимо отличался от нуля при 5% уровне значимости). Кроме того, надо проверять, чтобы коэффициенты не были сильно коррелированны друг с другом. Сильная корреляция коэффициентов делает модель неустойчивой. В этом случае следует исключить те коэффициенты, которые в наименьшей степени ухудшают результаты прогноза.

Кроме того, важно, чтобы остатки оцениваемой модели были сериально некоррелированные. Наличие сериальной корреляции остатков сигнализирует о систематических изменениях в {yt} - последовательности, которые не могут быть учтены АРСС-моделью.

Для проверки корреляции остатков строятся АКФ И ЧАКФ для остатков оцениваемой модели. Можно далее использовать Q-статистики (10.49)-(10.50) Бокса-Пирса и Льюиса-Бокса. С их помощью можно определить будут ли автокорреляции остатков или частные автокорреляции статистически значимы. Обычно можно предполагать наличие сериальной корреляции остатков при превышении критического уровня Q- статистикой при 10% уровне значимости. В этом случае велика вероятность построения другой модели, лучше отражающей специфику процесса.

Стационарность и обратимость. Из результатов теории вероятности известно, что выборочные АКФ и ЧАКФ аппроксимируют АКФ и ЧАКФ реального временного ряда в том случае, если предполагать стационарность ряда yt­. Далее, t-статистики и Q-статистики также предполагают стационарность ряда yt.

Если искомый ряд yt не стационарный, то первым шагом в подходе Бокса-Дженкинса является взятие первой, второй и следующих разностей временного ряда

, ,...

и так далее, до тех пор, пока в результате не получится стационарный временной ряд. Этот подход обладает серьезным недостатком, так как не позволяет включать в модель долговременные составляющие. О современных подходах к построению модели временных рядов в условиях нестационарности пойдет речь в последующих главах книги.

Подход Бокса-Дженкинса требует также обратимости модели. Это означает, что модель может быть представлена в виде конечного или бесконечного, но сходящегося авторегрессионого процесса. Это необходимо для АКФ и ЧАКФ. Например, рассмотрим СС(1)-модель

yt = et - b1et-1.

Если |b1| < 1, то

et = yt/(1-b1L)

или, разлагая в ряд правую часть равенства, получаем

yt + b1yt-1 + b12yt + b13yt +... = et.

Полученная модель представляет собой сходящуюся авторегрессионную модель бесконечного порядка, для которой могут быть посчитаны АКФ и ЧАКФ. Однако, если b1| ³ 1, то {yt} - последовательность не может быть представлена сходящейся авторегрессией. В общем случае для АРСС (p, q)-модели корни многочлена 1 + b1L + b2L2 +... + bqLq должны лежать вне единичного круга. Тогда модель обратима.

Заметим, что могут существовать и необратимые модели с долгосрочной “памятью”, которые нельзя построить по методу Бокса-Дженкинса. Например, модель стационарного процесса

yt = et - et-1

с постоянным средним Myt = Myt-s = 0 и дисперсией Dyt = Dyt-s = s2(1+b12) = 2s2 и автоковариациями g1 = -b1s2 = -s2 и gs = 0. Записывая модель в эквивалентном виде

yt = -yt-1 + yt-2 - yt-3 + yt-4 +...

убеждаемся, что ЧАКФ не затухают с увеличением лага s ® ∞.



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2016-04-15 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: