Все множество наблюдений yt, t = 1, 2, 3,..., T разбивают на две выборки:
· обучающую с объемом наблюдений T1 (y1, y2,..., yT1);
· экзаменационную (yT1+1,..., yT1+T2) c объемом наблюдений Т2.
Вычисляются числовые характеристики временного ряда на обучающей выборке: среднее, дисперсия, автоковариации и автокорреляционные функции (АКФ):
; ;
, где k = 1, 2,..., Т1/4;
ρk = , k = 1, 2,..., T1/4.
3.Организуются циклы по переменным p - числу параметров авторегрессии и q - числу параметров скользящего среднего. p= 1, 2,..., pmax; q = 1, 2,..., qmax.
4.Для каждой пары (p, q) вычисляются оценки параметров авторегрессии = (Ф1, Ф2,..., Фр) как решения системы р линейных уравнений
,
где А-матрица с элементами Аij = γ |q+i-j|, а вектор = (х1, х2,...,хр) с координатами хi = gq+i; i,j = 1, 2,..., p.
5.По известным автоковариациям gk вычисляется модифицированная последовательность ковариаций gj1:
6.Вычисляем начальные значения ; t10 = t20 =... = tq0 = 0, то есть формируется начальный вектор = (t00,t10 , t20,...,tq0).
7. Далее используется алгоритм Ньютона-Рафсона вида:
, = (t0i,t1i , t2i,...,tqi),
где является решением системы , причем
= (f0i,f1i , f2i,...,fqi),
fji = , а
,
и начальный вектор определен в пункте 6.
8. Если |fji| < E для j = 0, 1,..., q, для некоторого выбираемого заранее малого e, то итерационный процесс завершается.
9. Оценки bi параметров скользящего среднего находятся по формулам
bj = -tj/t0, j = 0, 1,..., q,
где = (t0, t1 , t2,...,tq) получен в результате применения процедуры Ньютона - Рафсона (п.п. 7-8)
10. Вычисляется свободный член модели по формуле
а0 =
11. Вычисляется оценка дисперсии белого шума
.
12. Вычисляем остаточные ошибки модели на обучающей выборке. Пусть s = max{p, q}, тогда остаточные ошибки a1об, a2об,..., aТ1об на обучающей выборке (y1, y2,...,yT1) имеют вид:
a1об = a2об = a3об =... = asоб;
|
akоб = ykоб - а0 - ; k = s+1,..., T1.
13. Найдем остаточные ошибки модели на проверочной последовательности. Полагаем
a0пр = a1об; a-1пр = aТ1-1об;..., a-sпр = aТ1-sоб;
и далее
akпр = ykпр - а0 - ; k = s+1,..., T2.
14. Вычисляем на экзаменационной (проверочной) последовательности среднюю сумму квадратов ошибок
.
15. Оформляется конец циклов на p и q.
16. Выбирается пара pопт и qопт, для которой spq2 принимает минимальное значение
(pопт , qопт) = Argmin spq2
17. Далее производится оценка коэффициентов авторегрессии и скользящего среднего для модели выбранной оптимальной сложности с p = pопт, q = qопт, повторяя описанный в пунктах 1-14 алгоритм для всей выборки Т и получая окончательные значения коэффициентов а0, Ф1,..., Фp, b0,..., bq.
Экономичность модели. Кроме использования «внешнего» критерия при построении модели, можно использовать принцип «экономичности». Включение дополнительных переменных в модель увеличивает адекватность модели (на обучающей выборке), так как средняя ошибка модели убывает. Часто можно заменить одну модель другой - более экономичной. Как, например СС()-модель
yt = et + 0,5et-1 + 0,25et-2 + 0,125et-3 + 0,0625et-4 +...
эквивалентна модели
yt = 0,5yt-1 + et,
что легко проверяется.
Для того, чтобы сделать модель более экономичной считают, что коэффициенты авторегрессии и скользящего среднего должны иметь t-статистики больше или равны 2 (чтобы каждый коэффициент значимо отличался от нуля при 5% уровне значимости). Кроме того, надо проверять, чтобы коэффициенты не были сильно коррелированны друг с другом. Сильная корреляция коэффициентов делает модель неустойчивой. В этом случае следует исключить те коэффициенты, которые в наименьшей степени ухудшают результаты прогноза.
|
Кроме того, важно, чтобы остатки оцениваемой модели были сериально некоррелированные. Наличие сериальной корреляции остатков сигнализирует о систематических изменениях в {yt} - последовательности, которые не могут быть учтены АРСС-моделью.
Для проверки корреляции остатков строятся АКФ И ЧАКФ для остатков оцениваемой модели. Можно далее использовать Q-статистики (10.49)-(10.50) Бокса-Пирса и Льюиса-Бокса. С их помощью можно определить будут ли автокорреляции остатков или частные автокорреляции статистически значимы. Обычно можно предполагать наличие сериальной корреляции остатков при превышении критического уровня Q- статистикой при 10% уровне значимости. В этом случае велика вероятность построения другой модели, лучше отражающей специфику процесса.
Стационарность и обратимость. Из результатов теории вероятности известно, что выборочные АКФ и ЧАКФ аппроксимируют АКФ и ЧАКФ реального временного ряда в том случае, если предполагать стационарность ряда yt. Далее, t-статистики и Q-статистики также предполагают стационарность ряда yt.
Если искомый ряд yt не стационарный, то первым шагом в подходе Бокса-Дженкинса является взятие первой, второй и следующих разностей временного ряда
, ,...
и так далее, до тех пор, пока в результате не получится стационарный временной ряд. Этот подход обладает серьезным недостатком, так как не позволяет включать в модель долговременные составляющие. О современных подходах к построению модели временных рядов в условиях нестационарности пойдет речь в последующих главах книги.
|
Подход Бокса-Дженкинса требует также обратимости модели. Это означает, что модель может быть представлена в виде конечного или бесконечного, но сходящегося авторегрессионого процесса. Это необходимо для АКФ и ЧАКФ. Например, рассмотрим СС(1)-модель
yt = et - b1et-1.
Если |b1| < 1, то
et = yt/(1-b1L)
или, разлагая в ряд правую часть равенства, получаем
yt + b1yt-1 + b12yt + b13yt +... = et.
Полученная модель представляет собой сходящуюся авторегрессионную модель бесконечного порядка, для которой могут быть посчитаны АКФ и ЧАКФ. Однако, если b1| ³ 1, то {yt} - последовательность не может быть представлена сходящейся авторегрессией. В общем случае для АРСС (p, q)-модели корни многочлена 1 + b1L + b2L2 +... + bqLq должны лежать вне единичного круга. Тогда модель обратима.
Заметим, что могут существовать и необратимые модели с долгосрочной “памятью”, которые нельзя построить по методу Бокса-Дженкинса. Например, модель стационарного процесса
yt = et - et-1
с постоянным средним Myt = Myt-s = 0 и дисперсией Dyt = Dyt-s = s2(1+b12) = 2s2 и автоковариациями g1 = -b1s2 = -s2 и gs = 0. Записывая модель в эквивалентном виде
yt = -yt-1 + yt-2 - yt-3 + yt-4 +...
убеждаемся, что ЧАКФ не затухают с увеличением лага s ® ∞.