Задание к лабораторной работе




Методические указания

 

Теоретический материал к выполнению данной лабораторной работы рассмотрен на лекциях по курсу «Интеллектуальный анализ данных».

Рекомендуем в начале получить навыки идентификации и оценивания параметров моделей AR(р) в системе STATISTICA. С этой целью целесообразно решить следующую учебную задачу: для сгенерированного программно временного ряда, описывающего случайный процесс авторегрессии, идентифицировать с точностью до числа параметры авторегрессионных моделей AR(1) и AR(2), а также оценить качество построенных моделей.

Для этого следует придерживаться следующего порядка работ.

1. Построить на языке Basic в пакете STATISTICA траекторию процесса авторегрессии первого порядка AR(1) с некоторым параметром α (например, α = 0,8).

Для этого на языке STATISTICA Basic программируем временн о й ряд длиной 150 отсчётов, описывающий траекторию процесса авторегрессии первого порядка AR(1). Параметр α устанавливаем, например, равным 0,8. Полученный временн о й ряд сохраняем в файле Laba2_ar1_150.sta в подкаталоге Examples. Этот подкаталог расположить в каталоге, в котором установлена STATISTICA (например, D:\Stat). Также для исследования точности построения модели AR(1) необходимо сохранить первые 110 и 40 отсчётов временного ряда в отдельных файлах: Laba2_ar1_110.sta и Laba2_ar1_40.sta.

С этой целью с помощью пункта меню Analysis → STATISTICA Basic создаём новую программу, текст которой приведён ниже.

 

Dim src(150, 1);

src(1,1):= 0.2;

alpha:= 0.8;

for i:= 2 to 150 do

src(i,1):= alpha * src(i-1,1) + rnd(1) – 0.5;

MatrixSaveAsDataFile(src, 'D:\STAT\Examples\laba4_ar1_150_1.sta');

SetVarName('D:\STAT\Examples\laba4_ar1_150_1.sta', 1, 'VAR1');

 

Запускаем программу на выполнение кнопкой «Execute». Если всё правильно, то в директории D:\Stat\Examples будет создан необходимый нам файл с данными: Laba2_ar1_150_1.sta.

 

2. Для сгенерированного временного ряда построить с помощью STATISTICA модель AR(1) и оценить её параметры. Исследовать адекватность построенной модели.

Для этого в окне «Time Series Analysis» (см. рис. 1) с помощью кнопки «Open Data» загружаем данные из файла Laba2_ar1_150_1.sta. Нажимаем на кнопку Variables и в открывшемся диалоговом окне (см. рис. 2) выбираем переменную VAR1, в которой хранятся значения временного ряда, сгенерированного на предыдущем шаге.

 

 

Рис. 1. Стартовое окно анализа временных рядов в STATISTICA 5.5.

 

Рис. 2. Окно выбора анализируемой переменной.

 

После выбора переменной приступаем к идентификации модели процесса по его траектории. Для этого с помощью кнопки «ARIMA & autocorrelation functions» заходим в диалоговое окно, приведённое на рис. 3. Здесь расположена необходимая для последующего анализа группа элементов под общим заголовком Autocorrelations. Как известно, процесс идентифицируется как процесс AR(1) при выполнении двух условий: корреляционная функция экспоненциально затухает, а частная автокорреляционная функция имеет выброс на лаге 1 (т.е. нет корреляций для других задержек). Необходимо проверить это.

 

 

Рис. 3. Окно идентификации моделей ARIMA

 

Нажимая на кнопку «Plot», можно увидеть график исходного временного ряда (рис. 4).

Нажимая на кнопку «Autocorrelations», можно увидеть вид и значения автокорреляционной функции, вычисленной по траектории исходного временн о го ряда. Как видно из рис. 5, эта функция экспоненциально затухает.

Нажимая на кнопку «Partial autocorrs», также можно увидеть вид и значения частной автокорреляционной функции. Как видно из рис. 6, частная автокорреляционная функция имеет положительный выброс на лаге 1, равный 0,842. Все остальные значения не значимы. Следовательно, условия соответствия процесса, описываемого исходным временн ы м рядом модели AR(1), выполняются.

 

 

 

Рис. 4. График исходного временного ряда

 

 

Рис. 5. Автокорреляционная функция

 

 

Рис. 6. Частная автокорреляционная функция

Определим параметр модели AR(1) и исследуем адекватность полученной модели.

Зададим значение поля «p – Autoregressive», равное 1, поскольку была выбрана модель AR(1). Нажмём на кнопку «OK (Begin parameter estimation)» (см. рис. 3). После этого увидим окно, в котором отображён ход итеративного процесса подбора параметра модели AR(1). В результате последней итерации будет вычислено итоговое значение параметра модели, которое составило 0,835408 (см. рис. 7).

 

 

Рис. 7. Окно оценивания параметра модели AR(1)

 

Нажимая на клавишу «OK» этого окна, увидим окончательный результат моделирования (рис. 8).

 

 

Рис. 8. Окно результатов моделирования исходного временного ряда по модели AR(1).

 

3. Аналогичные действия выполнить для процесса AR(2).

 

Далее рекомендуем аналогичным образом получить навыки идентификации и оценивания параметров моделей MA(p) в системе STATISTICA. С этой целью целесообразно решить вторую учебную задачу: для сгенерированного программно временного ряда, описывающего случайный процесс скользящего среднего, идентифицировать с точностью до числа параметры моделей скользящего среднего MA(1) и MA(2), а также оценить качество построенных моделей.

Для этого следует придерживаться следующего порядка работ.

 

4. Построить на языке Basic в пакете STATISTICA траекторию процесса скользящего среднего первого порядка MA(1) с некоторым параметром β (например, β = 0,8).

Для этого на языке STATISTICA BASIC программируем временн о й ряд длиной 150 отсчётов, описывающий траекторию процесса авторегрессии первого порядка MA(1). Параметр β устанавливаем, например, равным 0,8. Полученный временн о й ряд сохраняем в файле Laba2.sta в подкаталоге Examples каталога, в котором установлена Statistica (например, D:\Stat).

С этой целью мы с помощью пункта меню Analysis → STATISTICA BASIC создаём новую программу, текст которой приведён ниже.

 

Dim src(150, 1);

Dim last_e, cur_e;

IniAll;

last_e:= normal(1);

src(1,1):= last_e;

betta:= -0.8;

for i:= 2 to 150 do

begin

cur_e:= normal(1);

src(i,1):= cur_e - betta * last_e;

last_e:= cur_e;

end;

MatrixSaveAsDataFile(src, 'D:\STAT\Examples\laba5_150.sta');

SetVarName('D:\STAT\Examples\laba5_150.sta', 1, 'VAR1');

 

Запускаем программу на выполнение кнопкой «Execute». Если всё правильно, то в директории D:\Stat\Examples будет создан необходимый нам файл с данными: Laba2_150.sta.

 

5. Для сгенерированного временного ряда построить с помощью STATISTICA модель MA(1) и оценить её параметры. Исследовать адекватность построенной модели.

Для этого в окне «Time Series Analysis» (см. рис. 9) с помощью кнопки «Open Data» загружаем данные из файла Laba2_150.sta. Нажимаем на кнопку Variables и в открывшемся диалоговом окне (см. рис. 10) выбираем переменную VAR1, в которой хранятся значения временн о го ряда, сгенерированного на предыдущем шаге (собственно, переменная там одна, поэтому выбирать в данном случае не из чего).

Рис. 9. Стартовое окно анализа временных рядов в STATISTICA 5.5.

 

Рис. 10. Окно выбора анализируемой переменной.

 

После выбора переменной приступаем к идентификации модели процесса по его траектории. Для этого с помощью кнопки «ARIMA & autocorrelation functions» заходим в диалоговое окно, приведённое на рис. 11.

Как известно, процесс идентифицируется как процесс MA(1) при выполнении двух условий: корреляционная функция имеет резко выделяющееся значение на лаге 1 (отрицательное – при положительном β, положительное – при отрицательном β), а частная автокорреляционная функция похожа на затухающую экспоненту, причём в случае отрицательного параметра β она колеблется относительно 0. Проверим это.

Рис. 11. Окно идентификации моделей ARIMA

 

Нажимая на кнопку «Plot», мы можем увидеть график нашего временного ряда (рис. 12).

Нажимая на кнопку «Autocorrelations», мы можем увидеть вид и значения автокорреляционной функции, вычисленной по траектории нашего временного ряда. Как видно из рис. 13, эта функция имеет положительный выброс на лаге 1

Нажимая на кнопку «Partial autocorrs», мы можем увидеть вид и значения частной автокорреляционной функции. Как видно из рис. 14, частная автокорреляционная функция колеблется около 0, экспоненциально затухая. Следовательно, условия соответствия процесса, описываемого нашим временн ы м рядом, модели MA(1) выполняются, и этот процесс является процессом скользящего среднего MA(1) с отрицательным параметром.

 

Рис. 12. График исходного временного ряда

 

Рис. 13. Автокорреляционная функция

 

Рис. 14. Частная автокорреляционная функция

Далее определим параметр модели MA(1) и исследуем адекватность полученной модели.

Зададим значение поля «q – Moving aver.», равное 1, поскольку мы выбрали модель MA(1). Нажмём на кнопку «OK (Begin parameter estimation)» (см. рис. 11). Мы увидим окно, в котором отображён ход итеративного процесса подбора параметра модели MA(1). В результате последней итерации будет вычислено итоговое значение параметра модели, которое составило 0,835408 (см. рис. 15).

 

Рис. 15. Окно оценивания параметра модели MA(1)

Нажимая на клавишу «OK» этого окна, увидим окончательный результат моделирования (рис. 16). Значение вычисленного параметр модели составляет –0,781, что почти равняется значению параметра, заданному при генерации временн о го ряда (–0,8).

 

Рис. 16. Окно результатов моделирования исходного временного ряда по модели MA(1).

 

Проверим адекватность построенной модели. Для этого вычислим остатки. Визуализация остатков происходит по нажатию на кнопку «Review residuals» (рис. 17).

Если полученные остатки ведут себя как белый шум, то наша модель адекватно описывает процесс. Глядя на график автокорреляционной функции остатков (рис. 18), который визуализируется по нажатию на кнопку «Autocorrelations» в окне на рис. 8, мы можем убедиться в справедливости нашего предположения.

Рис. 17. Вычисленные остатки.

Рис. 18. Автокорреляционная функция остатков.

 

6. Аналогичные действия выполнить для процесса MA(2).

 

Задание к лабораторной работе

 

1. В заданном временном ряде выделить тренд, сезонную и случайную составляющие. В качестве тренда выбрать лучший из не менее чем из трёх вариантов.

2. При выделении сезонных индексов выбрать лучшую из аддитивной и мультипликативно-аддитивной моделей.

3. Проанализировать случайную составляющую. Идентифицировать и оценить параметры модели ARIMA в пакете STATISTICA. Выбрать наиболее адекватную модель, используя материал методических указаний.

4. Осуществить прогнозирование процесса на один сезон с помощью пакета STATISTICA.

 

 

Содержание отчета

 

1. График исходного временного ряда.

2. Определение лучшего тренда и его график.

3. Определение лучшей сезонной модели и график сезонных индексов.

4. График случайной составляющей и порядок выбора наиболее адекватной модели ARIMA(p,d,q). Вычисление параметров модели случайной составляющей.

5. График прогноза временного ряда.

 



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2016-04-27 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: