Декомпозиция временных рядов




ЛАБОРАТОРНАЯ РАБОТА 3

 

Цель работы: обучить разложению временных рядов на отдельные составляющие: трендовую, сезонную и нерегулярную.

 

1 Основные сведения

1.1 Метод сезонной декомпозиции: Census I

Основная идея сезонной декомпозиции проста. В общем случае временной ряд можно представить себе состоящим из четырех различных компонент:

1. Сезонного компонента (обозначается St, где t - момент времени).

2. Тренда Tt.

3. Циклической составляющей Ct.

4.Случайного нерегулярного компонента или флуктуации It.

Разница между циклической и сезонной составляющими состоит в том, что последняя имеет регулярную (сезонную) периодичность, тогда как циклические факторы обычно имеют более длительный эффект, который к тому же меняется от цикла к циклу. В методе Census I тренд и циклическую составляющую обычно объединяют в один тренд-циклический компонент TCt. Конкретные функциональные взаимосвязи между этими компонентами могут иметь самый разный вид. Однако можно выделить два основных способа, с помощью которых они могут взаимодействовать: аддитивно и мультипликативно.

Аддитивная модель

Xt = TCt+St+It

Мультипликативная модель

Xt = Tt*Ct*St*It

Здесь Xt обозначает значение временного ряда в момент времени t. Если имеются какие-то априорные сведения о циклических факторах, влияющих на ряд (например, циклы деловой конъюнктуры), то можно использовать оценки для различных компонент для составления прогноза будущих значений ряда.

В вычислительном отношении процедура метода Сезонной декомпозиции (Census I) модуля Временные ряды и прогнозирование следует стандартным приемам:

Скользящее среднее. Сначала вычисляется скользящее среднее для временного ряда; при этом ширина окна берется равной периоду сезонности. Если период сезонности - четное число, пользователь может выбрать одну из двух возможностей: брать скользящее среднее с одинаковыми весами или же с неравными весами таким образом, что первое и последнее наблюдения в окне имеют уменьшенные в два раза веса.

Отношения или разности. После взятия скользящих средних вся сезонная (т.е. внутри сезона) изменчивость будет исключена, и поэтому разность (в случае аддитивной модели) или отношение (для мультипликативной модели) между наблюдаемым и сглаженным рядом будет выделять сезонную составляющую (плюс нерегулярный компонент). Более точно, ряд скользящих средних вычитается из наблюдаемого ряда (в аддитивной модели) или же значения наблюдаемого ряда делятся на значения скользящих средних (в мультипликативной модели).

Сезонная составляющая. На следующем шаге вычисляется сезонная составляющая как среднее (для аддитивных моделей) или урезанное среднее (для мультипликативных моделей) всех значений ряда, соответствующих данной точке сезонного интервала.

Сезонная корректировка ряда. Исходный ряд можно скорректировать, вычитая из него (при аддитивной модели) или деля его значения (при мультипликативной модели) на величину сезонной составляющей. Получающийся в результате ряд называется сезонной корректировкой ряда (из ряда убрана сезонная составляющая).

Тренд-циклический компонент. Напомним, что циклический компонент отличается от сезонного тем, что продолжительность цикла, как правило, больше, чем один сезонный период, и разные циклы могут иметь разную продолжительность. Приближение для объединенного тренд-циклического компонента можно получить, применяя к ряду с сезонной поправкой процедуру 5-точечного (центрированного) взвешенного скользящего среднего с весами 1, 2, 3, 2, 1.

Случайный или нерегулярный компонент. На последнем шаге выделяется случайная или нерегулярная составляющая(погрешность) путем вычитания из ряда с сезонной поправкой (аддитивная модель) или делением этого ряда (мультипликативная модель) на тренд-циклический компонент.

 

1.2 Метод сезонной декомпозиции: Census II

 

 

Метод Census II является развитием и уточнением обычного метода корректировки. На протяжении многих лет различные варианты метода Census II развивались в Бюро Переписи США (US Census Bureau); один из вариантов этого метода, получивший широкую известность и наиболее часто применяемый в государственных органах и сфере бизнеса, называется "вариант X-11 метода Census II ". Впоследствии этот усовершенствованный вариант метода Census II стал называться просто X-11.

Вариант X-11 метода Census II представляет собой результат многочисленных специально разработанных приемов и усовершенствований, которые доказали свою работоспособность в многолетней практике решения реальных задач. (Некоторые из наиболее важных усовершенствований перечислены ниже).

Поправка на число рабочих дней. В месяцах разное число дней и разное число рабочих дней. Если мы анализируем, например, цифры ежемесячной выручки парка аттракционов, то разница в числе суббот и воскресений (пиковые дни) в разных месяцах существенным образом скажется на различиях в ежемесячных показателях дохода. Вариант X-11 метода Census II дает возможность пользователю проверить, присутствует ли во временном ряду этот эффект числа рабочих дней, и если да, то внести соответствующие поправки.

Выбросы. Большинство реальных временных рядов содержит выбросы, то есть резко выделяющиеся наблюдения, вызванные какими-то исключительными событиями. Такие выбросы могут исказить оценки сезонной компоненты и тренда. В процедуре X-11 предусмотрены корректировки на случай появления выбросов, основанные на использовании принципов статистического контроля: значения, выходящие за определенный диапазон (который определяется в терминах, кратных сигма, т.е. стандартных отклонений), могут быть преобразованы или вовсе пропущены, и только после этого будут вычисляться окончательные оценки параметров сезонности.

Последовательные уточнения. Корректировки, связанные с наличием выбросов и различным числом рабочих дней можно производить многократно, чтобы последовательно получать для компонентов оценки все лучшего качества. В методе X-11 делается несколько последовательных уточнений оценок для получения окончательных компонентов тренд-цикличности и сезонности, нерегулярной составляющей и самого временного ряда с сезонными поправками.

Критерии и итоговые статистики. Помимо оценки основных компонентов ряда в системе могут быть вычислены различные сводные статистики. Например, можно сформировать таблицы дисперсионного анализа для проверки значимости фактора сезонной изменчивости и ряда и фактора рабочих дней (см. выше). Процедура метода X-11 вычисляет также ежемесячные относительные изменения в случайной и тренд-циклической компонентах. С увеличением продолжительности временного промежутка, измеряемого в месяцах или в случае квартального варианта метода X-11 - в кварталах года изменения в тренд-циклической составляющей, вообще говоря, будут нарастать, в то время как изменения случайной составляющей должны оставаться примерно на одном уровне. Средняя длина временного интервала, на котором изменения тренд-циклической компоненты становятся примерно равными изменениям случайной компоненты, называется месяцем (кварталом) циклического доминирования, или сокращенно МЦД (соответственно КЦД). Например, если МЦД равно двум, то на сроках более двух месяцев тренд-циклический компонент станет доминировать над флуктуациями нерегулярного (случайного) компонента.

 

Вычисления, которые производятся в процедуре метода X-11, лучше всего обсуждать в контексте результирующих таблиц. Процедура корректировки разбивается на семь этапов, которые обычно обозначаются буквами A - G.

A. Априорная корректировка (помесячная сезонная корректировка). Перед тем, как к временному ряду, содержащему ежемесячные значения, будет применяться какая-либо сезонная корректировка, могут быть произведены различные корректировки, заданные пользователем. Можно ввести еще один временной ряд, содержащий априорные корректирующие факторы; значения этого ряда будут вычитаться из исходного ряда (аддитивная модель), или же значения исходного ряда будут поделены на значения корректирующего ряда (мультипликативная модель). В случае мультипликативной модели пользователь может также определить свои собственные поправочные коэффициенты (веса) на число рабочих дней. Эти веса будут использоваться для корректировки ежемесячных наблюдений, так чтобы учитывалось число рабочих дней в этом месяце.

B. Предварительное оценивание вариации числа рабочих дней (месячный вариант X-11) и весов. На следующем шаге вычисляются предварительные поправочные коэффициенты на число рабочих дней (только в месячном варианте X-11) и веса, позволяющие уменьшить эффект выбросов.

C. Окончательное оценивание вариации числа рабочих дней и нерегулярных весов (месячный вариант X-11). Поправки и веса, вычисленные в пункте B, используются для построения улучшенных оценок тренд-циклической и сезонной компонент. Эти улучшенные оценки используются для окончательного вычисления факторов числа рабочих дней (в месячном варианте X-11) и весов.

D. Окончательное оценивание сезонных факторов, тренд-циклической, нерегулярной и сезонно скорректированной компонент ряда. Окончательные значения факторов рабочих дней и весов, вычисленные в пункте C, используются для вычисления окончательных оценок для компонент ряда.

E. Модифицированные ряды: исходный, сезонно скорректированный и нерегулярный. Исходный и окончательный сезонно скорректированный ряды, а также нерегулярный компонент модифицируются путем сглаживания выбросов. Полученные в результате этого, модифицированные ряды позволяют пользователю проверить устойчивость сезонной корректировки.

F. Месяц (квартал) циклического доминирования (МЦД, КЦД), скользящее среднее и сводные показатели. На этом этапе вычислений рассчитываются различные сводные характеристики (см. далее), позволяющие пользователю исследовать относительную важность разных компонент, среднюю флуктуацию от месяца к месяцу (от квартала к кварталу), среднее число идущих подряд изменений в одну сторону и др.

G. Графики. В завершение анализа программа строит различные графики, в обобщенном виде представляющие результаты анализа. Например, будет выведен окончательный сезонно скорректированный ряд как функция времени.

 

2 Работа на компьютере

 

Выполнение работы производится с программным пакетом Statistica; версия 6.1.

2.1 Метод Census I

1. Открыть через меню Файл – Открыть файл данных Retail. Данные представляют собой помесячные результаты продаж на протяжении 12 лет, что дает временной ряд, состоящий из 144 точек.

2. Из меню Анализ – Углубленные методы анализа выбрать модуль Временные ряды и прогнозирование для отображения стартовой панели Анализ временных рядов. Для входа в диалог нажать кнопку Переменные. Выбрать переменную Sales (Продажи) и нажать ОК (рис.1).

 

 

Рис.1. Стартовая панель

 

Затем нажать кнопку Сезонная декомпозиция (Census I), после чего откроется диалоговое окно Классическая сезонная декомпозиция (метод Census I) (рис.2).

 

Рис.2. Диалоговое окно

 

3. Вначале изобразим полученный ряд на графике. Для использования данных, содержащихся в переменной Date, выбрать вкладку Прогноз, щелкнуть в поле метку Датами и выбрать переменную Date. Затем отметить параметр Задать масштаб оси X вручную и задать Мин=1 и Шаг = 12. Далее нажать кнопку График в окне Просмотр высвеченной переменной (рис.3).

 

 

Рис.3. Исходный ряд

Ряд показывает растущий тренд и явно выраженные сезонные составляющие. Цель сезонной декомпозиции - получение оценок сезонного, трендового и нерегулярного компонентов, которые вместе образуют ряд. Сезонная составляющая может быть использована для вычисления сезонно отрегулированного ряда, т.е. оценки ряда после устранения сезонной составляющей.

4. В нашем примере с данными розничных продаж можно предположить, что в период декабрьских каникул объем продаж каждый год возрастает примерно на одну и ту же величину. Для того чтобы оценить объем продаж в декабре, следует к усредненному показателю за данный год прибавить определенную величину. Таким образом, сезонные колебания носят аддитивный характер. Однако могло бы быть и так, что каждый год в декабре объем продаж возрастает в определенное число раз, определяемое некоторым множителем; например, продажи могут возрастать в 1,3 раза или на 30% против среднегодового показателя. В таком случае сезонные колебания носят мультипликативный характер.

Эти два типа сезонных колебаний по-разному "отражаются" на структуре ряда. Если сезонность аддитивная, колебания имеют примерно одинаковую амплитуду на всем протяжении ряда, независимо от его среднего уровня. Если же сезонность мультипликативная, то колебания имеют больший размах там, где значения ряда больше. В рассматриваемом примере представляется правдоподобным, что сезонность имеет мультипликативный характер; такое предположение более естественно и с точки зрения здравого смысла: вероятнее, что в декабре объем продаж будет увеличиваться на определенный процент, а не на а некоторую абсолютную величину. Итак, примем заданную по умолчанию установку Мультипликативная в окне Сезонная модель на вкладке Дополнительно.

5. В решении рассматриваемой задачи можно оценить всего 6 различных рядов, поэтому введем это значение в окно Число копий на переменную (ряд). Затем в окне Добавить в рабочую область отметить галочками все 6 позиций (рис.4).

 

Рис.4. Текущее окно анализа

 

Теперь все готово для проведения анализа данных. Нажать OK (Выполнить сезонную декомпозицию), в результате на экран будет выведена таблица результатов, содержащая все интересующие нас ряды.

Таблица 1. Результирующие данные

 

 

6. Далее нужно построить графики компонентов, которые были выделены. Вернемся в окно Классическая сезонная декомпозиция (метод Census I). Ряды будут добавлены в активную рабочую область. Высветить (щелкнув) ряд Сезонные составляющие в активной рабочей области, затем нажать кнопку График в окне Просмотр высвеченной переменной которое появляется при закладке Прогноз. В результате появляется график выделенного сезонного компонента (рис.5).

 

 

Рис.5. Сезонный компонент

 

Как видно из графика, имеется стабильная сезонная вариабельность, которая была выделена из исходного ряда. Этот сезонный компонент может быть использован для модификации (изменения) исходного ряда: его значения могут быть вычтены из исходного ряда (при аддитивной модели) или на его значения должны быть разделены те же величины (при мультипликативной модели).

Затем щелкнуть по кнопке График в окне Просмотр многих переменных для отображения окна диалога Select variables for the Spreadsheet/plot (Выбор переменных для таблицы / график). Выбрать два ряда: исходный и скорректированный, исключив при этом промежуточные ряды (необходимо использовать клавишу Ctrl) (рис.6).

Рис.6. Выбор переменных

Далее нажать кнопку OK. Как видно из графика рис.7, скорректированный ряд больше не показывает сезонных флуктуаций.

 

 

Рис.7. Исходный и скорректированный ряды

 

7.Затем можно сгладить этот ряд для того, чтобы устранить оставшиеся нерегулярные флуктуации. Сглаженный отрегулированный (без сезонности) ряд представляет собой тренд-циклический компонент, так как он показывает целиком тренд и цикл в данном ряде (цикл отличается от сезонности большим периодом). Построим графики двух рядов: ряд Тренд / Цикл и ряд, свободный от сезонности. Для этого нужно нажать кнопку Просмотр многих переменных и выбрать графики Скорректированный (сезонный) и Сглаженный тренд-цикл ( рис.8).

Рис.8. Выбор переменных

На рис.9 показаны графики тренд-циклической составляющей и ряда с сезонной поправкой.

 

Рис.9. Тренд-циклической ряд и ряд с сезонной поправкой.

 

8. Последним шагом анализа является оценка остатков ряда, которые могут быть показаны вместе с исходным и сезонно отрегулированным рядом. Нажать кнопку График двух списков в разных масштабах и выбрать исходный и сезонно скорректированный ряды для отображения на левой вертикальной оси, а нерегулярный (irregular) ряд- для отображения на правой вертикальной оси (рис.10).

 

 

Рис.10. Окно выбора рядов для построения графика

 

После нажатия ОК появится итоговый график с тремя рядами (рис.11).

 

 

Рис.11. Итоговый график

 

2.2 Метод Census II

1. Открыть через меню Файл – Открыть файл данных Retail. Данные представляют собой помесячные результаты продаж на протяжении 12 лет, что дает временной ряд, состоящий из 144 точек.

2. Из меню Анализ – Углубленные методы анализа выбрать модуль Временные ряды и прогнозирование для отображения стартовой панели Анализ временных рядов. Для входа в диалог нажать кнопку Переменные. Выбрать переменную Sales (Продажи) и нажать ОК.

3. Нажать кнопку X11 (Census 2) - месячный. Откроется диалоговое окно Месячная сезонная корректировка X11 (Метод Census II) (рис.12).

 

 

Рис.12. Диалоговое окно Месячная сезонная корректировка X11 (Метод Census II)

 

4. Изобразим ряд на графике. Нажать кнопку Другие преобразования и графики при выделенной закладке Дополнительно, в результате чего будет открыто окно диалога Преобразования переменных. На графиках будем использовать даты событий, хранящиеся в переменной Date, поэтому при закладке Графики щелкнуть по кнопке Датами в разделе Пометить точки и выбрать переменную Date. Затем выделить поле Задать масштаб оси X и задать Мин= 1 и Шаг=12. Нажать кнопку График, расположенную рядом с кнопкой Просмотр выдел. переменной, после чего на экран будет выведен график ряда (рис.13).

 

 

Рис.13. График ряда

 

График розничных продаж имеет возрастающий тренд и отчетливые сезонные колебания. Цель сезонной декомпозиции состоит в том, чтобы получить оценки для сезонной, тренд/циклической и нерегулярной составляющих ряда. Сезонный компонент используется для получения ряда с сезонной поправкой, т.е. для оценки ряда после того, как из него будут удалены сезонные колебания.

5. Два типа сезонных колебаний (аддитивная и мультипликативная модели) по-разному "отражаются" на структуре ряда. Если сезонность аддитивная, колебания имеют примерно одинаковую амплитуду на всем протяжении ряда, независимо от его среднего уровня. Если же сезонность мультипликативная, то колебания имеют больший размах там, где значения ряда больше. В рассматриваемом примере представляется, что сезонность имеет мультипликативный характер; такое предположение более естественно и с точки зрения здравого смысла: вероятнее, что в декабре объем продаж будет увеличиваться на определенный процент, а не на некоторую абсолютную величину. Итак, примем заданную по умолчанию установку Мультипликативная в разделе Сезонная модель. Вернемся теперь в это окно, нажав кнопку Отмена в окне Преобразования переменных.

6. После выполнения декомпозиции естественно было бы изобразить на графике все выделенные компоненты. Программа автоматически добавит сезонную составляющую, сезонную корректировку ряда, тренд/циклическую и регулярную компоненты в активную рабочую область. Сейчас (по умолчанию), значение параметра Число копий на переменную (ряд) установлено равным трем. У нас появятся четыре ряда, которые нужно будет добавить, поэтому сделаем Число копий на переменную (ряд), равным 4.

7. Начальная дата. Метод X-11 позволяет учитывать различное число рабочих дней в месяце. Например, если речь идет о доходах парка, то доход за месяц будет существенно зависеть от количества выходных дней в этом месяце. Поэтому метод X-11 требует задания начальной даты ряда (и тогда программа автоматически будет определять число рабочих дней в каждом месяце). Можно либо непосредственно ввести месяц и год первого наблюдения в разделе Даты (начало ряда), либо просто взять дату из первой строки файла. В данном примере выберем второй способ, для чего щелкнем на кнопку Переменная в окне Даты (начало ряда) и выберем переменную Date (рис.14).

Рис.14. Выбор переменной

 

8. Регрессия рабочих дней. Отклонения в данных, вызванные разным числом рабочих дней в месяцах, можно оценить (с помощью среднеквадратичной регрессии) по самим данным. В этом примере вычислим регрессию рабочих дней, но использовать ее для корректировки ряда будем только в том случае, если она окажется статистически значимой. Выделим на закладке Регрессия рабочих дней поле Вычислить и корректировать условно. Все остальные параметры в этом разделе можно принять по умолчанию (например, если не вводить никаких чисел в поля Начать оценивать с и корректировать с..., то они автоматически установятся на первое наблюдение ряда).

9. Просмотр таблиц результатов. Теперь все готово для анализа данных; нажмем кнопку OK (Сезонная корректировка). Реализация метода сезонной корректировки X-11 в модуле Временные Ряды следует методике, принятой Бюро Переписи США. Результаты выдаются в виде серии таблиц и графиков. При выделенной закладке Вывод указать стандартную комплектацию таблиц и графиков. Некоторые из них приведены ниже.

Рис.15. Графики сезонно отрегулированного и тренд-циклического рядов

 

Рис.16. Значения компонентов ряда по отдельным месяцам

 

10. Вернемся в окно диалога метода X-11. Видно, что окончательные варианты оценок компонентов ряда и окончательный вариант ряда с сезонной поправкой добавлены в активную рабочую область (рис.17).

 

Рис.17. Расширенная активная рабочая область

 

В заключение построим график, где будут изображены одновременно исходный ряд, ряд с сезонной поправкой (таблица D 11) и нерегулярная составляющая (таблица D 13). Щелкнуть по кнопке Другие преобразования и графики при закладке Дополнительно, после чего активизировать окно Другие преобразования и графики. Используя опцию График двух списков переменных в разных масштабах, выбрать в первом списке исходный ряд и ряд с сезонной поправкой (им будет соответствовать левая ось Y), а во втором списке ряд нерегулярный (рис.18).

 

Рис.18. Выбор переменных

На экран будет выведен итоговый график (рис.19).

 

Рис.19. Итоговый график

 

3. Задание

Применить метод Cencus –I для ряда Series G из пакета Statistica.

 

 

Вопросы к защите работы

1. Что такое декомпозиция ряда?

2. В чем различие между сезонной и циклической составляющими?

3. В чем отличие аддитивной модели от мультипликативной?

4. Что такое сезонная корректировка ряда?

5. К чему приводит выделение и устранение сезонного компонента?

6. Всегда ли возможна процедура декомпозиции?

7. В чем различие рассмотренных в работе двух методов декомпозиции?

8. Приводит ли наличие тренда к нестационарности временного ряда?

 



Поделиться:




Поиск по сайту

©2015-2025 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2017-11-19 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: