ФІКТИВНІ ЗМІННІ В РЕГРЕСІЙНИХ МОДЕЛЯХ

В регрессионных моделях в качестве объясняющих переменных часто приходится использовать не только количественные (определяемые численно), но и качественные переменные. Это могут быть разного рода признаки: профессия, пол, климатические условия, и др. Чтобы ввести такие переменные в регрессионную модель, им должна быть присвоена некоторая цифровая метка, т.е. качественные переменные должны быть преобразованы в количественные. Такого вида сконструированные переменные в эконометрике принято называть фиктивными, структурными или искусственными.

Например, при опросе группы людей, «1» может означать, что опрашиваемый – мужчина, «0» – женщина. К фиктивным переменным иногда относят регрессор, состоящий из одних единиц (т.е. константу, свободный член), а также временной тренд.

Если надо изучить зависимость размера заработной платы работников не только от количественных факторов , но и от качественного признака , например, пола работника, то можно поступить двумя способами, рассмотреть две регрессионные модели по женщинам и мужчинам отдельно

а затем изучить различие между ними.

Но в основном используют другой подход, позволяющий оценивать влияние значений количественных переменных и уровней качественных признаков с помощью одного уравнения регрессии. В этом случае первоначальная регрессионная модель заработной платы изменится и примет вид

где

Фиктивные переменные позволяют строить и оценивать кусочно-линейные модели, которые можно применять для исследования структурных изменений.

Пусть, например, исследуется зависимость выпуска продукции от размера основного фонда предприятия . При этом есть основания считать, что в момент времени произошла структурная перестройка, и характер зависимости изменился.

Чтобы оценить такую ситуацию, введем бинарную переменную

Наша модель запишется в виде . При линия регрессии имеет наклон , при наклон равен и разрыва в точке не происходит. При приходим к выводу, что в момент структурного изменения не происходит.

Видыфиктивныхпеременных. В регрессионных моделях с временными рядами используют три основных вида фиктивных переменных.

1. Переменные – индикаторы принадлежности наблюдения к определенному периоду. Их используют для моделирования скачкообразных структурных сдвигов. Постоянный структурный сдвиг моделируется переменной, равной 0 до определенного момента времени и 1 для всех наблюдений после этого момента времени, например, .

2. Сезонные переменные – для моделирования сезонности. Например, модель потребления, учитывающая сезонные колебания:

где

Следует отметить, что вводить четвертую переменную для осенних месяцев не требуется, так как в этом случае все переменные оказались бы связанными тождеством , что привело бы их к полной коллинеарности и вырожденности информационной матрицы данных .

Объем потребления составит:

	для осенних месяцев;
	для зимних месяцев;
	для весенних месяцев;
	для летних месяцев.

При этом, если в результате регрессионного анализа окажется, что , то это значит, что между летними и осенними сезонами различие в потреблении несущественно. Если , то отсутствует различие между потреблением зимой, весной и т.д.

3. Линейный временной трендиспользуется для моделирования плавных постепенных структурных сдвигов. Эта фиктивная переменная показывает, какой промежуток времени прошел от некоторого «нулевого» момента времени до того момента времени, к которому относится данное наблюдение (координаты данного наблюдения на временной шкале). Если промежутки времени между последовательными наблюдениями одинаковы, то временной тренд можно составить из номеров наблюдений. Временной тренд отличается от бинарных фиктивных переменных тем, что имеется возможность использовать его степени: , и т. д. Они помогают моделировать гладкий, но нелинейный тренд.

Возможна комбинация фиктивных переменных различных видов. Она позволяет моделировать изменение наклона тренда с определенного момента. В этом случае помимо тренда в регрессию вводится переменная, которая в начале выборки до некоторого момента времени равна 0, а далее представляет собой временной тренд (1, 2, 3, … в случае одинаковых интервалов между наблюдениями).

Замечание. Если в регрессионной модели учитываются факторы с бóльшим, чем две, числом градаций, то необходимо ввести в модель бинарных переменных. При этом следует увеличить объем выборки так как надежность статистических выводов существенно зависит от отношения объёма выборки к общему числу всех параметров регрессионной модели: чем больше величина отношения , тем надежнее статистические выводы.

Преимуществаиспользованияфиктивныхпеременных следующие:

· интервалы между наблюдениями не обязательно должны быть одинаковыми. В выборке могут быть пропущены наблюдения;

· коэффициенты при фиктивных переменных легко интерпретировать, они наглядно представляют структуру динамического процесса;

· для оценивания модели не приходится выходить за рамки классического метода наименьших квадратов.

Рассмотрим использование фиктивных переменных на конкретных примерах.

Пример 1. Построить регрессионную модель зависимости заработной платы работника от возраста с использованием фиктивной переменной по фактору «пол» по 20 работникам одного предприятия. Данные приведены в таблице 1.

Таблица 1

№ п/п				№ п/п

Решение: Введем в модель фиктивную переменную , которая принимает два значения: «1» – если пол мужской; «0» – если пол женский.

Оценим параметры модели методом наименьших квадратов. Уравнение множественной регрессии имеет вид

Коэффициент детерминации равен . Уравнение регрессии значимо по критерию Фишера при 5%-ом уровне значимости, так как .

Из полученного уравнения регрессии следует, что при одинаковом возрасте заработная плата у работников-мужчин на 178,290 грн. выше, чем у женщин.

Из модели с фиктивной переменной можно получить частные уравнения для мужчин при и для женщин при :

;

Если изобразить полученные модели на графике, то увидим, что графики частных регрессий параллельны и график уравнения «Регрессия для мужчин» находится выше графика частного уравнения «Регрессия для женщин», что отражает вышеописанную закономерность.

Пример 2. Пусть необходимо построить эконометрическую модель, которая характеризует зависимость прибыли от продаж безалкогольных напитков (млн. грн.) от доходов населения (млн. грн.), используя квартальные данные за пять лет. На потребление безалкогольных напитков влияют природноклиматические условия, то есть весенне-летние и осенне-зимние периоды, а поэтому необходимо для построения модели использовать фиктивные переменные.

Исходные данные приведены в таблице 2.

Таблица2

Год	квартал
	I
II
III
IV
	I
II
III
IV
	I
II
III
IV
	I
II
III
IV
	I
II
III
IV

Решение: Эмпирическое уравнение регрессии имеет вид:

где – прибыль от продажи безалкогольных напитков,

– доходы населения,

При решении указанной задачи можно построить разные эконометрические модели:

· модель на основе всей информации, объединяя данные за пять лет по всем кварталам;

· четыре простых модели на основании данных одного квартала за пять лет;

· модель потребления безалкогольных напитков с фиктивными переменными, которые отображают потребление в зависимости от тёплых и холодных кварталов года;

· модель, которая отображала бы влияние фиктивных переменных непосредственно на параметры при переменных регрессионной модели.

Первые две задачи решаются стандартным МНК. Четвёртая решается по аналогии с третьей. Поэтому рассмотрим решение только третьей задачи.

Так как надо учесть четыре качественных переменных, то необходимо ввести три фиктивные переменные, которые обозначим в соответствии с часто используемыми обозначениями , , . Матрица фиктивных переменных содержит три вектора, каждый из которых отображает отличие информации II–IV кварталов от первого.

Построенная модель будет следующей

Она представляет собой общее уравнение регрессии. Частные уравнения регрессий по кварталам можно получить, если подставлять вместо значений соответствующих фиктивных переменных ноль и единицу.

ФІКТИВНІ ЗМІННІ В РЕГРЕСІЙНИХ МОДЕЛЯХ

Поиск по сайту