1.1. Ситуационная (практическая) задача № 1 Предполагается, что объем предложения Y некоторого блага для функционирующей в условиях конкуренции фирмы линейно зависит от цены этого блага X1 и заработной платы X2 сотрудников фирмы, производящих данное благо. Статистические данные за 18 месяцев собраны в следующую таблицу:
месяц | Y, тыс. ед. | X1, руб. | X2, тыс. руб. | месяц | Y, тыс. ед. | X1, руб. | X2, тыс. руб. |
Требуется:
1. Построить корреляционное поле между объемом предложения блага и его ценой. Выдвинуть гипотезу о тесноте и виде зависимости между указанными показателями.
2. Оценить тесноту линейной связи между объемом предложения блага и его ценой с надежностью 0,9.
3. Рассчитать коэффициенты линейного уравнения регрессии для зависимости объема предложения блага от его цены.
4. Проверить статистическую значимость параметров уравнения регрессии с надежностью 0,9 и построить для них доверительные интервалы.
5. Рассчитать коэффициент детерминации. С помощью F -критерия Фишера оценить статистическую значимость уравнения регрессии с надежностью 0,9.
6. Дать точечный и интервальный прогноз с надежностью 0,9 объема предложения, если цена блага составит 30 руб.
7. Рассчитать коэффициенты линейного уравнения множественной регрессии и пояснить экономический смысл его параметров.
Проанализировать статистическую значимость коэффициентов множественного уравнения с надежностью 0,9 и построить для них доверительные интервалы.
9. Найти коэффициенты парной и частной корреляции. Проанализировать их.
10. Найти скорректированный коэффициент множественной детерминации. Сравнить его с нескорректированным (общим) коэффициентом детерминации.
11. С помощью F -критерия Фишера оценить адекватность уравнения регрессии с надежностью 0,9.
12. Дать точечный и интервальный прогноз с надежностью 0,9 объема предложения блага для фирмы, если цена блага составит 30 руб., а заработная плата сотрудников фирмы равна 11 тыс. руб.
13. Проверить построенное уравнение на наличие мультиколлинеарности по: критерию Стьюдента; критерию χ2. Сравнить полученные результаты.
1.2. Решение:
1. Построить корреляционное поле между объемом предложения блага и его ценой. Выдвинуть гипотезу о тесноте и виде зависимости между указанными показателями.
На основе анализа поля рассеяния выдвигаем гипотезу о том, что зависимость между объемом предложения блага и его ценой описывается линейной регрессионной моделью .
2. Оценить тесноту линейной связи между объемом предложения блага и его ценой с надежностью 0,9.
Оценим тесноту линейной связи с помощью коэффициента корреляции. Его можно рассчитать по формуле:
Для расчета заполним таблицу:
i | yi | xi1 | xi1yi | ||
Итого |
Тогда:
Проверим значимость коэффициента корреляции на уровне значимости 0,1. Для этого рассчитаем значения выражения :
Находим критическое значение критерия Стьюдента по таблице критических точек:
tкр=t(1- ;n-2)=t(0,95;16)=1,746.
Т.к. условие tф > tкр выполняется, то коэффициент парной корреляции статистически значим, т.е. они существенно отличается от нуля. Таким образом, линейную связь между признаками можно считать установленной.
3. Рассчитать коэффициенты линейного уравнения регрессии для зависимости объема предложения блага от его цены.
Рассчитаем коэффициенты линейного уравнения регрессии методом наименьших квадратов. Для этого составляем систему нормальных уравнений и находим ее решение:
Решением этой системы являются числа: b 0=15,076, b 1=1,525.
Получили уравнение регрессии: .
4. Проверить статистическую значимость параметров уравнения регрессии с надежностью 0,9 и построить для них доверительные интервалы.
Для проверки значимости заполним расчетную таблицу:
i | Xi1 | Yi | ||||
30,329 | 4,671 | 21,816 | 954,123 | |||
37,956 | -2,956 | 8,737 | 670,235 | |||
45,582 | -7,582 | 57,493 | 436,346 | |||
53,209 | -4,209 | 17,715 | 252,457 | |||
76,089 | -16,089 | 258,843 | 0,790 | |||
71,513 | -2,513 | 6,314 | 15,123 | |||
80,665 | -5,665 | 32,087 | 4,457 | |||
68,462 | 4,538 | 20,593 | 34,679 | |||
73,038 | 1,962 | 3,849 | 8,346 | |||
98,968 | -4,968 | 24,684 | 199,123 | |||
91,342 | 1,658 | 2,750 | 83,012 | |||
68,462 | 6,538 | 42,745 | 34,679 | |||
76,089 | 8,911 | 79,413 | 0,790 | |||
98,968 | 6,032 | 36,382 | 199,123 | |||
83,715 | 16,285 | 265,196 | 16,901 | |||
114,221 | -6,221 | 38,706 | 581,346 | |||
106,595 | 3,405 | 11,595 | 365,235 | |||
118,797 | -3,797 | 14,420 | 735,012 | |||
Сумма | 943,336 | 4591,778 |
Рассчитаем стандартную ошибку регрессии s:
Рассчитаем фактические значения t -критерия для каждого коэффициента:
, Þ
, Þ
Критическое значение t -критерия Стьюдента равно t 0,95;16=1,746.
Проверяем значимость коэффициента . Выдвигаем гипотезы:
H0: =0
H1: ¹0
Сравнивая расчетное и критическое значения (3,031 > 1,746), делаем вывод, что коэффициент статистически значим, т.е. он не может быть равен нулю.
Проверяем значимость коэффициента . Выдвигаем гипотезы:
H0: =0
H1: ¹0
Сравнивая расчетное и критическое значения (13,461 > 1,746), делаем вывод, что коэффициент также статистически значим, т.е. он не может быть равен нулю.
Определим доверительные интервалы для коэффициентов и :
15,076±1,746×4,974
15,076±8,684
1,525±1,746×0,113
1,525±0,198
5. Рассчитать коэффициент детерминации. С помощью F -критерия Фишера оценить статистическую значимость уравнения регрессии с надежностью 0,9.
Рассчитаем коэффициент детерминации. В случае парной регрессии он равен квадрату коэффициента корреляции:
=0,9592=0,9189
Рассчитаем фактическое значение F-статистики Фишера по формуле:
.
При уровне значимости a=0,1 и количестве степеней свободы k1=1, k2=18-2=16 определяем, что критическое значение F-статистики Фишера будет равно Fкр(0,1;1;16)=3,048. Т.к. неравенство Fф > Fкр выполняется, поэтому гипотеза H0 отклоняется и признается статистическая значимость уравнения.
6. Дать точечный и интервальный прогноз с надежностью 0,9 объема предложения, если цена блага составит 30 руб.
Точечный прогноз при =30 руб.:
=15,076+1,525×30=60,836 тыс. ед.
Доверительные интервалы находятся по формуле
, где
y в, y н – верхняя и нижняя граница доверительного интервала
- значение независимой переменной x, для которой определяется доверительный интервал
- квантиль распределения Стьюдента с доверительной вероятностью 1-a и числом степеней свободы n -2. При a=0,1 t0,95;16=1,746.
Значение s y определяется по формуле: .
y н=60,836-1,746×2,19=57,011 тыс. ед.
y в=60,836+1,746×2,19=64,66 тыс. ед.
7. Рассчитать коэффициенты линейного уравнения множественной регрессии и пояснить экономический смысл его параметров.
Найдем по методу наименьших квадратов оценки коэффициентов линейной регрессионной модели . Оценки коэффициентов в этом случае можно найти по формуле:
A=(XT×X)-1×XT×Y
Для этого выполним следующие расчеты:
X= | Y= | ||||
XT= | ||||||||||||||||||
XT×X= | |||
1,190 | 0,004 | -0,098 | |
(XT×X)-1= | 0,004 | 0,000 | -1,691E-03 |
-0,098 | -1,691E-03 | 1,249E-02 |
XT×Y= | |
-9,386 | |
A=(XT×X)-1×XT×Y= | 1,103 |
3,115 |
8. Проанализировать статистическую значимость коэффициентов множественного уравнения с надежностью 0,9 и построить для них доверительные интервалы.
Заполним вспомогательную таблицу:
i | Y | X1 | X2 | |||
39,033 | 16,265 | 1801,531 | ||||
38,320 | 11,020 | 1801,531 | ||||
37,606 | 0,155 | 1555,864 | ||||
46,239 | 7,624 | 809,086 | ||||
62,791 | 7,788 | 304,309 | ||||
62,596 | 41,016 | 71,309 | ||||
75,447 | 0,200 | 5,975 | ||||
72,850 | 0,022 | 19,753 | ||||
73,045 | 3,821 | 5,975 | ||||
98,035 | 16,278 | 274,086 | ||||
92,517 | 0,233 | 241,975 | ||||
75,965 | 0,932 | 5,975 | ||||
84,598 | 0,161 | 57,086 | ||||
104,265 | 0,540 | 759,309 | ||||
93,231 | 45,822 | 508,753 | ||||
109,069 | 1,143 | 933,642 | ||||
109,783 | 0,047 | 1059,864 | ||||
118,610 | 13,034 | 1410,420 | ||||
Сумма | 166,103 | 11626,44 |
Рассчитаем стандартные ошибки коэффициентов регрессии по формуле:
, j=0,1,…,m,
где zjj - диагональные элементы обратной матрицы (XT×X)-1, которые равны соответственно 1,19, 0,00045, 0,0125.
,
,
,
По таблице критических точек определяем фактическое значение t -критерия Стьюдента:
tкр=t0,95;15=1,753.
Неравенство tФ > tкр выполняется для всех коэффициентов, поэтому все коэффициенты уравнения регрессии статистически значимы, т.е. они существенно отличны от нуля.
Построим доверительные интервалы для коэффициентов уравнения регрессии:
-9,386±1,753×3,624
-9,386±6,363
1,103±1,753×0,07
1,103±0,123
3,115±1,753×0,372
3,115±0,652
9. Найти коэффициенты парной и частной корреляции. Проанализировать их.
Найдем коэффициенты парной корреляции.
(был найден ранее)
Найдем коэффициенты частной корреляции. Частные коэффициенты корреляции в случае трех переменных находятся по формуле:
Тогда:
10. Найти скорректированный коэффициент множественной детерминации. Сравнить его с нескорректированным (общим) коэффициентом детерминации.
Рассчитаем скорректированный коэффициент множественной детерминации:
Скорректированный коэффициент множественной детерминации определяет тесноту связи с учетом степеней свободы общей и остаточной дисперсий. Он дает такую оценку тесноты связи, которая не зависит от числа факторов и поэтому может сравниваться по разным моделям с разным числом факторов. Оба коэффициента указывают на очень высокую (более 90%) детерминированность результата в модели факторами и .
11. С помощью F -критерия Фишера оценить адекватность уравнения регрессии с надежностью 0,9.
Найдем коэффициент множественной корреляции и детерминации:
R2=0,9932=0,9857, Þ регрессия y на x1 и x2 объясняет 98,57% колебаний значений y.
Рассчитаем фактическое значение F-статистики Фишера по формуле:
При уровне значимости a=0,1 и количестве степеней свободы k1=2, k2=18-3=15 определяем, что критическое значение F-статистики Фишера будет равно Fкр(0,1;2;15)=2,695. Неравенство Fф > Fкр выполняется, поэтому гипотеза H0 отклоняется и признается статистическая значимость уравнения регрессии.
12. Дать точечный и интервальный прогноз с надежностью 0,9 объема предложения блага для фирмы, если цена блага составит 30 руб., а заработная плата сотрудников фирмы равна 11 тыс. руб.
Выполним точечный и интервальный прогноз объема предложения блага.
=30 руб., =11 тыс. руб.
=-9,386+1,103×30+3,115×11=57,987 тыс. ед.
XР = | = | |||||
XР×(XT×X)-1= | 0,242 | -0,001 | -0,011 |
=0,092
=57,987±1,753×1,008=57,987±1,768
=56,219 тыс. ед., =59,754 тыс. ед.
13. Проверить построенное уравнение на наличие мультиколлинеарности по: критерию Стьюдента; критерию χ2. Сравнить полученные результаты.
Проверим наличие или отсутствие мультиколлинеарности для множественной регрессионной модели.
а) Если составить матрицу парных коэффициентов между объясняющими переменными, то получится следующая матрица:
Так как , то коэффициент корреляции между объясняющими переменными значимо отличается от 0. Таким образом, можно предположить, что в данном случае есть мультиколлинеарность.
б) Рассчитаем определитель матрицы r:
Рассчитываем фактическое значение статистики c2:
Табличное значение статистики c2 при k=1 и a=0,1 равно: . Неравенство не выполняется, поэтому окончательно делаем вывод о наличии мультиколлинеарности.
1.3. Ситуационная (практическая) задача № 2
Имеются поквартальные данные по товарообороту некоторой компании в 1999-2008 гг.
год | Товарооборот, млн. руб. | год | Товарооборот, млн. руб. |
100,0 | 95,7 | ||
93,9 | 98,2 | ||
96,5 | 104,0 | ||
101,8 | 99,0 | ||
107,8 | 98,8 |
Требуется:
1. Проверить гипотезу о наличии тренда во временном ряде.
2. Рассчитать коэффициенты автокорреляции. Проверить наличие сезонных колебаний во временном ряде.
3. Оценить параметры линейной трендовой модели, проверить статистическую значимость соответствующего уравнения регрессии с надежностью 0,99.
4. Дать точечный и интервальный прогноз товарооборота компании на 2011 год с надежностью 0,99.
1.4. Решение:
1. Проверить гипотезу о наличии тренда во временном ряде.
Для проверки гипотезы о наличии тренда воспользуемся критерием серий. Вычислим выборочную медиану исходных данных:
Ме (yt) = 98,9 млн. руб.
Вместо исходных элементов временного ряда Х(t) сформируем последовательность знаков: +, если yt > Me,
−, если yt < Me.
Полученные результаты для временного ряда оформим в виде таблицы:
год | yt | |
+ | ||
93,9 | - | |
96,5 | - | |
101,8 | + | |
107,8 | + | |
95,7 | - | |
98,2 | - | |
+ | ||
+ | ||
98,8 | - |
Вычислим характеристики данной последовательности: количество серий – ν, длину максимальной серии – τ: ν =6, τ = 2.
Проверим удовлетворяют ли эти значения неравенствам:
ν (10) > 0,5(10 + 2 - 1,65 ) = 3,53
τ (10) < 1,43ln(10 + 1) = 3,43
Поскольку оба неравенства выполняются, то гипотеза об отсутствии тренда не отвергается.
2. Рассчитать коэффициенты автокорреляции. Проверить наличие сезонных колебаний во временном ряде.
Оценим автокорреляцию, используя следующую формулу:
, где
В результате расчетов для от 1 до 4 получаем следующие значение автокорреляции:
-0,060 | |
-0,650 | |
0,027 | |
0,415 |
Значения коэффициентов автокорреляции позволяют сделать вывод об отсутствии сезонности.
3. Оценить параметры линейной трендовой модели, проверить статистическую значимость соответствующего уравнения регрессии с надежностью 0,99.
Найдем оценку уравнения линейного тренда методом наименьших квадратов. Составим расчетную таблицу:
год | t | yt | yt×t | t2 |
93,9 | 187,8 | |||
96,5 | 289,5 | |||
101,8 | 407,2 | |||
107,8 | ||||
95,7 | 574,2 | |||
98,2 | 687,4 | |||
98,8 | ||||
Итого | 995,7 | 5496,1 |
Тогда:
Решением этой системы являются числа: a0=98,253 и a1=0,239.
Следовательно, уравнение тренда будет иметь вид: .
Для проверки значимости уравнения рассчитаем фактическое значение F-критерия Фишера. Для этого заполним таблицу:
год | |||||
98,493 | 2,272 | 0,185 | 20,25 | ||
93,9 | 98,732 | 23,349 | 32,149 | 12,25 | |
96,5 | 98,972 | 6,108 | 9,425 | 6,25 | |
101,8 | 99,211 | 6,703 | 4,973 | 2,25 | |
107,8 | 99,450 | 69,717 | 67,733 | 0,25 | |
95,7 | 99,690 | 15,918 | 14,977 | 0,25 | |
98,2 | 99,929 | 2,990 | 1,877 | 2,25 | |
100,168 | 14,681 | 19,625 | 6,25 | ||
100,408 | 1,982 | 0,325 | 12,25 | ||
98,8 | 100,647 | 3,412 | 0,593 | 20,25 | |
Итого | 995,7 | 995,7 | 147,133 | 151,861 | 82,5 |
Тогда:
При уровне значимости a=0,01 и количестве степеней свободы k1=1, k2=10-2=8 определяем, что критическое значение F-статистики Фишера будет равно Fкр(0,01;1;8)=11,259. Неравенство Fф > Fкр не выполняется, поэтому уравнение тренда признается незначимым, т.е. могло сформироваться под воздействием случайных факторов.
4. Дать точечный и интервальный прогноз товарооборота компании на 2011 год с надежностью 0,99.
С помощью уравнения тренда рассчитаем точечный и интервальный прогноз товарооборота компании на 2011 год.
Точечный прогноз находим по уравнению тренда при t =13:
=98,253+0,239×13=101,365 млн. руб.
Интервальный прогноз:
=101,365±3,355×3,792=101,365±12,723
=88,642 млн. руб., =114,089 млн. руб.
Тестовые задания
1. С помощью какого метода можно найти оценки параметра уравнения линейной регрессии:
a) метода наименьших квадратов;
b) корреляционно-регрессионного анализа;
c) дисперсионного анализа;
d) метода серий.
Ответ: a).
2. Уравнение регрессии, описывающее зависимость удельных постоянных расходов от объема выпускаемой продукции имеет вид: y*=80+0,7x. Чему может быть равен линейный коэффициент парной корреляции?
a) -0,9;
b) 0,75;
c) 1,5;
d) -0,75.
Ответ: b).
3. Линейный коэффициент парной корреляции для величин X и Y равен 0,8. Чему равен коэффициент детерминации для линейного уравнения парной регрессии, построенного по этой выборке?
a) 0,64;
b) 0,894;
c) 0,2;
d) 0,4.
Ответ: a).
4. По 30 наблюдениям построено уравнение регрессии y*=3,7+1,048x1+0,532x2+0,19x3. Каким квантилем нужно воспользоваться при проверке статистической значимости коэффициентов частной корреляции для этого уравнения?
a) t0,975(25);
b) t0,95(28);
c) t0,975(28);
d) t0,95(27).
Ответ: a).
5. По формуле (XTX)-1XTY вычисляется
a) статистика c2 для проверки наличия мультиколлинеарности в модели регрессии;
b) вектор оценок коэффициентов для уравнения множественной регрессии;
c) критерий для проверки адекватности модели;
d) прогнозное значение исследуемого показателя.
Ответ: b).
6. С помощью какого критерия проверяют наличие автокорреляции остатков?
a) Дарбина-Уотсона;
b) Фишера;
c) Голдфельда-Кванта;
d) Стьюдента.
Ответ: a).
7. Следствием гетероскедастичности является
a) несостоятельность оценок параметров уравнения, полученных по МНК;
b) смещенность оценок параметров уравнения, полученных по МНК;
c) неприменимость статистических тестов;
d) ненадежность оценок параметров уравнения, полученных по МНК.
Ответ: d).
8. Какая из составляющих временного ряда описывает конъюнктурные факторы, формирующие изменения анализируемого признака, обусловленные воздействием долговременных циклов экономической, демографической или солнечной активности
a) тренд;
b) сезонная составляющая;
c) циклическая составляющая;
d) случайная составляющая.
Ответ: c).
9. Какая из представленных моделей временного ряда является моделью
тренда?
a) yt*=at+b+e;
b) yt*= a +a1t+a2cos(kt)+a3sin(kt)+ e;
с) y t*= ayt-1 +b+e;
d) yt*=a0+a1t+a2t2+b1d1+b2d2+e.
Ответ: a).
10. Для каких видов систем параметры отдельных эконометрических уравнений могут быть найдены с помощью обычного МНК?
a) система нормальных уравнений;
b) система независимых уравнений;
c) система рекурсивных уравнений;
d) система взаимозависимых уравнений.
Ответ: a).