Содержание
Ситуационная (практическая) задача № 1. 3
Ситуационная (практическая) задача № 2. 14
Тестовые задания. 18
Список литературы.. 20
Ситуационная (практическая) задача № 1
Предполагается, что объем предложения Y некоторого блага для функционирующей в условиях конкуренции фирмы линейно зависит от цены этого блага X1 и заработной платы X2 сотрудников фирмы, производящих данное благо. Статистические данные за 20 месяцев собраны в следующую таблицу:
месяц | У тыс.ед | Х1 руб | Х2 тыс.руб |
18,9 | |||
24,68 | 15,6 | 8,2 | |
21,4 | 10,4 | ||
25,78 | 16,6 | 6,9 | |
22,94 | 16,8 | 9,3 | |
26,76 | 18,2 | 7,3 | |
23,64 | 18,8 | 12,3 | |
28,98 | 20,6 | 13,4 | |
26,66 | 22,2 | 15,7 | |
30,16 | 23,2 | 13,2 | |
26,12 | 23,4 | 17,7 | |
31,9 | 12,3 | ||
29,68 | 25,6 | 16,6 | |
33,08 | 27,6 | 16,4 | |
30,9 | |||
36,84 | 30,8 | 13,8 | |
32,5 | 17,9 | ||
35,7 | 14,9 | ||
34,72 | 33,4 | 19,8 | |
39,52 | 33,4 |
Требуется:
1. Построить корреляционное поле между объемом предложения блага и его ценой. Выдвинуть гипотезу о тесноте и виде зависимости между указанными показателями.
2. Оценить тесноту линейной связи между объемом предложения блага и его ценой с надежностью 0,95.
3. Рассчитать коэффициенты линейного уравнения регрессии для зависимости объема предложения блага от его цены.
4. Проверить статистическую значимость параметров уравнения регрессии с надежностью 0,95 и построить для них доверительные интервалы.
5. Рассчитать коэффициент детерминации. С помощью F -критерия Фишера оценить статистическую значимость уравнения регрессии с надежностью 0,95.
6. Дать точечный и интервальный прогноз с надежностью 0,95 объема предложения, если цена блага составит 20 руб.
7. Рассчитать коэффициенты линейного уравнения множественной регрессии и пояснить экономический смысл его параметров.
8.Проанализировать статистическую значимость коэффициентов множественного уравнения с надежностью 0,95 и построить для них доверительные интервалы.
9. Найти коэффициенты парной и частной корреляции. Проанализировать их.
10. Найти скорректированный коэффициент множественной детерминации. Сравнить его с нескорректированным (общим) коэффициентом детерминации.
11. С помощью F -критерия Фишера оценить адекватность уравнения регрессии с надежностью 0,95.
12. Дать точечный и интервальный прогноз с надежностью 0,95 объема предложения блага для фирмы, если цена блага составит 20 руб., а заработная плата сотрудников фирмы равна 10 тыс. руб.
13. Проверить построенное уравнение на наличие мультиколлинеарности по: критерию Стьюдента; критерию χ2. Сравнить полученные результаты.
Решение:
1. Построить корреляционное поле между объемом предложения блага и его ценой. Выдвинуть гипотезу о тесноте и виде зависимости между указанными показателями.
На основе анализа поля рассеяния выдвигаем гипотезу о том, что зависимость между объемом предложения блага и его ценой описывается линейной регрессионной моделью .
2. Оценить тесноту линейной связи между объемом предложения блага и его ценой с надежностью 0,95.
Оценим тесноту линейной связи с помощью коэффициента корреляции. Его можно рассчитать по формуле:
Для расчета заполним таблицу:
i | yi | xi1 | xi1yi | ||
18,9 | 357,21 | 264,6 | |||
24,68 | 15,6 | 243,36 | 609,1024 | 385,008 | |
21,4 | 457,96 | 342,4 | |||
25,78 | 16,6 | 275,56 | 664,6084 | 427,948 | |
22,94 | 16,8 | 282,24 | 526,2436 | 385,392 | |
26,76 | 18,2 | 331,24 | 716,0976 | 487,032 | |
23,64 | 18,8 | 353,44 | 558,8496 | 444,432 | |
28,98 | 20,6 | 424,36 | 839,8404 | 596,988 | |
26,66 | 22,2 | 492,84 | 710,7556 | 591,852 | |
30,16 | 23,2 | 538,24 | 909,6256 | 699,712 | |
26,12 | 23,4 | 547,56 | 682,2544 | 611,208 | |
31,9 | 1017,61 | 797,5 | |||
29,68 | 25,6 | 655,36 | 880,9024 | 759,808 | |
33,08 | 27,6 | 761,76 | 1094,286 | 913,008 | |
30,9 | 954,81 | 896,1 | |||
36,84 | 30,8 | 948,64 | 1357,186 | 1134,672 | |
32,5 | 1056,25 | 1007,5 | |||
35,7 | 1274,49 | 1142,4 | |||
34,72 | 33,4 | 1115,56 | 1205,478 | 1159,648 | |
39,52 | 33,4 | 1115,56 | 1561,83 | 1319,968 | |
Итого | 580,86 | 473,2 | 11988,72 | 17435,39 | 14367,18 |
Тогда:
Проверим значимость коэффициента корреляции на уровне значимости 0,05. Для этого рассчитаем значения выражения :
Находим критическое значение критерия Стьюдента по таблице критических точек:
tкр=t(1- ;n-2)=t(0,975;18)=2,101.
Т.к. условие tф > tкр выполняется, то коэффициент парной корреляции статистически значим, т.е. они существенно отличается от нуля. Таким образом, линейную связь между признаками можно считать установленной.
3. Рассчитать коэффициенты линейного уравнения регрессии для зависимости объема предложения блага от его цены.
Рассчитаем коэффициенты линейного уравнения регрессии методом наименьших квадратов. Для этого составляем систему нормальных уравнений и находим ее решение:
Решением этой системы являются числа: b 0=10,42, b 1=0,787.
Получили уравнение регрессии: .
4. Проверить статистическую значимость параметров уравнения регрессии с надежностью 0,95 и построить для них доверительные интервалы.
Для проверки значимости заполним расчетную таблицу:
i | Xi1 | Yi | ||||
18,9 | 21,440 | -2,540 | 6,449 | 93,316 | ||
15,6 | 24,68 | 22,699 | 1,981 | 3,925 | 64,964 | |
21,4 | 23,014 | -1,614 | 2,604 | 58,676 | ||
16,6 | 25,78 | 23,486 | 2,294 | 5,262 | 49,844 | |
16,8 | 22,94 | 23,643 | -0,703 | 0,495 | 47,060 | |
18,2 | 26,76 | 24,745 | 2,015 | 4,059 | 29,812 | |
18,8 | 23,64 | 25,218 | -1,578 | 2,489 | 23,620 | |
20,6 | 28,98 | 26,634 | 2,346 | 5,502 | 9,364 | |
22,2 | 26,66 | 27,894 | -1,234 | 1,522 | 2,132 | |
23,2 | 30,16 | 28,681 | 1,479 | 2,188 | 0,212 | |
23,4 | 26,12 | 28,838 | -2,718 | 7,389 | 0,068 | |
31,9 | 30,098 | 1,802 | 3,248 | 1,796 | ||
25,6 | 29,68 | 30,570 | -0,890 | 0,792 | 3,764 | |
27,6 | 33,08 | 32,144 | 0,936 | 0,876 | 15,524 | |
30,9 | 33,246 | -2,346 | 5,505 | 28,516 | ||
30,8 | 36,84 | 34,663 | 2,177 | 4,739 | 50,980 | |
32,5 | 34,820 | -2,320 | 5,384 | 53,876 | ||
35,7 | 35,608 | 0,092 | 0,009 | 69,556 | ||
33,4 | 34,72 | 36,709 | -1,989 | 3,958 | 94,868 | |
33,4 | 39,52 | 36,709 | 2,811 | 7,899 | 94,868 | |
Сумма | 473,2 | 580,86 | 580,86 | 74,294 | 792,808 |
Рассчитаем стандартную ошибку регрессии s:
Рассчитаем фактические значения t -критерия для каждого коэффициента:
, Þ
, Þ
Критическое значение t -критерия Стьюдента равно t 0,975;18=2,101.
Проверяем значимость коэффициента . Выдвигаем гипотезы:
H0: =0
H1: ¹0
Сравнивая расчетное и критическое значения (5,898 > 2,101), делаем вывод, что коэффициент статистически значим, т.е. он не может быть равен нулю.
Проверяем значимость коэффициента . Выдвигаем гипотезы:
H0: =0
H1: ¹0
Сравнивая расчетное и критическое значения (10,909 > 2,101), делаем вывод, что коэффициент также статистически значим, т.е. он не может быть равен нулю.
Определим доверительные интервалы для коэффициентов и :
10,42±2,101×1,767
10,42±3,711
0,787±2,101×0,072
0,787±0,152
5. Рассчитать коэффициент детерминации. С помощью F -критерия Фишера оценить статистическую значимость уравнения регрессии с надежностью 0,95.
Рассчитаем коэффициент детерминации. В случае парной регрессии он равен квадрату коэффициента корреляции:
=0,9322=0,8686
Рассчитаем фактическое значение F-статистики Фишера по формуле:
.
При уровне значимости a=0,05 и количестве степеней свободы k1=1, k2=20-2=18 определяем, что критическое значение F-статистики Фишера будет равно Fкр(0,05;1;18)=4,414. Т.к. неравенство Fф > Fкр выполняется, поэтому гипотеза H0 отклоняется и признается статистическая значимость уравнения.
6. Дать точечный и интервальный прогноз с надежностью 0,95 объема предложения, если цена блага составит 20 руб.
Точечный прогноз при =20 руб.:
=10,42+0,787×20=26,163 тыс. ед.
Доверительные интервалы находятся по формуле
, где
y в, y н – верхняя и нижняя граница доверительного интервала
- значение независимой переменной x, для которой определяется доверительный интервал
- квантиль распределения Стьюдента с доверительной вероятностью 1-a и числом степеней свободы n -2. При a=0,05 t0,975;18=2,101.
Значение s y определяется по формуле: .
y н=26,163-2,101×0,525=25,058 тыс. ед.
y в=26,163+2,101×0,525=27,266 тыс. ед.
7. Рассчитать коэффициенты линейного уравнения множественной регрессии и пояснить экономический смысл его параметров.
Найдем по методу наименьших квадратов оценки коэффициентов линейной регрессионной модели . Оценки коэффициентов в этом случае можно найти по формуле:
A=(XT×X)-1×XT×Y
Для этого выполним следующие расчеты:
18,9 | |||||
15,6 | 8,2 | 24,68 | |||
10,4 | 21,4 | ||||
16,6 | 6,9 | 25,78 | |||
16,8 | 9,3 | 22,94 | |||
18,2 | 7,3 | 26,76 | |||
18,8 | 12,3 | 23,64 | |||
20,6 | 13,4 | 28,98 | |||
22,2 | 15,7 | 26,66 | |||
X= | 23,2 | 13,2 | Y= | 30,16 | |
23,4 | 17,7 | 26,12 | |||
12,3 | 31,9 | ||||
25,6 | 16,6 | 29,68 | |||
27,6 | 16,4 | 33,08 | |||
30,9 | |||||
30,8 | 13,8 | 36,84 | |||
17,9 | 32,5 | ||||
14,9 | 35,7 | ||||
33,4 | 19,8 | 34,72 | |||
33,4 | 39,52 |
XT= | 15,6 | 16,6 | 16,8 | 18,2 | 18,8 | 20,6 | 22,2 | 23,2 | 23,4 | 25,6 | 27,6 | 30,8 | 33,4 | 33,4 | ||||||
8,2 | 10,4 | 6,9 | 9,3 | 7,3 | 12,3 | 13,4 | 15,7 | 13,2 | 17,7 | 12,3 | 16,6 | 16,4 | 13,8 | 17,9 | 14,9 | 19,8 |
473,2 | 276,1 | ||
XT×X= | 473,2 | 11988,72 | 6926,56 |
276,1 | 6926,56 | 4116,37 |
0,794 | -0,021 | -0,019 | |
(XT×X)-1= | -0,021 | 0,004 | -4,561E-03 |
-0,019 | -4,561E-03 | 9,177E-03 |
580,86 | |
XT×Y= | 14367,176 |
8262,868 | |
11,660 | |
A=(XT×X)-1×XT×Y= | 1,088 |
-0,606 |
8.Проанализировать статистическую значимость коэффициентов множественного уравнения с надежностью 0,95 и построить для них доверительные интервалы.
Заполним вспомогательную таблицу:
i | Y | X1 | X2 | |||
18,9 | 19,623 | 0,523 | 102,880 | |||
24,68 | 15,6 | 8,2 | 23,668 | 1,024 | 19,036 | |
21,4 | 10,4 | 22,770 | 1,877 | 58,415 | ||
25,78 | 16,6 | 6,9 | 25,545 | 0,055 | 10,647 | |
22,94 | 16,8 | 9,3 | 24,307 | 1,870 | 37,247 | |
26,76 | 18,2 | 7,3 | 27,044 | 0,080 | 5,212 | |
23,64 | 18,8 | 12,3 | 24,666 | 1,052 | 29,192 | |
28,98 | 20,6 | 13,4 | 25,958 | 9,132 | 0,004 | |
26,66 | 22,2 | 15,7 | 26,305 | 0,126 | 5,679 | |
30,16 | 23,2 | 13,2 | 28,909 | 1,565 | 1,248 | |
26,12 | 23,4 | 17,7 | 26,399 | 0,078 | 8,544 | |
31,9 | 12,3 | 31,414 | 0,236 | 8,162 | ||
29,68 | 25,6 | 16,6 | 29,460 | 0,048 | 0,406 | |
33,08 | 27,6 | 16,4 | 31,758 | 1,747 | 16,297 | |
30,9 | 31,100 | 0,040 | 3,448 | |||
36,84 | 30,8 | 13,8 | 36,817 | 0,001 | 60,793 | |
32,5 | 17,9 | 34,549 | 4,200 | 11,951 | ||
35,7 | 14,9 | 37,456 | 3,085 | 44,316 | ||
34,72 | 33,4 | 19,8 | 36,010 | 1,664 | 32,228 | |
39,52 | 33,4 | 37,101 | 5,852 | 109,768 | ||
Сумма | 34,255 | 565,4738 |
Рассчитаем стандартные ошибки коэффициентов регрессии по формуле:
, j=0,1,…,m,
где zjj - диагональные элементы обратной матрицы (XT×X)-1, которые равны соответственно 0,794, 0,00353, 9,177×10-3.
,
,
,
По таблице критических точек определяем фактическое значение t -критерия Стьюдента:
tкр=t0,975;17=2,11.
Неравенство tФ > tкр выполняется для всех коэффициентов, поэтому все коэффициенты уравнения регрессии статистически значимы, т.е. они существенно отличны от нуля.
Построим доверительные интервалы для коэффициентов уравнения регрессии:
11,66±2,11×1,265
11,66±2,67
1,088±2,11×0,0843
1,088±0,91
-0,606±2,11×0,136
-0,606±0,287
9. Найти коэффициенты парной и частной корреляции. Проанализировать их.
Найдем коэффициенты парной корреляции.
(был найден ранее)
Найдем коэффициенты частной корреляции. Частные коэффициенты корреляции в случае трех переменных находятся по формуле:
Тогда:
10. Найти скорректированный коэффициент множественной детерминации. Сравнить его с нескорректированным (общим) коэффициентом детерминации.
Рассчитаем скорректированный коэффициент множественной детерминации:
Скорректированный коэффициент множественной детерминации определяет тесноту связи с учетом степеней свободы общей и остаточной дисперсий. Он дает такую оценку тесноты связи, которая не зависит от числа факторов и поэтому может сравниваться по разным моделям с разным числом факторов. Оба коэффициента указывают на очень высокую (более 90%) детерминированность результата в модели факторами и .
11. С помощью F -критерия Фишера оценить адекватность уравнения регрессии с надежностью 0,95.
Найдем коэффициент множественной корреляции и детерминации:
R2=0,9692=0,939, Þ регрессия y на x1 и x2 объясняет 93,9% колебаний значений y.
Рассчитаем фактическое значение F-статистики Фишера по формуле:
При уровне значимости a=0,05 и количестве степеней свободы k1=2, k2=20-3=17 определяем, что критическое значение F-статистики Фишера будет равно Fкр(0,05;2;17)=3,592. Неравенство Fф > Fкр выполняется, поэтому гипотеза H0 отклоняется и признается статистическая значимость уравнения регрессии.
12. Дать точечный и интервальный прогноз с надежностью 0,95 объема предложения блага для фирмы, если цена блага составит 20 руб., а заработная плата сотрудников фирмы равна 10 тыс. руб.
Выполним точечный и интервальный прогноз объема предложения блага.
=20 руб., =10 тыс. руб.
=11,66+1,088×20-0,606×10=27,366 тыс. ед.
XР= | = | |||||
XР×(XT×X)-1= | 0,197 | 0,004 | -0,018 |
=0,103
=27,366±2,11×0,456=27,366±0,962
=26,404 тыс. ед., =28,328 тыс. ед.
13. Проверить построенное уравнение на наличие мультиколлинеарности по: критерию Стьюдента; критерию χ2. Сравнить полученные результаты.
Проверим наличие или отсутствие мультиколлинеарности для множественной регрессионной модели.
а) Если составить матрицу парных коэффициентов между объясняющими переменными, то получится следующая матрица:
Так как , то коэффициент корреляции между объясняющими переменными значимо отличается от 0. Таким образом, можно предположить, что в данном случае есть мультиколлинеарность.
б) Рассчитаем определитель матрицы r:
Рассчитываем фактическое значение статистики c2:
Табличное значение статистики c2 при k=1 и a=0,05 равно: . Неравенство не выполняется, поэтому окончательно делаем вывод о наличии мультиколлинеарности.
Ситуационная (практическая) задача № 2
Имеются поквартальные данные по товарообороту некоторой компании в 1997-2010 гг.
год | Товарооборот млн.руб |
Требуется: 1. Проверить гипотезу о наличии тренда во временном ряде. 2. Рассчитать коэффициенты автокорреляции. Проверить наличие сезонных колебаний во временном ряде. 3. Оценить параметры линейной трендовой модели, проверить статистическую значимость соответствующего уравнения регрессии с надежностью 0,99. 4. Дать точечный и интервальный прогноз товарооборота компании компании на 2012 год с надежностью 0,99.
Решение:
1. Проверить гипотезу о наличии тренда во временном ряде.
Для проверки гипотезы о наличии тренда воспользуемся критерием серий. Вычислим выборочную медиану исходных данных:
Ме (yt) = 87 млн. руб.
Вместо исходных элементов временного ряда Х(t) сформируем последовательность знаков: +, если yt > Me,
−, если yt < Me.
Полученные результаты для временного ряда оформим в виде таблицы:
год | yt | |
- | ||
- | ||
- | ||
+ | ||
- | ||
- | ||
+ | ||
- | ||
+ | ||
- | ||
+ | ||
+ | ||
+ | ||
+ |
Вычислим характеристики данной последовательности: количество серий – ν, длину максимальной серии – τ: ν =8, τ = 4.
Проверим удовлетворяют ли эти значения неравенствам:
ν (14) > 0,5(14 + 2 - 1,65 ) = 5,03
τ (14) < 1,43ln(14 + 1) = 3,87
Поскольку второе неравенство не выполняется, то гипотеза об отсутствии тренда отвергается.
2. Рассчитать коэффициенты автокорреляции. Проверить наличие сезонных колебаний во временном ряде.
Оценим автокорреляцию, используя следующую формулу:
, где
В результате расчетов для от 1 до 4 получаем следующие значение автокорреляции:
0,37 | |
0,316 | |
0,04 | |
0,336 |
Значения коэффициентов автокорреляции позволяют сделать вывод об отсутствии сезонности.
3. Оценить параметры линейной трендовой модели, проверить статистическую значимость соответствующего уравнения регрессии с надежностью 0,99.
Найдем оценку уравнения линейного тренда методом наименьших квадратов. Составим расчетную таблицу:
год | t | yt | yt×t | t2 |
Итого |
Тогда:
Решением этой системы являются числа: a0=78,242 и a1=1,073.
Следовательно, уравнение тренда будет иметь вид: .
Для проверки значимости уравнения рассчитаем фактическое значение F-критерия Фишера. Для этого заполним таблицу:
год | |||||
79,314 | 10,984 | 105,796 | 42,25 | ||
80,387 | 13,055 | 5,224 | 30,25 | ||
81,459 | 2,374 | 10,796 | 20,25 | ||
82,532 | 29,900 | 2,939 | 12,25 | ||
83,604 | 21,200 | 53,082 | 6,25 | ||
84,677 | 44,581 | 68,653 | 2,25 | ||
85,749 | 5,065 | 2,939 | 0,25 | ||
86,822 | 0,676 | 0,082 | 0,25 | ||
87,895 | 26,066 | 45,082 | 2,25 | ||
88,967 | 15,737 | 1,653 | 6,25 | ||
90,040 | 0,002 | 13,796 | 12,25 | ||
91,112 | 0,013 | 22,224 | 20,25 | ||
92,185 | 7,926 | 75,939 | 30,25 | ||
93,257 | 1,580 | 32,653 | 42,25 | ||
Итого | 179,160 | 440,857 | 227,5 |
Тогда:
При уровне значимости a=0,01 и количестве степеней свободы k1=1, k2=14-2=12 определяем, что критическое значение F-статистики Фишера будет равно Fкр(0,01;1;12)=9,33. Неравенство Fф > Fкр выполняется, поэтому уравнение тренда статистически значимо и адекватно описывает исходные данные.
4. Дать точечный и интервальный прогноз товарооборота компании на 2012 год с надежностью 0,99.
С помощью уравнения тренда рассчитаем точечный и интервальный прогноз товарооборота компании на 2012 год.
Точечный прогноз находим по уравнению тренда при t =16:
=78,242+1,073×16=95,402 млн. руб.
Интервальный прогноз:
=95,402±3,055×2,447=95,402±7,473
=87,929 млн. руб., =102,875 млн. руб.
Тестовые задания
Необходимо из предложенных вариантов ответа на вопрос теста выбрать единственно верный, по Вашему мнению.
1. По характеру различают связи:
а) функциональные и корреляционные;
б) функциональные, криволинейные и прямолинейные;
в) корреляционные и обратные;
г) статистические и прямые.
Ответ: a).
2. Коэффициент детерминации R2 для уравнения у* = 20х-3 равен 0,75. Это означает, что (выберите неверное утверждение):
a) модель объясняет имеющиеся данные на 75%;
b) доля объясненной части вариации переменной Y вокруг своего среднего составляет 0,75;
c) доля объясненной части вариации переменной Y вокруг своего среднего составляет 0,25;
d) доля необъясненной части вариации переменной Y вокруг своего среднего составляет 0,25.
Ответ: c).
3. При расчете коэффициента детерминации получен коэффициент наклона линии регрессии, равный -0,5. Это означает, что:
a) при увеличении независимой переменной на 1 ед. измерения, следует ожидать уменьшения зависимой переменной на 0,5 ед. измерения;
b) при увеличении независимой переменной на 1 ед. измерения, следует ожидать уменьшения зависимой переменной на 50%;
c) при увеличении независимой переменной на 1 ед. измерения, зависимая переменная уменьшится на 0,5 ед. измерения;
d) данное значение никак не интерпретируется.
Ответ: a).
4. Следствием мультиколлинеарности является
а) невозможность получить оценки параметров уравнения регрессии;
b) несостоятельность полученных оценок параметров уравнения регрессии;
c) смещенность оценок параметров уравнения регрессии;
d) увеличение стандартных ошибок параметров уравнения регрессии.
Ответ: c).
5. Модель множественной регрессии - это модель...
a) описывающая влияние множества факторов на исследуемый показатель;
b) построенная по множеству признаков;
с) для которой исследуемый показатель в каждой ситуации принимает множество значений;
d) имеющая множество интерпретаций.
Ответ: a).
6. Вывод о наличии гетероскедастичности делают, если
a) > ;
b) Fнабл > Fтаб;
c) < ;
d) Fнабл < Fтаб.
Ответ: b).
7. Если статистика Дарбина-Уотсона равна 4, это говорит
a) об отсутствии автокорреляции остатков;
b) о наличии положительной автокорреляции остатков;