Выполнил: студент гр. 22 ПС-204
Лемясов А.Р.
Проверил: Шатин И.А.
г. Челябинск
Содержание
Экономическое моделирование стоимости квартир в Челябинске. 3
1 Построим парную регрессию. 4
1.1 Оценим параметры уравнения с помощью метода наименьших квадратов. 5
1.2 Оценим адекватность построенной модели по критерию: 6
1.3 Определите значимость переменных: 9
1.4 Найдем среднюю ошибку аппроксимации: 9
1.5 линейные коэффициенты корреляции между всеми членами регрессии: 9
1.6 Проверим гипотезу о значимости уравнения с помощью критерия Фишера: 10
1.7 Проверим модель на отсутствие автокорреляции. 10
1.8 Проверка на гетероскедастичность моделей. 10
2 Построим линейную множественную регрессию. 11
2.1 Оценим параметры уравнения с помощью метода наименьших квадратов. 11
2.2 Оценим адекватность построенной модели по критерию: 12
2.3 Определите значимость переменных: 15
2.4 Найдем среднюю ошибку аппроксимации: 15
2.5 Вычислим коэффициент детерминации: 15
2.6 линейные коэффициенты корреляции между всеми членами регрессии: 15
2.7 Проверим гипотезу о значимости уравнения с помощью критерия Фишера: 16
2.8 Проверим модель на отсутствие автокорреляции. 16
2.9 Проверка на гетероскедастичность моделей. 17
Вывод: 17
Список используемой литературы.. 18
Экономическое моделирование стоимости квартир в Челябинске
y – цена квартиры, тыс. долл.;
х1 – жилая площадь квартиры, кв. м.;
х2 – этаж;
х3 – площадь кухни, кв. м.;
х4 – количество комнат.
Таблица 1- Исходные данные
№п/п | у | х1 | х2 | х3 | х4 |
51,4 | |||||
184,6 | |||||
17,9 | |||||
8,3 | |||||
16,5 | |||||
60,65 | 37,8 | 12,1 | |||
70,69 | 36,9 | 12,5 | |||
39,5 | |||||
78,9 | 16,9 | 13,6 | |||
123,5 | 67,5 | 12,3 | |||
55,2 | 15,3 | ||||
95,5 | 12,5 | ||||
57,6 | 31,5 | 11,4 | |||
64,5 | 34,8 | 10,6 | |||
6,5 | |||||
52,3 | |||||
27,8 | 6,3 | ||||
17,3 | 6,6 | ||||
123,5 | 44,5 | 9,7 | |||
55,2 | 19,1 | 6,5 |
Рассчитаем корреляцию между данными экономическими показателями
Строим эконометрическую модель, которая относится к классу факторных статических моделей:
y = f(x1, x2, х3, х4)
y – цена квартиры, тыс. долл. (зависимая переменная);
х1 – жилая площадь квартиры, кв. м.; х2 – этаж; х3 – площадь кухни, кв. м.; х4 – количество комнат (объясняющие переменные).
Чтобы убедиться в том, что выбор объясняющих переменных оправдан, оценим связь между признаками количественно, для этого заполним матрицу корреляций. Расчет выполним по формуле:
Вычислим матрицу корреляции с помощью пакета MS Excel.
Сервис - Анализ данных – Корреляция.
Таблица 2 - Матрица корреляций между исходными статистическими признаками
y | x1 | x2 | x3 | x4 | |
y | |||||
x1 | 0,746 | ||||
x2 | 0,087 | -0,025 | |||
х3 | 0,151 | 0,181 | 0,340 | ||
х4 | 0,507 | 0,730 | 0,115 | 0,149 |
Анализируя матрицу корреляций, можем сделать вывод о том, что связь между ценой квартиры и жилой площадью квартиры достаточно заметная, а между ценой квартиры и остальными факторами слабая.
Построим парную регрессию.
Так как наиболее сильная связь фактора y с фактором х4, то модифицируем модель к виду парной регрессии:
y = f(x1)
Для выбора функциональной формы модели проанализируем корреляционное поле.
Рис. 1 - Корреляционное поле
(x1 – жилая площадь квартиры, кв. м.;
y – цена квартиры, тыс. долл.)
Визуальный анализ показывает, что для построения модели вполне подойдет линейная функция:
y = α0 + α1x1 + ε
Оценим параметры уравнения с помощью метода наименьших квадратов.
Составим систему уравнений:
Найдем коэффициенты уравнения в программе Excel. Сервис – Анализ данных – Регрессия.
Таблица 3 - Результат регрессионного анализа
Таким образом, теоретическое уравнение множественной регрессии имеет вид:
Коэффициенты регрессии приведены в столбце “Коэффициенты” табл. 3.
1.2 Оценим адекватность построенной модели по критерию:
- случайности остаточной компоненты по критерию пиков.
Так как количество поворотных точек равно 22 (р = 22), то неравенство выполняется
p > 14; 22 > 14
Следовательно, свойство случайности выполняется.
- независимости уровней ряда остатков по d-критерию (d1 = 1,08, d2 = 1,36) или по первому коэффициенту корреляции, критический уровень которого равен r(1) = 0,36.
Так как
, то уровни ряда остатков независимы.
Воспользуемся критерием по первому коэффициенту автокорреляции:
то гипотеза об отсутствии автокорреляции в ряду остатков может быть принята, следовательно, свойство выполняется.
- Нормальности распределения относительной компоненты по R/S – критерию с критическими уровнями 2,7 – 4,8
Таблица 4 - Расчет адекватности модели
t | E(t) | E2(t) | E(t)-E(t-1) | [E(t)-E(t-1)]2 | E(t)*E(t-1) | |E(t)/Y(t)|*100 % |
3,01 | 9,08 | - | - | - | 2,62 | |
21,56 | 464,94 | 18,55 | 344,08 | 64,97 | 25,37 | |
12,12 | 146,81 | -9,45 | 89,22 | 261,26 | 17,56 | |
17,76 | 315,24 | 5,64 | 31,79 | 215,13 | 31,15 | |
-37,75 | 1424,94 | -55,50 | 3080,63 | -670,23 | 20,45 | |
-9,02 | 81,42 | 28,73 | 825,13 | 340,62 | 16,11 | |
6,72 | 45,14 | 15,74 | 247,82 | -60,63 | 7,90 | |
-86,34 | 7454,78 | -93,06 | 8660,17 | -580,12 | 32,58 | |
28,52 | 813,64 | 114,87 | 13194,07 | -2462,83 | 47,03 | |
-0,11 | 0,01 | -28,64 | 820,06 | -3,20 | 0,09 | |
5,43 | 29,48 | 5,54 | 30,71 | -0,61 | 11,80 | |
-21,16 | 447,77 | -26,59 | 707,04 | -114,90 | 18,40 | |
16,58 | 274,76 | 37,74 | 1424,04 | -350,76 | 23,45 | |
11,93 | 142,32 | -4,65 | 21,59 | 197,75 | 30,20 | |
-34,04 | 1158,98 | -45,97 | 2113,56 | -406,13 | 43,15 | |
16,88 | 284,78 | 50,92 | 2592,78 | -574,51 | 28,13 | |
32,01 | 1024,53 | 15,13 | 229,00 | 540,16 | 32,01 | |
34,36 | 1180,44 | 2,35 | 5,52 | 1099,72 | 67,37 | |
-3,79 | 14,34 | -38,14 | 1455,00 | -130,11 | 2,41 | |
28,65 | 820,98 | 32,44 | 1052,34 | -108,51 | 23,20 | |
-13,74 | 188,69 | -42,39 | 1796,86 | -393,59 | 24,89 | |
19,54 | 381,98 | 33,28 | 1107,62 | -268,47 | 20,47 | |
18,22 | 331,80 | -1,33 | 1,77 | 356,01 | 31,62 | |
18,31 | 335,36 | 0,10 | 0,01 | 333,58 | 28,39 | |
14,56 | 212,06 | -3,75 | 14,07 | 266,68 | 15,83 | |
19,92 | 396,86 | 5,36 | 28,72 | 290,10 | 19,92 | |
16,97 | 287,96 | -2,95 | 8,71 | 338,06 | 33,27 | |
-111,30 | 12386,71 | -128,27 | 16451,94 | -1888,63 | 70,89 | |
-20,12 | 404,75 | 91,18 | 8313,29 | 2239,09 | 16,29 | |
-5,68 | 32,25 | 14,44 | 208,50 | 114,25 | 10,29 | |
Итого | 0,00 | 31092,82 | 64856,05 | -1355,87 | 752,84 |
Так как расчетное значение попадает в интервал, следовательно, свойство нормальности распределения выполняется.
Так как выполняются все условия, то, следовательно, модель адекватна данному временному ряду.
1.3 Определите значимость переменных:
Значимость коэффициентов уравнения регрессии а0, а1, а2 оценим с использованием t-критерия Стьюдента.
- коэффициент свободного члена незначим
- коэффициент перед х1 значим
Расчетные значения t-критерия Стьюдента для коэффициентов уравнения регрессии, приведены в столбце “t-статистика” таблицы 3.
Табличное значение t-критерия при 5% уровне значимости и степенях свободы (30 – 1 – 1 = 28) составляет 2,368, если |tрасч| > tтабл, то коэффициент - существен (значим).
1.4 Найдем среднюю ошибку аппроксимации:
.
А = 752,84/30 = 25,09%
В среднем расчетные значения для линейной модели отличаются от фактических значений на 25,09%. Модель не достаточно точная.
д) Вычислим коэффициент детерминации:
R2 = 0,557
Вариация результата Y на 55,7% объясняется вариацией фактора X1.
1.5 линейные коэффициенты корреляции между всеми членами регрессии:
- линейный коэффициент корреляции между х1 и y
Связь между фактором y и х1 заметная, прямая.
1.6 Проверим гипотезу о значимости уравнения с помощью критерия Фишера:
Сравним Fфакт с Fтабл при уровне значимости α=0,05 и количестве степеней свободы k1 = m = 1, k2 = n - m – 1 = 30 – 1 – 1 = 28.
Fтабл(1; 28) = 4,196.
Так как Fфакт > Fтабл, то уравнение регрессии в целом значимо.