Пример 3. По данным за 16 лет с 2000 по 2015 гг. (приложение В) выявить наиболее существенные показатели, влияющие на численность населения Оренбургской области, построить прогнозную многофакторную модель и осуществить прогноз до 2020 года. Сформирована база, включающая следующие показатели:
Х1 – среднемесячная заработная плата работников организаций, руб.;
Х2 – соотношение средней заработной платы работников организаций с прожиточным минимумом;
Х3 -численность студентов, обучающихся по программам бакалавриата, специалитета, магистратуры, на 10 000 человек населения;
Х4 – численность обучающихся в общеобразовательных организациях (без вечерних (сменных) общеобразовательных организаций), тыс.человек;
Х5 - численность воспитанников, приходящихся на 100 мест в дошкольных образовательных организациях, человек;
Х6- Численность врачей всех специальностей всего на 10 000 человек населения;
Х7 - Численность среднего медицинcкого персонала всего на 10 000 человек населения;
Х8 - число больничных коек всего на 10 000 человек населения;
Х9– заболеваемость населения по основным классам заболеваний на 1000 человек населения;
Х10– число зарегистрированных преступлений, всего.
Для выбора факторов, максимально оказывающих влияние на численность населения Оренбургской области, построена корреляционная матрица, представленная в приложении Г.
Чтобы получить корреляционную матрицу необходимо из меню MSExcel выбрать «Данные» - «Анализ данных» - «Корреляция», ввести запрашиваемый диапазон данных, как представлено на рисунке 2.
По результатам, представленным в корреляционной матрице, для дальнейшего анализа устранены из рассмотрения факторы с коэффициентом корреляции меньше 0,5 с показателем Y - численность населения. Затем устранены факторы, в которых наблюдается мультиколлинеарность.
Рисунок 2 – Рабочее окно расчета корреляционной матрицы заданного массива данных
В результате для дальнейшего анализ получим данные, представленные в таблице 2.
Таблица 2– Исходные данные для расчета многофакторной линейной модели
t (годы) | Yt | Х3 | Х4 | Х8 |
2211,2 | 343,8 | 127,1 | ||
2203,6 | 330,2 | 126,5 | ||
2179,5 | 312,5 | 128,2 | ||
291,5 | 127,3 | |||
2149,9 | 270,8 | 129,5 | ||
2122,4 | 253,5 | 127,2 | ||
2093,5 | 239,1 | |||
2067,9 | 227,1 | |||
2055,7 | 218,8 | 125,4 | ||
2044,3 | 105,4 | |||
2033,1 | 208,8 | 103,1 | ||
2031,5 | 206,5 | 101,8 | ||
2023,7 | 205,9 | 103,4 | ||
2016,1 | 205,8 | 92,5 | ||
2008,5 | 208,6 | 89,5 | ||
2001,1 | 212,5 | 86,5 |
В таблице 3 представлена корреляционная матрица, полученная по данным таблицы 2.
Таблица 3 – Корреляционная матрица данных таблицы 2
Столбец 1 | Столбец 2 | Столбец 3 | Столбец 4 | |
Столбец 1 | ||||
Столбец 2 | -0,5161 | |||
Столбец 3 | 0,970995 | -0,65573 | ||
Столбец 4 | 0,825148 | -0,20643 | 0,698943 |
По результатам, представленным в корреляционной матрице можно наблюдать отрицательную зависимость между численностью населения и численность студентов, обучающихся по программам бакалавриата, специалитета, магистратуры, что, возможно объяснить тем, что, обучающиеся в вузах откладывают на более поздний период рождение детей.
Следующий этап – построение многофакторной регрессионной модели. Для ее построения используется функция «Анализ данных» - «Регрессия». После ввода необходимых данных получены результаты, представленные на рисунке 3.
ВЫВОД ИТОГОВ | ||||||||
Регрессионная статистика | ||||||||
Множест-венный R | 0,995 | |||||||
R-квадрат | 0,990 | |||||||
Нормиро-ванный R-квадрат | 0,988 | |||||||
Стандарт-ная ошибка | 8,268 | |||||||
Наблюде-ния | ||||||||
Дисперсионный анализ | ||||||||
df | SS | MS | F | Значи-мость F | ||||
Регрессия | 81615,75 | 27205,2 | 397,99 | 2,83E-12 | ||||
Остаток | 820,2772 | 68,36 | ||||||
Коэффи-циенты | Стан-дартная ошибка | t-статис-тика | P-Значение | Нижние 95% | Верхние 95% | Нижние 95,0% | Верх-ние 95,0% | |
Y-пересечение | 1571,85 | 32,13 | 48,92 | 3,49E-15 | 1501,8 | 1641,8 | 1501,84 | 1641,9 |
Перемен-ная X 1 | 0,1746 | 0,069 | 2,52 | 0,02687 | 0,023 | 0,326 | 0,024 | 0,325 |
Перемен-ная X 2 | 1,3576 | 0,091 | 14,9 | 4,17E-09 | 1,159 | 1,556 | 1,159 | 1,556 |
Перемен-ная X 3 | 1,0829 | 0,212 | 5,12 | 0,00025 | 0,621 | 1,544 | 0,621 | 1,54 |
Рисунок 3- Результаты расчета многофакторной регрессионной модели
Таким образом, анализируя данные, представленные на рисунке 3, модель зависимости численности населения от факторов Х3, Х4, Х8 выглядит следующим образом:
Yt*= 1571,85 +0,1745 Х3 + 1,3576 Х4 + 1,0829 Х8. (7)
Качество модели, судя по данным рисунка 3, соответствует требуемому уровню и может использоваться для прогнозирования.
Следующий этап – построение моделей факторов Х3, Х4, Х8 как одномерных временных рядов с целью их прогнозирования.
На рисунке 4 представлен график и полученная модель для фактора Х3.
Рисунок 4 - График и полученная модель для фактора Х3
На рисунке 5 представлен график и полученная модель для фактора Х4.
Рисунок 5 - График и полученная модель для фактора Х4
На рисунке 6 представлены графики исходных данных и полученной модели для фактора Х8.
Рисунок 6 - График и полученная модель для фактора Х8
В таблице 4 представлены исходные данные для построения многофакторной регрессионной модели и результаты прогноза по рассматриваемым факторам и численностью населения Оренбургской области.
Таблица 4 - Исходные данные для построения многофакторной регрессионной модели и результаты прогноза по рассматриваемым факторам и численностью населения Оренбургской области
t | Yt | X3 | X4 | X8 | Yt* |
2211,2 | 343,8 | 127,1 | 2219,01 | ||
2203,6 | 330,2 | 126,5 | 2204,61 | ||
2179,5 | 312,5 | 128,2 | 2188,01 | ||
291,5 | 127,3 | 2162,89 | |||
2149,9 | 270,8 | 129,5 | 2137,70 | ||
2122,4 | 253,5 | 127,2 | 2111,72 | ||
2093,5 | 239,1 | 2092,62 | |||
2067,9 | 227,1 | 2076,15 | |||
2055,7 | 218,8 | 125,4 | 2064,23 | ||
2044,3 | 105,4 | 2050,51 | |||
2033,1 | 208,8 | 103,1 | 2036,64 | ||
2031,5 | 206,5 | 101,8 | 2028,61 | ||
2023,7 | 205,9 | 103,4 | 2027,61 | ||
2016,1 | 205,8 | 92,5 | 2010,61 | ||
2008,5 | 208,6 | 89,5 | 2006,45 | ||
2001,1 | 212,5 | 86,5 | 2000,63 | ||
266,73 | 219,98 | 75,26 | 1998,56 | ||
236,28 | 228,85 | 67,65 | 1997,05 | ||
202,05 | 239,73 | 59,54 | 1997,06 | ||
164,04 | 252,61 | 50,93 | 1998,59 | ||
122,2388 | 267,5013 | 41,81 | 2001,63 |
На рисунке 7 представлены исходные данные, модельные значения и результаты прогноза численности населения Оренбургской области до 2020 года.
Рисунок 7 - Исходные данные, модельные значения и результаты прогноза численности населения Оренбургской области до 2020 года
По результатам прогноза наблюдается уменьшение к 2018 году, затем небольшое увеличение численности населения Оренбургской области.