Вычисление параметров линейного уравнения множественной регрессии.
Эта операция проводится с помощью инструмента анализа данных Регрессия. Она аналогична расчету параметров парной линейной регрессии, а отличие от парной регрессии состоит только в том, что в диалоговом окне при заполнении параметров входной интервал Х следует указывать не один столбец, а все столбцы, содержащие значения факторных признаков. Результаты анализа представлены на рис. 3.1
Рис.3.1. Результат применения инструмента Регрессия
По результатам вычислений составим уравнение множественной регрессии с помощью результатов вычислений в Ecxel [ Коэффициенты ] вида:
;
.
Значения случайных ошибок параметров ,
и
[ Стандартная ошибка ] с учетом округления:
,
,
.
Они показывают, какое значение данной характеристики сформировалось под влиянием случайных факторов. Эти значения используются для расчета t-критерия Стьюдента [ t-статистика ]:
;
;
,
Если значения t-критерия больше 2-3, можно сделать вывод о существенности данного параметра, который формируется под воздействием неслучайных причин. Здесь статистически значимыми являются и
, а величина
сформировалась под воздействием случайных причин, поэтому фактор
, силу влияния которого оценивает
, можно исключить как несущественно влияющий, неинформативный.
На это же указывает показатель вероятности случайных значений параметров регрессии: если меньше принятого нами уровня (обычно 0,1; 0,05 или 0,01; это соответствует 10%, 5% или 1% вероятности), делают вывод о несущественной природе данного значения параметра, т.е. о том, что он статистически значим и надежен. В противном случае принимается гипотеза о случайной природе значения коэффициентов уровня. Здесь
> 5%, что позволяет рассматривать
как неинформативный фактор и удалить его для улучшения данного уравнения.
Величина оценивает агрегированное влияние прочих (кроме учтенных в модели факторов
и
) факторов на результат y.
Величины и
указывают, что с увеличением
и
на единицу конечный результат увеличивается соответственно на 0,9459 и 0,0856 млн. руб. [ Коэффициенты ]. Сравнивать эти значения не следует, т.к. они зависят от единиц измерения каждого признака и потому несопоставимы между собой.
4. Оценку надежности уравнения регрессии в целом и показателя тесноты связи дает F-критерий Фишера:
По данным таблицы дисперсионного анализа, представленной на рис. 3.1 =151,65. Вероятность случайно получить такое значение F-критерия составляет 0,0000, что не превышает допустимый уровень значимости 5%; об этом свидетельствует величина Р-значения из этой же таблицы. Следовательно, полученное значение не случайно, оно сформировалось под влиянием существенных факторов, т.е. подтверждается статистическая значимость всего уравнения и показателя тесноты связи
.
Значения скорректированного и нескорректированного линейных коэффициентов множественной детерминации приведены на рис. 3.1 в рамках регрессионной статистики.
Нескорректированный коэффициент множественной детерминации [ R-квадрат ] =0,9469 оценивают долю вариации результата за счет представленных в уравнении факторов в общей вариации результата. Здесь эта доля составляет 94,7% и указывает на весьма высокую степень обусловленности вариации результата вариацией факторов, иными словами – на весьма тесную связь факторов с результатом.
Скорректированный коэффициент множественной детерминации [ Нормированный R-квадрат ] =0,9407 определяет тесноту связи с учетом степеней свободы общей и остаточной дисперсий. Он дает такую оценку тесноты связи, которая не зависит от числа факторов в модели и потому может сравниваться по разным моделям с разным числом факторов. Оба коэффициента указывают на весьма высокую (более 90%) детерминированность результата y в модели факторами
и
.
5. Информация для оценки с помощью частных F- критериев Фишера целесообразности включения в модель фактора после фактора
и фактора
после фактора
может быть получена в ППП Statgraphics. Частный F- критерий показывает статистическую значимость включения фактора
после того, как в нее включен фактор
.
Но по данным, вычисленным с помощью ППП Excel, можно сделать общий вывод, который состоит в том, что множественная модель с факторами и
с
=0,9469 содержит неинформативный фактор
. Если исключить фактор
, то можно ограничиться уравнением парной регрессии:
более простым, хорошо детерминированным, пригодным для анализа и для прогноза.
6. Средние частные коэффициенты эластичности
показывают, на сколько процентов от значения своей средней
изменяется результат при изменении фактора
на 1% от своей средней
и при фиксированном воздействии на у всех прочих факторов, включенных в уравнение регрессии. Для линейной зависимости
,
где - коэффициент регрессии при
в уравнении множественной регрессии.
Здесь ,
.
По значениям частных коэффициентов эластичности можно сделать вывод о более сильном влиянии на результат у признака фактора , чем признака фактора
: 0,6% против 0,2%.
Контрольные задания
1. По 19 предприятиям оптовой торговли изучается зависимость объема реализации (у) от размера торговой площади () и товарных запасов (
). Были получены следующие варианты уравнений регрессии:
1. у=25+15
2. у=42+27
3. у=30+10 +8
(2,5) (4,0)
4. у=21+14 +20
+0,6
(5,0) (12,0) (0,2)
В скобках указаны значения стандартных ошибок для коэффициентов регрессии.
1. Проанализируйте тесноту связи результата с каждым из факторов.
2. Выберите наилучшее уравнение регрессии, обоснуйте принятое решение.
2. Для изучения рынка жилья в городе по данным о 46 коттеджах было построено уравнение множественной регрессии6
У= 21,1-6,2 +0,95
+3,57
;
(1,8) (0,54) (0,83)
где у – цена объекта, тыс. долл.;
- расстояние до центра города, км;
- полезная площадь объекта, кв. м;
- число этажей в доме, ед.;
- коэффициент множественной детерминации.
В скобках указаны значения стандартных ошибок для коэффициентов регрессии.
1. Проверьте гипотезу о том, что коэффициент регрессии в генеральной совокупности равен нулю.
2. Проверьте гипотезу о том, что коэффициент в генеральной совокупности равен нулю.
3. Исходные данные для выявления тенденции себестоимости добычи нефти и газа представлены в таблице.
Фактор времени t | Себестоимость добычи 1 т нефти и попутного газа, руб. | Средний дебит на отработанный скважино-месяц, т | Обводненность нефти, % | Удельная численность на одну скважину, чел./скв. | Газовый фактор, газ м3/нефть т | Фондоемкость на одну скважину, тыс.руб. |
12,19 | 42,6 | 35,1 | 2,21 | 150,2 | 68,3 | |
9,59 | 55,8 | 29,3 | 2,27 | 257,0 | 72,2 | |
8,17 | 73,4 | 23,2 | 2,50 | 324,8 | 78,1 | |
7,15 | 99,4 | 25,1 | 2,55 | 272,3 | 83,1 | |
6,52 | 136,2 | 20,2 | 2,63 | 228,7 | 94,1 | |
5,31 | 176,8 | 17,7 | 2,77 | 211,7 | 87,9 | |
5,21 | 228,9 | 15,1 | 2,83 | 231,1 | 97,1 | |
5,32 | 268,2 | 12,8 | 2,87 | 273,0 | 102,7 | |
5,23 | 306,9 | 12,6 | 3,01 | 258,2 | 117,1 | |
4,9 | 408,3 | 12,2 | 3,20 | 214,6 | 131,3 | |
4,8 | 481,0 | 12,9 | 3,52 | 188,8 | 166,6 | |
4,81 | 529,0 | 15,6 | 2,99 | 174,7 | 177,6 | |
4,78 | 558,0 | 20,5 | 2,98 | 165,9 | 175,6 | |
4,65 | 596,0 | 24,3 | 2,95 | 183,7 | 194,6 | |
4,79 | 614,0 | 31,2 | 2,86 | 159,7 | 214,1 |
1. Оценить показатели вариации каждого признака и сделать вывод о возможностях применения МНК для их изучения.
2. Проанализировать линейные коэффициенты парной и частной корреляции.
3. Написать уравнение множественной регрессии, оценить значимость его параметров, пояснить их экономический смысл.
4. С помощью F-критерия Фишера оценить статистическую надежность уравнения регрессии и показателя тесноты связи. Сравнить значения скорректированного и нескорректированного коэффициентов множественной детерминации.
5. Рассчитать точечную оценку прогноза себестоимости добычи 1т нефти и попутного газа по полученной регрессионной модели на 16, 17, 18 временной интервал.
6. Для каждого фактора корреляционно-регрессионной модели построить тренд и осуществить прогноз на 16, 17, 18 временной интервал.
4. Построить математическую модель рынка арендных ставок в зависимости от двух факторных признаков:
· местоположения объекта аренды;
· его состояния
Критерий | Номер объекта | ||||
Местоположение, ч1 | |||||
Состояние, x2 | |||||
Арендная ставка, y |
5. Руководство фабрики заинтересовано в построении модели того, чтобы предсказать реализацию одной из своих уже долго существующих торговых марок. Были собраны следующие данные.
Дата | Реализация за 6 месяцев, млрд.д.ед. | Реклама, млрд.д.ед | Цена, д.ед | Цена конкурента, д.ед | Индекс потребительских расходов |
январь-июнь | 4,0 | 15,0 | 17,0 | 100,0 | |
июль-декабрь | 4,8 | 14,8 | 17,3 | 98,4 | |
январь-июнь | 3,8 | 15,2 | 16,8 | 101,2 | |
июль-декабрь | 8,7 | 15,5 | 16,2 | 103,5 | |
январь-июнь | 8,2 | 15,5 | 16,0 | 104,1 | |
июль-декабрь | 9,7 | 16,0 | 18,0 | 107,0 | |
январь-июнь | 14,7 | 18,1 | 20,2 | 107,4 | |
июль-декабрь | 18,7 | 13,0 | 15,8 | 108,5 | |
январь-июнь | 19,8 | 15,8 | 18,2 | 108,3 | |
июль-декабрь | 10,6 | 16,9 | 16,8 | 109,2 | |
январь-июнь | 8,6 | 16,3 | 17,0 | 110,1 | |
июль-декабрь | 6,5 | 16,1 | 18,3 | 110,7 | |
январь-июнь | 12,6 | 15,4 | 16,4 | 110,3 | |
июль-декабрь | 6,5 | 15,7 | 16,2 | 111,8 | |
январь-июнь | 5,8 | 16,0 | 17,7 | 112,3 | |
июль-декабрь | 5,7 | 15,1 | 16,2 | 112,9 |
1. Осуществить отбор факторов для включения в регрессионную модель.
2. Определить уравнение регрессии и прогнозировать объем реализации на январь-июнь следующего года.
6. По исходным технико-экономическим показателям транспорта газа оценить тесноту связи между параметрами. Определить уравнение регрессии. Спрогнозировать параметры на 5 лет.
Номер года | Производительность | Общая установленная мощность | Средняя дальность перекачки | ОПФ | Средний диаметр ГП |
90,1 | 1538,8 | ||||
1868,8 | |||||
124,6 | |||||
139,4 | 2460,5 | ||||
151,7 | 2990,7 | ||||
3077,3 | |||||
179,1 | 3400,7 | ||||
3873,7 | |||||
205,6 | 4248,3 | ||||
217,9 | 5296,5 | ||||
245,4 | 6679,6 | ||||
272,7 | 8232,1 | ||||
302,2 | 9603,1 | ||||
324,8 | 11165,7 | ||||
348,2 | |||||
377,8 | 15463,5 | ||||
403,1 | 17571,3 |
3. Исходные данные для выявления тенденции себестоимости добычи нефти и газа представлены в таблице.
Фактор времени t | Себестоимость добычи 1 т нефти и попутного газа, руб. | Средний дебит на отработанный скважино-месяц, т | Обводненность нефти, % | Удельная численность на одну скважину, чел./скв. | Газовый фактор, газ м3/нефть т | Фондоемкость на одну скважину, тыс.руб. |
5,8 | 407,0 | 35,1 | 2,21 | 150,2 | 68,3 | |
6,1 | 410,0 | 29,3 | 2,27 | 257,0 | 72,2 | |
5,5 | 409,0 | 23,2 | 2,50 | 324,8 | 78,1 | |
5,9 | 408,0 | 25,1 | 2,55 | 272,3 | 83,1 | |
5,7 | 411,0 | 20,2 | 2,63 | 228,7 | 94,1 | |
6,1 | 406,0 | 17,7 | 2,77 | 211,7 | 87,9 | |
5,6 | 408,0 | 15,1 | 2,83 | 231,1 | 97,1 | |
5,3 | 413,0 | 12,8 | 2,87 | 273,0 | 102,7 | |
6,3 | 407,0 | 12,6 | 3,01 | 258,2 | 117,1 | |
5,9 | 408,0 | 12,2 | 3,20 | 214,6 | 131,3 | |
6,2 | 411,0 | 12,9 | 3,52 | 188,8 | 166,6 | |
5,5 | 412,0 | 15,6 | 2,99 | 174,7 | 177,6 | |
6,2 | 409,0 | 20,5 | 2,98 | 165,9 | 175,6 | |
5,8 | 410,0 | 24,3 | 2,95 | 183,7 | 194,6 | |
6,1 | 407,0 | 31,2 | 2,86 | 159,7 | 214,1 |
1. Оценить показатели вариации каждого признака и сделать вывод о возможностях применения МНК для их изучения.
2. Проанализировать линейные коэффициенты парной и частной корреляции.
3. Написать уравнение множественной регрессии, оценить значимость его параметров, пояснить их экономический смысл.
4. С помощью F-критерия Фишера оценить статистическую надежность уравнения регрессии и показателя тесноты связи. Сравнить значения скорректированного и нескорректированного коэффициентов множественной детерминации.
5. Рассчитать точечную оценку прогноза себестоимости добычи 1т нефти и попутного газа по полученной регрессионной модели на 16, 17, 18 временной интервал.
6. Для каждого фактора корреляционно-регрессионной модели построить тренд и осуществить прогноз на 16, 17, 18 временной интервал.