Линейная модель.
Уравнение однофакторной (парной) линейной регрессии имеет вид:
Для нашего примера:
Y – Валовый доход растениеводства, приходящийся на 100 га пашни, тыс. руб. (результативный признак);
Х – Доля трактористов – машинистов в общей численности работников, занятых в сельскохозяйственном производстве, % (факторный признак).
Для нахождения параметров a и b линейной регрессии можно решить систему нормальных уравнений относительно a и b.
Для расчета параметров уравнения регрессии можно также воспользоваться готовыми формулами, полученными путем преобразования уравнений системы:
Уравнение принимает вид:
Рис. 2. Влияние доли трактористов – машинистов в общей численности работников, занятых в сельскохозяйственном производстве, на валовый доход растениеводства, приходящийся на 100 га пашни.
Коэффициент -0,7113 стоящий перед Х, называется коэффициентом регрессии. По знаку этого коэффициента судят о направлении связи. Если знак «+» – связь прямая; «-» – связь обратная. Величина коэффициента регрессии показывает, на сколько в среднем изменится величина результативного признака Y при изменении факторного признака Х на единицу. В данном случае с увеличением доли трактористов – машинистов в общей численности работников, занятых в сельскохозяйственном производстве, на 1 % валовый доход растениеводства, приходящийся на 100 га пашни, уменьшается в среднем на 0,7113 тыс. руб.
Коэффициент регрессии применяется для расчета среднего коэффициента эластичности, который показывает: на сколько процентов в среднем по совокупности изменится результат Y от своей средней величины при изменении фактора X на 1% от своего среднего значения.
Коэффициент эластичности рассчитывается по формуле:
В нашем случае
И формула коэффициента эластичности парной линейной регрессии принимает вид:
С увеличением доли трактористов – машинистов в общей численности работников, занятых в сельскохозяйственном производстве, на 1 % валовый доход растениеводства, приходящийся на 100 га пашни, уменьшается в среднем на 0,26749%.
При линейной корреляции между Х и Y исчисляют парный линейный коэффициент корреляции r. Он принимает значения в интервале –1 £ r £ 1. Знак коэффициента корреляции показывает направление связи: «+» – связь прямая, «–» – связь обратная. Абсолютная величина характеризует степень тесноты связи.
Коэффициент парной линейной корреляции рассчитаем по формуле:
Линейный коэффициент парной корреляции показывает, что связь между долей трактористов – машинистов в общей численности работников, занятых в сельскохозяйственном производстве, и валовым доходом растениеводства, приходящийся на 100 га пашни, обратная и слабая.
Изменение результативного признака Y обусловлено вариацией факторного признака X. Долю дисперсии, объясняемую регрессией, в общей дисперсии результативного признака характеризует коэффициент детерминации D.
Коэффициент детерминации рассчитывается по формуле:
Следовательно, вариация валового дохода растениеводства, приходящийся на 100 га пашни, на 6,4% объясняется вариацией доли трактористов – машинистов в общей численности работников, занятых в сельскохозяйственном производстве, а остальные 93,6% вариации валового дохода растениеводства, приходящийся на 100 га пашни, обусловлены изменением других, не учтенных в модели факторов.
Для практического использования корреляционно-регрессионных моделей большое значение имеет их адекватность, т.е. соответствие фактическим статистическим данным. Корреляционно-регрессионный анализ проводится обычно по ограниченному объему статистической совокупности. Поэтому показатели регрессии и корреляции – параметры уравнения регрессии, коэффициенты корреляции и детерминации могут быть искажены действием случайных факторов. Чтобы проверить насколько эти показатели характерны для генеральной совокупности, являются ли они результатом действия случайных величин, необходимо проверить адекватность построенных статистических моделей.
Оценим модель через среднюю ошибку аппроксимации.
Средняя ошибка аппроксимации – среднее отклонение расчетных значений от фактических:
Допустимый предел значений - не более 8 – 10%.
Выполним вспомогательные расчеты (табл.6).
Таблица 6. Исходные данные, необходимые для определения показателей аппроксимации.
№ хозяйства | Доля трактористов-машинистов в общей численности работников, занятых в сельскохозяйственном производстве, % | Валовый доход растениеводства, приходящийся на 100 га пашни, тыс.руб. | Расчетные величины | ||||
![]() | ![]() | ![]() | ![]() | ![]() | |||
34,0426 | 48,2162 | 53,3288883 | -5,11268832 | 10,6036733 | 26,1395818 | 121,975157 | |
24,1935 | 46,3568 | 60,3337919 | -13,9769919 | 30,1508989 | 195,356302 | 1,42835093 | |
28,2486 | 47,4703 | 57,4497127 | -9,97941268 | 21,0224344 | 99,5886775 | 27,5649819 | |
18,9850 | 40,5136 | 64,0381953 | -23,5245953 | 58,0659219 | 553,406586 | 16,1070877 | |
27,1845 | 100,7356 | 58,2065248 | 42,52907524 | 42,2185158 | 1808,72224 | 17,5237377 | |
11,9266 | 59,4603 | 69,0582897 | -9,59798971 | 16,1418454 | 92,1214064 | 122,58395 | |
19,5652 | 61,4004 | 63,6255439 | -2,22514394 | 3,62398931 | 4,95126553 | 11,7866126 | |
18,1208 | 49,7596 | 63,9008582 | 8,871941755 | 12,1912882 | 78,7113505 | 14,5944143 | |
15,8228 | 99,1870 | 64,652834 | -14,893234 | 29,9303733 | 221,808419 | 23,790627 | |
19,1781 | 72,7728 | 66,2872238 | 32,89977621 | 33,1694438 | 1082,39527 | 51,4887135 | |
35,7143 | 47,1492 | 52,1399373 | -4,99073732 | 10,5849883 | 24,907459 | 161,695038 | |
![]() | 252,9819 | 673,0219 | 673,0218 | 267,703373 | 4188,10856 | 570,53867 | |
сред. знач. | 22,9984 | 61,1838 | 61,1838 | 24,3366702 |
Средняя ошибка аппроксимации равна 24,3%. т.е. в среднем расчетные значения валового дохода растениеводства, приходящийся на 100 га пашни, отличаются от фактических на 24,3367%, что не входит в допустимый предел.
Оценим модель через F-критерий Фишера. F-критерий Фишера необходим для проверки нулевой гипотезы о статистической незначимости уравнения регрессии и показателя тесноты связи (r).
Выдвинем H0 о статистической незначимости полученного уравнения регрессии и показателя тесноты связи.
Сравним фактическое значение F-критерия с табличным. Для этого выпишем из таблицы «Значения F-Фишера при уровне значимости α=0,05» табличное значение.
k1 – число факторных признаков в модели
k2 = n- k1-1
n – число единиц совокупности
В нашем примере k1 =1, k2 = 11-1-1 = 9
Таким образом
Так как Fфакт<Fтабл,то при заданном уровне вероятности α=0,05 следует принять нулевую гипотезу о статистической незначимости уравнения регрессии и показателя тесноты связи.
Для оценки статистической значимости коэффициентов регрессии и корреляции рассчитывается t-критерий Стьюдента и доверительные интервалы для каждого из показателей.
Вероятностная оценка параметров корреляции производится по общим правилам проверки статистических гипотез, разработанным математической статистикой, в частности путем сравнения оцениваемой величины со средней случайной ошибкой оценки:
;
;
Случайные ошибки параметров линейной регрессии и коэффициента корреляции определяются по формулам:
;
Выдвинем нулевую гипотезу о незначимости коэффициентов корреляции и регрессии.
Рассчитаем случайные ошибки параметров линейной регрессии и коэффициента корреляции:
tтабл при уровне значимости α=0,05 и числе степеней свободы, равном n-2 = 11-2=9, равно 2,2622.
Так как | tb|<tтабл и | tr|<tтабл, следовательно, Н0 о незначимости коэффициентов корреляции и регрессии подтверждается.
Взаимосвязь между t-статистикой и F-статистикой:
0.62=0.62=0.62
Рассчитаем доверительные интервалы для каждого показателя. Для этого определим предельную ошибку D для каждого из показателей.
С вероятностью 95% можно утверждать, что показатель a находится в пределах:
62,6974<a<92,3878
Так как в пределы доверительного интервала не входит 0, то с вероятностью 95% можно судить о статистической значимости параметра a.
С вероятностью 95% можно утверждать, что коэффициент регрессии находится в пределах:
-2.7541<b<1,3317
Так как в пределы доверительного интервала входит 0, то с вероятностью 95% можно судить о незначимости коэффициента регрессии.
С вероятностью 95% можно утверждать, что коэффициент корреляции находится в пределах:
-0,9821<r<0,4743
Так как в пределы доверительного интервала входит 0, то с вероятностью 95% можно судить о статистической незначимости коэффициента корреляции.
Равносторонняя гипербола.
Уравнение равносторонней гиперболы имеет вид:
Для нашего примера:
Y – Валовый доход растениеводства, приходящийся на 100 га пашни, тыс. руб. (результативный признак);
Х – Доля трактористов – машинистов в общей численности работников, занятых в сельскохозяйственном производстве, % (факторный признак).
Данная функция нелинейна относительно переменной, но линейна по параметрам. Прежде, чем проводить анализ необходимо перейти от нелинейной формы к линейной. В нелинейных регрессиях относительно переменных процедура лианеризации (аноморфоза) производится путем замены переменных.
Сделаем замену:
Вновь полученное уравнение будет иметь вид:
Таблица 7. Расчетные величины, необходимые для определения параметров уравнения
№ хозяйства | Доля трактористов-машинистов в общей численности работников, занятых в сельскохозяйственном производстве, % X | Валовый доход растениеводства, приходящийся на 100 га пашни, тыс.руб. Y | Z | ![]() | ![]() | ![]() |
34,0426 | 48,2162 | 0,029375 | 0,0009 | 2324,80194 | 1,4163 | |
24,1935 | 46,3568 | 0,041333 | 0,0017 | 2148,95291 | 1,9161 | |
28,2486 | 47,4703 | 0,0354 | 0,0013 | 2253,42938 | 1,6804 | |
18,9850 | 40,5136 | 0,052673 | 0,0028 | 1641,35178 | 2,134 | |
27,1845 | 100,7356 | 0,036786 | 0,0014 | 10147,6611 | 3,7056 | |
11,9266 | 59,4603 | 0,083846 | 0,007 | 3535,52728 | 4,9855 | |
19,5652 | 61,4004 | 0,051111 | 0,0026 | 3770,00912 | 3,1382 | |
18,1208 | 49,7596 | 0,052143 | 0,0027 | 5295,88042 | 3,7946 | |
15,8228 | 99,1870 | 0,055185 | 0,003 | 2476,01779 | 2,746 | |
19,1781 | 72,7728 | 0,0632 | 0,004 | 9838,06097 | 6,2686 | |
35,7143 | 47,1492 | 0,028 | 0,0008 | 2223,04706 | 1,3202 | |
![]() | 252,9819 | 673,0219 | 0,5290525 | 0,02814 | 45654,73976 | 33,1056 |
сред.знач. | 22,9984 | 61,1838 | 0,0480957 | 0,00256 | 4150,430887 | 3,0096 |
Сренднее квадратич отклонение | 7,2018853 | 20,173584 | 0,015644 |
Найдем среднее квадратическое отклонение по Z:
Для расчета параметров уравнения регрессии воспользуемся готовыми формулами:
Уравнение принимает вид:
Коэффициент эластичности рассчитывается по формуле:
В нашем случае
И формула коэффициента эластичности парной линейной регрессии принимает вид:
С увеличением доли трактористов – машинистов в общей численности работников, занятых в сельскохозяйственном производстве, на 1 % валовый доход растениеводства, приходящийся на 100 га пашни, уменьшается в среднем на 0,19848%.
Для нелинейной парной корреляции рассчитывается индекс корреляции:
Для расчета индекса корреляции выполним вспомогательные расчеты (таблица 8).
Таблица 8. Расчетные величины, необходимые для расчета индекса корреляции и определения показателей аппроксимации.
№ хозяйства | Доля трактористов-машинистов в общей численности работников, занятых в сельскохозяйственном производстве, % | Валовый доход растениеводства, приходящийся на 100 га пашни, тыс.руб. | Расчетные величины | ||||
![]() | ![]() | ![]() | ![]() | ![]() | |||
34,0426 | 48,2162 | 56,0644 | 168,159 | 61,594275 | 16,277 | 0,000350 | |
24,1935 | 46,3568 | 59,33458 | 219,84 | 168,422788 | 27,995 | 0,000046 | |
28,2486 | 47,4703 | 57,71201 | 188,06 | 104,892724 | 21,575 | 0,000161 | |
18,9850 | 40,5136 | 62,43557 | 427,257 | 480,572586 | 54,11 | 0,000021 | |
27,1845 | 100,7356 | 58,09095 | 1564,34 | 1818,5665 | 42,333 | 0,000128 | |
11,9266 | 59,4603 | 70,96019 | 2,97045 | 132,247518 | 19,34 | 0,001278 | |
19,5652 | 61,4004 | 62,00842 | 0,04692 | 0,36968473 | 0,9902 | 0,000009 | |
18,1208 | 49,7596 | 62,29053 | 134,305 | 109,877894 | 14,404 | 0,000016 | |
15,8228 | 99,1870 | 63,12251 | 130,512 | 178,567414 | 26,855 | 0,000050 | |
19,1781 | 72,7728 | 65,31423 | 1444,24 | 1147,36422 | 34,15 | 0,000228 | |
35,7143 | 47,1492 | 55,6884 | 196,97 | 72,9179421 | 18,111 | 0,000404 | |
![]() | 252,9819 | 673,0219 | 673,0218 | 4476,7086 | 4275,393542 | 276,14 | 0,002692 |
сред. знач. | 22,9984 | 61,1838 | - | - | - | 25,104 |
Индекс корреляции показывает, что между долей трактористов – машинистов в общей численности работников, занятых в сельскохозяйственном производстве, и валовым доходом растениеводства, приходящийся на 100 га пашни, слабая.
Коэффициент детерминации для нелинейных функций рассчитывается по формуле:
Следовательно, вариация валового дохода растениеводства, приходящийся на 100 га пашни, на 4,4969% объясняется вариацией доли трактористов – машинистов в общей численности работников, занятых в сельскохозяйственном производстве, а остальные 95,503% вариации валового дохода растениеводства, приходящийся на 100 га пашни, обусловлены изменением других, не учтенных в модели факторов.
Оценим модель через среднюю ошибку аппроксимации:
Средняя ошибка аппроксимации равна 25,1%, т.е. в среднем расчетные значения валового дохода растениеводства, приходящийся на 100 га пашни, отличаются от фактических на 25,104%, что не входит в допустимый предел.
Оценим модель через F-критерий Фишера. F-критерий Фишера необходим для проверки нулевой гипотезы о статистической незначимости уравнения регрессии и показателя тесноты связи.
Выдвинем H0 о статистической незначимости полученного уравнения регрессии и показателя тесноты связи.
Сравним фактическое значение F-критерия с табличным. Для этого выпишем из таблицы «Значения F-Фишера при уровне значимости α=0,05» табличное значение.
Так как Fфакт<Fтабл,то при заданном уровне вероятности α=0,05 следует принять нулевую гипотезу о статистической незначимости уравнения регрессии и показателя тесноты связи.
Для оценки статистической значимости коэффициентов регрессии и корреляции рассчитывается t-критерий Стьюдента.
Вероятностная оценка параметров корреляции производится по общим правилам проверки статистических гипотез, разработанным математической статистикой, в частности путем сравнения оцениваемой величины со средней случайной ошибкой оценки:
;
;
Случайные ошибки параметров линейной регрессии и коэффициента корреляции определяются по формулам:
;
Выдвинем нулевую гипотезу о незначимости коэффициентов корреляции и регрессии.
Рассчитаем случайные ошибки параметров линейной регрессии и коэффициента корреляции:
tтабл при уровне значимости α=0,05 и числе степеней свободы, равном 9, равно 2,2281.
Так как | tb| <tтабл и tr <tтабл, следовательно, Н0 о незначимости коэффициентов корреляции и регрессии подтверждается.
Взаимосвязь между t-статистикой и F-статистикой:
;
Степенная модель.
Уравнение степенной модели имеет вид:
Для нашего примера:
Y – Валовый доход растениеводства, приходящийся на 100 га пашни, тыс. руб. (результативный признак);
Х – Доля трактористов – машинистов в общей численности работников, занятых в сельскохозяйственном производстве, % (факторный признак).
Данная функция нелинейна относительно параметров, но линейна по переменным. Прежде, чем проводить анализ необходимо перейти от нелинейной формы к линейной. В нелинейных регрессиях относительно параметров процедура лианеризации (аноморфоза) производится путем логарифмирования обеих частей уравнения:
Введем замену:
Вновь полученное уравнение будет иметь вид:
Таблица 9. Расчетные величины, необходимые для определения параметров уравнения
№ хозяйства | Доля трактористов-машинистов в общей численности работников, занятых в сельскохозяйственном производстве, % X | Валовый доход растениеводства, приходящийся на 100 га пашни, тыс.руб. Y | ![]() | ![]() | ![]() | ![]() | ![]() |
34,0426 | 48,2162 | 1,532023 | 1,683193 | 2,347094 | 2,833139 | 2,57869 | |
24,1935 | 46,3568 | 1,383699 | 1,666113 | 1,914622 | 2,775934 | 2,305399 | |
28,2486 | 47,4703 | 1,450997 | 1,676422 | 2,105392 | 2,810391 | 2,432483 | |
18,9850 | 40,5136 | 1,278411 | 1,607601 | 1,634334 | 2,58438 | 2,055174 | |
27,1845 | 100,7356 | 1,434321 | 2,003183 | 2,057278 | 4,012742 | 2,873208 | |
11,9266 | 59,4603 | 1,076517 | 1,774227 | 1,158888 | 3,147882 | 1,909985 | |
19,5652 | 61,4004 | 1,291484 | 1,788171 | 1,667932 | 3,197556 | 2,309395 | |
18,1208 | 49,7596 | 1,282806 | 1,861969 | 1,64559 | 3,466929 | 2,388544 | |
15,8228 | 99,1870 | 1,258177 | 1,696877 | 1,58301 | 2,879391 | 2,134972 | |
19,1781 | 72,7728 | 1,199283 | 1,996455 | 1,438281 | 3,985832 | 2,394315 | |
35,7143 | 47,1492 | 1,552842 | 1,673474 | 2,411319 | 2,800516 | 2,598641 | |
![]() | 252,9819 | 673,0219 | 14,7406 | 19,4277 | 19,9637 | 34,4947 | 25,9808 |
сред.знач. | 22,9984 | 61,1838 | 1,34005 | 1,76615 | 1,81489 | 3,13588 | 2,36189 |
Среднее квадратич отклонение | 7,2018853 | 20,173584 |
Найдем среднее квадратическое отклонение по L:
Для расчета параметров уравнения регрессии воспользуемся готовыми формулами:
Уравнение принимает вид:
Проведем потенцирование полученного уравнения:
A=Lg a = 2.1051
a= 102.1051
b= -0.25295
lgY = 102.1051*(-0.25295)lgX
Y=127.3836*X-0.25295
Рис. 4. Влияние доли трактористов – машинистов в общей численности работников, занятых в сельскохозяйственном производстве, на валовый доход растениеводства, приходящийся на 100 га пашни.
Коэффициент эластичности рассчитывается по формуле:
В нашем случае
И формула коэффициента эластичности парной линейной регрессии принимает вид:
С увеличением доли трактористов – машинистов в общей численности работников, занятых в сельскохозяйственном производстве, на 1 % валовый доход растениеводства, приходящийся на 100 га пашни, уменьшается в среднем на 0,2617%.
Для нелинейной парной корреляции рассчитывается индекс корреляции:
Для расчета индекса корреляции выполним вспомогательные расчеты (таблица 10).
Таблица 10. Расчетные величины, необходимые для расчета индекса корреляции и определения показателей аппроксимации
№ хозяйства | Доля тракторис-тов-машинистов в общей численности работников, занятых в сельскохозяйственном производстве, % | Валовый доход растениеводства, приходящийся на 100 га пашни, тыс.руб. | Расчетные величины | ||||||
![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | |||
34,0426 | 48,2162 | 52,190896 | 15,79820936 | 168,1586498 | 8,243486908 | 1,717595 | 0,0012 | 0,036853 | |
24,1935 | 46,3568 | 56,900057 | 111,1602591 | 219,839929 | 22,74371089 | 1,755113 | 0,0079 | 0,001905 | |
28,2486 | 47,4703 | 54,71292 | 52,45554041 | 188,0600823 | 15,2571602 | 1,73809 | 0,0038 | 0,012309 | |
18,9850 | 40,5136 | 60,498539 | 399,3977771 | 427,257168 | 49,32896301 | 1,781745 | 0,0303 | 0,0038 | |
27,1845 | 100,7356 | 55,246899 | 2069,221877 | 1564,344883 | 45,15652912 | 1,742308 | 0,0681 | 0,008887 | |
11,9266 | 59,4603 | 68,047648 | 73,74254765 | 2,97045225 | 14,44215403 | 1,832813 | 0,0034 | 0,06945 | |
19,5652 | 61,4004 | 60,039622 | 1,85171669 | 0,04691556 | 2,216236331 | 1,778438 | 0,0001 | 0,002359 | |
18,1208 | 49,7596 | 60,343875 | 154,4781809 | 134,304921 | 17,0790806 | 1,780633 | 0,0066 | 0,003277 | |
15,8228 | 99,1870 | 61,215697 | 131,2421549 | 130,5123456 | 23,02288773 | 1,786863 | 0,0081 | 0,006703 | |
19,1781 | 72,7728 | 63,351922 | 1284,152795 | 1444,24321 | 36,1288049 | 1,80176 | 0,0379 | 0,019816 | |
35,7143 | 47,1492 | 51,561859 | 19,47156064 | 196,9699972 | 9,358926842 | 1,712329 | 0,0015 | 0,04528 | |
![]() | 252,9819 | 673,0219 | 644,1099 | 4312,97262 | 4476,708554 | 242,97794 | 19,4277 | 0,1689 | 0,21064 |
сред. знач. | 22,9984 | 61,1838 | - | - | - | 22,0889 |
Индекс корреляции показывает, что между долей трактористов – машинистов в общей численности работников, занятых в сельскохозяйственном производстве, и валовым доходом растениеводства, приходящийся на 100 га пашни, слабая.
Коэффициент детерминации для нелинейных функций рассчитывается по формуле:
Следовательно, вариация валового дохода растениеводства, приходящийся на 100 га пашни, на 3,6575% объясняется вариацией доли трактористов – машинистов в общей численности работников, занятых в сельскохозяйственном производстве, а остальные 96,3425% вариации валового дохода растениеводства, приходящийся на 100 га пашни, обусловлены изменением других, не учтенных в модели факторов.
Оценим модель через среднюю ошибку аппроксимации:
Средняя ошибка аппроксимации равна 22,1%, т.е. в среднем расчетные значения валового дохода растениеводства, приходящийся на 100 га пашни, отличаются от фактических на 22,0889%, что не входит в допустимый предел. Данная модель имеет наименьшую ошибку аппроксимации.
Оценим модель через F-критерий Фишера. F-критерий Фишера необходим для проверки нулевой гипотезы о статистической незначимости уравнения регрессии и показателя тесноты связи.
Выдвинем H0 о статистической незначимости полученного уравнения регрессии и показателя тесноты связи.
Сравним фактическое значение F-критерия с табличным. Для этого выпишем из таблицы «Значения F-Фишера при уровне значимости α=0,05» табличное значение.
Так как Fфакт<Fтабл,то при заданном уровне вероятности α=0,05 следует принять нулевую гипотезу о статистической незначимости уравнения регрессии и показателя тесноты связи.
Для оценки статистической значимости коэффициентов регрессии и корреляции рассчитывается t-критерий Стьюдента.
Вероятностная оценка параметров корреляции производится по общим правилам проверки статистических гипотез, разработанным математической статистикой, в частности путем сравнения оцениваемой величины со средней случайной ошибкой оценки:
;
;
Случайные ошибки параметров линейной регрессии и коэффициента корреляции определяются по формулам:
;
Выдвинем нулевую гипотезу о незначимости коэффициентов корреляции и регрессии.
Рассчитаем случайные ошибки параметров линейной регрессии и коэффициента корреляции:
tтабл при уровне значимости α=0,05 и числе степеней свободы, равном 9, равно 2,2622.
Так как | tb| <tтабл и tr <tтабл, следовательно, Н0 о незначимости коэффициентов корреляции и регрессии подтверждается.
Взаимосвязь между t-статистикой и F-статистикой:
;
8. прогноз значения результативного признака при прогнозном значении факторного, составляющем 125% от его среднего уровня (т.е. 125% от ).
В виду того, что все уравнения регрессии являются статистически незначимыми, рассчитывать прогнозируемое значение валового дохода растениеводства, приходящегося а 100 га пашни ни по одному из рассмотренных уравнений не имеет смысла, поскольку данный прогноз не даст достоверного результата.
Тем не менее, для закрепления методики расчета прогнозов, выполним расчет прогнозного значения результата по степенной модели, так как в данном случае средняя ошибка аппроксимации минимальна.
Расчет прогнозного значения будем производить по линейной модели, так как значение квадрата индекса корреляции (R2) для нее максимальное
№ п/п | Модель | Средняя ошибка аппроксимации | R2 (ρ2) |
![]() | 24,33 | 0,064 | |
![]() | 25,104 | 0,045 | |
Y=127.3836*X-0.25295 | 22,0889 | 0,037 |
По условию задачи прогнозное значение фактора составляет 125% от его среднего уровня =22,9984:
=1,25∙22,9984=28,7479
и прогнозное значение среднедушевого прожиточного минимума в день при этом составит:
= 77,5426-0,7113*28,7479= 57,0942
Если доля машинистов-трактористов составит 125% от среднего уровня =22,9984, то валовой доход растениеводства, приходящийся на 100 га пашни составит 57,0942 тыс. руб.
Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал
Найдем ошибку прогноза:
=
=
тыс.руб.
Далее строится доверительный интервал прогноза при уровне значимости g=0,05:
;
предельная ошибка прогноза, которая в 95% случаев не будет превышена, составит:
=2,2622∙25,7934=58,35
Доверительный интервал прогноза
Нижняя граница интервала:
57,0942-58,35=-1,2558
Верхняя граница интервала:
57,0942+58,35=115,4442
Доверительный интервал:
(-1,2558;115,4442)
Выполненный прогноз валового дохода растениеводства, приходящийся на 100 га пашни является неточным, так как в доверительный интервал входит 0.