Равносторонняя гипербола.




Линейная модель.

Уравнение однофакторной (парной) линейной регрессии имеет вид:

Для нашего примера:

Y – Валовый доход растениеводства, приходящийся на 100 га пашни, тыс. руб. (результативный признак);

Х – Доля трактористов – машинистов в общей численности работников, занятых в сельскохозяйственном производстве, % (факторный признак).

Для нахождения параметров a и b линейной регрессии можно решить систему нормальных уравнений относительно a и b.

Для расчета параметров уравнения регрессии можно также воспользоваться готовыми формулами, полученными путем преобразования уравнений системы:

Уравнение принимает вид:

Рис. 2. Влияние доли трактористов – машинистов в общей численности работников, занятых в сельскохозяйственном производстве, на валовый доход растениеводства, приходящийся на 100 га пашни.

 

Коэффициент -0,7113 стоящий перед Х, называется коэффициентом регрессии. По знаку этого коэффициента судят о направлении связи. Если знак «+» – связь прямая; «-» – связь обратная. Величина коэффициента регрессии показывает, на сколько в среднем изменится величина результативного признака Y при изменении факторного признака Х на единицу. В данном случае с увеличением доли трактористов – машинистов в общей численности работников, занятых в сельскохозяйственном производстве, на 1 % валовый доход растениеводства, приходящийся на 100 га пашни, уменьшается в среднем на 0,7113 тыс. руб.

Коэффициент регрессии применяется для расчета среднего коэффициента эластичности, который показывает: на сколько процентов в среднем по совокупности изменится результат Y от своей средней величины при изменении фактора X на 1% от своего среднего значения.

Коэффициент эластичности рассчитывается по формуле:

В нашем случае

 

И формула коэффициента эластичности парной линейной регрессии принимает вид:

 

С увеличением доли трактористов – машинистов в общей численности работников, занятых в сельскохозяйственном производстве, на 1 % валовый доход растениеводства, приходящийся на 100 га пашни, уменьшается в среднем на 0,26749%.

При линейной корреляции между Х и Y исчисляют парный линейный коэффициент корреляции r. Он принимает значения в интервале –1 £ r £ 1. Знак коэффициента корреляции показывает направление связи: «+» – связь прямая, «–» – связь обратная. Абсолютная величина характеризует степень тесноты связи.

Коэффициент парной линейной корреляции рассчитаем по формуле:

 

Линейный коэффициент парной корреляции показывает, что связь между долей трактористов – машинистов в общей численности работников, занятых в сельскохозяйственном производстве, и валовым доходом растениеводства, приходящийся на 100 га пашни, обратная и слабая.

Изменение результативного признака Y обусловлено вариацией факторного признака X. Долю дисперсии, объясняемую регрессией, в общей дисперсии результативного признака характеризует коэффициент детерминации D.

Коэффициент детерминации рассчитывается по формуле:

Следовательно, вариация валового дохода растениеводства, приходящийся на 100 га пашни, на 6,4% объясняется вариацией доли трактористов – машинистов в общей численности работников, занятых в сельскохозяйственном производстве, а остальные 93,6% вариации валового дохода растениеводства, приходящийся на 100 га пашни, обусловлены изменением других, не учтенных в модели факторов.

Для практического использования корреляционно-регрессионных моделей большое значение имеет их адекватность, т.е. соответствие фактическим статистическим данным. Корреляционно-регрессионный анализ проводится обычно по ограниченному объему статистической совокупности. Поэтому показатели регрессии и корреляции – параметры уравнения регрессии, коэффициенты корреляции и детерминации могут быть искажены действием случайных факторов. Чтобы проверить насколько эти показатели характерны для генеральной совокупности, являются ли они результатом действия случайных величин, необходимо проверить адекватность построенных статистических моделей.

Оценим модель через среднюю ошибку аппроксимации.

Средняя ошибка аппроксимации – среднее отклонение расчетных значений от фактических:

Допустимый предел значений - не более 8 – 10%.

Выполним вспомогательные расчеты (табл.6).

 

Таблица 6. Исходные данные, необходимые для определения показателей аппроксимации.

№ хозяйства Доля трактористов-машинистов в общей численности работников, занятых в сельскохозяйственном производстве, % Валовый доход растениеводства, приходящийся на 100 га пашни, тыс.руб. Расчетные величины
  34,0426 48,2162 53,3288883 -5,11268832 10,6036733 26,1395818 121,975157
  24,1935 46,3568 60,3337919 -13,9769919 30,1508989 195,356302 1,42835093
  28,2486 47,4703 57,4497127 -9,97941268 21,0224344 99,5886775 27,5649819
  18,9850 40,5136 64,0381953 -23,5245953 58,0659219 553,406586 16,1070877
  27,1845 100,7356 58,2065248 42,52907524 42,2185158 1808,72224 17,5237377
  11,9266 59,4603 69,0582897 -9,59798971 16,1418454 92,1214064 122,58395
  19,5652 61,4004 63,6255439 -2,22514394 3,62398931 4,95126553 11,7866126
  18,1208 49,7596 63,9008582 8,871941755 12,1912882 78,7113505 14,5944143
  15,8228 99,1870 64,652834 -14,893234 29,9303733 221,808419 23,790627
  19,1781 72,7728 66,2872238 32,89977621 33,1694438 1082,39527 51,4887135
  35,7143 47,1492 52,1399373 -4,99073732 10,5849883 24,907459 161,695038
252,9819 673,0219 673,0218   267,703373 4188,10856 570,53867
сред. знач. 22,9984 61,1838 61,1838   24,3366702    

 

Средняя ошибка аппроксимации равна 24,3%. т.е. в среднем расчетные значения валового дохода растениеводства, приходящийся на 100 га пашни, отличаются от фактических на 24,3367%, что не входит в допустимый предел.

Оценим модель через F-критерий Фишера. F-критерий Фишера необходим для проверки нулевой гипотезы о статистической незначимости уравнения регрессии и показателя тесноты связи (r).

Выдвинем H0 о статистической незначимости полученного уравнения регрессии и показателя тесноты связи.

 

Сравним фактическое значение F-критерия с табличным. Для этого выпишем из таблицы «Значения F-Фишера при уровне значимости α=0,05» табличное значение.

k1 – число факторных признаков в модели

k2 = n- k1-1

n – число единиц совокупности

В нашем примере k1 =1, k2 = 11-1-1 = 9

Таким образом

Так как Fфакт<Fтабл,то при заданном уровне вероятности α=0,05 следует принять нулевую гипотезу о статистической незначимости уравнения регрессии и показателя тесноты связи.

Для оценки статистической значимости коэффициентов регрессии и корреляции рассчитывается t-критерий Стьюдента и доверительные интервалы для каждого из показателей.

Вероятностная оценка параметров корреляции производится по общим правилам проверки статистических гипотез, разработанным математической статистикой, в частности путем сравнения оцениваемой величины со средней случайной ошибкой оценки:

; ;

Случайные ошибки параметров линейной регрессии и коэффициента корреляции определяются по формулам:

;

 

Выдвинем нулевую гипотезу о незначимости коэффициентов корреляции и регрессии.

Рассчитаем случайные ошибки параметров линейной регрессии и коэффициента корреляции:

tтабл при уровне значимости α=0,05 и числе степеней свободы, равном n-2 = 11-2=9, равно 2,2622.

Так как | tb|<tтабл и | tr|<tтабл, следовательно, Н0 о незначимости коэффициентов корреляции и регрессии подтверждается.

Взаимосвязь между t-статистикой и F-статистикой:

0.62=0.62=0.62

Рассчитаем доверительные интервалы для каждого показателя. Для этого определим предельную ошибку D для каждого из показателей.

С вероятностью 95% можно утверждать, что показатель a находится в пределах:

62,6974<a<92,3878

Так как в пределы доверительного интервала не входит 0, то с вероятностью 95% можно судить о статистической значимости параметра a.

С вероятностью 95% можно утверждать, что коэффициент регрессии находится в пределах:

-2.7541<b<1,3317

Так как в пределы доверительного интервала входит 0, то с вероятностью 95% можно судить о незначимости коэффициента регрессии.

С вероятностью 95% можно утверждать, что коэффициент корреляции находится в пределах:

-0,9821<r<0,4743

Так как в пределы доверительного интервала входит 0, то с вероятностью 95% можно судить о статистической незначимости коэффициента корреляции.

 

 

Равносторонняя гипербола.

Уравнение равносторонней гиперболы имеет вид:

Для нашего примера:

Y – Валовый доход растениеводства, приходящийся на 100 га пашни, тыс. руб. (результативный признак);

Х – Доля трактористов – машинистов в общей численности работников, занятых в сельскохозяйственном производстве, % (факторный признак).

Данная функция нелинейна относительно переменной, но линейна по параметрам. Прежде, чем проводить анализ необходимо перейти от нелинейной формы к линейной. В нелинейных регрессиях относительно переменных процедура лианеризации (аноморфоза) производится путем замены переменных.

Сделаем замену:

Вновь полученное уравнение будет иметь вид:

 

 

Таблица 7. Расчетные величины, необходимые для определения параметров уравнения

№ хозяйства Доля трактористов-машинистов в общей численности работников, занятых в сельскохозяйственном производстве, % X Валовый доход растениеводства, приходящийся на 100 га пашни, тыс.руб. Y Z
  34,0426 48,2162 0,029375 0,0009 2324,80194 1,4163
  24,1935 46,3568 0,041333 0,0017 2148,95291 1,9161
  28,2486 47,4703 0,0354 0,0013 2253,42938 1,6804
  18,9850 40,5136 0,052673 0,0028 1641,35178 2,134
  27,1845 100,7356 0,036786 0,0014 10147,6611 3,7056
  11,9266 59,4603 0,083846 0,007 3535,52728 4,9855
  19,5652 61,4004 0,051111 0,0026 3770,00912 3,1382
  18,1208 49,7596 0,052143 0,0027 5295,88042 3,7946
  15,8228 99,1870 0,055185 0,003 2476,01779 2,746
  19,1781 72,7728 0,0632 0,004 9838,06097 6,2686
  35,7143 47,1492 0,028 0,0008 2223,04706 1,3202
252,9819 673,0219 0,5290525 0,02814 45654,73976 33,1056
сред.знач. 22,9984 61,1838 0,0480957 0,00256 4150,430887 3,0096
Сренднее квадратич отклонение 7,2018853 20,173584 0,015644      

Найдем среднее квадратическое отклонение по Z:

Для расчета параметров уравнения регрессии воспользуемся готовыми формулами:

Уравнение принимает вид:

Коэффициент эластичности рассчитывается по формуле:

В нашем случае

И формула коэффициента эластичности парной линейной регрессии принимает вид:

С увеличением доли трактористов – машинистов в общей численности работников, занятых в сельскохозяйственном производстве, на 1 % валовый доход растениеводства, приходящийся на 100 га пашни, уменьшается в среднем на 0,19848%.

Для нелинейной парной корреляции рассчитывается индекс корреляции:

Для расчета индекса корреляции выполним вспомогательные расчеты (таблица 8).

Таблица 8. Расчетные величины, необходимые для расчета индекса корреляции и определения показателей аппроксимации.

№ хозяйства Доля трактористов-машинистов в общей численности работников, занятых в сельскохозяйственном производстве, % Валовый доход растениеводства, приходящийся на 100 га пашни, тыс.руб. Расчетные величины
  34,0426 48,2162 56,0644 168,159 61,594275 16,277 0,000350
  24,1935 46,3568 59,33458 219,84 168,422788 27,995 0,000046
  28,2486 47,4703 57,71201 188,06 104,892724 21,575 0,000161
  18,9850 40,5136 62,43557 427,257 480,572586 54,11 0,000021
  27,1845 100,7356 58,09095 1564,34 1818,5665 42,333 0,000128
  11,9266 59,4603 70,96019 2,97045 132,247518 19,34 0,001278
  19,5652 61,4004 62,00842 0,04692 0,36968473 0,9902 0,000009
  18,1208 49,7596 62,29053 134,305 109,877894 14,404 0,000016
  15,8228 99,1870 63,12251 130,512 178,567414 26,855 0,000050
  19,1781 72,7728 65,31423 1444,24 1147,36422 34,15 0,000228
  35,7143 47,1492 55,6884 196,97 72,9179421 18,111 0,000404
252,9819 673,0219 673,0218 4476,7086 4275,393542 276,14 0,002692
сред. знач. 22,9984 61,1838 - - - 25,104  

Индекс корреляции показывает, что между долей трактористов – машинистов в общей численности работников, занятых в сельскохозяйственном производстве, и валовым доходом растениеводства, приходящийся на 100 га пашни, слабая.

Коэффициент детерминации для нелинейных функций рассчитывается по формуле:

Следовательно, вариация валового дохода растениеводства, приходящийся на 100 га пашни, на 4,4969% объясняется вариацией доли трактористов – машинистов в общей численности работников, занятых в сельскохозяйственном производстве, а остальные 95,503% вариации валового дохода растениеводства, приходящийся на 100 га пашни, обусловлены изменением других, не учтенных в модели факторов.

Оценим модель через среднюю ошибку аппроксимации:

Средняя ошибка аппроксимации равна 25,1%, т.е. в среднем расчетные значения валового дохода растениеводства, приходящийся на 100 га пашни, отличаются от фактических на 25,104%, что не входит в допустимый предел.

Оценим модель через F-критерий Фишера. F-критерий Фишера необходим для проверки нулевой гипотезы о статистической незначимости уравнения регрессии и показателя тесноты связи.

Выдвинем H0 о статистической незначимости полученного уравнения регрессии и показателя тесноты связи.

Сравним фактическое значение F-критерия с табличным. Для этого выпишем из таблицы «Значения F-Фишера при уровне значимости α=0,05» табличное значение.

Так как Fфакт<Fтабл,то при заданном уровне вероятности α=0,05 следует принять нулевую гипотезу о статистической незначимости уравнения регрессии и показателя тесноты связи.

Для оценки статистической значимости коэффициентов регрессии и корреляции рассчитывается t-критерий Стьюдента.

Вероятностная оценка параметров корреляции производится по общим правилам проверки статистических гипотез, разработанным математической статистикой, в частности путем сравнения оцениваемой величины со средней случайной ошибкой оценки:

; ;

Случайные ошибки параметров линейной регрессии и коэффициента корреляции определяются по формулам:

;

Выдвинем нулевую гипотезу о незначимости коэффициентов корреляции и регрессии.

Рассчитаем случайные ошибки параметров линейной регрессии и коэффициента корреляции:

tтабл при уровне значимости α=0,05 и числе степеней свободы, равном 9, равно 2,2281.

Так как | tb| <tтабл и tr <tтабл, следовательно, Н0 о незначимости коэффициентов корреляции и регрессии подтверждается.

Взаимосвязь между t-статистикой и F-статистикой:

;

 

Степенная модель.

Уравнение степенной модели имеет вид:

Для нашего примера:

Y – Валовый доход растениеводства, приходящийся на 100 га пашни, тыс. руб. (результативный признак);

Х – Доля трактористов – машинистов в общей численности работников, занятых в сельскохозяйственном производстве, % (факторный признак).

Данная функция нелинейна относительно параметров, но линейна по переменным. Прежде, чем проводить анализ необходимо перейти от нелинейной формы к линейной. В нелинейных регрессиях относительно параметров процедура лианеризации (аноморфоза) производится путем логарифмирования обеих частей уравнения:

Введем замену:

Вновь полученное уравнение будет иметь вид:

Таблица 9. Расчетные величины, необходимые для определения параметров уравнения

№ хозяйства Доля трактористов-машинистов в общей численности работников, занятых в сельскохозяйственном производстве, % X Валовый доход растениеводства, приходящийся на 100 га пашни, тыс.руб. Y
  34,0426 48,2162 1,532023 1,683193 2,347094 2,833139 2,57869
  24,1935 46,3568 1,383699 1,666113 1,914622 2,775934 2,305399
  28,2486 47,4703 1,450997 1,676422 2,105392 2,810391 2,432483
  18,9850 40,5136 1,278411 1,607601 1,634334 2,58438 2,055174
  27,1845 100,7356 1,434321 2,003183 2,057278 4,012742 2,873208
  11,9266 59,4603 1,076517 1,774227 1,158888 3,147882 1,909985
  19,5652 61,4004 1,291484 1,788171 1,667932 3,197556 2,309395
  18,1208 49,7596 1,282806 1,861969 1,64559 3,466929 2,388544
  15,8228 99,1870 1,258177 1,696877 1,58301 2,879391 2,134972
  19,1781 72,7728 1,199283 1,996455 1,438281 3,985832 2,394315
  35,7143 47,1492 1,552842 1,673474 2,411319 2,800516 2,598641
252,9819 673,0219 14,7406 19,4277 19,9637 34,4947 25,9808
сред.знач. 22,9984 61,1838 1,34005 1,76615 1,81489 3,13588 2,36189
Среднее квадратич отклонение 7,2018853 20,173584          

Найдем среднее квадратическое отклонение по L:

Для расчета параметров уравнения регрессии воспользуемся готовыми формулами:

Уравнение принимает вид:

Проведем потенцирование полученного уравнения:

A=Lg a = 2.1051

a= 102.1051

b= -0.25295

lgY = 102.1051*(-0.25295)lgX

Y=127.3836*X-0.25295

 

Рис. 4. Влияние доли трактористов – машинистов в общей численности работников, занятых в сельскохозяйственном производстве, на валовый доход растениеводства, приходящийся на 100 га пашни.

Коэффициент эластичности рассчитывается по формуле:

В нашем случае

И формула коэффициента эластичности парной линейной регрессии принимает вид:

С увеличением доли трактористов – машинистов в общей численности работников, занятых в сельскохозяйственном производстве, на 1 % валовый доход растениеводства, приходящийся на 100 га пашни, уменьшается в среднем на 0,2617%.

Для нелинейной парной корреляции рассчитывается индекс корреляции:

Для расчета индекса корреляции выполним вспомогательные расчеты (таблица 10).

Таблица 10. Расчетные величины, необходимые для расчета индекса корреляции и определения показателей аппроксимации

 

№ хозяйства Доля тракторис-тов-машинистов в общей численности работников, занятых в сельскохозяйственном производстве, % Валовый доход растениеводства, приходящийся на 100 га пашни, тыс.руб. Расчетные величины
  34,0426 48,2162 52,190896 15,79820936 168,1586498 8,243486908 1,717595 0,0012 0,036853
  24,1935 46,3568 56,900057 111,1602591 219,839929 22,74371089 1,755113 0,0079 0,001905
  28,2486 47,4703 54,71292 52,45554041 188,0600823 15,2571602 1,73809 0,0038 0,012309
  18,9850 40,5136 60,498539 399,3977771 427,257168 49,32896301 1,781745 0,0303 0,0038
  27,1845 100,7356 55,246899 2069,221877 1564,344883 45,15652912 1,742308 0,0681 0,008887
  11,9266 59,4603 68,047648 73,74254765 2,97045225 14,44215403 1,832813 0,0034 0,06945
  19,5652 61,4004 60,039622 1,85171669 0,04691556 2,216236331 1,778438 0,0001 0,002359
  18,1208 49,7596 60,343875 154,4781809 134,304921 17,0790806 1,780633 0,0066 0,003277
  15,8228 99,1870 61,215697 131,2421549 130,5123456 23,02288773 1,786863 0,0081 0,006703
  19,1781 72,7728 63,351922 1284,152795 1444,24321 36,1288049 1,80176 0,0379 0,019816
  35,7143 47,1492 51,561859 19,47156064 196,9699972 9,358926842 1,712329 0,0015 0,04528
252,9819 673,0219 644,1099 4312,97262 4476,708554 242,97794 19,4277 0,1689 0,21064
сред. знач. 22,9984 61,1838 - - - 22,0889      

Индекс корреляции показывает, что между долей трактористов – машинистов в общей численности работников, занятых в сельскохозяйственном производстве, и валовым доходом растениеводства, приходящийся на 100 га пашни, слабая.

Коэффициент детерминации для нелинейных функций рассчитывается по формуле:

Следовательно, вариация валового дохода растениеводства, приходящийся на 100 га пашни, на 3,6575% объясняется вариацией доли трактористов – машинистов в общей численности работников, занятых в сельскохозяйственном производстве, а остальные 96,3425% вариации валового дохода растениеводства, приходящийся на 100 га пашни, обусловлены изменением других, не учтенных в модели факторов.

Оценим модель через среднюю ошибку аппроксимации:

Средняя ошибка аппроксимации равна 22,1%, т.е. в среднем расчетные значения валового дохода растениеводства, приходящийся на 100 га пашни, отличаются от фактических на 22,0889%, что не входит в допустимый предел. Данная модель имеет наименьшую ошибку аппроксимации.

Оценим модель через F-критерий Фишера. F-критерий Фишера необходим для проверки нулевой гипотезы о статистической незначимости уравнения регрессии и показателя тесноты связи.

Выдвинем H0 о статистической незначимости полученного уравнения регрессии и показателя тесноты связи.

Сравним фактическое значение F-критерия с табличным. Для этого выпишем из таблицы «Значения F-Фишера при уровне значимости α=0,05» табличное значение.

Так как Fфакт<Fтабл,то при заданном уровне вероятности α=0,05 следует принять нулевую гипотезу о статистической незначимости уравнения регрессии и показателя тесноты связи.

Для оценки статистической значимости коэффициентов регрессии и корреляции рассчитывается t-критерий Стьюдента.

Вероятностная оценка параметров корреляции производится по общим правилам проверки статистических гипотез, разработанным математической статистикой, в частности путем сравнения оцениваемой величины со средней случайной ошибкой оценки:

; ;

Случайные ошибки параметров линейной регрессии и коэффициента корреляции определяются по формулам:

;

Выдвинем нулевую гипотезу о незначимости коэффициентов корреляции и регрессии.

Рассчитаем случайные ошибки параметров линейной регрессии и коэффициента корреляции:

tтабл при уровне значимости α=0,05 и числе степеней свободы, равном 9, равно 2,2622.

Так как | tb| <tтабл и tr <tтабл, следовательно, Н0 о незначимости коэффициентов корреляции и регрессии подтверждается.

Взаимосвязь между t-статистикой и F-статистикой:

;

 

8. прогноз значения результативного признака при прогнозном значении факторного, составляющем 125% от его среднего уровня (т.е. 125% от ).

В виду того, что все уравнения регрессии являются статистически незначимыми, рассчитывать прогнозируемое значение валового дохода растениеводства, приходящегося а 100 га пашни ни по одному из рассмотренных уравнений не имеет смысла, поскольку данный прогноз не даст достоверного результата.

Тем не менее, для закрепления методики расчета прогнозов, выполним расчет прогнозного значения результата по степенной модели, так как в данном случае средняя ошибка аппроксимации минимальна.

Расчет прогнозного значения будем производить по линейной модели, так как значение квадрата индекса корреляции (R2) для нее максимальное

№ п/п Модель Средняя ошибка аппроксимации R22)
  24,33 0,064
  25,104 0,045
  Y=127.3836*X-0.25295   22,0889 0,037

По условию задачи прогнозное значение фактора составляет 125% от его среднего уровня =22,9984:

=1,25∙22,9984=28,7479

и прогнозное значение среднедушевого прожиточного минимума в день при этом составит:

= 77,5426-0,7113*28,7479= 57,0942

Если доля машинистов-трактористов составит 125% от среднего уровня =22,9984, то валовой доход растениеводства, приходящийся на 100 га пашни составит 57,0942 тыс. руб.

Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал

Найдем ошибку прогноза:

=

= тыс.руб.

Далее строится доверительный интервал прогноза при уровне значимости g=0,05:

;

предельная ошибка прогноза, которая в 95% случаев не будет превышена, составит:

=2,2622∙25,7934=58,35

Доверительный интервал прогноза

Нижняя граница интервала:

57,0942-58,35=-1,2558

Верхняя граница интервала:

57,0942+58,35=115,4442

Доверительный интервал:

(-1,2558;115,4442)

Выполненный прогноз валового дохода растениеводства, приходящийся на 100 га пашни является неточным, так как в доверительный интервал входит 0.



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2021-01-23 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: