Построим поле корреляции по исходным данным




БУ Лашманова М.С РГР-1

АНАЛИТИЧЕСКАЯ ЗАПИСКА (РГР № 1)

 

Задание

 

1. Построить поле корреляции результата и фактора и сформулировать гипотезу о форме связи.

2. Рассчитать параметры уравнений линейной, степенной, экспоненциальной, полулогарифмической и гиперболической парной регрессии.

3. Оценить тесноту связи с помощью показателя корреляции и коэффициента детерминации.

4. Дать с помощью среднего (общего) коэффициента эластичности сравнительную оценку силы связи фактора с результатом.

5. Оценить с помощью средней ошибки аппроксимации качество уравнений.

6. Оценить с помощью критерия Фишера статистическую надежность результатов регрессионного моделирования.

7. Выбрать лучшее уравнение регрессии и дать его обоснование.

8. Для лучшего уравнения регрессии рассчитать прогнозное значение результата, если прогнозное значение фактора увеличиться на 10% от его среднего уровня. Определить доверительный интервал прогноза для уровня значимости .

9. Оценить полученные результаты, выводы оформить в аналитической записке.

Решение

 

Построим поле корреляции по исходным данным

Y X
  10,0 40,0
  12,2 23,0
  12,4 53,0
  13,5 57,0
  15,4 53,0
  15,3 51,0
  10,5 29,0
  10,7 68,0
  14,6 65,0
  10,0 41,0
  12,5 28,0
  9,7 15,0
  13,2 46,0
  12,9 38,0
  11,0 19,0
  12,6 65,0
  15,0 40,0
  8,9 18,0
  12,0 19,0
  14,9 39,0
  9,1 10,0
  14,4 27,0
  10,9 39,0
  11,1 45,0
  11,4 26,0
  11,3 51,0
  15,0 41,0
  9,8 17,0
  15,2 46,0
  11,8 36,0
  14,4 56,0
  14,9 38,0
  12,7 32,0

Построив поле корреляции, можно выдвинуть гипотезу о том, что связь между фактором и результатом описывается линейной функцией.


2. Рассчитаем параметры уравнений:

а) линейной регрессии (y=a+bx)

· 0,06 9,96 0,48

· 0,23 0,24 12,26

· 31,49 0, 32 3,21

· 8,29 0,008

Все расчеты были произведены с помощью Excel:

Y X XY X2 Y^ (Y-Y^)2 (Y-Yср)2 abs(Y-Y^)/Y (X-Xср)2
  10,0 40,0 399,1995   12,42066 5,956888 5,893777 0,244557 2,204775
  12,2 23,0 281,3571   12,27224 0,001546 0,030548 0,003215  
  12,4 53,0 655,0744   12,53416 0,030368 0,002285 0,014099  
  13,5 57,0 767,1128   12,56908 0,790392 1,103386 0,06606  
  15,4 53,0 814,0744   12,53416 7,984787 8,715465 0,183968  
  15,3 51,0 780,7062   12,5167 7,791178 8,411549 0,182341  
  10,5 29,0 305,8296   12,32463 3,164044 3,466478 0,168671  
  10,7 68,0 727,3508   12,66512 3,876093 2,92876 0,184061  
  14,6 65,0 951,3025   12,63892 3,98601 4,96276 0,136416  
  10,0 41,0 410,5462   12,42939 5,83739 5,733032 0,241285  
  12,5 28,0 349,9573   12,31589 0,033336 0,008241 0,014608  
  9,7 15,0 144,838   12,2024 6,484818 7,572567 0,263729  
  13,2 46,0 605,7586   12,47304 0,48389 0,579073 0,052824  
  12,9 38,0 490,6082   12,4032 0,257598 0,253053 0,039312  
  11,0 19,0 208,5249   12,23732 1,593471 2,052643 0,115019  
  12,6 65,0 821,3025   12,63892 1,23E-05 0,051859 0,000277  
  15,0 40,0 599,1995   12,42066 6,550151 6,616675 0,17085  
  8,9 18,0 160,236   12,22859 11,06619 12,2899 0,37369  
  12,0 19,0 227,5249   12,23732 0,068816 0,187233 0,021906  
  14,9 39,0 582,8865   12,41193 6,420537 6,442006 0,169538  
  9,1 10,0 91,0849   12,15875 9,304062 10,88477 0,334881  
  14,4 27,0 390,1333   12,30716 4,589087 4,168467 0,148257  
  10,9 39,0 426,8865   12,41193 2,149514 2,13712 0,133944  
  11,1 45,0 501,2547   12,46431 1,756471 1,609608 0,11898  
  11,4 26,0 296,3592   12,29843 0,810006 1,01862 0,078959  
  11,3 51,0 576,7062   12,5167 1,461033 1,209412 0,106892  
  15,0 41,0 615,5462   12,42939 6,676699 6,789281 0,172109  
  9,8 17,0 167,0222   12,21986 5,736127 6,671163 0,243772  
  15,2 46,0 697,7586   12,47304 7,266378 7,622947 0,17771  
  11,8 36,0 426,159   12,38574 0,300291 0,324839 0,046292  
  14,4 56,0 808,3166   12,56035 3,511411 4,106813 0,129822  
  14,9 38,0 566,6082   12,4032 6,287764 6,265229 0,16817  
  12,7 32,0 405,7198   12,35082 0,107536 0,073466 0,025864  
сумма 409,5 1271,0 16252,9 56567,0 409,5 122,3 130,2 4,5 54969,2
ср.значен 12,4077 38,51515 492,5135 1714,152 12,4077 3,707088 3,94494 0,137336 1665,733

 

b 0,06   Sa 0,32  
a 9,96   Sb 0,008  
rxy 0,48   S2 3,21  
R2 0,23   F 9,53  
Э 0,24   ta 31,49  
A 12,26   tb 8,29  

 

ВЫВОД ИТОГОВ                
                 
Регрессионная статистика                
Множественный R 0,484889              
R-квадрат 0,235117              
Нормированный R-квадрат 0,210444              
Стандартная ошибка 1,79223              
Наблюдения                
                 
Дисперсионный анализ                
  df SS MS F Значимость F      
Регрессия   30,6083 30,6083 9,529098 0,004238      
Остаток   99,57473 3,212088          
Итого   130,183            
                 
  Коэффициенты Стандартная ошибка t-статистика P-Значение Нижние 95% Верхние 95% Нижние 95,0% Верхние 95,0%
Y-пересечение 9,965741 0,850364 11,71938 6,37E-13 8,231412 11,70007 8,231412 11,70007
Переменная X 1 0,063402 0,020539 3,086924 0,004238 0,021513 0,105292 0,021513 0,105292

 

 

УРАВНЕНИЕ ЛИНЕЙНОЙ РЕГРЕССИИ:

Выводы: Уравнение регрессии: , показывает, что с увеличением инвестиций в основной капитал на душу населения на 1 рубль, среднемесячная заработная плата повысится в среднем на0,06 %. Линейный коэффициента парной корреляции 0,48 означает, что связь между фактором и результатом прямая, тесная. Вариация результата на 23% () объясняется вариацией фактора x. Средняя ошибка аппроксимации показывает, что расчетные значения отклоняются от фактических на 12,26%. Полученный коэффициент эластичности 0,24, показывает, что при увеличении на 1% инвестиций в основной капитал, заработная плата увеличится в среднем на 0,24 %. Для оценки статистической значимости уравнения сравним полученное фактическое значение (F=9,53) с табличным (), так как полученное значение больше, то уравнение статистически значимо, также статистически значимы и коэффициенты регрессии, так как по абсолютному значению (31,49 и 8,29) они превышают табличное значение Стюдента ().

б) степенной регрессии

Логарифмируем уравнение и получим уравнение линейной регрессии: . Заменяя значения фактора и результата на логарифмированные, рассчитаем параметры: 0,20 1,79, отсюда 5,98. Уравнение регрессии примет вид:

.

Рассчитаем параметры качества уравнения регрессии:

Y X (X-Xср)2 lnY lnX Y^ (Y-Yср)2 X2
  10,0 40,0 2,204775 2,300582 3,688879 12,57651 5,893777 34,73661
  12,2 23,0   2,50413 3,135494 11,24895 0,030548 0,000933
  12,4 53,0   2,514457 3,970292 13,31059 0,002285 5,22E-06
  13,5 57,0   2,599583 4,043051 13,50727 1,103386 1,21746
  15,4 53,0   2,73176 3,970292 13,31059 8,715465 75,95933
  15,3 51,0   2,728373 3,931826 13,20778 8,411549 70,75416
  10,5 29,0   2,355732 3,367296 11,78707 3,466478 12,01647
  10,7 68,0   2,369901 4,219508 13,99639 2,92876 8,577636
  14,6 65,0   2,683445 4,174387 13,86966 4,96276 24,62899
  10,0 41,0   2,303916 3,713572 12,63927 5,733032 32,86766
  12,5 28,0   2,525607 3,332205 11,70398 0,008241 6,79E-05
  9,7 15,0   2,267566 2,70805 10,32024 7,572567 57,34377
  13,2 46,0   2,57784 3,828641 12,93588 0,579073 0,335325
  12,9 38,0   2,55806 3,637586 12,44714 0,253053 0,064036
  11,0 19,0   2,395619 2,944439 10,82394 2,052643 4,213344
  12,6 65,0   2,536504 4,174387 13,86966 0,051859 0,002689
  15,0 40,0   2,706715 3,688879 12,57651 6,616675 43,78039
  8,9 18,0   2,186276 2,890372 10,70661 12,2899 151,0417
  12,0 19,0   2,482821 2,944439 10,82394 0,187233 0,035056
  14,9 39,0   2,704431 3,663562 12,51249 6,442006 41,49944
  9,1 10,0   2,209207 2,302585 9,510247 10,88477 118,4782
  14,4 27,0   2,670651 3,295837 11,61849 4,168467 17,37611
  10,9 39,0   2,392957 3,663562 12,51249 2,13712 4,567283
  11,1 45,0   2,410452 3,806662 12,8787 1,609608 2,590836
  11,4 26,0   2,433476 3,258097 11,53043 1,01862 1,037587
  11,3 51,0   2,425507 3,931826 13,20778 1,209412 1,462678
  15,0 41,0   2,708938 3,713572 12,63927 6,789281 46,09433
  9,8 17,0   2,284914 2,833213 10,58395 6,671163 44,50441
  15,2 46,0   2,719232 3,828641 12,93588 7,622947 58,10932
  11,8 36,0   2,471294 3,583519 12,31221 0,324839 0,105521
  14,4 56,0   2,669602 4,025352 13,45916 4,106813 16,86591
  14,9 38,0   2,702082 3,637586 12,44714 6,265229 39,25309
  12,7 32,0   2,539927 3,465736 12,02331 0,073466 0,005397
сумма 409,5 1271,0 54969,2 82,7 117,4 405,8 130,2 909,5
ср.значен 12,4077 38,51515 1665,733 2,505199 3,556768 12,29799 3,94494 27,56139
b 0,20   Sa 0,82  
a 5,98   Sb 0,02  
rxy 0,54   S2 2,98  
R2 0,3   F 12,65  
Э 0,62   ta 7,3  
A 11,45   tb 10,2  

· 0,3 0,54

· 0,62

· 11,45

· 7,3 0,82 2,98

· 10,2 0,02

ВЫВОД ИТОГОВ                
                 
Регрессионная статистика                
Множественный R 0,571522              
R-квадрат 0,326637              
Нормированный R-квадрат 0,304916              
Стандартная ошибка 0,138055              
Наблюдения                
                 
Дисперсионный анализ                
  df SS MS F Значимость F      
Регрессия   0,286605 0,286605 15,03761 0,000512      
Остаток   0,590835 0,019059          
Итого   0,87744            
                 
  Коэффициенты Стандартная ошибка t-статистика P-Значение Нижние 95% Верхние 95% Нижние 95,0% Верхние 95,0%
Y-пересечение 1,788195 0,186453 9,590591 8,61E-11 1,407922 2,168469 1,407922 2,168469
Переменная X 1 0,201588 0,051985 3,877835 0,000512 0,095565 0,307612 0,095565 0,307612

Рассчитаем индекс корреляции, F критерий и коэффициент детерминации:

Выводы: Уравнение регрессии: . Индекс корреляции 0,54 означает, что связь между фактором и результатом прямая, сильная. Вариация результата на 33% () объясняется вариацией фактора x. Средняя ошибка аппроксимации показывает, что расчетные значения отклоняются от фактических на 109,41 %. Полученный коэффициент эластичности 0,62. Для оценки статистической значимости уравнения сравним полученное фактическое значение (F=12,65) с табличным (), так как полученное значение больше, то уравнение в целом статистически значимо, также статистически значим коэффициент регрессии b, так как по абсолютному значению он превышает табличное значение Стюдента (), а коэффициент a – статистически незначим.

В) Экспоненциальная регрессия: .

Прологарифмируем обе части уравнения: ; . Отсюда , . Уравнение регрессии примет вид:

.

 

Y X lnY Y^ abs(Y-Y^)/Y
  10,0 40,0 2,300582 1,00537206 0,899261
  12,2 23,0 2,50413 1,00537206 0,917814
  12,4 53,0 2,514457 1,00537206 0,918659
  13,5 57,0 2,599583 1,00537206 0,925296
  15,4 53,0 2,73176 1,00537206 0,934546
  15,3 51,0 2,728373 1,00537206 0,934324
  10,5 29,0 2,355732 1,00537206 0,904667
  10,7 68,0 2,369901 1,00537206 0,906008
  14,6 65,0 2,683445 1,00537206 0,931306
  10,0 41,0 2,303916 1,00537206 0,899597
  12,5 28,0 2,525607 1,00537206 0,91956
  9,7 15,0 2,267566 1,00537206 0,89588
  13,2 46,0 2,57784 1,00537206 0,923654
  12,9 38,0 2,55806 1,00537206 0,922129
  11,0 19,0 2,395619 1,00537206 0,908394
  12,6 65,0 2,536504 1,00537206 0,920432
  15,0 40,0 2,706715 1,00537206 0,932886
  8,9 18,0 2,186276 1,00537206 0,887062
  12,0 19,0 2,482821 1,00537206 0,916044
  14,9 39,0 2,704431 1,00537206 0,932732
  9,1 10,0 2,209207 1,00537206 0,889623
  14,4 27,0 2,670651 1,00537206 0,930421
  10,9 39,0 2,392957 1,00537206 0,90815
  11,1 45,0 2,410452 1,00537206 0,909743
  11,4 26,0 2,433476 1,00537206 0,911797
  11,3 51,0 2,425507 1,00537206 0,911092
  15,0 41,0 2,708938 1,00537206 0,933035
  9,8 17,0 2,284914 1,00537206 0,89767
  15,2 46,0 2,719232 1,00537206 0,93372
  11,8 36,0 2,471294 1,00537206 0,915071
  14,4 56,0 2,669602 1,00537206 0,930348
  14,9 38,0 2,702082 1,00537206 0,932574
  12,7 32,0 2,539927 1,00537206 0,920704
сумма 409,5 1271,0 82,7 33,2 30,3
ср.знач 12,4077 38,51515 2,505199 1,00537206 0,916794
b 0,005   F 10,28
a 2,30   ta 33,23
rxy 0,50   tb 3,21
R2 0,25   А 91,68
Э 0,21    
   
           

0,25 0,50 = 0,21

91,68

 

ВЫВОД ИТОГОВ                
                 
Регрессионная статистика                
Множественный R 0,499093              
R-квадрат 0,249094              
Нормированный R-квадрат 0,224871              
Стандартная ошибка 0,145788              
Наблюдения                
                 
Дисперсионный анализ                
  df SS MS F Значимость F      
Регрессия   0,218565 0,218565 10,28345 0,00311      
Остаток   0,658875 0,021254          
Итого   0,87744            
                 
  Коэффициенты Стандартная ошибка t-статистика P-Значение Нижние 95% Верхние 95% Нижние 95,0% Верхние 95,0%
Y-пересечение 2,298847 0,069172 33,23366 8,3E-26 2,157769 2,439925 2,157769 2,439925
Переменная X 1 0,005358 0,001671 3,206781 0,00311 0,00195 0,008765 0,00195 0,008765

Коэффициент эластичности: =0,005*1271,0=0,21

Выводы: Уравнение регрессии: Индекс корреляции 0,50 означает, что связь между фактором и результатом прямая, сильная. Вариация результата на 25,% () объясняется вариацией фактора x. Средняя ошибка аппроксимации показывает, что расчетные значения отклоняются от фактических на 91,8 %. Полученный коэффициент эластичности 0,21. Для оценки статистической значимости уравнения сравним полученное фактическое значение (F=10,28) с табличным (), так как полученное значение больше, то уравнение в целом статистически значимо, также статистически значим коэффициент регрессии b, так как по абсолютному значению он превышает табличное значение Стюдента (), а коэффициент a – статистически незначим.

 

Г) полулогарифмическая регрессия:

Y X LnX Y^ abs((Y-Y^)/Y)
  10,0 40,0 3,688879 12,72099 0,27465
  12,2 23,0 3,135494 11,40866 0,06738
  12,4 53,0 3,970292 13,38835 0,083209
  13,5 57,0 4,043051 13,5609 0,007637
  15,4 53,0 3,970292 13,38835 0,128356
  15,3 51,0 3,931826 13,29713 0,131359
  10,5 29,0 3,367296 11,95837 0,133941
  10,7 68,0 4,219508 13,97936 0,30693
  14,6 65,0 4,174387 13,87236 0,052138
  10,0 41,0 3,713572 12,77955 0,276255
  12,5 28,0 3,332205 11,87515 0,049872
  9,7 15,0 2,70805 10,395 0,076547
  13,2 46,0 3,828641 13,05243 0,008826
  12,9 38,0 3,637586 12,59935 0,024118
  11,0 19,0 2,944439 10,95558 0,001769
  12,6 65,0 4,174387 13,87236 0,097894
  15,0 40,0 3,688879 12,72099 0,150801
  8,9 18,0 2,890372 10,82736 0,216284
  12,0 19,0 2,944439 10,95558 0,085128
  14,9 39,0 3,663562 12,66095 0,152876
  9,1 10,0 2,302585 9,433452 0,035677
  14,4 27,0 3,295837 11,78891 0,184123
  10,9 39,0 3,663562 12,66095 0,156694
  11,1 45,0 3,806662 13,00031 0,167099
  11,4 26,0 3,258097 11,69941 0,026405
  11,3 51,0 3,931826 13,29713 0,175909
  15,0 41,0 3,713572 12,77955 0,148786
  9,8 17,0 2,833213 10,69182 0,088243
  15,2 46,0 3,828641 13,05243 0,139513
  11,8 36,0 3,583519 12,47114 0,053506
  14,4 56,0 4,025352 13,51893 0,063412
  14,9 38,0 3,637586 12,59935 0,155015
  12,7 32,0 3,465736 12,19182 0,038405
сумма 409,5 1271,0 117,4 409,5 3,8
ср.значение 12,4077 38,51515 3,556768 12,4077 0,113902

 

b 2,37   F 13,58
a 3,97   ta 1,72
rxy 0,55   tb 3,68
R2 0,30   А 11,39
Э 2,28    

 

0,30 0,55 2,28

11,39

 

ВЫВОД ИТОГОВ                
                 
Регрессионная статистика                
Множественный R 0,551969              
R-квадрат 0,30467              
Нормированный R-квадрат 0,28224              
Стандартная ошибка 1,708803              
Наблюдения                
                 
Дисперсионный анализ                
  df SS MS F Значимость F      
Регрессия   39,66284 39,66284 13,58314 0,000868      
Остаток   90,52019 2,920006          
Итого   130,183            
                 
  Коэффициенты Стандартная ошибка t-статистика P-Значение Нижние 95% Верхние 95% Нижние 95,0% Верхние 95,0%
Y-пересечение 3,972962 2,307859 1,721493 0,095128 -0,73395 8,679871 -0,73395 8,679871
Переменная X 1 2,371461 0,643452 3,685531 0,000868 1,059133 3,683789 1,059133 3,683789

Выводы: Уравнение регрессии: . Индекс корреляции 0,55 означает, что связь между фактором и результатом прямая, сильная. Вариация результа



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2022-11-01 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: