Лабораторная работа №5. Линейный регрессионный анализ.




Постановка задачи и алгоритм ее решения.

Заданы значения переменных x, y, z, и где y и z – исследуемые параметр системы, а x - независимая переменная (время в месяцах, x =1,2,...,12). Необходимо проверить возможность линейных зависимостей y и z от х, оценить их параметры и осуществить прогноз изменения параметров y и z на год вперед.

Зависимости между параметрами системы будут представлены в виде:

Они называются уравнениями линейной регрессии, а коэффициенты a, b, c. d – их параметрами.

Значения параметров b и d могут быть определены следующим образом:

 

где n = 12 – количество данных;

xcp, ycp, zcp - среднеарифметические значения переменных соответственно (могут быть рассчитаны с использованием стандартных функций Excel или MathCad);

; ;

Уравнения линейной регрессии– это уравнения прямых, которые проходят через точки с координатами, xcp, ycp и xcp,, zcp, следовательно, значения коэффициентов а и с этих уравнений можно определить следующим образом:

Поскольку фактические значения у, z отклоняются от прямых, определяемых уравнениями линейной регрессии, необходимо оценить степень тесноты связи между исследуемыми переменными, для чего вычисляются значения коэффициентов корреляции:

Величина r находится между минус 1 и плюс 1. Чем выше абсолютное значение r, тем теснее связь между переменными, и тем с большим основанием уравнение линейной регрессии может быть использовано для прогнозирования. При решени практических задач часто принимается, что значение подтверждает достаточную тесноту связи между переменными, однако в рамках данной работы полученное меньшее значение коэффициента корреляции не является основанием для прекращения выполнения дальнейших расчетов.

Далее необходимо ответить на вопрос, существенно ли коэффициенты корреляции отличаются от 0, или их отличие от нуля случайно. Для этого необходимо вычислить величины tx,y и tx,z:

;

Величины t здесь следуют распределению Стьюдента, поэтому можно считать, что коэффициенты корреляции существенно отличаются от нуля при выполнении условий

;

где значение tα,k может быть определено с использованием стандартной функции Excel;

k=n-2 – количество степеней свободы;

значение вероятности α выбирается из диапазона 0,9; 0,95; 0,99.

Далее, с использованием уравнений линейной регрессии,выполняется прогнозирование изменения переменных у, z для чего рассчитываются их значения, соответствующие значениям х=18 и х=24. Завершается расчет определением доверительных границ для переменных у, z, которые определяются уравнениями:

ymin=yp-Δy;

ymax=yp+Δy;

Δy= tα,k sy; Δz= tα,k sz

sy= ; sz =

, - - дисперсии значений зависимых переменных, в случае их определения по уравнениям линейной регрессии;

;

;

урi, – значения переменных, вычисленные по уравнениям линейной регрессии.

Работа выполняется в среде Excel или MathCad.

Исходные данные приведены ниже.


 

Задания

 

Вариант        
х у z у z у z у z
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
Вариант        
х у z у z у z у z
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
Вариант        
х у z у z у z у z
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 

 


 

 

Вариант        
х у z у z у z у z
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
Вариант        
х у z у z у z у z
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 

 


 

 

Пример

Исходные данные     Расчет параметров уравнений линейной регрессии  
x у z   х-хср у-уср z-zcp (х-хср)^2 (х-хср)(у-уср) (х-хср)(z-zср)
        -5,50 -96,67 -137,00 30,25 531,67 753,5
        -4,50 -143,67 -44,00 20,25 646,50  
        -3,50 -12,67 -109,00 12,25 44,33 381,5
        -2,50 20,33 9,00 6,25 -50,83 -22,5
        -1,50 -55,67 -65,00 2,25 83,50 97,5
        -0,50 -42,67 -41,00 0,25 21,33 20,5
        0,50 68,33 -28,00 0,25 34,17 -14
        1,50 5,33 84,00 2,25 8,00  
        2,50 55,33 -25,00 6,25 138,33 -62,5
        3,50 16,33 109,00 12,25 57,17 381,5
        4,50 88,33 98,00 20,25 397,50  
        5,50 97,33 149,00 30,25 535,33 819,5
xcp ycp zcp       143,00 2447,00 3120,00
6,50 889,67 931,00              
      Параметры b d      
          17,11 21,82      
          a c      
          778,44 789,18      
    Расчет коэффициентов корреляции        
  xy x^2 y^2 xz z^2        
                   
                   
                   
                   
                   
                   
                   
                   
                   
                   
                   
                   
                 

 

  rx,y rx,z          
  0,911 0,917          
  tx,y tx,z          
  7,004 7,276          
  α k          
  0,9            
  t0,9;10 1,37          
  Вывод: значения коэффициентов корреляции,    
  достаточно велики и существенно отличаются от 0  
  Расчет значений переменных и доверительных границ  
x yp (y-yp)^2 sy^2 Δy ymin ymax  
  795,55 6,51 589,1 33,30 762,25 828,85  
  812,66 4443,98 456,8 29,33 783,33 841,99  
  829,78 2230,20 351,1 25,71 804,07 855,48  
  846,89 3983,26 271,7 22,62 824,27 869,51  
  864,00 899,93 218,8 20,30 843,70 884,30  
  881,11 1163,54 192,4 19,03 862,08 900,14  
  898,22 3573,34 192,4 19,03 879,19 917,26  
  915,33 413,49 218,8 20,30 895,04 935,63  
  932,45 157,59 271,7 22,62 909,83 955,07  
  949,56 1897,32 351,1 25,71 923,85 975,27  
  966,67 128,37 456,8 29,33 937,34 996,00  
  983,78 10,36 589,1 33,30 950,48 1017,09  
  18907,88          
  s1^2 1890,79          
x zp (z-zp)^2 sz^2 Δz zmin zmax  
  811,00 289,00 705,67 36,45 774,55 847,45  
  832,82 2935,67 547,27 32,10 800,72 864,92  
  854,64 1065,13 420,55 28,14 826,50 882,78  
  876,45 4038,02 325,51 24,76 851,70 901,21  
  898,27 1041,53 262,15 22,22 876,06 920,49  
  920,09 905,46 230,47 20,83 899,26 940,92  
  941,91 1513,92 230,47 20,83 921,08 962,74  
  963,73 2628,89 262,15 22,22 941,51 985,94  
  985,55 6327,48 325,51 24,76 960,79 1010,30  
  1007,36 1065,13 420,55 28,14 979,22 1035,50  
  1029,18 0,03 547,27 32,10 997,08 1061,28  
  1051,00 841,00 705,67 36,45 1014,55 1087,45  
  22651,27          
  s2^2 2265,13          
  Прогноз            
x yp sy^2 Δy ymin ymax    
  1086,45 1937,73 60,40 1026,05 1146,86    
  1189,12 7805,12 121,23 1067,90 1310,35    
               
x zp sz^2 Δz zmin zmax    
  1181,91 2321,36 66,11 1115,80 1248,02    
  1312,82 9350,38 132,69 1180,13 1445,50    

Графики

 

 

 



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2019-03-27 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: