Расчет теоретической линии регрессии




 

Теоретическая линия регрессии представляет собой такую математически правильную кривую (либо прямую) линию, которая проходит наиболее близко к точкам эмпирической линии регрессии выражает общую закономерность средних изменений признака в связи со средними изменениями фактора.

 

В нашем примере характер размещения точек на корреляционном поле делает весьма вероятной гипотезу о линейной связи y от x y = a 0 + a 1 x.

Параметры искомой прямой (ао1) находим из системы уравненной по способу наименьших квадратов:

ì na ¢ + a ¢S x ¢ = S y ¢    
í o       (5)  
S x ¢ + a ¢S(x ¢)2    
ï a ¢ = S y ¢ x ¢    
î o       i    

 

Исходную информацию для решения системы(5) получаем из таблицы 11, которая основана на результатах таблицы 10.

 

Для получения упрощенных вариантов по факторному признаку также используем метод отсчета от условного нуля. В нашем примере примем cx =307

тыс.руб, ix =9 тыс.руб

 

Результатов расчетов по нашему примеру приведены в таблице11.

 

 


 

 

Расчет эмпирической линии регрессии для зависимости y от x

 

  y ¢           x           Численность рабочих, чел.        
                                           
                                             
    y                                        
о                                            
          16   16     16              
б                                    
                                 
ъ                                    
                                 
м                             13      
                  12                  
С                     11   11          
М               10                    
Р -1                     1-1 1-1          
  -2                       1-2          
тыс. -3                     1-3            
руб. -4                     2-8            
    Итого                          
          hi        
                                     
стро-   å     m y ¢             -12 -2          
            i i                          
                                           
ки                             3,5 -3 -0,67          
      y ¢        
                                         
                                  22,7          
          y        
                                             
                                             

 

              Расчет теоретической линии регрессии для зависимости y  
О               Численность рабочих, чел.            
б y ¢                                
  x ¢    
                                 
ъ   x ¢   -5 -4 -3 -2 -1             li  
       
                               
е       x                          
м   y        
                               
                                 
С                                
М                                
Р,                                
т                                
ы                                
с.                                
р -1                              
у -2                              
б -3                              
  -4                              
  Итого                         n=15  
    hi        
                                 
с   S hix ¢   -5   -6 -2 -2                
т        
                                 
р   S h x ¢2                          
о   i        
                                 
к   S m y ¢             -12 -2       -4    
    i i      
и   S m y ¢ x ¢ -30   -18 -4 -7   -2       -20    
    i i      
                                   


В качестве проверки правильного составление таблицы 6 должно соблюдаться равенство итогов четвертой строки и второго столбца. Если это условие не соблюдается, то в расчетах допущена ошибка, которая может привести к существенным искажениям величины параметров теоретической линии регрессии.

 

В систему уравнений (5) подставим результаты, полученные в табл. 6.

ì15 a ¢ - 5 a ¢ = 6    
í o   (6)  
-5 a ¢ + 81 a ¢ = -75  
î    
o      

 

В качестве метода решения системы (6) принимаем метод Гаусса, который позволяет находить решения последовательно, исключая неизвестные. Для этого 1-ое уравнение системы (6) делим на 5, а 2-ое уравнение -

 

на 81:

 

  ì3 a ¢ - a ¢ =1,2        
  í o     (7)      
  -0,062 a ¢ + a ¢ = -0,926      
  î        
    o          
Сложим уравнения системы (7):          
    2,938 a ¢ =0,274        
        o        
откуда   a ¢=0,093.        
    o          
Затем в 1-ое уравнение системы (7) подставляем значение a ¢ и находим  
            o  
величину a ¢:                
                 
      × 0,093- a ¢ =1,2        
                 

a 1¢=-0,921.

Параметры ao ¢ и a 1¢ необходимо преобразовать исходя из фактических

 

значений x и y.

Формулы перевода из упрощенных в реальные координаты:

  a = a ¢ ×   iy   (8)    
           
          i          
          x          
a = c + i a ¢ - a ¢ iy c (9)  
   
o y   y o     1 i x  
              x      

где iy - интервал группивровки по функции; ix -интервал группировки по аргументу; сy -новое начало отсчета по функции;

 

сx -новое начало отсчета по аргументу.

 

По формулам (8), (9) находим:

 

? 1= -0,2; a 0=86,9.


 

Уравнение теоретической линии регрессии в реальных коэффициентах имеет вид y=86,9-0,2x.

 

В уравнении регрессии первое слагаемое носит название свободного члена, второе слагаемое называется коэффициентом регрессии. Он показывает, на сколько натуральных единиц изменяется в среднем результативный признак при изменении факторного признака на единицу.

 

В нашем примере из уравнения теоретической линии регрессии видно, что объем СМР понижается на 0,2% при увеличении численности на 1%.

 

Объем СМР,не зависящий от рассматриваемых факторов, равен 86,9 тыс.руб.

 

Для графического изображения линии регрессии, рассчитанной по линейной гипотезе, достаточно определить две точки, через которые можно провести прямую.

 

В нашем примере по x1=302 тыс.руб; y1=26,5 и x2=347,5; y2=17,4 проводим на поле корреляции прямую линию.

 

Графическое изображение теоретической линии регрессии в виде уравнения прямой еще раз подтверждает наличие корреляционной связи между изучаемыми признаками.

 

Измерение тесноты связи

Коэффициент корреляции ry является одним из наиболее совершенных

x

 

методов измерения тесноты связи. Коэффициент корреляции отвечает на вопрос, в какой мере соблюдается строгая пропорциональность в изменениях функционального и факториального признаков.

 

Коэффициент корреляции может принимать как положительные, так и

отрицательные значения, т.е.

-1 £ r £1.

 

При выполнении корреляционных расчетов, когда связь между признаками x и y выражается прямой линией, соблюдается условие, при котором знак при коэффициенте корреляции ry должен совпадать со знаком при коэффициенте

x

регрессии а1.

 

Для расчета коэффициента корреляции существует формула, представленная в упрощенных координатах признаков x и y.

              &     &                    
ry =         n S x ¢ y ¢ - S x ¢S y ¢               . (7)  
                                   
    &   &       &   &      
x                      
          n S(x ¢)   - (S x ¢)     n S(y ¢)   - (S y ¢)          
В нашем примере исходную информацию для нахождения ry принимаем  
                                          x  
из таблицы 11.                                            
ry =         15 × (-75) + (-5) × 6       = -0,6. (8)  
                                 
                                 
    15 × 81 - 25 15 ×186 - 36  
x                
                                           


Выполненные расчеты показывают, что между объемом СМР и численностью рабочих существует отрицательная корреляция, которая говорит о том, что с увеличением факторного признака x функциональный признак y уменьшается.

 

Знак при коэффициенте корреляции совпадает со знаком регрессии a1, что свидетельствует о правильности произведенных вычислений. Случайные факторы оказывают большое влияние на функцию, так как r=-0,6, следовательно имеем по соотношению Чэддока заметную связь между изучаемыми явлениями.

 

Имеются и другие формулы линейного коэффициента корреляции, Линейный коэффициент корреляции r представляет собой среднюю

 

величину из произведений нормированных отклонений для x и у:

 

    æ         æ           ö                                    
                                                         
            ö                                                
        x - x ç y - y ÷                                    
                                           
    ç         ÷                                                
    åç         ÷           ÷                 å (x - x)(y - y)      
    è s x   ç s y , (9) или   . (10)  
      ø                  
r =             è           ø r =   ns s        
          n               y  
                                                 
                                                    x      
Числитель формулы Ошибка! Источник ссылки не найден., деленный на n,  
                                                       
т.е. å (x - x)(y - y)                                            
                                           
= (x - x)(y - y), представляет собой среднее произведение  
      n            
                                                             

 

отклонений значений двух признаков от их средних значений, именуемое ковариацией. Поэтому можно сказать,что линейный коэффициент корреляциипредставляет собой частное от деления ковариации между х и у на произведение их средних квадратических отклонений. Путем несложных математических преобразований можно получить и другие модификации формулы линейного коэффициента корреляции, например:

 

                   
r =   xy - x y . (11)

s xs y

 

Линейный коэффициент корреляции может принимать значения от –1 до +1, причем знак определяется в ходе решения. Например, если xy > x y, то r по формуле Ошибка! Источник ссылки не найден. будет положительным, что характеризует прямую зависимость между х и у, в противном случае (r< 0) – обратную связь. Если xy = x y, то r= 0, что означает отсутствие линейной зависимости между х и у, а при r= 1 – функциональная зависимость между х и у. Следовательно, всякое промежуточное значение r от 0 до 1 характеризует степень приближения корреляционной связи между х и у к функциональной. Таким образом, коэффициент корреляции при линейной зависимости служит как мерой тесноты связи, так и показателем, характеризующим степень приближения корреляционной зависимости между х и у к линейной. Поэтому близость значения r к 0 в одних случаях может означать отсутствие связи между х и у, а в других свидетельствовать о том, что зависимость не линейная.

В нашей задаче для расчета r построить вспомогательную таблицу 12.


Таблица 12

 

. Вспомогательные расчеты линейного коэффициента корреляции

 

                                   
i xi yi (x - x)2 (y - y)2                 xy    
(x - x)(y - y)      
                                       
                                       

 

Пользуясь данными табл.12 рассчитать линейный коэффициент корреляции по формулам 10 и11.

 

 



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2016-04-27 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: