Парная регрессия и корреляция




ЗАДАНИЕ 1. ПАРНАЯ РЕГРЕССИЯ И КОРРЕЛЯЦИЯ

 

Для группы предприятий заданы значения признаков.

Для пары признаков Y и X1.

1. Рассчитать параметры линейного уравнения регрессии .

. Оценить регрессионное уравнение через среднюю ошибку аппроксимации, F-критерий Фишера, t-критерий Стьюдента, построить уравнение на корреляционном поле.

. Найти коэффициент корреляции, коэффициент детерминации.

. Выполнить прогноз признака Y при прогнозном значении X1, составляющем 105% от среднего уровня, оценить точность прогноза по стандартной ошибке и доверительному интервалу.

. Определить с помощью коэффициентов эластичности силу влияния признака X1 на результирующий признак Y.

МНОЖЕСТВЕННАЯ РЕГРЕССИЯ

 

. Составить корреляционную матрицу, провести ее анализ.

. Найти коэффициенты множественной детерминации и корреляции, сделать вывод.

. Оставить в модели множественной регрессии две независимые переменные.

. Построить уравнение множественной регрессии по двум независимым переменным. Оценить точность модели. Проверить статистическую значимость уравнения множественной регрессии в целом. Найти коэффициенты множественной детерминации и корреляции.

. Построить частные уравнения множественной регрессии.

. Найти средние по совокупности и частные коэффициенты эластичности. Провести сравнительный анализ.

Результаты анализа оформить в виде аналитической записки.

Исходные данные. Вариант № 16

Y - рентабельность;

Х1 - премии и вознаграждения на одного работника;

Х2 - фондоотдача;

Х3 - оборачиваемость нормируемых оборотных средств;

Х4 - оборачиваемость ненормируемых оборотных средств;

Х5 - непроизводственные расходы.

 

№ предприятия Рентабельность Премии и вознаграждения на одного работника Фондоотдача Оборачиваемость нормируемых оборотных средств Оборачиваемость ненормируемых оборотных средств непроизводственные расходы
n Y X1 X2 X3 X4 X5
  13,26 1,23 1,45 166,32 10,08 17,72
  10,16 1,04 1,3 92,88 14,76 18,39
  13,72 1,8 1,37 158,04 6,48 26,46
  12,85 0,43 1,65 93,96 21,96 22,37
  10,63 0,88 1,91 173,88 11,88 28,13
  9,12 0,57 1,68 162,3 12,6 17,55
  25,83 1,72 1,94 88,56 11,52 21,92
  23,39 1,7 1,89 101,16 8,28 19,52
  14,68 0,84 1,94 166,32 11,52 23,99
  10,05 0,6 2,06 140,76 32,4 21,76
  13,99 0,82 1,96 128,52 11,52 25,68
  9,68 0,84 1,02 177,84 17,28 18,13
  10,03 0,67 1,85 114,48 16,2 25,74
  9,13 1,04 0,88 93,24 13,32 21,21
  5,37 0,66 0,62 126,72 17,28 22,97
  9,86 0,86 1,09 91,8 9,72 16,38
  12,62 0,79 1,6 69,12 16,2 13,21
  5,02 0,34 1,53 66,24 24,84 14,48
  21,18 1,6 1,4 67,68 14,76 13,38
  25,17 1,46 2,22 50,4 7,56 13,69
  19,4 1,27 1,32 70,56 8,64 16,66
    1,58 1,48   8,64 15,06
  6,57 0,68 0,68 97,2   20,09
  14,19 0,86 2,3 80,28 14,76 15,98
  15,81 1,98 1,37 51,48 10,08 18,27
  5,23 0,33 1,51 105,12 14,76 14,42
  7,99 0,45 1,43 128,52 10,44 22,76
  17,5 0,74 1,82 94,68 14,76 15,41
  17,16 0,03 2,62 85,32 20,52 19,35
  14,54 0,99 1,75 76,32 14,4 16,83
  6,24 0,24 1,54   24,84 30,53
  12,08 0,57 2,25 107,64 11,16 17,98
  9,49 1,22 1,07 90,72 6,48 22,09
  9,28 0,68 1,44 82,44 9,72 18,29
  11,42   1,4 79,92 3,24 26,05
  10,31 0,81 1,31 120,96 6,48 26,2
  8,65 1,27 1,12 84,6 5,4 17,26
  10,94 1,14 1,16 85,32 6,12 18,83
  9,87 1,89 0,88 101,52 8,64 19,7
  6,14 0,67 1,07 107,64 11,88 16,87
  12,93 0,96 1,24 85,32 7,92 14,63
  9,78 0,67 1,49 131,76 10,08 22,17
  13,22 0,98 2,03 116,64 18,72 22,62
  17,29 1,16 1,84 138,24 13,68 26,44
  7,11 0,54 1,22 156,96 16,56 22,26
  22,49 1,23 1,72 137,52 14,76 19,13
  12,14 0,78 1,75 135,72 7,92 18,28
  15,25 1,16 1,46 155,52 18,36 28,23
  31,34 4,44 1,6 48,6 8,28 12,39
  11,56 1,06 1,47 42,84 14,04 11,64
  30,14 2,13 1,38 142,2 16,92 8,62
  19,71 1,21 1,41 145,8 11,16 20,1
  23,56 2,2 1,39 120,52 14,76 19,41

 

 

Парная регрессия и корреляция

 

1. Построим уравнение парной линейной регрессии вида для пары переменных y, x1.

Параметры b0 и b1 уравнения линейной регрессии рассчитываются методом наименьших квадратов путем решения системы нормальных уравнений:

 

 

Для нахождения параметров b0 и b1 используем ППП «Анализ данных» MS Excel. Результаты расчетов приведены в приложении 1.

Уравнение регрессии имеет вид:

 

(1)

 


Рис. 1. Линия регрессии на корреляционном поле

 

. Оценка уравнения регрессии через среднюю ошибку аппроксимации и F-критерий Фишера, t-критерий Стьюдента.

Средняя относительная ошибка аппроксимации определяется по формуле:

 

.

 

Для вычисления составлена расчетная таблица (см. приложение 2).

= 47,839%

Т.к. значение средней относительной ошибки аппроксимации для уравнения находятся в пределах от 20% до 50%, уравнение имеет удовлетворительную точность.

Исследование статистической значимости уравнения регрессии в целом проводится с помощью F-критерия Фишера. Выдвинем гипотезу Н0 о том, что уравнение в целом статистически незначимо, при конкурирующей гипотезе Н1: уравнение в целом статистически значимо. Расчетное значение критерия находится по формуле:

 

.

 

Для парного уравнения p = 1.

Табличное (теоретическое) значение критерия находится по таблице критических значений распределения Фишера-Снедекора (в работе использована функция FРACПОБР (0,05;1;51)) по уровню значимости α=0,05 и двум числам степеней свободы

 

k 1 = p = 1 и k 2 = n - p - 1 = 53 - 1 - 1 = 51.

.

Fрасч=54,73781 > Fтабл, (4)

 

гипотеза Н0 принимается, а уравнение линейной регрессии в целом считается статистически незначимо (с вероятностью ошибки 5%).

Проверка статистической значимости параметров b0, b1 с помощью t-критерия Стъюдента производится для статистически значимого линейного уравнения регрессии. В моём варианте уравнение линейной регрессии в целом статистически значимо. Проверим статистическую значимость оценок параметров b0, b1 с помощью t-критерия Стъюдента. Выдвигается гипотеза Н0: параметр bj = 0 (j = 0, 1) (статистически незначим, случайно отличается от 0), при конкурирующей гипотезе Н1: параметр bj ≠ 0 (статистически значим, неслучайно отличается от 0). Находится расчетное значение критерия


,

 

где средние квадратические ошибки параметров bj равны

 

,

.

 

Теоретическое значение критерия tтабл находится по таблице критических значений распределения Стъюдента (в работе использована функция СТЬЮДРACПОБР (0,05;51))по уровню значимости α=0,05 и числу степеней свободы k = n - p - 1. Если t bj > tтабл, то гипотеза Н 0 отвергается с вероятностью ошибки α, т.е. оценка коэффициента регрессии b j признается статистически значимой, в противном случае (t bj < tтабл) - незначимой.

Табличное значение критерия для уровня значимости α=0,05 и числа степеней свободы k = n - 2 = 51 равно.

Найдем доверительные интервалы для параметров b0 и b1 уравнения (1).

∆b0= tтабл·mb0=2,008·6,545=13,142;

∆b1 = tтабл·mb1 =2,008·6,702=13,458.

Сами доверительные интервалы имеют вид:

 

;

.

Результаты расчетов (см. приложения 1) приведены в таблице 1.

 

Таблица 1. Проверка критерия Стъюдента

  Уравнение регрессии
Параметр уравнения b j Среднеквадратическая ошибка параметра Расчетное значение критерия Табличное значение критерия tтабл Вывод о статистической значимостиГраницы доверительных интервалов        
          левая правая
b0=6,515 1,145 5,691 2,008 значим 4,217 8,814
b1=6,702 0,906 7,399   незначим 4,884 8,521

 

Доверительный интервал для параметра b1 имеет одинаковые знаки, что подтверждает вывод критерия Стьюдента о его статистической значимости.

. Коэффициент корреляции находится по формуле:

 

уравнение регрессия детерминация корреляция


Из таблицы «Вывод итогов» (см. приложение 1)

. Следовательно, между показателями y и x1 имеется линейная связь.

Коэффициент детерминации для пары признаков y и x1:

 

.

Т.е. всего 0,03% изменчивости y объясняется показателем x1, остальная доля приходятся на неучтённые в модели независимые переменные.

. Найдем прогнозное значение yпр путем подстановки значения x1пр в уравнение регрессии (105% от среднего уровня ср.Х1=1,0719)

xпр = 1,072*1,05 = 1,125

Стандартную ошибку прогноза найдем по формуле

 

 

= 7,16

Доверительный интервал прогнозного значения имеет вид

 

или (5,11; 23,007).

 

Результаты расчетов приведены в приложении 2.

. Определим с помощью коэффициентов эластичности силу влияния признаков xj на результирующий признак y.

Для парного линейного уравнения регрессии средний коэффициент эластичности находится по формуле:

 

 

Для признаков y и x1 уравнение регрессии имеет вид

,Х1ср=1,0719.

Фактор «Удельный вес покупных изделий» (X1) оказывает влияние на величину производительности труда (Y): при его росте на 1% рентабельность увеличивается в среднем на 0,509%.

Частные коэффициенты эластичности находятся по формулам

 

.

 

Расчеты эластичности приведены в итоговой таблице 2.

№ предприятия Х1 - премии и вознаграждения на одного работника Частный коэффициент эластичности Э1
  1,23 0,56
  1,04 0,52
  1,8 0,65
  0,43 0,31
  0,88 0,48
  0,57 0,37
  1,72 0,64
  1,7 0,64
  0,84 0,46
  0,6 0,38
  0,82 0,46
  0,84 0,46
  0,67 0,41
  1,04 0,52
  0,66 0,40
  0,86 0,47
  0,79 0,45
  0,34 0,26
  1,6 0,62
  1,46 0,60
  1,27 0,57
  1,58 0,62
  0,68 0,41
  0,86 0,47
  1,98 0,67
  0,33 0,25
  0,45 0,32
  0,74 0,43
  0,03 0,03
  0,99 0,50
  0,24 0,20
  0,57 0,37
  1,22 0,56
  0,68 0,41
    0,51
  0,81 0,45
  1,27 0,57
  1,14 0,54
  1,89 0,66
  0,67 0,41
  0,96 0,50
  0,67 0,41
  0,98 0,50
  1,16 0,54
  0,54 0,36
  1,23 0,56
  0,78 0,45
  1,16 0,54
  4,44 0,82
  1,06 0,52
  2,13 0,69
  1,21 0,55
  2,2 0,69
Средний коэффициент эластичности   0,49

Множественная регрессия

 

. Составить корреляционную матрицу, провести ее анализ. Исследовать интеркорреляцию переменных.

Элементами данной матрицы являются коэффициенты парной корреляции. Элементы, стоящие на главной диагонали, равны 1. Следовательно:

 

 

Элементы, стоящие симметрично относительно главной диагонали, равны.

 

 

Расчеты проводились с помощью ППП «Анализ данных» MS Excel. Корреляционная матрица имеет вид:

 

  Y X1 X2 X3 X4 X5
Y            
X1 0,719496          
X2 0,365277 -0,111446227        
X3 -0,202637 -0,259423713 -0,007311      
X4 -0,145227 -0,361135957 0,270123 0,2105495    
X5 -0,3297 -0,289296498 0,037362 0,548945 0,07286  

 

Анализ корреляционной матрицы показывает, что независимые переменные в основном слабо связаны между собой (коэффициенты межфакторной корреляции по абсолютному значению меньше 0,7), связь средней силы наблюдается только между факторами х3 и х5. С результативным показателем y сильная связь наблюдается только с фактором х1, с остальными факторами связь слабая.

. Найти коэффициенты множественной детерминации и корреляции, сделать вывод.

Коэффициент множественной детерминации найдем по формуле

 

.

 

Коэффициент множественной детерминации показывает, что изменение значений y на 74% объясняется признаками x1, x2, x3, x4, x5.

Коэффициент множественной корреляции равен:

 

 

Коэффициент множественной корреляции, равный 0,86, свидетельствует о том, что между y и факторами x1, x2, x3, x4, x5 существует сильная регрессионная связь.

. Оставить в модели множественной регрессии две независимые переменные.

Как показывает анализ корреляционной матрицы, факторы, за исключением х1, оказывают слабое влияние на результирующий фактор Y. Исходя из требования независимости переменных, мы оставляем в модели независимые переменные х1 и х2.

Таким образом, в уравнении множественной линейной регрессии остаются только две объясняющие переменные: х1 и х2.

. Построить уравнение множественной регрессии по двум независимым переменным. Оценить точность модели. Проверить статистическую значимость уравнения множественной регрессии в целом. Найти коэффициенты множественной детерминации и корреляции.

Уравнение множественной линейной регрессии по двум объясняющим переменным имеет вид

 

,

 

(см. приложение 3)

Средняя относительная ошибка аппроксимации равна

 

,

 

расчёты приведены в таблице (см. приложение 4).

Т.к. значение средней относительной ошибки аппроксимации для уравнения > 12%, уравнениe не даёт хорошую точность.

Коэффициент множественной детерминации равен

.

Коэффициент множественной детерминации показывает, что изменение значений Y на 71% объясняется признаками х1 и х2.

Коэффициент множественной корреляции будет равен:

 

 


Коэффициент множественной корреляции, равный 0.84, показывает, что связь между показателями сильная.

Исследуем статистическую значимость уравнения множественной регрессии в целом, используя F-критерий Фишера.

 

 

α=0,05

k1=m=2=n-m-1=50

Поскольку Fрасч>Fтабл, уравнение множественной регрессии в целом является статистически значимым.

. Построить частные уравнения множественной регрессии.

На основе линейного уравнения множественной регрессии

 

 

можно построить частные уравнения регрессии. Эти уравнения имеют вид

 

;

.

 

После приведения подобных уравнения принимают вид парных уравнений линейной регрессии

 


;

.

 

В нашем случае

Или

 

.

 

7. Найти средние по совокупности и частные коэффициенты эластичности. Провести сравнительный анализ.

Средние по совокупности коэффициенты эластичности находятся по формуле

 

, j = 1,2.

 

Частные коэффициенты эластичности равны

 

;

.

 

Результаты расчетов приведены в таблице 3.

 

Таблица 3

№ предприятия Y X1 X2 Yпр.x1x2 Yпр.x2x1 Эxi1 Эxi2
  13,26 1,23 1,45 14,83 13,17 0,59 0,77
  10,16 1,04 1,3 13,47 12,12 0,55 0,75
  13,72 1,8 1,37 18,92 12,61 0,68 0,76
  12,85 0,43 1,65 9,10 14,56 0,34 0,79
  10,63 0,88 1,91 12,32 16,37 0,51 0,81
  9,12 0,57 1,68 10,10 14,77 0,40 0,79
  25,83 1,72 1,94 18,35 16,58 0,67 0,81
  23,39 1,7 1,89 18,20 16,23 0,67 0,81
  14,68 0,84 1,94 12,04 16,58 0,50 0,81
  10,05 0,6 2,06 10,32 17,42 0,42 0,82
  13,99 0,82 1,96 11,89 16,72 0,49 0,82
  9,68 0,84 1,02 12,04 10,17 0,50 0,70
  10,03 0,67 1,85 10,82 15,96 0,44 0,81
  9,13 1,04 0,88 13,47 9,20 0,55 0,67
  5,37 0,66 0,62 10,75 7,39 0,44 0,58
  9,86 0,86 1,09 12,18 10,66 0,51 0,71
  12,62 0,79 1,6 11,68 14,21 0,49 0,78
  5,02 0,34 1,53 8,45 13,73 0,29 0,78
  21,18 1,6 1,4 17,49 12,82 0,66 0,76
  25,17 1,46 2,22 16,48 18,53 0,64 0,83
  19,4 1,27 1,32 15,12 12,26 0,60 0,75
    1,58 1,48 17,34 13,38 0,65 0,77
  6,57 0,68 0,68 10,89 7,81 0,45 0,61
  14,19 0,86 2,3 12,18 19,09 0,51 0,84
  15,81 1,98 1,37 20,21 12,61 0,70 0,76
  5,23 0,33 1,51 8,38 13,59 0,28 0,77
  7,99 0,45 1,43 9,24 13,03 0,35 0,76
  17,5 0,74 1,82 11,32 15,75 0,47 0,81
  17,16 0,03 2,62 6,23 21,32 0,03 0,86
  14,54 0,99 1,75 13,11 15,26 0,54 0,80
  6,24 0,24 1,54 7,73 13,80 0,22 0,78
  12,08 0,57 2,25 10,10 18,74 0,40 0,84
  9,49 1,22 1,07 14,76 10,52 0,59 0,71
  9,28 0,68 1,44 10,89 13,10 0,45 0,77
  11,42   1,4 13,18 12,82 0,54 0,76
  10,31 0,81 1,31 11,82 12,19 0,49 0,75
  8,65 1,27 1,12 15,12 10,87 0,60 0,72
  10,94 1,14 1,16 14,19 11,15 0,58 0,72
  9,87 1,89 0,88 19,57 9,20 0,69 0,67
  6,14 0,67 1,07 10,82 10,52 0,44 0,71
  12,93 0,96 1,24 12,90 11,71 0,53 0,74
  9,78 0,67 1,49 10,82 13,45 0,44 0,77
  13,22 0,98 2,03 13,04 17,21 0,54 0,82
  17,29 1,16 1,84 14,33 15,89 0,58 0,81
  7,11 0,54 1,22 9,89 11,57 0,39 0,73
  22,49 1,23 1,72 14,83 15,05 0,59 0,80
  12,14 0,78 1,75 11,61 15,26 0,48 0,80
  15,25 1,16 1,46 14,33 13,24 0,58 0,77
  31,34 4,44 1,6 37,85 14,21 0,84 0,78
  11,56 1,06 1,47 13,61 13,31 0,56 0,77
  30,14 2,13 1,38 21,29 12,68 0,72 0,76
  19,71 1,21 1,41 14,69 12,89 0,59 0,76
  23,56 2,2 1,39 21,79 12,75 0,72 0,76
Средние по совокупности коэффициенты эластичности           0,52 0,77

 

Расчёты по двум выбранным признакам показывают, что при изменении х1 на 1%, y, в среднем, изменяется на 0,52%, при изменении х2 на 1%, y, в среднем, изменяется на 0,77%.

 

 

Приложение 1

 

ВЫВОД ИТОГОВ            
             
Регрессионная статистика          
Множественный R 0,719496289          
R-квадрат 0,51767491          
Нормированный R-квадрат 0,508217555          
Стандартная ошибка 4,415816543          
Наблюдения            
             
Дисперсионный анализ          
  df SS MS F Значимость F  
Регрессия   1067,35646 1067,35646 54,73781266 1,27887E-09  
Остаток   994,4712227 19,49943574      
Итого   2061,827683        
             
  Коэффициенты Стандартная ошибка t-статистика P-Значение Нижние 95% Верхние 95%
Y-пересечение 6,515443991 1,144887287 5,690904304 6,22892E-07 4,216986902 8,81390108
X1 6,702190961 0,90588502 7,398500703 1,27887E-09 4,883550934 8,520830987

 


Приложение 2

 

Расчетная таблица

№ предприятия X1 Y Yпр. (Y-Yпр.) Abs((Y-Yпр.)/Y) (Y-Yпр.)2 (Xi -Xср.)2
  1,23 13,26 14,76 -1,50 0,11 2,25 0,025
  1,04 10,16 13,49 -3,33 0,33 11,06 0,001
  1,8 13,72 18,58 -4,86 0,35 23,61 0,530
  0,43 12,85 9,40 3,45 0,27 11,92 0,412
  0,88 10,63 12,41 -1,78 0,17 3,18 0,037
  0,57 9,12 10,34 -1,22 0,13 1,48 0,252
  1,72 25,83 18,04 7,79 0,30 60,63 0,420
  1,7 23,39 17,91 5,48 0,23 30,04 0,395
  0,84 14,68 12,15 2,53 0,17 6,42 0,054
  0,6 10,05 10,54 -0,49 0,05 0,24 0,223
  0,82 13,99 12,01 1,98 0,14 3,92 0,063
  0,84 9,68 12,15 -2,47 0,25 6,08 0,054
  0,67 10,03 11,01 -0,98 0,10 0,95 0,162
  1,04 9,13 13,49 -4,36 0,48 18,97 0,001
  0,66 5,37 10,94 -5,57 1,04 31,01 0,170
  0,86 9,86 12,28 -2,42 0,25 5,85 0,045
  0,79 12,62 11,81 0,81 0,06 0,66 0,079
  0,34 5,02 8,79 -3,77 0,75 14,24 0,536
  1,6 21,18 17,24 3,94 0,19 15,53 0,279
  1,46 25,17 16,30 8,87 0,35 78,67 0,151
  1,27 19,4 15,03 4,37 0,23 19,12 0,039
  1,58   17,10 3,90 0,19 15,17 0,258
  0,68 6,57 11,07 -4,50 0,69 20,28 0,154
  0,86 14,19 12,28 1,91 0,13 3,65 0,045
  1,98 15,81 19,79 -3,98 0,25 15,81 0,825
  0,33 5,23 8,73 -3,50 0,67 12,23 0,550
  0,45 7,99 9,53 -1,54 0,19 2,38 0,387
  0,74 17,5 11,48 6,02 0,34 36,30 0,110
  0,03 17,16 6,72 10,44 0,61 109,07 1,086
  0,99 14,54 13,15 1,39 0,10 1,93 0,007
  0,24 6,24 8,12 -1,88 0,30 3,55 0,692
  0,57 12,08 10,34 1,74 0,14 3,04 0,252
  1,22 9,49 14,69 -5,20 0,55 27,06 0,022
  0,68 9,28 11,07 -1,79 0,19 3,21 0,154
    11,42 13,22 -1,80 0,16 3,23 0,005
  0,81 10,31 11,94 -1,63 0,16 2,67 0,069
  1,27 8,65 15,03 -6,38 0,74 40,67 0,039
  1,14 10,94 14,16 -3,22 0,29 10,34 0,005
  1,89 9,87 19,18 -9,31 0,94 86,72 0,669
  0,67 6,14 11,01 -4,87 0,79 23,68 0,162
  0,96 12,93 12,95 -0,02 0,00 0,00 0,013
  0,67 9,78 11,01 -1,23 0,13 1,50 0,162
  0,98 13,22 13,08 0,14 0,01 0,02 0,008
  1,16 17,29 14,29 3,00 0,17 9,00 0,008
  0,54 7,11 10,13 -3,02 0,43 9,15 0,283
  1,23 22,49 14,76 7,73 0,34 59,77 0,025
  0,78 12,14 11,74 0,40 0,03 0,16 0,085
  1,16 15,25 14,29 0,96 0,06 0,92 0,008
  4,44 31,34 36,27 -4,93 0,16 24,34 11,344
  1,06 11,56 13,62 -2,06 0,18 4,24 0,000
 


Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2022-09-12 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: