Тема: Статистические методы анализа взаимосвязи




Вопрос 4. Множественная корреляция.

При решении практических задач оказывается, что признак-результат у зависит сразу от нескольких факторов х (например, инфляция связана с динамикой потребительских цен, объемами экспорта и импорта, курсом $, количеством денег в обращении, объемом промышленного производства и др.).

Многофакторный корреляционно-регрессионный анализ решает следующие задачи: 1) обоснование взаимосвязи факторов, влияющих на исследуемый показатель; 2) определение степени влияния каждого фактора на признак-результат путем построения модели – уравнения множественной регрессии, которая позволяет установить, в каком направлении и на какую величину изменится признак-результат при изменении каждого фактора, входящего в модель; 3) количественная оценка тесноты связи между признаком-результатом и факторами.

Наиболее простыми для построения, анализа и экономической интерпретации являются многофакторные линейные модели, которые содержат независимые переменные только в первой степени:

у‾=а01х12х2+…+акхк,

где а0 – свободный член, а1, а2, …, ак – коэффициенты регрессии; х1, х2, …, хк – признаки-факторы.

Параметры уравнения множественной регрессии также рассчитываются методом наименьших квадратов (МНК), решается система нормальных уравнений с к+1 неизвестным:

а0n+а1∑хi1+ а2∑хi2 +…+ ак∑х=∑уi

а0∑хi1+ а1∑хi122∑хi1∑хi2+…+ак∑хi1∑х=∑уiхi1

……

а0∑х+ а1∑хi1х2∑хi2∑хi2+…+ак∑х2=∑уiх,

где хij – значение j-го признака-фактора в i-ом наблюдении; уi – значение результативного признака в i-ом наблюдении (i=1,…,n).

Систему нормальных уравнений следует видоизменить, чтобы при вычислении параметров регрессии можно было использовать уже найденные парные коэффициенты корреляции. Заменим переменные у, х1, х2,…, хк переменными tj, полученными следующим образом:

t=(уi – у‾)/σу; tjj=(хij – хj‾)/σxj (i=1,…n; j=1,…,k).

Эта процедура называется стандартизацией переменных. При переходе к стандартизированному масштабу переменных уравнение множественной регрессии имеет вид:

tу1t1+ β2t2+…+ βкtк, где

βj (j=1,…, к) – коэффициент регрессии.

β – стандартизированные коэффициенты множественной корреляции. Β показывает, на какую часть сигмы (σу) изменилось бы значение результата, если бы соответствующий j-тый фактор изменился на сигму (σхj), а прочие факторы не изменились бы.

аj= βjσу/ σxj (j=1,…,k).

Для вычисления βj используется МНК.

rух1= β1+ rх1х2β2+…+ rх1хкβк

rух2= rх1х2β1+ β2+…+ rх2хкβк

rухк= rх1хкβ1+ rх2хкβ2+…+ βк, где

rухj=1/n∑tiytij – парный коэффициент корреляции признака-результата у с j-тым фактором;

rxjxl=1/n∑tijtil – парный коэффициент корреляции j-го фактора с l-тым фактором.

После рассчитывается коэффициент детерминации R2 и совокупный коэффициент множественной корреляции R – общие показатели тесноты связи многих признаков.

R2=rух1β1+rух2β2+…+rухкβк

R=√R2 (0≤R≤1).

Если R стремится к 1, то моделируемая связь стремится к функциональной. Если парный коэффициент корреляции между двумя факторами больше 0,8, то это явление называется колленеарностью, а между несколькими факторами – мультиколленеарностью.

Далее определяются частные и совокупные коэффициенты эластичности:

Эj=∆Xј/X‾ј: ∆У/У‾=аj*X‾j/У‾,

где ∆Xј – среднее значение j-го признака-фактора; У‾ -- среднее значение результативного признака; аj – коэффициент регрессии при j-м признаке-факторе.

Этот показатель показывает, на сколько процентов следует ожидать изменения признака-результата при изменении фактора на 1% и неизменном значении других факторов.

∑ Эjсовок – позволяет оценить эластичность в целом при совокупном изменении факторов.

Рассмотрим пример.

№ предприятия Чистая прибыль, тыс.руб., У Численность обслу-живаемого населения, млн.чел.,Х1 Рентабельность, % Х2
       
    4,9  
    5,1  
    6,5  
    3,7  
    4,0  
    2,5  

у¯х01х12х2

Определяются у¯, х0, х1, х2 и их среднее квадратичное отклонения, а также коэффициенты корреляции rу1, rу2, rх1х2.

Построим расчетную таблицу для определения параметров уравнения регрессии.

У Х1 Х2 Х12 Х22 Х1Х2 УХ1 УХ2 У2
  4,9   24,0          
  5,1   26,0          
  6,5   42,3          
  3,7   13,7          
  4,0   16,0          
  2,5   6,3          
  26,7   128,3          
∑У ∑Х1 ∑Х2 ∑Х12 ∑Х22 ∑Х1Х2 ∑УХ1 ∑УХ2 ∑У2

х¯=∑х/n; σ2=х¯2 – (х¯)2; r=((ху¯) – х¯у¯)/σхσу

у¯=160 тыс.руб

х¯1=4,45 млн.чел.

х¯2=19,5 %.

σу=57,8 тыс.руб.

σх1=1,2513 млн.чел.

σх2=4,6458 %.

r у1=0,3392 rу2=0,5071 r12=0,5806

 

Корреляционная матрица:

  У Х1 Х2
У   0,3392 0,5071
Х1 0,3392   -0,5806
Х2 0,5071 -0,5806  

Составим систему нормальных уравнений в стандартизированном виде:

0,3392=β1 – 0,5806β2

0,5071=-0,5806 β12

β1=0,9558

β2=1,062

tу=0,9558t1+1,062t2. (β21) – фактор х2 больше влияет на у, чем фактор х1.

аj= βjσухj

а0=у¯– а1х¯2 – а2х¯2.

Из уравнения у¯=а01х¯12х¯2.

а1= β1σух1=0,9558*57,8/1,2513=44,15

а2= β2σух2=1,062*57,8/4,6458=13,21

а0=у¯– а1х¯1 – а2х¯2=160 – 44,15*4,45 – 13,21*19,5=–294.

у¯х=-294+44,5х1+13,21х2 – уравнение регрессии.

Вывод: с ростом численности обслуживаемого населения на 1млн.чел. при исключении влияния другого фактора (рентабельности) чистая прибыль возрастает на 44,15 тыс.руб., а при неизменной численности населения с ростом рентабельности на 1% чистая прибыль повысится на 13,21 тыс.руб.

Коэффициент множественной корреляции:

R2= β1*rу1+ β2*rу2=0,9558*0,3392+1,062*0,5071=0,8627

R=√R2=√0,8627=0,929.

R2 и R близки к 1, следовательно, при построении двухфакторной модели учтены важные факторы увеличения прибыли.

σ¯ост=1 – R2=1 – 0,8627=0,1373.

Следовательно, на долю неучтенных факторов=13,73% дисперсии признака-результата.

Рассчитываем эластичность по каждому фактору и по их совокупности:

Э11*х¯1/у¯=44,15*4,45/160=1,23.

Э2= а2*х¯2/у¯=13,21*19,5/160=1,61.

∑Эj=2,84.

Эластичность по каждому фактору и в целом по совокупности больше 1, следовательно, чистая прибыль увеличивается в большей степени, чем факторы. С увеличением каждого фактора на 1% следует ожидать увеличения чистой прибыли на 2,84%.

 

Контрольные вопросы

1.Что такое корреляционная зависимость и какие виды связей вам известны? Что такое «признак-фактор» и «признак-результат»?

2.Назовите основные этапы корреляционного анализа. Дайте содержание каждого этапа.

3.Как вы понимаете парную корреляцию и множественную корреляцию?

4.Как вы понимаете выражение «определить класс функций» применительно к анализу корреляционной связи между признаками?

5.Раскройте содержание теоремы сложения дисперсий. В чем заключается необходимость разложения общей дисперсии на среднюю внутригрупповую и межгрупповую дисперсии?

5.Какие показатели, характеризующие меру тесноты связи между признаками вам известны? Каким образом можно их рассчитать? Чем отличаются они друг от друга?

6. Как вы понимаете «выявление аналитической связи между признаками на основе метода наименьших квадратов»? Что для этого необходимо сделать?

7.С помощью какого коэффициента можно определить как тесноту связи между признаками, так и направление связи? Дайте описание его значений.

8. Что такое «множественная корреляция» и как можно решить задачу анализа влияния множества факторов на признак-результат?

9.Что показывают показатели: коэффициент множественной корреляции и коэффициент эластичности?

 



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2017-12-29 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: