Вопрос 4. Множественная корреляция.
При решении практических задач оказывается, что признак-результат у зависит сразу от нескольких факторов х (например, инфляция связана с динамикой потребительских цен, объемами экспорта и импорта, курсом $, количеством денег в обращении, объемом промышленного производства и др.).
Многофакторный корреляционно-регрессионный анализ решает следующие задачи: 1) обоснование взаимосвязи факторов, влияющих на исследуемый показатель; 2) определение степени влияния каждого фактора на признак-результат путем построения модели – уравнения множественной регрессии, которая позволяет установить, в каком направлении и на какую величину изменится признак-результат при изменении каждого фактора, входящего в модель; 3) количественная оценка тесноты связи между признаком-результатом и факторами.
Наиболее простыми для построения, анализа и экономической интерпретации являются многофакторные линейные модели, которые содержат независимые переменные только в первой степени:
у‾=а0+а1х1+а2х2+…+акхк,
где а0 – свободный член, а1, а2, …, ак – коэффициенты регрессии; х1, х2, …, хк – признаки-факторы.
Параметры уравнения множественной регрессии также рассчитываются методом наименьших квадратов (МНК), решается система нормальных уравнений с к+1 неизвестным:
а0n+а1∑хi1+ а2∑хi2 +…+ ак∑хiк=∑уi
а0∑хi1+ а1∑хi12+а2∑хi1∑хi2+…+ак∑хi1∑хiк=∑уiхi1
……
а0∑хiк+ а1∑хi1х iк+а2∑хi2∑хi2+…+ак∑хiк2=∑уiхiк,
где хij – значение j-го признака-фактора в i-ом наблюдении; уi – значение результативного признака в i-ом наблюдении (i=1,…,n).
Систему нормальных уравнений следует видоизменить, чтобы при вычислении параметров регрессии можно было использовать уже найденные парные коэффициенты корреляции. Заменим переменные у, х1, х2,…, хк переменными tj, полученными следующим образом:
tjу=(уi – у‾)/σу; tjj=(хij – хj‾)/σxj (i=1,…n; j=1,…,k).
Эта процедура называется стандартизацией переменных. При переходе к стандартизированному масштабу переменных уравнение множественной регрессии имеет вид:
tу=β1t1+ β2t2+…+ βкtк, где
βj (j=1,…, к) – коэффициент регрессии.
β – стандартизированные коэффициенты множественной корреляции. Β показывает, на какую часть сигмы (σу) изменилось бы значение результата, если бы соответствующий j-тый фактор изменился на сигму (σхj), а прочие факторы не изменились бы.
аj= βjσу/ σxj (j=1,…,k).
Для вычисления βj используется МНК.
rух1= β1+ rх1х2β2+…+ rх1хкβк
rух2= rх1х2β1+ β2+…+ rх2хкβк
…
rухк= rх1хкβ1+ rх2хкβ2+…+ βк, где
rухj=1/n∑tiytij – парный коэффициент корреляции признака-результата у с j-тым фактором;
rxjxl=1/n∑tijtil – парный коэффициент корреляции j-го фактора с l-тым фактором.
После рассчитывается коэффициент детерминации R2 и совокупный коэффициент множественной корреляции R – общие показатели тесноты связи многих признаков.
R2=rух1β1+rух2β2+…+rухкβк
R=√R2 (0≤R≤1).
Если R стремится к 1, то моделируемая связь стремится к функциональной. Если парный коэффициент корреляции между двумя факторами больше 0,8, то это явление называется колленеарностью, а между несколькими факторами – мультиколленеарностью.
Далее определяются частные и совокупные коэффициенты эластичности:
Эj=∆Xј/X‾ј: ∆У/У‾=аj*X‾j/У‾,
где ∆Xј – среднее значение j-го признака-фактора; У‾ -- среднее значение результативного признака; аj – коэффициент регрессии при j-м признаке-факторе.
Этот показатель показывает, на сколько процентов следует ожидать изменения признака-результата при изменении фактора на 1% и неизменном значении других факторов.
∑ Эj=Эсовок – позволяет оценить эластичность в целом при совокупном изменении факторов.
Рассмотрим пример.
№ предприятия | Чистая прибыль, тыс.руб., У | Численность обслу-живаемого населения, млн.чел.,Х1 | Рентабельность, % Х2 |
4,9 | |||
5,1 | |||
6,5 | |||
3,7 | |||
4,0 | |||
2,5 |
у¯х=а0+а1х1+а2х2
Определяются у¯, х0, х1, х2 и их среднее квадратичное отклонения, а также коэффициенты корреляции rу1, rу2, rх1х2.
Построим расчетную таблицу для определения параметров уравнения регрессии.
У | Х1 | Х2 | Х12 | Х22 | Х1Х2 | УХ1 | УХ2 | У2 |
4,9 | 24,0 | |||||||
5,1 | 26,0 | |||||||
6,5 | 42,3 | |||||||
3,7 | 13,7 | |||||||
4,0 | 16,0 | |||||||
2,5 | 6,3 | |||||||
26,7 | 128,3 | |||||||
∑У | ∑Х1 | ∑Х2 | ∑Х12 | ∑Х22 | ∑Х1Х2 | ∑УХ1 | ∑УХ2 | ∑У2 |
х¯=∑х/n; σ2=х¯2 – (х¯)2; r=((ху¯) – х¯у¯)/σхσу
у¯=160 тыс.руб
х¯1=4,45 млн.чел.
х¯2=19,5 %.
σу=57,8 тыс.руб.
σх1=1,2513 млн.чел.
σх2=4,6458 %.
r у1=0,3392 rу2=0,5071 r12=0,5806
Корреляционная матрица:
У | Х1 | Х2 | |
У | 0,3392 | 0,5071 | |
Х1 | 0,3392 | -0,5806 | |
Х2 | 0,5071 | -0,5806 |
Составим систему нормальных уравнений в стандартизированном виде:
0,3392=β1 – 0,5806β2
0,5071=-0,5806 β1+β2
β1=0,9558
β2=1,062
tу=0,9558t1+1,062t2. (β2>β1) – фактор х2 больше влияет на у, чем фактор х1.
аj= βjσу/σхj
а0=у¯– а1х¯2 – а2х¯2.
Из уравнения у¯=а0+а1х¯1+а2х¯2.
а1= β1σу/σх1=0,9558*57,8/1,2513=44,15
а2= β2σу/σх2=1,062*57,8/4,6458=13,21
а0=у¯– а1х¯1 – а2х¯2=160 – 44,15*4,45 – 13,21*19,5=–294.
у¯х=-294+44,5х1+13,21х2 – уравнение регрессии.
Вывод: с ростом численности обслуживаемого населения на 1млн.чел. при исключении влияния другого фактора (рентабельности) чистая прибыль возрастает на 44,15 тыс.руб., а при неизменной численности населения с ростом рентабельности на 1% чистая прибыль повысится на 13,21 тыс.руб.
Коэффициент множественной корреляции:
R2= β1*rу1+ β2*rу2=0,9558*0,3392+1,062*0,5071=0,8627
R=√R2=√0,8627=0,929.
R2 и R близки к 1, следовательно, при построении двухфакторной модели учтены важные факторы увеличения прибыли.
σ¯ост=1 – R2=1 – 0,8627=0,1373.
Следовательно, на долю неучтенных факторов=13,73% дисперсии признака-результата.
Рассчитываем эластичность по каждому фактору и по их совокупности:
Э1=а1*х¯1/у¯=44,15*4,45/160=1,23.
Э2= а2*х¯2/у¯=13,21*19,5/160=1,61.
∑Эj=2,84.
Эластичность по каждому фактору и в целом по совокупности больше 1, следовательно, чистая прибыль увеличивается в большей степени, чем факторы. С увеличением каждого фактора на 1% следует ожидать увеличения чистой прибыли на 2,84%.
Контрольные вопросы
1.Что такое корреляционная зависимость и какие виды связей вам известны? Что такое «признак-фактор» и «признак-результат»?
2.Назовите основные этапы корреляционного анализа. Дайте содержание каждого этапа.
3.Как вы понимаете парную корреляцию и множественную корреляцию?
4.Как вы понимаете выражение «определить класс функций» применительно к анализу корреляционной связи между признаками?
5.Раскройте содержание теоремы сложения дисперсий. В чем заключается необходимость разложения общей дисперсии на среднюю внутригрупповую и межгрупповую дисперсии?
5.Какие показатели, характеризующие меру тесноты связи между признаками вам известны? Каким образом можно их рассчитать? Чем отличаются они друг от друга?
6. Как вы понимаете «выявление аналитической связи между признаками на основе метода наименьших квадратов»? Что для этого необходимо сделать?
7.С помощью какого коэффициента можно определить как тесноту связи между признаками, так и направление связи? Дайте описание его значений.
8. Что такое «множественная корреляция» и как можно решить задачу анализа влияния множества факторов на признак-результат?
9.Что показывают показатели: коэффициент множественной корреляции и коэффициент эластичности?