Тема: Статистические методы анализа взаимосвязи

Вопрос 4. Множественная корреляция.

При решении практических задач оказывается, что признак-результат у зависит сразу от нескольких факторов х (например, инфляция связана с динамикой потребительских цен, объемами экспорта и импорта, курсом $, количеством денег в обращении, объемом промышленного производства и др.).

Многофакторный корреляционно-регрессионный анализ решает следующие задачи: 1) обоснование взаимосвязи факторов, влияющих на исследуемый показатель; 2) определение степени влияния каждого фактора на признак-результат путем построения модели – уравнения множественной регрессии, которая позволяет установить, в каком направлении и на какую величину изменится признак-результат при изменении каждого фактора, входящего в модель; 3) количественная оценка тесноты связи между признаком-результатом и факторами.

Наиболее простыми для построения, анализа и экономической интерпретации являются многофакторные линейные модели, которые содержат независимые переменные только в первой степени:

у‾=а₀+а₁х₁+а₂х₂+…+а_кх_к,

где а₀ – свободный член, а₁, а₂, …, а_к – коэффициенты регрессии; х₁, х₂, …, х_к – признаки-факторы.

Параметры уравнения множественной регрессии также рассчитываются методом наименьших квадратов (МНК), решается система нормальных уравнений с к+1 неизвестным:

а₀n+а₁∑х_i1+ а₂∑х_i2 +…+ а_к∑х_iк=∑у_i

а₀∑х_i1+ а₁∑х_i1²+а₂∑х_i1∑х_i2+…+а_к∑х_i1∑х_iк=∑у_iх_i1

……

а₀∑х_iк+ а₁∑х_i1х_iк+а₂∑х_i2∑х_i2+…+а_к∑х_iк²=∑у_iх_iк,

где х_ij – значение j-го признака-фактора в i-ом наблюдении; у_i – значение результативного признака в i-ом наблюдении (i=1,…,n).

Систему нормальных уравнений следует видоизменить, чтобы при вычислении параметров регрессии можно было использовать уже найденные парные коэффициенты корреляции. Заменим переменные у, х₁, х₂,…, х_к переменными t_j, полученными следующим образом:

t_jу=(у_i – у‾)/σ_у; t_j_j=(х_ij – х_j‾)/σ_xj (i=1,…n; j=1,…,k).

Эта процедура называется стандартизацией переменных. При переходе к стандартизированному масштабу переменных уравнение множественной регрессии имеет вид:

t_у=β₁t₁+ β₂t₂+…+ β_кt_к, где

β_j (j=1,…, к) – коэффициент регрессии.

β – стандартизированные коэффициенты множественной корреляции. Β показывает, на какую часть сигмы (σ_у) изменилось бы значение результата, если бы соответствующий j-тый фактор изменился на сигму (σ_х_j), а прочие факторы не изменились бы.

а_j= β_jσ_у/ σ_xj (j=1,…,k).

Для вычисления β_j используется МНК.

r_ух1= β₁+ r_х1х2β₂+…+ r_х1хкβ_к

r_ух2= r_х1х2β₁+ β₂+…+ r_х2хкβ_к

…

r_ухк= r_х1хкβ₁+ r_х2хкβ₂+…+ β_к, где

r_ух_j=1/n∑t_iyt_ij – парный коэффициент корреляции признака-результата у с j-тым фактором;

r_xjxl=1/n∑t_ijt_il – парный коэффициент корреляции j-го фактора с l-тым фактором.

После рассчитывается коэффициент детерминации R² и совокупный коэффициент множественной корреляции R – общие показатели тесноты связи многих признаков.

R²=r_ух1β₁+r_ух2β₂+…+r_ухкβ_к

R=√R² (0≤R≤1).

Если R стремится к 1, то моделируемая связь стремится к функциональной. Если парный коэффициент корреляции между двумя факторами больше 0,8, то это явление называется колленеарностью, а между несколькими факторами – мультиколленеарностью.

Далее определяются частные и совокупные коэффициенты эластичности:

Э_j=∆X_ј/X‾_ј: ∆У/У‾=а_j*X‾_j/У‾,

где ∆X_ј – среднее значение j-го признака-фактора; У‾ -- среднее значение результативного признака; а_j – коэффициент регрессии при j-м признаке-факторе.

Этот показатель показывает, на сколько процентов следует ожидать изменения признака-результата при изменении фактора на 1% и неизменном значении других факторов.

∑ Э_j=Э_совок – позволяет оценить эластичность в целом при совокупном изменении факторов.

Рассмотрим пример.

№ предприятия	Чистая прибыль, тыс.руб., У	Численность обслу-живаемого населения, млн.чел.,Х₁	Рентабельность, % Х₂

		4,9
		5,1
		6,5
		3,7
		4,0
		2,5

у¯_х=а₀+а₁х₁+а₂х₂

Определяются у¯, х₀, х₁, х₂ и их среднее квадратичное отклонения, а также коэффициенты корреляции r_у1, r_у2, r_х1х2.

Построим расчетную таблицу для определения параметров уравнения регрессии.

У	Х₁	Х₂	Х₁²	Х₂²	Х₁Х₂	УХ₁	УХ₂	У²
	4,9		24,0
	5,1		26,0
	6,5		42,3
	3,7		13,7
	4,0		16,0
	2,5		6,3
	26,7		128,3
∑У	∑Х₁	∑Х₂	∑Х₁²	∑Х₂²	∑Х₁Х₂	∑УХ₁	∑УХ₂	∑У²

х¯=∑х/n; σ²=х¯² – (х¯)²; r=((ху¯) – х¯у¯)/σ_хσ_у

у¯=160 тыс.руб

х¯₁=4,45 млн.чел.

х¯₂=19,5 %.

σ_у=57,8 тыс.руб.

σ_х1=1,2513 млн.чел.

σ_х2=4,6458 %.

r_у1=0,3392 r_у2=0,5071 r₁₂=0,5806

Корреляционная матрица:

	У	Х₁	Х₂
У		0,3392	0,5071
Х₁	0,3392		-0,5806
Х₂	0,5071	-0,5806

Составим систему нормальных уравнений в стандартизированном виде:

0,3392=β₁ – 0,5806β₂

0,5071=-0,5806 β₁+β₂

β₁=0,9558

β₂=1,062

t_у=0,9558t₁+1,062t₂. (β₂>β₁) – фактор х₂ больше влияет на у, чем фактор х₁.

а_j= β_jσ_у/σ_х_j

а₀=у¯– а₁х¯₂ – а₂х¯₂.

Из уравнения у¯=а₀+а₁х¯₁+а₂х¯₂.

а₁= β₁σ_у/σ_х1=0,9558*57,8/1,2513=44,15

а₂= β₂σ_у/σ_х2=1,062*57,8/4,6458=13,21

а₀=у¯– а₁х¯₁ – а₂х¯₂=160 – 44,15*4,45 – 13,21*19,5=–294.

у¯_х=-294+44,5х₁+13,21х₂ – уравнение регрессии.

Вывод: с ростом численности обслуживаемого населения на 1млн.чел. при исключении влияния другого фактора (рентабельности) чистая прибыль возрастает на 44,15 тыс.руб., а при неизменной численности населения с ростом рентабельности на 1% чистая прибыль повысится на 13,21 тыс.руб.

Коэффициент множественной корреляции:

R²= β₁*r_у1+ β₂*r_у2=0,9558*0,3392+1,062*0,5071=0,8627

R=√R²=√0,8627=0,929.

R² и R близки к 1, следовательно, при построении двухфакторной модели учтены важные факторы увеличения прибыли.

σ¯_ост=1 – R²=1 – 0,8627=0,1373.

Следовательно, на долю неучтенных факторов=13,73% дисперсии признака-результата.

Рассчитываем эластичность по каждому фактору и по их совокупности:

Э₁=а₁*х¯₁/у¯=44,15*4,45/160=1,23.

Э₂= а₂*х¯₂/у¯=13,21*19,5/160=1,61.

∑Э_j=2,84.

Эластичность по каждому фактору и в целом по совокупности больше 1, следовательно, чистая прибыль увеличивается в большей степени, чем факторы. С увеличением каждого фактора на 1% следует ожидать увеличения чистой прибыли на 2,84%.

Контрольные вопросы

1.Что такое корреляционная зависимость и какие виды связей вам известны? Что такое «признак-фактор» и «признак-результат»?

2.Назовите основные этапы корреляционного анализа. Дайте содержание каждого этапа.

3.Как вы понимаете парную корреляцию и множественную корреляцию?

4.Как вы понимаете выражение «определить класс функций» применительно к анализу корреляционной связи между признаками?

5.Раскройте содержание теоремы сложения дисперсий. В чем заключается необходимость разложения общей дисперсии на среднюю внутригрупповую и межгрупповую дисперсии?

5.Какие показатели, характеризующие меру тесноты связи между признаками вам известны? Каким образом можно их рассчитать? Чем отличаются они друг от друга?

6. Как вы понимаете «выявление аналитической связи между признаками на основе метода наименьших квадратов»? Что для этого необходимо сделать?

7.С помощью какого коэффициента можно определить как тесноту связи между признаками, так и направление связи? Дайте описание его значений.

8. Что такое «множественная корреляция» и как можно решить задачу анализа влияния множества факторов на признак-результат?

9.Что показывают показатели: коэффициент множественной корреляции и коэффициент эластичности?

Тема: Статистические методы анализа взаимосвязи

Поиск по сайту