Корреляцией называется такая связь между двумя варьирующими признаками в статистической совокупности, при которой различиям в величине одного из них соответствует закономерное различие между средними значениями другого. Задачами корреляционно – регрессионного анализа являются отражение статистической связи в форме уравнения регрессии (регрессионной анализ) и измерение тесноты связи (корреляционный анализ), т.е. измерение всех основных параметров статистической связи. Рассмотрим методику проведения корреляционно-регрессионного анализа (КРА) зависимости между уровнем заработной платы населения и численностью населения с доходами ниже прожиточного минимума, чем больше уровень заработной платы, тем ниже уровень бедного населения.
Таблица 4.1. Исходные данные
годы | уровень з/платы населения | ч-ть насел. с дох-ми ниже прожиточ. минимума | Δу | Δх |
1208,0 | 34,3 | - | - | |
1838,1 | 41,6 | 630,1 | 7,3 | |
2735,7 | 42,3 | 897,6 | 0,7 | |
4016,0 | 1280,3 | -2,3 | ||
5128,6 | 35,6 | 1112,6 | -4,4 | |
6439,1 | 29,3 | 1310,5 | -6,3 | |
7864,8 | 25,5 | 1425,7 | -3,8 |
Вводим таблицу с исходными данными в Excel. Далее выбираем пункт меню «Сервис»/ «Анализ данных»/ выбираем «корреляция». Полученный результат в виде матрицы коэффициентов парной корреляции представлен в Таблице 4.2.
Динамика уровня заработной платы населения и численность населения с доходами ниже прожиточного минимума представлена в графиках.
Рис. 5. Динамика уровня заработной платы населения.
Рис. 6. Динамика численности населения с доходами ниже прожиточного минимума.
То есть мы имеем обратную зависимость. Согласно значению коэффициента R= -0,894588185 можно говорить о том, что уровень заработной платы населения увеличивается, но общая численность населения с доходами ниже прожиточного минимума при этом уменьшается.
Таблица 4.2. Матрица коэффициентов парной корреляции
Столбец 1 | Столбец 2 | |
Заработная плата | ||
числен-ть населения с доходами ниже прожит. Минимума | -0,894588185 |
Следующий этап проведения КРА – это регрессионный анализ. В пункте «Сервис»/ «Анализ данных» / «регрессия», в данном диалоговом окне указали диапазон результативного показателя (у) и факторного показателя (Таблица 4.3)
Таблица 4.3. Регрессионная статистика
Регрессионная статистика | |
Множественный R | 0,894588 |
R-квадрат | 0,800288 |
Нормированный R-квадрат | 0,75036 |
Стандартная ошибка | 148,9382 |
Наблюдения |
Согласно коэффициенту множественной корреляции R=0,894588185, связь между уровнем заработной платы населения и уровнем численности населения с доходами ниже прожиточного минимума сильная. Коэффициент детерминации R=0,0800288 показывает, что 80 % вариации Зависимость уровня населения с доходами ниже прожиточного минимума и уровня заработной платы составляет, а на остальные 20 % оказали влияние другие факторы, не включенные в модель, что показывает.
Оценка значимости уравнения регрессии в целом приводиться по F-критерию Фишера (F фактическая=16,02), приведенному в таблице 4.4.(α=0,05; к1=m=1; к2=5, Fтабличная=6,61). Так как F фактическая › Fтабличного, то уравнение является статистически значимым.
Таблица 4.4. Дисперсионный анализ
Дисперсионный анализ | |||||
df | SS | MS | F | Значимость F | |
Регрессия | 355561,2 | 355561,2 | 16,02 | 0,02 | |
Остаток | 88730,3 | 22182,5 | |||
Итого | 444291,6 |
По данным представленных в таблице 4.5 линейное уравнение регрессии уровня занятости имеет вид:
y=1029,5-54,5*х
Коэффициент регрессии b=-54,5 показывает, что уменьшение численности населения, чей доход ниже прожиточного минимума на 1 человека от своего среднего значения по группе годов повлечет уменьшение уровня заработной платы на -54,5 %.
Таблица 4.5. Основные характеристики параметров регрессионного уравнения
Коэффициенты | Стандартная ошибка | t-статистика | P-Значение | Нижние 95% | Верхние 95% | |
Y-пересечение | 1029,5 | 63,9 | 16,1 | 0,000087 | 851,8 | 1207,2 |
Переменная X 1 | -54,5 | 13,6 | -4 | 0,016081 | -92,3 | -16,7 |
А: t факт= 16,1, t табл=2,77, t факт > t табл, отсюда параметр уравнения является статистически значимым. В: t факт= -4,, t табл=2,77, t факт < t табл, отсюда параметр уравнения является статистически не значимым.
Таблица 4.6. Отклонения фактических данных результативного показателя от предсказанных значений
Наблюдение | Предсказанное Y | Остатки |
631,5 | -1,4 | |
991,3 | -93,7 | |
1154,9 | 125,4 | |
1269,3 | -156,7 | |
1372,9 | -62,4 | |
1236,6 | 189,0 |
В Таблице 4.6 приведены отклонения фактических данных результативного показателя от предсказанных значений, согласно уравнению прямой y=1029,5-54,5*х после подставлений в него фактических значений х:
Заключение
Исследуя изменения уровня заработной платы за определенный период времени происходившие за счет влияния на нее различных факторов можно сделать следующие выводы:
- уровень среднемесячной номинальной заработной платы про-мышленно – производственного персонала стабильно увеличивался каждый год, и с 1998 года к 2004 году уровень заработной платы увеличился на 6 656,8 руб.;
- после проведения индексного анализа, мы выяснили, что уменьшение уровня прожиточного минимума за счет изменения уровня реальной среднемесячной заработной платы;
- проанализировав уровень занятости населения методом корреляционно - регрессионного анализа, согласно значению коэффициента парной корреляции мы видим, что связь между уровнем занятости и численностью населения с доходами ниже прожиточного минимума обратная отсутствует;
- согласно коэффициенту множественной корреляции R=0,894588185, связь между уровнем заработной платы населения и уровнем численности населения с доходами ниже прожиточного минимума сильная;
- зависимость уровня населения с доходами ниже прожиточного минимума и уровня заработной платы составляет 80 % вариации, а на остальные 20 % оказали влияние другие факторы, не включенные в модель, что показывает коэффициент детерминации R=0,0800288;
- в итоге метод корреляционно - регрессионного анализа показал, что численность населения с доходами ниже прожиточного минимума оказывает влияние на уровень заработной платы населения.