Тема 7 Статистическое изучение взаимосвязи социально-экономических процессов и явлений
Понятие о статистической и корреляционной связи
Исследование явлений в различных областях обнаруживает существование зависимости, как между количественными, так и между качественными признаками. Задача статистики выявить такие зависимости и дать им количественную характеристику.
При взаимосвязи признаков одни из них рассматриваются как факторы, влияющие на изменение других, их называют факторными. Другие изменяются под действием факторных признаков и называются результативными.
Например, если изучается зависимость изменения спроса на товары, то спрос - результативный признак, который зависит от цены (цена выступает факторным признаком).
Статистической называют связь, проявляющуюся в массовых явлениях, при которой значениям факторного признака соответствует множество значений результативного признака. При этом признаки могут быть, как количественными, так и качественными.
В статистике, в основном, изучаются статистические корреляционные связи. Слово «корреляция» означает соответствие. Корреляционной называют стат истическую связь, при которой изменение значений факторного признака вызывает различные изменения средних значений результативного признака. Корреляционные связи можно изучать только по количественным признакам.
При исследовании корреляционной связи изучают следующие вопросы:
1. Выявляется наличие связи - производится количественная оценка тесноты с помощью специальных коэффициентов, (корреляционный анализ);
2. Осуществляется построение математической модели связи (регрессионный анализ);
|
Классификация корреляционных-регрессионных связей
1. По направлению связи бывают:
a. прямыми, когда зависимая переменная (результативный фактор) растет с увеличением факторного признака, (чем больше стаж работы, тем выше производительность труда);
b. обратными, при которых рост факторного признака приводит к уменьшению результативного, (чем выше производительность труда, тем ниже себестоимость единицы продукции);
2. По числу рассматриваемых факторов;
a. Парная (однофакторная) корреляционно-регрессионная зависимость – когда одному результирующему признаку соответствует один факторный, (спрос на товар зависит от цены товара);
b. Множественная (многофакторная) – несколько факторных признаков объясняют изменения результативного, (спрос на товар зависит от цены товара и дохода потребителя);
3. По аналитическому выражению:
a. Линейная (выражается уравнением прямой);
1) Прямая однофакторная со свободным членом y=a0+a1*x
2) Прямая однофакторная без свободного члена y=a1*x
b. нелинейная (описывается уравнениями кривых линий – гипербол, парабол, степенных функций и т.д.).
Основные методы изучения связей
Для выявления наличия связи, ее характера и направления в статистике используются методы, которые можно разделить на 2 группы:
1. Описательные (качественные) методы;
2. Аналитические (количественные) методы:
К описательным относятся следующие:
ü метод параллельных рядов: приводится ряд данных по одному признаку и параллельно с ним – по другому признаку, связь с которым предполагается. По вариации признака в первом и втором ряду судят о наличии связи признаков. Такой метод позволяет вывести только направление связи, но не измерить ее.
|
ü метод аналитических группировок. Сначала выбираются два признака: факторный и результативный. По факторному признаку производится группировка, а по результативному – подсчет средних или относительных величин. Путем сопоставления характера изменений значений факторного и результативного признака можно сделать вывод о наличии связи и ее направлении.
ü графический метод может использоваться как самостоятельно, так и совместно с другими методами. Для выявления корреляционной связи между двумя признаками можно построить поле корреляции. Поле корреляции - это поле точек, координаты которых определяются значениями факторного и результативного признаков. Беспорядочное расположение говорит об отсутствии связи. Наоборот, чем сильнее связь, тем теснее точки группируются вокруг определенной линии.
Например: изучается зависимость оценки, полученной на экзамене (у) студентами от суммы баллов (х), набранных ими в течение в течение семестра. Построить поле корреляции.
|
Аналитические методы бывают 2-х видов: параметрические и непараметрические методы.
Непараметрические методы – дают оценку тесноте связи на основе условных оценок признаков.
Основные среди них следующие:
ü Коэффициент Фехнера (коэффициент совпадения знаков):
u – число пар, у которых знаки отклонений значений показателей от их средних совпадают; v – число пар, у которых знаки отклонений значений от средних не совпадают.
|
Пример
№ | Среднегодовая стоимость оборотных средств, млн.руб. | Балансовая прибыль, млн. руб. | Знак отклонения от среднего значения | |
x | y | x | y | |
0,22 | 0,8 | |||
0,38 | 0,9 | |||
0,39 | 1,0 | |||
0,44 | 1,3 | |||
0,58 | 1,2 | |||
0,61 | 1,2 | |||
0,67 | 1,2 | |||
0,68 | 1,3 | |||
0,68 | 1,4 | |||
0,71 | 1,3 |
Коэффициент совпадения знаков может принимать значения от –1 до +1. Чем ближе значение коэффициента к |1|, тем связь более тесная. Знак коэффициента говорит о направлении, величина – о силе связи.
Вывод:
ü Ранговые коэффициенты связи
Ранг – это порядковый номер значений признака, расположенных в порядке возрастания или убывания их величин. Если значения признака имеют одинаковую количественную оценку, то ранг всех этих значений принимается равным средней арифметической от соответствующих номеров мест, которые определяют. Ранговые коэффициенты принимают значения от –1 до +1, причем чем ближе значение коэффициента к |1|, тем связь более тесная. Знак коэффициента говорит о направлении связи.
Ø Коэффициент корреляции рангов Спирмена
d2 – квадрат разности рангов для каждого наблюдения; n – число наблюдений.
Пример:
№ | Средня годовая стоимость оборотных средств, млн.руб. | Балансовая прибыль, млн. руб. | Ранги | Разность | Квадрат | |
x | y | x | y | d=Nx-Ny | d2 | |
0,22 | 0,8 | |||||
0,38 | 0,9 | |||||
0,39 | 1,0 | |||||
0,44 | 1,3 | |||||
0,58 | 1,2 | |||||
0,61 | 1,2 | |||||
0,67 | 1,2 | |||||
0,68 | 1,3 | |||||
0,68 | 1,4 | |||||
0,71 | 1,3 |
Ø Коэффициент корреляции рангов Кенделла
S = P+Q (P – сумма наблюдений с большими значениями рангов; Q – с наименьшими)
Пример: (продолжение предыдущего)
Число наблюдений, следующих за текущим | |
с большими значениями рангов у | с меньшими значениями рангов у |
Параметрические методы дают оценку тесноты связи непосредственно на базе значений факторного и результативного признаков.
Мы рассмотрим параметрический метод, основанный на расчете линейного коэффициента парной корреляции, который определяется по формуле:
№ | Сумма баллов (х) | Оценка на экзамене (у) | ху |
Средние | |||
Среднеквадратическое отклонение |
Величина коэффициента парной корреляции изменяется от -1 (полная обратная связь) до 1 (полная прямая связь).
Чем ближе значение по модулю к единице, тем связь теснее, чем ближе к нулю, тем она слабее. Характеристика тесноты связи выполняется с помощью следующей таблицы:
Показание тесноты связи | 0,1 – 0,3 | 0,3 – 0,5 | 0,5 – 0,7 | 0,7 – 0,9 |
Характеристика силы связи | Слабая | Умеренная | Заметная | Сильная |
Полная Сильная Умеренная/Заметная Слабая