В статистике принято различать следующие виды корреляции.




Качественные методы определения наличия связи

 

Для выявления наличия связи, ее характера и направления в статистике используются следующие качественные методы: приведения параллельных данных; аналитических группировок (изученный ранее) и графический методы.

Метод приведения параллельных данных основан на сопоставлении двух или нескольких рядов статистических величин. Такое сопоставление позволяет установить наличие связи и получить представление о ее характере.

Графическая взаимосвязь двух признаков изображается с помощью поля корреляции. Для этого на оси абсцисс откладывается значение факторного признака, а на оси ординат – результативного. Каждое пересечение линий, проводимых через эти оси, обозначается точкой. При отсутствии тесных связей имеет место беспорядочное расположение точек на графике. Чем сильнее связь между признаками, тем теснее будут группироваться точки вокруг определенной линии, выражающей форму связи.(рисунок __).


Корреляционный анализ

Корреляционный метод анализа является составляющим элементом более общего метода количественного статистического анализа связей – корреляционно – регрессионного.

При этом корреляционно – регрессионный анализ как общее понятие включает в себя измерение тесноты и направления связи (корреляционный анализ), а также установления аналитического выражения формы связи (регрессионный анализ).

В статистике принято различать следующие виды корреляции.

1. Парная корреляция – связь между двумя признаками (результативным и факторным).

2. Множественная корреляция – связь между результативным и двумя или более факторными признаками.

3. Частная корреляция – связь между результативным и одним из факторных признаков при фиксированном значении других признаков.

Количественно оценить тесноту и направление связи между двумя признаками при парной корреляции можно посредством расчета линейного коэффициента корреляции.

Линейный коэффициент корреляции характеризует тесноту и направление связи между двумя коррелируемыми признаками в случае наличия между ними линейной зависимости.

Линейный коэффициент корреляции имеет большое значение при исследовании социально - экономических явлений и процессов, распределение которых близко к нормальному.

На практике применяются различные модификации формул для расчета, данного коэффициента. Наиболее простой из них является зависимость вида

()

Физическая интерпретация значений коэффициента корреляции приведена в таблице__.

Таблица _. Оценка линейного коэффициента корреляции

Значение линейного коэффициента корреляции Характер связи Интерпретация связи
r=0 Отсутствует -
0<r<1 Прямая С увеличением Х увеличивается У
-1<r<0 Обратная С увеличением Х уменьшается У, и наоборот
r=1 Функциональная Каждому значению факторного признака строго соответствует одно значение результативного признака

Значимость линейного коэффициента корреляции проверяется на основе t- критерия Стьюдента. При этом выдвигается и проверяется нулевая гипотеза (Н0) о равенстве коэффициента корреляции нулю [Н0: r=0] При проверке этой гипотезы используется t-статистика.

()

Если расчетное значение tр >tкр (табличное), то гипотеза Н0 отвергается, что свидетельствует о значимости линейного коэффициента корреляции, а следовательно, и о статистической существенности зависимости между Х иУ. Примечание! Данный критерий оценки значимости применяется для совокупностей n< 50.

При большем числе наблюдений (n>100) используется следующая формула для определения t - статистики

. ()

Пример. По исходным данным, приведенным в таблице _ рассчитать линейный коэффициент корреляции. Сделать выводы.

Таблица ____- Характеристика использования библиотечного фонда библиотек районных муниципальных образований Пензенской области в 2004году

  Фонд, тыс. экз, yi Пользователи, тыс.чел, xi
Башмаковский 240,1 17,0
Беднодемьяновский 179,8 10,6
Бековский 178,5 10,8
Белинский 416,5 25,2
Бессоновский 181,6 15,3
Вадинский 193,8 7,0
Городищенский 268,4 19,0
Земетчинский 289,1 21,7
Иссинский 147,1 11,5
Каменский 246,4 16,2

 

Расчет линейного коэффициента корреляции выполним с использованием надстройки Анализ данных табличного процессора MS Excel. Для этого в меню Сервис активизируем надстройку Анализ данных и в появившемся меню активизируем инструмент Корреляция. Водя исходные данные, приведенные в таблице__ получим

 

  Столбец 1 Столбец 2
Столбец 1    
Столбец 2 0,878  

Рисунок ____ Результаты решения

Из рисунка __ видно, что линейный коэффициент корреляции равен 0,878.

 

Физическая интерпретация численного значения линейного коэффициента корреляции приведена в таблице __

Таблица __ - Количественные критерии оценки тесноты связи

Величина коэффициента корреляции Характер связи
До ½+ - 0,3½ ½+ - 0,3½…½+ - 0,5½ ½+ - 0,5½…½+ - 0,7½ ½+ - 0,7½…½+ - 1,0½   Практически отсутствует Слабая Умеренная Сильная

 

 

Сравнивая полученное значение линейного коэффициента корреляции с данными таблицы __ можно сделать вывод о том, что между библиотечным фондом и количеством пользователей (читателей) существует сильная положительная связь. Однако данный вывод является предварительным, поскольку необходимо убедиться в статистической значимости рассчитанного коэффициента корреляции.

Значимость линейного коэффициента корреляции проверяется на основе t- критерия Стьюдента. При этом выдвигается и проверяется нулевая гипотеза (Н0) о равенстве коэффициента корреляции нулю [Н0: r=0] При проверке этой гипотезы используется расчетное значение t-статистики, определяемое по зависимости

. ()
Если расчетное значение tр >tкр (критичекого), то гипотеза Н0 отвергается, что свидетельствует о значимости линейного коэффициента корреляции, а, следовательно, и о статистической существенности зависимости между Х и У.

В соответствии с зависимостью (4) имеем

 

 

Критическое значение критерия Стьюдента tкр можно определить либо по статистическим таблицам, приводимым в любом учебнике по статистке, либо с использованием статистической функции СТЬЮДРАСПОБР табличного процессора MS Excel.

Для вызова функции СТЬЮДРАСПОБР необходимо щелкнуть по кнопке Вставка функции (рисунок _)

Рисунок – Кнопка вызова функций

Из предъявленного списка статистических функций выбрать функцию СТЬЮДРАСПОБР и щелкнуть по кнопке ОК. Появляется окно диалога функции СТЬЮДРАСПОБР (рисунок _)

 


Рисунок __ – Окно диалога статистической функции СТЬЮДРАСПОБР

 

В поле Вероятность ввести значение уровня значимости 0,05 и число степеней свободы n-2 = 10-2 =8. В окне диалога появляется критическое значение критерия Стьюдента tкр = 2,306.

Так как tр >tкр (5,2 > 2,306), то гипотеза Н0 отвергается, что свидетельствует о значимости линейного коэффициента корреляции, а, следовательно, и о статистической существенности зависимости между Х и У.

Для статистически значимого линейного коэффициента корреляции необходимо построить его интервальные оценки. Для этого используется z- распределение Фишера. В данном случае первоначально строится интервальная оценка z- распределени я по зависимости
, ()
где функция определяется либо по статистическим таблицам, либо с помощью функции ФИШЕР табличного процессора MS Excel (рисунок __).

Рисунок – Выбор статистической функции ФИШЕР

 

В окно диалога функции ФИШЕР необходимо ввести рассчитанное значение линейного коэффициента корреляции. Значение функции отображается в окне диалога и примерно равно 1,36.

Значение параметра в зависимости () для уровня значимости равного 0,05 принимается равным 1,96.
Тогда в соответствии с зависимостью () имеем

 

 

Выполняя обратное преобразование Фишера, с помощью статистической функции ФИШЕРОБР, окончательно получим интервальные оценки найденного линейного коэффициента корреляции.

 

 

 

.

Вывод. Установлена статистически значимая сильная положительная связь между библиотечным фондом библиотек районных муниципальных образований Пензенской области и количеством пользователей (читателей).

Следует помнить! Приведенные выше зависимости и результаты практических расчетов относятся к предположениям о наличии линейной связи между оцениваемыми параметрами. В случае если заранее известно, что связь нелинейная то можно воспользоваться эмпирическим корреляционным отношением.

 

Регрессионный анализ

Как отмечалось ранее регрессионный анализ заключается в определении аналитического выражения связи, в котором изменение одной величины (называемой зависимой или результативным признаком) обусловлено влиянием одной или нескольких независимых величин (факторов), а множество всех прочих факторов, также оказывающих влияние на зависимую величину, принимается за постоянные и средние значения.

Примечание!. Термин «регрессия от лат. regression-движение назад.
Регрессия может быть однофакторной (парной) и многофакторной (множественной).



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2017-11-22 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: