Параметрический корреляционный анализ.




Лабораторная работа №1. Обработка и оценка результатов корреляционного анализа исследовательских данных.

 

Цель работы.

Научиться использовать возможности MS Excel для проведения корреляционного анализа исследовательских данных.

 

Краткое изложение основных теоретических и методических аспектов работы.

Параметрический корреляционный анализ.

Одна из наиболее распространенных задач статистического исследования состоит в изучении связи между выборками (наборами числовых данных каких-либо величин). Обычно связь между выборками носит не функциональный, а вероятностный (или стохастический) характер. В этом случае нет строгой, однозначной зависимости между величинами. При изучении стохастических зависимостей различают корреляцию и регрессию.

Корреляционный анализ состоит в определении степени связи между двумя случайными величинами X и Y. В качестве меры такой связи используется коэффициент корреляции. Коэффициент корреляции оценивается по выборке объема n связанных пар наблюдений (xi, yi) из совместной генеральной совокупности X и Y. Существует несколько типов коэффициентов корреляции, применение которых зависит от измерения (способа шкалирования) величин X и Y.

Для оценки степени взаимосвязи величин X и Y, измеренных в количественных шкалах, используется коэффициент линейной корреляции (коэффициент Пирсона), предполагающий, что выборки X и Y распределены по нормальному закону.

Линейный коэффициент корреляции – параметр, который характеризует степень линейной взаимосвязи между двумя выборками, рассчитывается по формуле:

, (1)

где хi – значения, принимаемые в выборке X,

yi – значения, принимаемые в выборке Y;

– средняя по X,

– средняя по Y.

Коэффициент корреляции изменяется от –1 до 1. Когда при расчете получается величина большая +1 или меньшая –1 – следовательно, произошла ошибка в вычислениях. При значении 0 линейной зависимости между двумя выборками нет.

Знак коэффициента корреляции очень важен для интерпретации полученной связи (таблица 1). Если знак коэффициента линейной корреляции «+», то связь между коррелирующими признаками такова, что большей величине одного признака (переменной) соответствует большая величина другого признака (другой переменной). Иными словами, если один показатель (переменная) увеличивается, то соответственно увеличивается и другой показатель (переменная). Такая зависимость носит название прямо пропорциональной зависимости.Если же получен знак «–», то большей величине одного признака соответствует меньшая величина другого. Иначе говоря, при наличии знака минус, увеличению одной переменной (признака, значения) соответствует уменьшение другой переменной. Такая зависимость носит название обратно пропорциональной зависимости.

 

Таблица 1 – Теснота связи и величина коэффициента корреляции

Коэффициент корреляции rxy Теснота связи
+(0,91 … 1,00) очень сильная
+(0,81… 0,90) весьма сильная
+ (0,65… 0,80) сильная
+ (0,45… 0,64) умеренная
+ (0,25… 0,44) слабая
до + 0,25 очень слабая
«+» – прямая зависимость, «–» – обратная зависимость.

 

t -статистика Стьюдента.

Для того чтобы оценить наличие связи между двумя переменными, также можно использовать t -статистику Стьюдента, которая оценивает отношение величины линейного коэффициента корреляции к среднему квадратическому отклонению и рассчитывается по формуле:

, (2)

где п – число наблюдений.

Полученную величину tрасч сравнивают с табличным значением tтабл критерия Стьюдента (см. Приложение 1) с n – 2 степенями свободы. Если tрасч > tтабл, то практически невероятно, что найденное значение обусловлено только случайными совпадениями величин X и Y в выборке из генеральной совокупности, т.е. существует зависимость между X и Y. И наоборот, если tрасч < tтабл, то величины X и Y независимы.

 

Контрольные вопросы.

1. В чем цель корреляционного анализа?

2. Что такое коэффициент корреляции?

3. Для чего используется t-статистика Стьюдента?



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2018-09-16 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: