Коэффициент корреляции Бравэ-Пирсона




Коэффициент корреляции Браве-Пирсона применим в том случае, если измерение значений исследуемых признаков производятся в шкале отношений или интервалов и форма зависимости является линейной. Коэффициент корреляции характеризует только линейную взаимосвязь (степень ее тесноты). Линейная взаимосвязь двух случайных величин состоит в том, что при увеличении одной случайной величины другая случайная величина имеет тенденцию возрастать (убывать) по линейному закону.

Для вычисления коэффициента корреляции Браве-Пирсона используется формула:

,

либо

.

где и – средние, а и стандартные отклонения, рассчитанные по двум выборкам.

Рассчитанный коэффициент корреляции является выборочным, так как он определен для ограниченной совокупности, являющейся выборкой из генеральной совокупности. Поэтому делать вывод о существовании корреляции в генеральной совокупности только исходя из его значения, особенно если его модуль не очень близок к 1, преждевременно. Необходимо проверить статистическую значимость обнаруженной корреляции. Определение статистической значимости коэффициента корреляции осуществляется с помощью критерия Стьюдента. Основные этапы проверки гипотезы о достоверности коэффициента корреляции заключаются в следующем.

1. Задаются уровнем значимости α. В области физкультуры и спорта принято использовать уровень значимости α =0,05.

2. Формулируют гипотезы, которые в дальнейшем необходимо принять или отклонить. Н 0: r =0 (в генеральной совокупности корреляции нет, а отличие от нуля выборочного коэффициента корреляции связано со случайными факторами). Н 1: r ≠0 (в генеральной совокупности корреляция есть).

3. Рассчитывают эмпирическое значение t критерия Стьюдента

4. По специальной таблице определяют критическое значение критерия tкр для числа степеней свободы n = n -2 и уровня статистической значимости α (см. таблицу 1 Приложения).

5. Сравнивают эмпирическое значение критерия с критическим. Если tэмп ³ tкр, то полученный коэффициент корреляции достоверен, и между исследуемыми показателями существует статистическая связь с вероятностью q =1- α. Если же tэмп < tкр, то полученный коэффициент корреляции недостоверен, и между исследуемыми показателями нет взаимосвязи.

Существует и более простой способ проверки статистической значимости коэффициента корреляции. Он основан на использовании специальных таблиц критических значений коэффициента корреляции (см. таблицу 2 Приложения). Вычисленный коэффициент корреляции сравнивают с критическим значением rкр для объема выборки n и уровня значимости α. Если , то принимается гипотеза H0 и делается вывод об отсутствии значимой корреляции. Если же оказывается, что , то гипотеза H0 отклоняется и принимается гипотеза H1, согласно которой значение коэффициента корреляции в генеральной совокупности статистически значимо отличается от нуля на уровне значимости α.

2.1.6 Коэффициент ранговой корреляции rs Спирмена

В случаях, если измерения исследуемых признаков проводятся в шкале порядка, или же форма взаимосвязи отличается от линейной, исследование взаимосвязи между двумя случайными величинами осуществляется с помощь ранговых коэффициентов корреляции. Рассмотрим коэффициент ранговой корреляции Спирмена. При его вычислении необходимо ранжировать (упорядочить) варианты выборки. Ранжированием называется группировка экспериментальных данных в определенном порядке, либо по возрастанию, либо по убыванию.

Проведение операции ранжирования осуществляется по следующему алгоритму:

1. Меньшему значению начисляется меньший ранг. Наибольшему значению начисляется ранг, соответствующий количе­ству ранжируемых значений. Наименьшему значению начисляется ранг равный 1. Например, если n =7, то наибольшее значение получит ранг под номером 7, за исключением слу­чаев, которые предусмотрены вторым правилом.

2. Если несколько значений равны, то им начисляется ранг, представляющий собой среднее значение из тех рангов, которые они получили бы, если бы не были равны. В качестве примера рассмотрим упорядоченную по возрастанию выборку, состоящую из 7 элементов: 22, 23, 25, 25, 25, 28, 30. Значения 22 и 23 встречаются по одному разу, поэтому их ранги соответственно равны R 22=1, а R 23=2. Значение 25 встречается 3 раза. Если бы эти значения не повторялись, то их ранги были бы равными 3, 4, 5. Поэтому их ранг R 25 равен среднему арифметическому 3, 4 и 5: . Значения 28 и 30 не повторяются, поэтому их ранги соответственно равны R 28=6, а R 30=7. Окончательно имеем следующее соответствие:

элемент выборки              
его ранг              

3. Общая сумма рангов должна совпадать с расчетной, которая определяется по формуле:

,

где n - общее количество ранжируемых значений.

Несовпадение реальной и расчетной сумм рангов будет свидетельствовать об ошибке, допущенной при начислении рангов или их суммировании. В этом случае необходимо найти и исправить ошибку.

Коэффициент ранговой корреляции Спирмена является методом, позволяющим определить силу и направленность взаимосвязи между двумя признаками или двумя иерархиями признаков. Применение коэффициента ранговой корреляции имеет ряд ограничений:

а) Предполагаемая корреляционная зависимость должна носить монотонный характер.

б) Объем каждой из выборок должен быть больше или равен 5. Для определения верхней границы выборки пользуются таблицами критических значений (Таблица 3 Приложения). Максимальное значение n в таблице - 40.

в) При проведении анализа вероятна возможность возникновения большого количества одинаковых рангов. В этом случае, необходимо вносить поправку. Наиболее благоприятным является случай когда, обе изучаемые выборки представляют собой две последовательности несовпадающих значений.

Для проведения корреляционного анализа исследователь должен располагать двумя выборками, которые могут быть ранжированы, например:

- два признака, измеренные в одной и той же группе испытуемых;

- две индивидуальные иерархии признаков, выявленные у двух испытуемых по одному и тому же набору признаков;

- две групповые иерархии признаков;

- индивидуальная и групповая иерархии признаков.

Расчет начинаем с ранжирования изучаемых показателей отдельно по каждому из признаков.

Проведем анализ случая с двумя признаками, измеренными в одной и той же группе испытуемых. Сначала ранжируют индивидуальные значения по первому признаку, полученные разными испытуемыми, а затем индивидуальные значения по второму признаку. Если меньшим рангам одного показателя соответствуют меньшие ранги другого показателя, а большим рангам одного показателя соответствуют большие ранги другого показателя, то два признака связаны положительно. Если же большим рангам одного показателя соответствуют меньшие ранги другого показателя, то два признака связаны отрицательно. Для нахождения rs, определяем разности между рангами (d) по каждому испытуемому. Чем меньше разности между рангами, тем ближе коэффициент ранговой корреляции rs будет к «+1». Если взаимосвязь отсутствует, то между ними не будет никакого соответствия, следовательно rs окажется близким к нулю. Чем больше разности между рангами испытуемых по двум переменным, тем ближе к «-1» будет значение коэффициента rs. Таким образом, коэффициент ранговой корреляции Спирмена является мерой любой монотонной зависимости между двумя исследуемыми признаками.

Рассмотрим случай с двумя индивидуальными иерархиями признаков, выявленными у двух испытуемых по одному и тому же набору признаков. В данной ситуации ранжируют индивидуальные значения, полученные каждым из двух испытуемым по определенной совокупности признаков. Признаку с самым низким значением необходимо присвоить первый ранг; признаку с более высоким значением - второй ранг и т.д. Следует обратить особое внимание на то, чтобы все признаки были измерены в одних и тех же единицах. Например, невозможно ранжировать показатели, если они выражены в различных по «цене» баллах, поскольку невозможно определить, какой из факторов будет занимать первое место по выраженности, пока все значения не будут приведены к единой шкале. Если признаки, имеющие низкие ранги у одного из испытуемых так же имеют низкие ранги у другого, и наоборот, то индивидуальные иерархии связаны положительно.

В случае с двумя групповыми иерархиями признаков, ранжируют средне-групповые значения, полученные в двух группах испытуемых по одинаковому для исследуемых групп, набору признаков. Далее следует придерживаемся алгоритма, приведенного в предыдущих случаях.

Проведем анализ случая с индивидуальной и групповой иерархией признаков. Начинают с того, что ранжируют отдельно индивидуальные значения испытуемого и средне-групповые значения по тому же набору признаков, которые получены, при исключении того испытуемого, который не участвует в средне-групповой иерархии, так как с ней будет сопоставляться его индивидуальная иерархия. Ранговая корреляция позволяет оценить степень согласованности индивидуальной и групповой иерархии признаков.

Рассмотрим, как определяется значимость коэффициента корреляции в перечисленных выше случаях. В случае с двумя признаками она будет определяться объемом выборки. В случае сдвумя индивидуальными иерархиями признаков значимость зависит от количества признаков, входящих в иерархию. В двух последних случаях значимостьобуславливается числом изучаемых признаков, а не численностью групп. Таким образом, значимость rs во всех случаях определяется числом ранжированных значений n.

При проверке статистической значимости rs пользуются таблицами критических значений коэффициента ранговой корреляции, составленных для различных количеств ранжируемых значений и разных уровней значимости. Если абсолютная величина rs, достигает критического значения или превышает его, то корреляция достоверна.

При рассмотрении первого варианта (случай с двумя признаками, измеренными в одной и той же группе испытуемых) возможны следующие гипотезы.

Н0: Корреляция между переменными x и y не отличается от нуля.

Н1: Корреляция между переменными x и y достоверно отличается от нуля.

Если мы работаем с любым из трех оставшихся случаев, то необходимо выдвинуть другую пару гипотез:

Н0: Корреляция между иерархиями x и y не отличается от нуля.

Н1: Корреляция между иерархиями x и y достоверно отличается от нуля.

Последовательность действий при вычислении коэффициента ранговой корреляции Спирмена rs такова.

- Определить, какие два признака или две иерархии признаков будут участвовать в сопоставлении как переменные x и y.

- Ранжировать значения переменной x, начисляя ранг 1 наименьшему значению, в соответствии с правилами ранжирования. Поместить ранги в первую колонку таблицы по порядку номеров испытуемых или признаков.

- Ранжировать значения переменной y. Поместить ранги во вторую колонку таблицы по порядку номеров испытуемых или признаков.

- Вычислить разности d между рангами x и y по каждой строке таблицы. Результаты поместить в следующую колонку таблицы.

- Вычислить квадраты разностей (d2).Полученные значения поместить в четвертую колонку таблицы.

- Вычислить сумму квадратов разностей ∑ d2.

- При возникновении одинаковых рангов вычислить поправки:

где tx - объем каждой группы одинаковых рангов в выборке x;

ty - объем каждой группы одинаковых рангов в выборке y.

- Вычислить коэффициент ранговой корреляции в зависимости от наличия или отсутствия одинаковых рангов. При отсутствии одинаковых рангов коэффициент ранговой корреляции rs рассчитать по формуле:

При наличии одинаковых рангов коэффициент ранговой корреляции rs рассчитать по формуле:

где ∑ d2 - сумма квадратов разностей между рангами;

Tx и Ty - поправки на одинаковые ранги;

n - количество испытуемых или признаков, участвовавших в ранжировании.

- Определить по таблице 3 Приложения критические значения rs, для данного количества испытуемых n. Достоверное отличие от нуля коэффициента корреляции будет наблюдаться при условии, если rs не меньше критического значения.

 

Регрессия

Регрессией называется зависимость среднего значения одной случайной величины Y от значений других исследуемых величин Xi.

Регрессионный анализ устанавливает форму зависимости между случайной величиной Y и значениями одной или нескольких переменных, причем значения эти величин считаются точно заданными. Такая зависимость определяется уравнением регрессии.

Основной этап регрессионного анализа заключается в выборе подходящей регрессионной модели, т.е. математического выражения, связывающего значения зависимой случайной величины Y и значение независимой величины X.

В простейшем случае предполагается линейная зависимость, выраженная уравнением

.

b называют коэффициентом регрессии, а a – свободным членом уравнения регрессии.Параметр а является ординатой точки пересечения прямой с осью ординат, а параметр b – тангенсом угла наклона прямой относительно оси абсцисс.

Регрессия, выраженная таким уравнением, называется простой линейной регрессией. Она описывает зависимость только от одной контролируемой переменной.

Значения а и b вычисляются с помощью метода наименьших квадратов по формулам:

;

.

Мерой точности предсказания значений случайной величины Y по заданным значениям величины X является стандартное отклонение значений yi от регрессионной прямой, которое по-иному называется стандартной ошибкой предсказания. Стандартная ошибка предсказания вычисляется с помощью следующего соотношения:

.

Если провести две прямые, отстоящие от регрессионной прямой на расстояние ± Syx, то они ограничат область около прямой регрессии, в которую с вероятностью 0,7 попадают экспериментальные значения yi. Это означает, что приблизительно 70% всех значений yi находятся в этой области.

Поскольку вычисляемый по данным исследования коэффициент регрессии является выборочным, то следует проверить его статистическую значимость. Сформулируем статистические гипотезы. Н 0 – для рассматриваемой генеральной совокупности нет статистически значимого коэффициента регрессии. Н 1 – полученный коэффициент регрессии является статистически значимым. Нулевая гипотеза Н 0 проверяется с помощью t -критерия Стьюдента, эмпирическое значение которого вычисляется с помощью соотношения

.

Вычисленное эмпирическое значение критерия сравнивается с критическим (см. таблицу 1 Приложения) для числа степеней свободы ν = n -2 и уровне значимости α. Если tэмп ³ tкр, то гипотеза Н 0 отклоняется и делается вывод о значимости линейной регрессии на уровне значимости α. Если же оказывается, что tэмп < tкр, то принимается гипотеза Н 0.




Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2016-08-20 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: