Многомерный корреляционный анализ




Корреляционный анализ

 

Корреляционный анализ является одним из методов статистического анализа взаимозависимости нескольких признаков.

Основная задача корреляционного анализа состоит в оценке корреляционной матрицы генеральной совокупности по выборке и определении на основе этой матрицы частных и множественных коэффициентов корреляции и детерминации.

Парный и частный коэффициенты корреляции характеризуют тесноту линейной зависимости между двумя переменными соответственно на фоне действия и при исключении влияния всех остальных показателей, входящих в модель. Они изменяются в пределах от -1 до +1, причем чем ближе коэффициент корреляции к 1, тем сильнее зависимость между переменными. Если коэффициент корреляции больше нуля, то связь положительная, а если меньше нуля — отрицательная.

Множественный коэффициент корреляции характеризует тесноту, линейной связи между одной переменной (результативной) и остальными, входящими в модель; он изменяется в пределах от 0 до 1.

Квадрат множественного коэффициента корреляции называется множественным коэффициентом детерминации. Он характеризует долю дисперсии одной переменной (результативной), обусловленной влиянием всех остальных переменных (аргументов), входящих в модель.

Исходной для анализа является матрица

 

 

размерности п х k, i-я строка которой характеризует i -е наблюдение (объект) по всем k показателям (j = 1, 2,..., k).

В корреляционном анализе матрицу Х рассматривают как выборку объема п из k -мерной генеральной совокупности, подчиняющейся k- мерному нормальному закону распределения.

По выборке определяют оценки параметров генеральной совокупности, а именно: вектор средних , вектор средних квадратических отклонений s и корреляционную матрицу R порядка k:

 


где

(53.1)

(53.2)

xij значение i -го наблюдения j -го фактора,

ril выборочный парный коэффициент корреляции, характеризующий тесноту линейной связи между показателями xj и xl. При этом rjl является оценкой генерального парного коэффициента корреляции.

Матрица R является симметричной (rjl = rlj) и положительно определенной.

Кроме того, находятся точечные оценки частных и множественных коэффициентов корреляции любого порядка. Например, частный коэффициент корреляции (k - 2)-го порядка между переменными х1 и х2 равен

 

(53.3)

 

где Rjl алгебраическое дополнение элемента rjl корреляционной матрицы R. При этом Rjl = (-l) j+l Mjl, где Mjl — минор, т.е. определитель матрицы, получаемой из матрицы R путем вычерчивания j- й строки и l -го столбца.

Множественный коэффициент корреляции (k - 1)-го порядка результативного признака x1 определяется по формуле

 

(53.4)

 

где | R | — определитель матрицы R.

Значимость частных и парных коэффициентов корреляции, т.е. гипотеза H0: ρ = 0, проверяется по t -критерию Стьюдента. Наблюдаемое значение критерия находится по формуле

 

(53.5)

 

где r — соответственно оценка частного или парного коэффициента корреляции ρ; l — порядок частного коэффициента корреляции, т.е. число фиксируемых факторов (для парного коэффициента корреляции l=0).

Напомним, что проверяемый коэффициент корреляции считается значимым, т.е. гипотеза H0: ρ = 0 отвергается с вероятностью ошибки α, если t набл по модулю будет больше, чем значение t кр, определяемое по таблицам t -распределения для заданного α и υ = nl - 2.

Значимость коэффициентов корреляции можно также проверить с помощью таблиц Фишера — Иейтса.

При определении с надежностью у доверительного интервала для значимого парного или частного коэффициента корреляции р используют Z -преобразование Фишера и предварительно устанавливают интервальную оценку для Z:

 

(53.6)

 

где tγ вычисляют по таблице значений интегральной функции Лапласа из условия

 

 

значение Z' определяют по таблице Z -преобразования по найденному значению r. Функция Z' — нечетная, т.е.

 

 

Обратный переход от Z к ρ осуществляют также по таблице Z -преобразования, после использования которой получают интервальную оценку для ρ с надежностью γ:

 

 

Таким образом, с вероятностью γ гарантируется, что генеральный коэффициент корреляции ρ будет находиться в интервале (r min, r max).

Значимость множественного коэффициента корреляции (или его квадрата — коэффициента детерминации) проверяется по F -критерию. Например, для множественного коэффициента корреляции проверка значимости сводится к проверке гипотезы, что генеральный множественный коэффициент корреляции равен нулю, т.е. H0 : ρ1/2,…,k = 0, а наблюдаемое значение статистики находится по формуле

 

(53.7)

 

Множественный коэффициент корреляции считается значимым, т.е. имеет место линейная статистическая зависимость между х1 и остальными факторами х2,..., хk, если F набл > F кр, где F кропределяется по таблице F -распределения для заданных α, υ1 = k - 1, υ2 = n - k.

 

Многомерный корреляционный анализ

Опыт исследований показывает, что при соблюдении исходных предпосылок корреляционного анализа более 99 % взаимосвязей инженерно-геологических характеристик достаточно хорошо отображаются прямолинейной, экспоненциальной, логарифмической или степенной функциями, причем последние три формы легко линеаризуются заменой значений одной или обеих переменных их логарифмами, что значительно облегчает решение задач многомерной корреляции.

Гипотезы о возможных формах зависимостей в ряде случаев требуют проверки. Благодаря тому, что большинство зависимостей являются прямолинейными или выравниваются заменой переменных, оценка непротиворечивости полученных моделей эмпирическим данным сводится к проверке гипотезы о прямолинейной форме связи. Для этого, наряду с более надежными, могут использоваться критерий линейности р и его стандарт ор:

В отличие от рассматриваемого выше парного корреляционного анализа, с помощью которого изучаются взаимосвязи между двумя показателями, множественная корреляция позволяет анализировать многомерные статистические совокупности.

Задачи множественной корреляции легко решаются в случае прямолинейных взаимосвязей между исследуемыми показателями. Уравнение прямолинейной зависимости х, от совокупности признаков в стандартизированном масштабе.

Алгоритмы изучения взаимосвязей, используемые в программном обеспечении ЭВМ, основаны на методах матричной алгебры и формально отличаются от формул. Однако последние при небольших объемах наблюдений облегчают расчеты на микрокалькуляторах типа БЗ-21 и БЗ-34. Это нередко позволяет решать необходимые задачи значительно оперативнее, чем на быстродействующих ЭВМ, которые целесообразно использовать лишь для больших массивов информации.

 

 

Исползованные сайты:

https://stroyfirm.ru/articles/igeologia83.html

https://www.bibliotekar.ru/economicheskaya-statistika-2/6.htm

google.ru wikipediya.ru

 



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2017-06-30 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: