Парный и многомерный корреляционный анализ.




КОРРЕЛЯЦИОННЫЙ АНАЛИЗ [correlation analysis] — ветвь математической статистики, изучающая взаимосвязи между изменяющимися величинами (корреляция — соотношение, от лат. correlatio). Взаимосвязь может быть полная (т. е. функциональная) и неполная, когда зависимость связанных величин искажена влиянием посторонних, дополнительных факторов. Примером функциональной связи является соотношение выпуска и потребления продукции, когда она дефицитна: во сколько раз больше выпуск, во столько раз больше продажа (все распродается, ничего не остается в запасе). Примером корреляционной связи может служить соотношение стажа рабочих и их производительности труда. Известно, что в среднем производительность труда рабочих тем выше, чем больше их стаж. Однако бывает, и нередко, что молодой рабочий (из-за влияния таких дополнительных факторов, как образование, здоровье и т. д.) работает лучше пожилого. Чем больше влияние этих дополнительных факторов, тем менее тесна связь между стажем и выработкой, и наоборот. В таком случае коэффициент корреляции (см. Корреляция) между двумя величинами — стажем и производительностью — занимает промежуточное положение между нулем и единицей, в зависимости от силы (тесноты) взаимосвязи. Именно такие взаимосвязи изучает К. а. Он может рассматривать и более сложные корреляционные связи — не между двумя переменными (это называется парной корреляцией), как в описанном случае, а между многими (множественная корреляция).

При изучении экономических явлений методами К. а. необходимо тщательно выявлять причинные зависимости, лежащие в основе корреляции наблюдаемых показателей. Отсутствие причинной связи между явлениями (хотя корреляционная связь между ними установлена) называется ложной корреляцией. Она часто встречается при анализе временных рядов, когда параллельно снижаются или повышаются показатели, на самом деле совершенно не зависящие друг от друга.

Рассматриваемые связи математически описываются корреляционными уравнениями (другое название — уравнение регрессии). Напр., простейшим корреляционным уравнением связи между двумя переменными является уравнение прямой вида y = a + bx. При функциональной связи такая прямая точно соответствовала бы всем значениям зависимой переменной. Если представить такую связь графически, то она проходила бы через все наблюдаемые точки y. При корреляции же соответствие, как указано, соблюдается лишь приблизительно, в общем, и точки наблюдений расположены не по прямой, а в виде “облачка”, более или менее вытянутого в некотором направлении. Поэтому приходится специальными приемами находить ту линию, которая наилучшим образом отражает корреляционную зависимость, т. е. направление “облачка” (рис. К. 1). Распространенный способ решения этой задачи — метод наименьших квадратов отклонений наблюдаемых значений y от значений, рассчитываемых по формуле корреляционного уравнения.

Особенно широко применяется К. а. в теории производственных функций, в разработке разного рода нормативов

на производстве, а также в анализе спроса и потребления.

Одна из наиболее распространенных задач статистического исследования состоит в изучении связи между выборками. Обычно связь между выборками носит не функциональный, а вероятностный (или стохастический) характер. В этом случае нет строгой, однозначной зависимости между величинами. При изучении стохастических зависимостей различают корреляцию и регрессию.

Корреляционный анализ состоит в определении степени связи между двумя случайными величинами X и Y. В качестве меры такой связи используется коэффициент корреляции. Коэффициент корреляции оценивается по выборке объема п связанных пар наблюдений (xi, yi) из совместной генеральной совокупности X и Y. Существует несколько типов коэффициентов корреляции, применение которых зависит от измерения (способа шкалирования) величин X и Y.

Для оценки степени взаимосвязи величин X и Y, измеренных в количественных шкалах, используется коэффициент линейной корреляции (коэффициент Пирсона), предполагающий, что выборки X и Y распределены по нормальному закону.

Коэффициент корреляции — параметр, который характеризует степень линейной взаимосвязи между двумя выборками, рассчитывается по формуле:

Коэффициент корреляции изменяется от -1 (строгая обратная линейная зависимость) до 1 (строгая прямая пропорциональная зависимость). При значении 0 линейной зависимости между двумя выборками нет.

К. Пирсон и Дж. Юл разработали корреляционный анализ, который по их мнению должен ответить на вопрос о том, как выбрать с учетом специфики и природы анализируемых переменных подходящий измеритель статистической связи (коэффициент корреляции, корреляционное отношение, и т.д.), решить задачу, как оценить его числовые значения по уже имеющимся выборочным данным. Корреляционный анализ поможет: найти методы проверки того, что полученное числовое значение анализируемого измерителя связи действительно свидетельствует о наличии статистической связи; определить структуру связей между исследуемыми k признаками х 1, х 2,…, сопоставив каждой паре признаков ответ («связь есть» или «связи нет»). Многомерный корреляционный анализ позволяет с помощью корреляционной матрицы (12.66) получить оценку модельного уравнения регрессии - линейного уравнения множественной регрессии.

Многомерный корреляционный анализ использовали для получения уравнения регрессии, связывающего коэффициенты извлечения конденсата с факторами, которые характеризуют термодинамическое состояние пласта (давление, температура) и состав пластовой смеси.

Статистическими методамимногомерного корреляционного анализа установлено количественное влияние основных геолого-промысловых факторов па фактическую нефтеотдачу пластов по данным о длительно разрабатываемых залежах. В результате выявлены связи нефтеотдачи с большим числом параметров, оказывающих существенное воздействие на полноту извлечения нефти, и получены статистические зависимости которые могут использоваться для определения коэффициентов нефтеотдачи применительно к месторождениям со сходными геологическим строением и условиями разработки. Эти модели основаны на различной геолого-промысловой информации, что позволяет достаточно надежно прогнозировать конечный коэффициент нефтеотдачи на разных стадиях разработки месторождений.

Основная задачамногомерного корреляционного анализа состоит в оценке корреляционной матрицы Qp no выборке.

С помощьюмногомерного корреляционного анализа была получена статистическая модель конечной нефтеотдачи пластов на основе данных 42 длительно разрабатываемых объектов Урало-Поволжья с использованием графической экстраполяции.

Зарубежными исследователями при помощимногомерного корреляционного анализаполучен ряд статистических зависимостей конечной нефтеотдачи, в частности по месторождениям США.

Большой объем исследований нефтеотдачи с помощьюмногомерного корреляционного анализапроведен по длительно эксплуатируемым месторождениям продуктивной толщи неогеновых отложений Азербайджана.

Ряд статистических зависимостей конечной нефтеотдачи с помощьюмногомерного корреляционного анализа получен зарубежными исследователями, в частности, по месторождениям США.

Дополнительно поставляются программы DANALYZER - для проведения углубленного исследования методом технического анализа и STATISTICA - для проведениямногомерного корреляционного анализа.

В настоящее время имеется ряд статистических моделей для приближенной оценки нефтеотдачи, полученных для разных нефте - Нзоносных районов с помощью многомерного корреляционного анализа на основе данных длительно разрабатываемых объектов. Некоторые из них, помимо различной геолого-промысловой ин-трормации, учитывают как плотность сетки скважин, так и соотношение добывающих и нагнетательных скважин.

Для определения вида зависимости между / Сн2з Ксг, Ас3 был использован многомерный корреляционный анализ.

В последние годы предложено. Имеется ряд статистических моделей для приближенной оценки нефтеотдачи, полученных для отдельных нефтегазоносных районов страны с помощью многомерного корреляционного анализа на основе данных по длительно разрабатываемым объектам. Некоторые из них, помимо различной геолого-промысловой информации, учитывают также плотность сетки скважин, соотношение добывающих и нагнетательных скважин, ряд других показателей. Предложенные модели (формулы репрессии) могут быть использованы для сравнительных оценок, но лишь как ориентировочные, как дополнение к расчетам, основанным на математическом моделировании.

Парный коэффициент корреляции – основной показатель взаимозависимости двух случайных величин, служит мерой линейной статистической зависимости между двумя величинами., он соответствует своему прямому назначению, когда статистическая связь между соответствующими признаками в генеральной совокупности линейна. То же самое относится к частным и множественным коэффициентам корреляции. Парный коэффициент корреляции, характеризует тесноту связи между случайными величинами х и у, определяется по формуле:

Если р = 0, то между величинами х и у линейная связь отсутствует и они называются некоррелированными. Коэффициент корреляции, определяемый по вышеуказанной формуле, относится к генеральной совокупности.

Частный коэффициент корреляции характеризует степень линейной зависимости между двумя величинами, обладает всеми свойствами парного, т.е. изменяется в пределах от -1 до +1. Если частный коэффициент корреляции равен ±1, то связь между двумя величинами функциональная, а равенство его нулю свидетельствует о линейной независимости этих величин.

Множественный коэффициент корреляции, характеризует степень линейной зависимости между величиной х 1и остальными переменными (х 2, х з), входящими в модель, изменяется в пределах от 0 до 1.

Ординальная (порядковая) переменная помогает упорядочивать статистически исследованные объекты по степени проявления в них анализируемого свойства



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2018-01-08 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: