Лекция 6. Методы несплошного наблюдения.




1. Монографический метод предполагает всестороннее изучение и описание единичных объектов. Требует особой осторожности при использовании массовых источников данных. Может использоваться, если все единичные объекты, избраные для изучения, не выделяются какими-либо резкими отличиями. Следовательно, выводы, полученные при использовании данного метода, должны основываться на заранее выявленных тенденциях и закономерностях. Чаще всего используется для иллюстрации как вспомогательный.

2. Метод основного массива. Предполагает изучение той части единиц наблюдения, которая имеет высокий удельный вес в совокупности. Часто важные тенденции не проявляются в равной степени у всех единиц наблюдения, только набирающие силу факторы, которые могут сыграть решающую роль в развитии процесса в будущем, затушевываются в генеральной совокупности. Для их выделения и используется данный метод.

3. Выборочный метод. Это такая система отбора единиц наблюдения, при которой результаты, полученные на частичном отборе, отражают всю изучаемую совокупность.

Статистическое наблюдение - это сбор необходимых данных, которые носят планомерный, научно-организованный, систематический характер и направлен на регистрацию признаков, характерных для изучаемых явлений и процессов. От качества данных, полученных на первом этапе, зависят конечные результаты исследования. Планомерность стат наблюдения заключается в том, что оно проводится по плану, включающему вопросы организации, техники сбора информации, контроля ее качества и достоверности, предоставление итоговых материалов. Различают три основные формы стат наблюдения: - стат отчетность - сведения об изучаемых объектах органы статистики получают в виде особых документов отчета, представляемых в определенные сроки по установленной форме. Делится на специализированную и типовую.

- специально организованное стат наблюдение - это организуемый стат органами сбор сведений для более детального изучения отчетных данных, их проверки и уточнения.

- Регистры - формы наблюдения, при кот факты состояния отдельных единиц совокупности регистрируются непрерывно.

По времени регистрации фактов стат наблюдение может быть непрерывным, периодическим и единовременным. По охвату единиц совокупности может быть сплошным и не сплошным.

Сплошное наблюдение - при котором исследованию подвергаются все единицы совокупности. Обеспечивает всю полноту информации, но связано с большими затратами труд и мат ресурсов. Часто сплошное наблюдение вообще невозможно.

Не сплошное - исследованию подвергается только часть единиц изучаемой совокупности, отобранная определенным образом. Проводится в краткие сроки, связано с меньшими затратами, полученная информация носит оперативный характер.

Виды несплошного наблюдения:

1) анкетный способ - когда используются усредненные показатели, которые распространяются на всю изучаемую совокупность

2) Метод основного массива - охватывает собой изучение определенных наиболее существенных по значимости признаков единиц совокупности, при этом в учет принимаются самые крупные единицы совокупности

3) Выборочный метод - подразумевает наблюдение части единиц исследуемой совокупности, выделенной методом случайного отбора. При правильной организации выборки получаются достаточно точные результаты, которые можно распространить на всю совокупность. Если выборочное наблюдение предполагает не только отбор единиц совокупности, но и отбор моментов времени, то оно называется методом моментных наблюдений.

4) Монографический метод - характерно всестороннее глубокое изучение только отдельных единиц совокупности, обладающих какими-то особенными признаками или представляющих какое-то новое явление. Цель данного метода - выявление существующих и только зарождающихся тенденций в развитии данного процесса. Этот метод тесно связан со сплошным и выборочным наблюдением.

 

Способы статистического наблюдения:

Основанием для регистрации фактов служат либо документы, либо устные заявления, либо какие-то хронометражные данные. В связи с этим различают наблюдения:

1) непосредственное - осуществляется путем регистрации фактов, лично установленных регистраторами в результате осмотра, измерения, подсчета признаков изучаемого явления.

2) Документальное - основано на использовании в качестве источника информации данных различных документов. К заполнению таких документов предъявляются высокие требования и данные, отраженные в них, носят наиболее достоверный характер.

3) Опрос - базируется на получении данных от респондентов.

 

Способы сбора информации:

1) респондентский опрос - на добровольной основе штат респондентов сообщает сведения непосредственно в организацию, ведущую наблюдение. Недостаток способа - сложность проверки достоверности сообщаемых сведений.

2) Экспедиционный (устный) - специально подготовленные работники фиксируют ответы респондентов в специальных формулярах.

3) Анкетный - респонденты заполняют опросники добровольно и чаще всего анонимно. Используется в тех исследованиях, где не требуется высокая точность результатов

4) Явочный - предполагает предоставление сведений в органы, ведущие наблюдение в явочном порядке

Исходя из задач исследования, определяется его программа и формы организации. Кроме того, устанавливаются объект и единицы наблюдения. Объект наблюдения - это совокупность общественных явлений или процессов, подлежащих исследованию. При его определении важно четко установить границы изучаемой совокупности. Для этого нужно четко определить существенные признаки для исследования, по которым определяют включать объект в совокупность или нет. Определяя объект наблюдения, нужно указать единицу наблюдения и единицу совокупности. Единица наблюдения - это составная часть объекта наблюдения, представляющая собой источник информации, то есть являющаяся носителем признаков, подлежащих регистрации. Единицы наблюдения называют отчетными единицами, если они представляют статистическую отчетность в статистические органы. Единицы совокупности - это также составная часть объекта наблюдения, от которой поступают сведения о единице наблюдения, то есть она служит основой счета и обладает признаками, подлежащими регистрации в процессе наблюдения. Для определения состава регистрируемых признаков составляется программа наблюдения. Программа статистического наблюдения - совокупность вопросов, ответы на которые в процессе наблюдения составляют статистические сведения. Требования к программе:

1. Она должна по возможности содержать только те признаки, значения которых будут использованы для проведения анализа или в контрольных целях.

2. Вопросы должны быть четко сформулированы, чтобы не допустить неправильную их трактовку.

3. Программа должна содержать контрольные вопросы для проверки и корректировки сообщаемых сведений.

Для проведения наблюдения используются формуляры и инструкции. Статистические формуляры - документы единого образца, в которых фиксируются ответы на вопросы программы. В зависимости от конкретного содержания проводимого наблюдения формуляр может называться формой стат отчетности, опросный листом, бланком анкеты, карточкой и тд. Различают два вида формуляра - карточный (единица совокупности) и списочный (вся совокупность). Обязательные элементы стат формуляра - это титульная, адресная, содержательная часть. В титульной части указываются наименования стат наблюдения и органа, утвердившего формуляр, сроки предоставления формуляра, в адресной части указываются реквизиты отсчитывающихся единиц наблюдения и в основной части таблица, содержащая наименование, код и значение показателей.

Заполнение стат формуляра осуществляется в соответствии с инструкцией.

При организации стат наблюдения решается вопрос о времени и месте проведения наблюдения. Выбор места зависит от цели наблюдения, выбор времени связан с определением критического момента даты или интервала времени. Критическим моментом стат наблюдения называют момент времени, к которому приурочены регистрируемые сведения. Срок наблюдения должен быть не слишком удален от критического момента наблюдения, чтобы можно было воспроизвести состояние объекта на тот момент.

Точность наблюдения - это степень соответствия действительной величине какого-либо показателя или признака, полученного по материалам наблюдения. Различия между результатом наблюдения и истинным значением величины называется ошибкой наблюдения. Различают несколько типов ошибок наблюдения:

1. По характеру:

- случайные - возникшие под воздействием случайных факторов, в результате наблюдения они как правило не отражаются, так как взаимопогашаются при сводной обработке результатов наблюдения

- Систематические - имеют одинаковую тенденцию либо к уменьшению, либо к увеличению значения показателей признаков. Они в значительной мере искажают результаты исследования.

2. По причинам возникновения:

- ошибки измерения - связаны с определенными погрешностями, возникающими при однократном стат наблюдении.

- Ошибки репрезентативности - возникают в ходе несплошного наблюдения и связаны с тем, что выборка сформирована неправильно

- Преднамеренные ошибки

- Непреднамеренные - случайный характер ошибок, низкая квалификация, невнимательность, небрежность

3. По стадии возникновения:

- ошибки регистрации

- Ошибки при подготовке данных к машинной обработке

- Ошибки в процессе обработки данных

Виды контроля достоверности данных:

1) синтаксический - означает проверку правильности структуры документа, наличия в нем обязательных реквизитов, полноту заполнения

2) Логический - проверяется правильность записи кодов, их соответствия наименованиям и значениям показателей, проверяется взаимосвязи между показателями, сопоставляются ответы на разные вопросы и выявляются несовместимые сочетания

3) Арифметический - сравниваются полученные итоги с предварительно посчитанными контрольными суммами по строкам, графам. Часто арифметический контроль основывается на зависимости одного показателя от нескольких других. Если в ходе контроля выявляется, что зависимость не соблюдается, это будет говорить о неточности данных.

Контроль достоверности результатов осуществляется на всех этапах проведения стат наблюдения.

 

Выборочное наблюдение - один из наиболее распространенных видов несплошного наблюдения. В основе этого наблюдения лежит идея о том, что отобранная в случайном порядке некоторая часть единиц, может представлять всю изучаемую совокупность по интересующим исследователя признакам. Следовательно, цель выборочного наблюдения - получение информации для определения сводных характеристик всей изучаемой совокупности. По своей цели выборочное наблюдение совпадает с одной из задач сплошного наблюдения. Встает вопрос выбора между этими двумя видами наблюдения. При решении этого вопроса нужно исходить из требований, предъявляемых стат наблюдению:

1) информация должна быть достоверной, то есть максимально соответствовать реальной действительности

2) Сведения должны быть достаточно полными для решения задач исследования

3) Отбор информации должен быть проведен в максимально сжатые сроки для использования ее в оперативных целях

При выборочном наблюдении эти требования......

Преимущества этого метода по сравнению со сплошным можно оценить, если оно организованно и проведено в строгом соответствии с научными принципами теории выборочного методы. Прежде всего если обеспечена случайность отбора единиц и изучено достаточное их число. Если это все соблюдается, то выборка считается репрезентативной.

Первый принцип отбора - обеспечение случайности, заключается в том, что при отборе каждой из единиц совокупности обеспечивается равная возможность попасть в выборку. Случайный отбор - это не беспорядочный отбор и проводится он с соблюдением определенной методики.

Второй принцип - обеспечение достаточного числа отобранных единиц. Выборка должна быть репрезентативной прежде всего в отношении тех признаков, которые изучаются или оказывают существенное влияние на формирование сводных обобщающих характеристик.

Выборочное исследование проходит три этапа:

1) определение объема выборочной совокупности. Поскольку мы имеем дело с частичными данными, каждый показатель или варианта признака несет в себе некоторую погрешность, связанную с неполнотой единиц наблюдения. Следовательно, точность и достоверность результатов напрямую зависит от объема выборки. При увеличении объема выборки до определенного уровня, величина ошибки уменьшается быстро, а затем все медленнее. Разработаны спец методики определения минимального объема выборки при сохранении достаточной репрезентативности. Выборка должна быть такой, чтобы свойство достоверности было присуще каждому изучаемому признаку, поэтому численность выборки насчитывается многократно, исходя из допустимых ошибок различных показателей. Исследование нужно базировать на максимальной величине объема выборочной совокупности или создавать многоступенчатую выборку. Выборочное изучение начинается с определения уровня точности будущих результатов. Он задается с помощью мат формул, либо с помощью таблицы достаточно больших чисел. Эта таблица рассчитана на определение выборки для признаков имеющих норм распределение или близкое к ним. Исследователь задает желаемый уровень вероятности Р и возможную допустимую ошибку м доп. В соответствии с этим на стыке строки и столбца таблицы находим величину, обозначающую объем выборки. Допустимая ошибка обычно не должна превышать пяти процентов. Вероятность должна быть в пределах от 0,95 до 0,99.

2) Выбор способа отбора единиц для наблюдения. Два способа отбора - повторный и бесповторный. При повторном каждая отобранная в случайном порядке единица после ее обследования возвращается в генеральную совокупность и при последующем отборе снова может попасть в выборку. При бесповторном единица отобранная в случайном порядке после ее изучения в ген совокупность не возвращается. Вероятность попасть в выборку для каждой единицы совокупности увеличивается по мере производства отбора. В зависимости от методики формирования выборки различают следующие их виды: собственно случайная; механическая; типическая; серийная; комбинированная; многоступенчатая; многофазная; взаимопроникающая.

3) Нахождение величины выбранной ошибки

 

25.02.2016

Следовательно таким образом собственно индекс - это относительный показатель особого рода, в котором уровни соц эконом явления рассматриваются в связи с другим (или другими) явлением, изменение которого при этом элиминируется.

Показатели, связанные с индексируемым показателем, используются в качестве весов индекса, а взвешивание и элиминирование изменения весов (фиксирование в числителе и знаменателе индекса на одном и том же уровне) составляют специфику собственно индексов и индексного метода.

Технически любой индекс представляет собой показатель, определяемый как соотношение двух величин. Эти величины являются определенными состояниями заданного признака. С помощью индексов осуществляется сравнение фактических показателей с базисными.

Существует два основных вида индексов: простые (частные, индивидуальные) и аналитические.

В первом случае исследуемый признак принимается без учета связи этого признака с остальными признаками изучаемых явлений. Ip=p1/p0

Во втором случае изучаемый признак используется во взаимосвязи с другими. Любой аналитический индекс будет состоять из 2 элементов: P - индексируемый признак - изменение которого подвергается изучению; Q - весовой признак.

С помощью весовых признаков исследуются изменения явлений, элементы которых несоизмеримы. Простые и аналитические индексы взаимно дополняют друг друга.

Фотка.

С помощью индексов можно сравнивать данные в динамике за ряд лет. Например, рассчитав темпы роста продукции в сопоставимых ценах. При анализе динамики показателей различают цепной и базисный индекс.

Базисный индекс рассчитывается по отношению к базисному периоду.

Цепной рассчитывается по отношению к предыдущему периоду.

Индексный метод широко используется в социологии для измерения соц установок и бюджетов времени респондентов при анализе текстовой информации, межличностных отношений и тд.

Социологический индекс - это инструмент классификации сравнения и измерения, создаваемый путем логического и аналитического комбинирования эмпирических индикаторов.

Различают логические и аналитические индексы.

Логические используются обычно для измерения скрытого (латентного) качественного признака через многомерное (и часто многосвязное) пространство эмпирических индикаторов, измеряемых по номинальным шкалам. Близкие по смыслу комбинации значений индикаторов объединяются в типологические группы, которым присваиваются текстовые или цифровые обозначения, используемые в дальнейшем как школьные значения измеряемого признака. Эти значения представляют собой логический индекс. Построив их, начинается сбор данных по шкалам индикаторов и затем сводит эти многомерные данные в одномерную шкалу признака.

Корректное выполнение данной процедуры требует ответа на следующие вопросы:

1) существует ли одномерный признак, который будет измеряться с помощью логического индекса

2) Связаны ли выделенные индикаторы с этим латентным признаком

3) Адекватна ли используемая форма выражения скрытого признака через эмпирический индикатор

4) К какому типу относится шкала признака соответствующая построенному логическому индексу

Аналитические индексы образуются из индикаторов с помощью математических операций. Их основная ценность не столько в конкретных получаемых значениях, сколько в возможностях их использования для сравнительного анализа.

 

Пример. Проанализируем коллектив из шести персон. Опросили членов группы как они относятся друг к другу. Получили таблицу (фотка).

Результаты предварительной обработки по столбцам позволяют оценить соц статус членов коллектива, по строкам их соц экспансию.

Персональные социоиндексы или индексы соц статуса. 2 Фотки.

Индексы соц экспансии. Фотка.

Результат - фотка.

Анализ таблицы: признанный коллективом лидер х2, так как у него максимальный положительный индекс статуса С+-. Изгой в коллективе х5. Самый изолированный член коллектива х6, потому что нулевые индексы соц статуса и соц активности. Наибольший интерес вызывает х4, х5. Наиболее активный член коллектива х1 и х3, так как у них максимальный соц индекс экспансии. При этом х3 наиболее благожелателен коллегам, так как у него более значительный индекс Э+-. Коллектив более или менее устойчив, так как нет отрицательных индексов Э+-.

 

Групповые социоиндексы.

Индекс связанности фотка. Индекс сплоченности (взаимосвязанности) фотка. Индекс референтности фотка. 1-Гр характеризует степень "безответной любви", когда положительные выборы не находят взаимности.

Фотка. Изучаемая группа примерно наполовину связана между собой, так как Гс более 0,5, то есть реализовано более 50% всех возможных связей между членами группы. Относительно мала степень сплоченности группы, всего 20%. При этом 40% положительных связей не находят взаимопонимания.

 

Корреляционный анализ.

Раскрытие и анализ существующих связей между признаками - основная задача любого эмпирического исследования. Если связь обнаруживается внутри одной выборки, либо между двумя и больше различными выборками, нужно определить сопровождается ли увеличение одного показателя возрастанием (положительная корреляция) или уменьшением (отрицательная корреляция) другого показателя, то есть нужно выяснить можно ли предсказать возможные значения одного показателя, зная величину другого.

Корреляционная связь - это согласованные изменения двух (парные корреляции) признаков или большего количества признаков (множественная корреляционная связь). Такие зависимости отличаются приблизительностью и определенностью. Они проявляются только в среднем по значительному числу наблюдаемых объектов, причем каждой величине факторного показателя может соответствовать несколько значений результативного показателя или функции.

В зависимости от того, насколько оптимально сочетаются разные факторы, будет неодинаковой степень воздействия каждого из них на величину результативного показателя.

Корреляционная зависимость - это изменения, которые вносят значения одного признака в вероятность появления разных значений другого признака. Связи между случайными явлениями называют вероятностными или стохастическими. Этот термин подчеркивает их отличие от функциональных связей в математике или статистике. В функциональных связях каждому значению первого признака всегда соответсвует определенное значение другого признака. В корреляционных связях каждому значению одного признака может соответствовать определенное распределение значений другого.

Оба термина часто используют как синонимы, но согласованные изменения признаков и отражающая это корреляционная связь может свидетельствовать не о зависимости этих признаков между собой, а об их зависимости от какого-то третьего признака или сочетания признаков, не изучаемых исследователем. Зависимость подразумевает влияние, а связь - любое согласованное явление, которое может быть вызвано разными причинами. Корреляционные связи не могут рассматриваться как свидетельство причинно-следственной связи. Они говорят только о том, что изменениям одного признака, как правило, сопутствуют определенные изменения другого, но находится ли причина изменений в одном из изучаемых признаков или за их пределами - неизвестно.

Корреляционные связи различаются по форме, направлению и силе.

По форме корреляционная связь может быть прямолинейной и криволинейной. Прямолинейной может быть связь между количеством правильно решенных заданий на семинаре и положительной оценкой. Криволинейной может быть связь между уровнем мотивации и эффективностью выполнения задачи.

По направлению может быть положительной (прямой) и отрицательной (обратной). При положительной более высоким значениям одного признака соответствуют более высокие значения другого, а более низким значениям одного признака низкие значения другого. При отрицательной корреляции наоборот.

При положительной корреляции коэффициент корреляции имеет положительный знак, при отрицательной - отрицательный знак.

Сила корреляционной связи определяется по величине коэффициента корреляции. Она не зависит от направления корреляции и определяется по абсолютному значению коэффициента корреляции. Коэффициент корреляции - это величина, которая может варьироваться в пределах от -1 до +1. В случае полной положительной корреляции 1,

Если точки не выстраиваются по прямой линии, а образуют облако, коэффициент корреляции по абсолютной величине становится меньше 1 и по мере округления этого облака приближается к нулю. Если коэффициент корреляции равен 0, переменные полностью независимы друг от друга.

Используются две системы классификации корреляционных связей по силе: общая и частная.

Общая классификация: фотка.

Согласно частной классификации: фотка

Первая классификация (общая) ориентирована только на величину коэффициента корреляции, а вторая (частная) определяет какого уровня значимости достигает данная величина коэффициента корреляции при данном объеме выборки. Чем больше объем выборки, тем меньше величины коэффициента корреляции оказывается достаточно, чтобы признать ее достоверность. Обычно ориентируются на частную классификацию, потому что она учитывает объем выборки.

В качестве мер корреляции используются: фотка.

Прежде чем приступать к корреляционному анализу, следует проверить будут ли его результаты реально отражать существующую картину. Признаки, исследуемые методом корреляции, должны быть нормально распределены и линейно зависимы между собой.

Признак обладает свойством нормальности, если его значение симметрично распределяется от центра, которым считается его средняя арифметическая величина. Проще всего проверить нормальность распределения графическим методом. График нормально распределенного признака имеет колоколообразный вид (фотка).

Линейная зависимость между двумя признаками существует тогда, когда с увеличением на единицу значений одного признака изменяется в ту или иную сторону значение другого. Проверить это можно с помощью графического метода, чаще всего когда в системе координат отмечаются точками те данные, которые имеются.

Основные правила:

1) Проверка нормальности и линейности должна проводиться перед применением мат методов

2) свойство нормальности и линейности определяется по не сгруппированным данным

3) нормальность и линейность определяются относительно каждого признака изучаемого явления

4) если признаки не отвечают свойству нормальности и линейности, это не означает отказа от статистических методов.

В статистике разработан ряд приемов, преобразующих значение признаков, существенно отклоняющихся от данных свойств.

Чаще всего при изучении массовых источников применяют коэффициент линейной корреляции (r). Формула: фотка.

Пример. Нам даны данные о возрасте 25 человек. Определить связь между возрастом и количеством детей.

Таблица: фотка (записать первые две строчки)... Сумма 684, 23, 695, 19188, 37

Возраст - факторный признак, количество детей - результативный.

Фотка.

Коэффициенты корреляции изменяются в пределах от 0 до плюс минус 1. Чем ближе значение к нулю, тем меньше связь между признаками. Если коэффициент корреляции имеет положительное значение, то связь между признаками прямая, то есть с увеличением значения одного признака растет среднее значение второго. Если коэффициент корреляции отрицательный, связь обратная. При r больше или равно 0,5 можно говорить о наличии существенной связи между признаками. Оценка значимости коэффициента корреляции во многом зависит от объема выборки. Если число наблюдений велико, то даже небольшая величина коэффициента линейной корреляции имеет определенную значимость, которой нельзя пренебречь. Это проверяется специальными стат таблицами, раскрывающими значимость r от объема изучаемой совокупности. В данном примере связь между признаками тесная и прямая, то есть количество детей в семье в значительной мере зависит от возраста родителей. Чем старше опрашиваемый, тем больше у него детей.

Применение коэффициента линейной корреляции имеет несколько ограничений:

1) он вычисляется только для количественных признаков

2) Признаки, связь между которыми выявляется, должны быть нормально распределены и линейно зависимы

Данная формула применяется только для первичных не сгруппированных данных.

Для анализа силы связи качественных альтернативных признаков применяется коэффициента ассоциации и коэффициент сопряженности. Их вычисление предворяется тем, что имеющиеся данные сводятся в таблицу 4-х полей.

Фотка. (Ад-цб исправить)

Пример. Фотка. Интерференция полученных значений аналогична толкованию значений коэффициента линейной корреляции. Но при этом оценивать связь между признаками как тесную, существенную можно при значении Ф не ниже +-0,3. Значение Q всегда несколько больше значения Ф. Коэффициент ассоциации отражает одностороннюю связь между признаками, то есть показывает степень влияния одного признака на другой.

Коэффициент сопряженности раскрывает силу взаимосвязи между признаками. Величина коэффициента сопряженности в определенной мере зависит от абсолютных значений признаков в таблице распределения. Следовательно, нужно это учитывать при сравнении коэффициентов сопряженности рассчитанных по разным исходным данным. Изменения его величины может в большей степени объясняться разницей абсолютных частот признака, чем разницей силы их взаимодействия.

Значения коэффициентов, полученных по данным примерам, говорят, что выбор места жительства в малой степени зависел от такого показателя как грамотность. Взаимодействие этих характеристик практически отсутсвует.

Когда достаточно получить ориентировочные представления о тесноте связи между признаками, можно обойтись коэффициентом корреляции знаков или коэффициентом Фехнера. Этот метод основан на оценке степени согласованности направлений и отклонений индивидуальных значений факторного и результативного признаков от соответствующих средних. Если значение признака больше его средней, оно фиксируется знаком плюс, если меньше - знаком минус. Затем подсчет ведется по формуле. Фотка.

Пример. Дано распределение факторов валового дохода в сельском хозяйстве. Нужно определить уровень влияния затрат труда на этот доход. Фотка. Полученное значение говорит о тесной сильной связи и прямой.

Не всякий качественный признак можно заменить количеством. Чтобы измерить влияние качественных признаков, используют коэффициент ранговой корреляции. Ранжировать изучаемые признаки нужно обязательно в одном и том же порядке. Ранжированию подвергаются как количественные, так и качественные признаки. Фотка. Интерпретируется так же, как и другие коэффициенты. При совпадении ранжированных рядов по обоим признакам коэффициент примет значение 1. Если объекты в одном ранжированном ряду будь прямо противоположны рангам второго признака, то выявляется максимально тесная обратная связь.

Пример. Данной семейное состояние и семейно-душевой доход. Фотка.

Значение коэффициента Спирмена в данном примере говорит о наличии прямой, но довольно слабой связи между признаками.

Данной формулой пользуются доя сгруппированных данных или при малых выборках, когда каждый ранг встречается в исходной совокупности только 1 раз. В остальных случаях формула видоизменяется. Фотка.

Пример. Дано распределение студентов по полу и успеваемости. Определить тесноту связи между признаками. Фотка. Пол - у.

Фотка.

Полученное значение говорит о прямой тесной связи между признаками. Успеваемость зависит от пола студента.

Сложнее обстоит дело при вычислении силы взаимодействия признаков, проявляющихся в динамике. В динамических рядах показатели могут быть обусловлены как случайными, так и детерминированными факторами, где каждое последующее явление обусловлено предыдущим. На изменение значения признака в динамическом ряду могут влиять сезонные колебания, цикличность процесса. Следовательно, прежде чем вычислять коэффициент корреляции, необходимо оценить характер признаков динамического ряда и факторы, определяющие изменения значения этих признаков. Когда предполагается, что компоненты динамического ряда могут быть связаны, прибегают к вычислению автокорреляции, которая раскрывает силу зависимости между соседними уровнями динамического ряда. Автокорреляция вычисляется по формуле линейного коэффициента корреляции. В качестве значений первого признака х берутся исходные уровни динамического ряда за исключением последнего. В качестве значений второго признака у, используются те же уровни динамического ряда, но без первого.

 

10.03.2016

Пример: фотка.

Автокорреляция - подсчитывать общее по столбцам и подставлять в формулу. Первая таблица исходные данные. Данное значение свидетельствует о прямой зависимости

 

Фотка.

Замечания:

1) Величины, подсчитанные разными методами коэффициентом корреляции не сопоставимы между собой.

2) Не рекомендуется сравнивать силу связи признаков разной природы. При расчете коэффициентов корреляции при выборочных данных необходима стат оценка степени надежности параметров корреляции.

3) Коэффициент корреляции не раскрывает степень воздействия факторного признака на результативный. Таким показателем служит коэффициент детерминации (Д). Его значение определяет долю изменений, возникающих под влиянием факторного признака в общей изменчивости результативного признака. Величина Д измеряется значением коэффициента линейной корреляции, возведенного в квадрат и выраженного в процентах. Например, если коэффициент линейной корреляции двух признаков факторного и результативного равен 0,7, то Д будет равно 49%. Следовательно, только на 49% данный признак зависит от изучаемого фактора. Использованию корреляционному метода должен предшествовать качественный анализ, в ходе которого определяется принципиальная возможность существования связи между признаками, Характер распределения их значений, в ходе которого доказывается правомерность использования той или иной формулы коэффициента корреляции.

 

Многомерный статистический анализ.

Это раздел мат статистики, посвященный методам, направленный на выявление характера и структуры взаимосвязи между компонентами исследуемого многомерного признака и предназначенная для получения научных и практических выводов и построения моделей.

Многомерный признак - это н-мерный вектор, составленный из признаков одномерных (фотка).

Если все одномерные первичны, то значение многомерного признака можно рассматривать как многомерное наблюдение. Совокупность значений многомерного признака обычно рассматривается как матрица данных. Часто используется геометрическая интерпретация объектов как точек признакового пространств, координатные оси которого соответствуют изучаемым одномерным признакам, а координаты каждого изучаемого объекта - это отвечающие ему значения признаков.

В процессе многомерного анализа происходит классификация данных, объяснение их структуры, поиск неизвестных значений с учетом выявленных закономерностей.

Исходным массивом данных для многомерного анализа обычно служат результаты измерения компонент многомерного признака для каждого из объектов изучаемой совокупности.

Под многомерным признаком чаще всего понимается многомерная случайная величина, а под последовательностью многомерных наблюдений выборка из генеральной совокупности. В этом случае выбор метода обработки данных производится на основе допущения относительно закона распределения изучаемого признака.

Многомерный стат анализ условно делится на три подраздела:

1) анализ многомерных распределений и их характеристик. Охватывает ситуации, когда обрабатываемые наблюдения имеют вероятностную природу. То есть интерпретируются как выборка из соответствующей генеральной совокупности. К основным задачам этого подраздела относят стат оценивание изучаемых многомерных распределений, изучение свойств использования стат оценок, исследования распределения вероятности для ряда статистик с помощью которых строятся стат критерии проверки различных гипотез о вероятностной природе изучаемых многомерных данных.

2) Анализ характера и структуры взаимосвязей компонентов исследуемого многомерного признака. Объединяет понятия и результаты, присущие таким моделям и методам, как регрессионный, дисперсионный, ковариационный, факторный, латентно-структурный, логлинейный анализы. Методы, принадлежащие к этой группе включают как алгоритмы, основанные на предположении о вероятностной природе данных, так и методы, не укладывающиеся в рамки любой из вероятностных моделей.

Ковариационный анализ - совокупность методов мат статистики, относящихся к анализу моделей зависимости среднего значения некоторой случайной величины У одновременного от набора качественных (основных) факторов F и количественных (сопутствующих) факторов Х. Факторы Ф задают сочетание условий,



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2017-06-21 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: