Технология эмпирического социологического исследования

Раздел 3. Методика и техника социологических исследований политической жизни.

Тема 3.1. Методика и техника социологического исследования политической жизни

Вопросы

1. Технология эмпирического социологического исследования

2. Методы сбора данных

3. Методы анализа данных

Аннотация

Этапы социологического исследования и их характеристика. Программа исследования и её составляющие. Выборка и её разновидности. Типы измерительных шкал. Репрезентативность. Валидность. Операционализация и интерпретация основных понятий. Зависимые и независимые переменные. Методы сбора данных. Наблюдение. Опросные методики. Эксперимент. Качественные методики изучения. Методы анализа данных.

Персоналии, которые надо знать (полное имя, годы жизни, национальность, вклад в науку, основные труды)

Термины и понятия

Анализ статистических таблиц

Вопрос-ловушка

Вторичный анализ данных

Выборочная совокупность

Гипотеза исследования

Генеральная совокупность

Закрытые вопросы

Измерение

Кванитификация

Кластерный анализ

Концептуализация проблемы

Корреляционный анализ

Корреляция

Методологическая часть программы социологического исследования

Методическая часть программы социологического исследования

Многомерное шкалирование

Мода

Наблюдение

Общий вопрос

Операционализация

Опрос

Организационная часть (рабочий план) программы социологического исследования

Открытые вопросы

Оценочный вопрос

Переменные зависимые (пассивные)

Переменные независимые

Пилотажное исследование (пилотаж)

Полузакрытый вопрос

Порядковая шкала

Репрезентативность (представительность)

Специфический вопрос

Традиционный анализ документов

Факторный анализ

Фильтрующий вопрос

Фокус-группа

Шкала

Основная литература

Дополнительная литература

Технология эмпирического социологического исследования

Технология эмпирических исследований включает в себя последовательность операций, необходимых для получения информации об изучаемом явлении. Во всех отраслевых социологических науках она одинакова. В социологической литературе существуют различные представления об этапах социологического исследования.

Н. Смелзер выделяет три этапа:

1. Формулировку гипотез.

2. Сбор и обработку данных.

3. Анализ и обобщение данных.

А.Г. Здравомыслов выделяет пять этапов:

1. Составление программы.

2. Построение выборки.

3 Разработку методики

4. Сбор и обработку материала

5. Анализ и интерпретацию данных.

Обобщая эти и другие подходы, можно утверждать, что всякое социологическое исследование проходит три этапа:

1. Подготовительный;

2. Полевой;

3. Аналитический.

Первый этап начинается с разработки программы и заканчивается пилотажным (пробным) исследованием.

Программа исследования обычно состоит из трех частей:

1. Методологической.

2. Методической

3. Организационной.

Методологическая часть программы содержит характеристику проблемы, цели, задач, объекта, предмета, концепции исследования, выборки, основных понятий, показателей, гипотез, а методическая – характеристику методов сбора и анализа данных, логической структуры инструментария, схемы обработки первичной информации.

Организационная часть (рабочий план) исследования включает в себя временной график осуществления необходимых работ, рабочие документы (формы анкет, бланков, карточек, инструкций участникам и руководителям полевых и аналитических работ), калькуляцию сметной стоимости этих работ.

Пилотажное исследование (пилотаж) проводится для проверки кач-ва инструментария, предназначенного для полевого исследования. В ходе пилотажа на ограниченном мат-ле устанавливается валидность (пригодность) сконструированного при разработке программы измерительного инструмента: показателей и шкал. Критериями пригодности использования инструментария являются распределение значений измеряемых признаков по делениям шкал (от минимума до максимума), невысокий удельный вес нулевых значений признаков, отсутствие перекоса значений признаков (их концентрации в одном месте шкалы). С учетом результатов пилотажа исслед-ия производится коррекция инструментария, после чего начинаются полевые работы.

В процессе подготовки и проведения социологического исследования осуществляется ряд процедур. Прежде всего – концептуализация проблемы, составляющей исходный пункт любого исследования. Эта процедура включает в себя определение понятий, выражающих наиболее существенные аспекты изучаемой проблемы. Система понятий образует теорию – идеальную модель явления, дающую целостное представление о нем и объясняющую его внутреннюю структуру, место в социальной реальности, причины возникновения и развития. Теория указывает на факты (реальные, эмпирически наблюдаемые события), относящиеся к данному явлению. На основе теорий выдвигаются гипотезы – неоднозначные предположения о связях между различными фактами, характеризующих изучаемое явление. Гипотеза должна быть подтверждена или опровергнута. Эмпирическое соц. исслед-ие можно рассматривать как процесс выдвижения и проверки гипотез, опирающийся на сбор, анализ и обобщение фактов. Для вып-ия этой зад. надо осуществить операционализацию выработанных в процессе концептуализации понятий.

Операционализация означает процедуру, с пом. кот. понятия переводятся в переменные. Переменные конструируются на осн. выявления наблюдаемых и изменяющихся признаков понятия, благодаря этому их можно обнаруживать в реальном сознании и поведении людей и измерять. Полный перевод понятий в переменные (редукция) невозможен не только потому, что понятие включает ненаблюдаемые и неизмеряемые признаки явления, но и потому, что в процессе конструирования переменных мы подводим не понятия под их «эмпирические референты», а устойчивые структуры социального действия людей под понятия. Суть операционализации заключается в трансформации языка науки в язык обыденный. Понятие отражает качественные (неизменные) признаки явления.

Переменные выражают не только качественные, но и количественные (изменяющиеся) признаки, которые могут принимать различные значения, воздействуя друг на друга. Переменные, которые оказывают это воздействие, называются независимыми (активными), а переменные, подвергающиеся воздействию, - зависимыми (пассивными).

Также существует деление переменных на показатели и индикаторы. Последние рассматриваются как частичные проявления показателей. Операционализация в этом случае выглядит как перевод понятий в показатели, а показателей – в индикаторы, значения которых и измеряются непосредственно. Операционализация делает возможной следующую процедуру социологического исследования – квантификацию.

Благодаря квантификации мы можем представить в виде чисел выделенные нами в процессе концептуализации исходные качественные характеристики изучаемого явления и использовать математические методы обработки и анализа информации.

Качество операционализации в значительной степени зависит от точности и однозначности их рабочих определений, сформулированных в ходе концептуализации, которая позволяет выбрать из множества существующих в научной лит-ре трактовок понятий те, которые в наибольшей степени соответствуют целям и задачам исслед-ия.

Выделение простейших кач. признаков делает возможным их измерение. В процессе дробления качественных признаков появляются количественные.

Измерение – это процедура, в рамках которой качественным оизнакам изучаемого явления приписываются определенные количественные характеристики (значения). Оно осуществляется на номинальном, порядковом и интервальном уровнях с помощью шкал.

Шкала (от лат. scala – лестница) представляет собой вербальную или числовую систему фиксирующую взаимосвязанные значения признаков изучаемого явления. Каждому уровню измерения соответствует шкала определенного типа, отличающегося способом количественного выражения соотношения качественных признаков.

На номинальном уровне фиксируется пронумерованный перечень качественных признаков изучаемого явления. Соответствующая данному уровню шкала (номинальная) дает нам классификацию этих признаков на основе их равенства или неравенства (сходства или различия). Сходным признакам приписываются одинаковые значения, отличающимся – разные. Примером такой шкалы является перечень видов политического участия: 1 – выборы, 2 – референдумы, 3 – собрания, 4 – митинги, 5 – демонстрации, 6 – марши протеста и т.д. В этом случае осуществляется простая фиксация использования или неиспользования населением того или иного вида участия. Измерение на этом уровне носит условный характер, поскольку оно не позволяет фиксировать количественное выражение определенных качественных признаков (в нашем примере – степень использования респондентом каждой из форм участия). Здесь мы можем получить лишь общее косвенное представление об этом в результате подсчета частоты (в абсолютных величинах и процентах) упоминания перечисленных форм участия в нашей выборке.

В соответствии с этими частотами можно выстроить из всех форм участия некоторый последовательный ряд от максимума до минимума (проранжировать их). Только после такой предварительной обработки становятся возможными следующие количественные операции:

1) определение моды, т.е. наиболее часто встречающегося значения изучаемого признака;

2) построение таблиц сопряженности (парных распределений) признаков;

3) вычисление в таблицах показателей парной связи признаков: критерия хи-квадрат, коэффициента сопряженности Пирсона (Р) и коэффици-Чупрова.

Эти коэффициенты равны нулю при полной независимости признаков и единице при полной их связи. С помощью данных операций можно обнаружить наличие связи между качественными признаками изучаемого явления. Напр., можно выяснить влияние пола, возраста, профессии, социального положения, политической активности обследуемых на их распределение по формам участия.

На порядковом уровне измерения, в отличие от номинального, устанавливается не просто перечень, но и иерархическая последовательность качественных признаков явления. Порядковая шкала позволяет фиксировать не только отношения «равенства – неравенства», но и отношения «больше – меньше» между отдельными позициями. Такую шкалу используют, например, для определения степени удовлетворенности опрашиваемых результатами полит. участия: 1 – совершенно не удовлетворен; 2 – скорее не удовлетворен, чем удовлетворен; 3 – в равной степени не удовлетворен и удовлетворен; 4 – скорее удовлетворен, чем не удовлетворен; 5 – полностью удовлетворен. Цифры, обозначающие ранги (ступени) перечисленных пунктов шкалы (1, 2, 3, 4, 5), как и в предыдущем случае, имеют условный характер, поскольку указывают на очередность расположения, а не на интенсивность качественных признаков. Мы можем, не нарушая отношения порядка, заменить указанные выше значения симметричными: -2, -1, 0, +1, +2. Шкала этого уровня не позволяет фиксировать изменение значений изучаемого признака от минимума (или нуля) до максимума, так как она не имеет единицы измерения.

Порядковые шкалы позволяют осуществлять больше операций с числами, чем шкалы предыдущего типа. К перечисленным выше (для номинальных шкал) операциям прибавляются: 1 – определение медианы (значения признака, расположенного в середине упорядоченного ряда); 2 – вычисление коэффициентов ранговой корреляции (взаимосвязи) признаков, т.е. коэффициентов Спирмена и Кендалла. Величина этих коэффициентов может изменяться от +1 (при наличии строгой прямой зависимости между двумя рядами рангов) до -1 (при наличии строгой обратной зависимости между двумя рядами рангов). При отсутствии зависимости они равны нулю. Эти коэффициенты используются для определения наличия или отсутствия связи между двумя проранжированными рядами признаков. С их помощью можно, например, измерить зависимость между степенью удовлетворенности политическим участием и степенью доверия политическим институтам по схеме: 1 – совсем не доверяю; 2 – больше не доверяю, чем доверяю; 3 – в равной степени не доверяю и доверяю, 4 – больше доверяю, чем не доверяю; 5 – полностью доверяю.

На интервальном уровне можно не только классифицировать и упорядочивать качественные признаки, но и определять величину удаленности одного их значения от другого. Шкалы этого уровня (интервальные) благодаря наличию стандартизованной единицы измеряемого признака позволяют определять расстояние между отдельными значениями этого признака, устанавливать насколько одно из них больше/меньше другого. Такие шкалы используются для измерения интереса к политической информации (продолжительности просмотра политических телепрограмм; числа политических изданий в домашней библиотеке и т.д.), политической активности (частоты участия в политических мероприятиях; времени, затрачиваемого на политическую работу, и др.).

В социологии существуют методы, с помощью которых можно сконструировать интервальную шкалу. Среди них наиболее распространен метод Тёрстоуна. Его можно использовать для измерения политических установок.

Частным случаем данной шкалы Тёрстоуна является «истинная» интервальная шкала, или шкала отношений, которая имеет не только единицу измерения, но и точку отсчета. Эта шкала позволяет определять, во сколько раз одно из значений изучаемого признака больше/меньше другого. С помощью такой шкалы обычно фиксируются возраст, доход, стаж работы и т.д.

Шкалы интервального уровня измерения допускают, помимо упомянутых на номинальном и порядковом уровнях, следующие операции с числами:

1) расчет средней арифметической;

2) определение дисперсии признака (рассеяния значений признака вокруг средней);

3) вычисление коэффициента парной корреляции Пирсона.

Последний позволяет измерять направление и интенсивность взаимосвязи двух интервальных признаков в случае наличия между ними линейной зависимости. Его величина изменяется от - 1 до +1.

В реальной практике социологических исследований встречаются переходные варианты шкал.

Очень важной процедурой является репрезентация объекта исследования (построение выборки). Все люди, подлежащие изучению в соответствии с выделенными переменными, называются генеральной совокупностью. Специально отобранная их часть, воспроизводящая в уменьшенном масштабе генеральную совокупность, составляет выборочную совокупность. В идеальном случае распределение выделенных признаков в обеих совокупностях должно совпадать. Это позволяет распространять на генеральную совокупность выводы, полученные на основе изучения выборочной совокупности.

Соответствие выборочной и ген. совокупностей называется репрезентативностью (представительностью).

Выборка считается репрезентативной, если по значениям основных переменных она отличается от генеральной совокупности не более, чем на ±5%. В практике соц. исслед-ий часто наблюдается «смещение» выборки – превышение 5%-ного барьера. В этом сл. делается «перевзвешивание» (ремонт) выборки с целью ликвидации указанного превышения.

Обычно репрезентация объекта исслед-ия осуществляется по таким признакам, как пол, возраст, образование, род занятий, место жительства (тип поселения) и др. Выборка, построенная на основе соответствующих ген. совокупности значений перечисленных выше переменных, называется. В этом случае представители различных социально-демографических групп отбираются сообразно их удельному весу среди населения. Каждый социолог, участвующий в обследовании, получает квотное задание и находит респондентов с соответствующими ему х-иками. Такую выборку можно построить в том сл., если имеются стат. данные о контролируемых нами признаках ген. совокупности (как пр., число этих признаков не превышает 4: пол, возраст, образование, род занятий).

Если же необходимых стат. данных нет, то можно построить случайную выборку.

Случайная выборка обычно создается на осн. систематического отбора необходимого кол-ва опрашиваемых из ген. совокупности, например из списка избирателей. Первый респондент выбирается с помощью таблицы случайных чисел, а остальные – в соответствии с определенным интервалом (шагом). Можно действовать иначе; сначала с помощью таблицы случайных чисел отобрать избирательные участки, а затем на каждом из них отобрать номера телефонов избирателей. В обоих случаях у каждого избирателя будет равная вероятность попадания в выборку. Например, если в нашем городе имеется 1800 изб. участков и нам нужно опросить 1200 человек, то мы можем отобрать 100 участков и на каждом из них отобрать по 12 абонентов.

В практике массовых опросов, проводимых Институтом Гэллапа, применялись две схемы построения выборки: социальная и политическая.

Социальная выборка основана на данных переписи всего населения,

Политическая – на списках избирателей.

Первая схема использовалась для изучения потребности в товарах, уровня жизни, распределения доходов, пособий и пр., вторая – для изучения отношения к кандидатам, партиям, должностным лицам и т.д. Социальная выборка формировалась двумя способами: случайным и стратифицированным. При простом случайном способе люди отбираются для опроса из алфавитного перечня всего населения. Это позволяет получить общее представление о состоянии дел. При стратификационном отборе все население делится на однородные группы (по образованию, профессии и т.д.), внутри которых проводится случайный отбор.

Политическая выборка должна учитывать факторы, влияющие на участие в голосовании (тип кампании, место жительства, уровень дохода, возраст и др.). При ее построении сначала составляется классификация населенных пунктов, затем из каждого их вида произвольно отбираются поселения пропорционально удельному весу этого вида. В этих поселениях выбираются административные районы, а в последних – избирательные участки. В первом варианте выборки единицей обследования является семья, во втором – избирательный участок. На участках делается выборка домов, в каждом из которых опрашивается один избиратель.

Одним из основных вопросов социологического исследования является определение объема выборки (числа единиц наблюдения). В большинстве наиболее значительных исследовательских проектов в области политологии используются выборки объемом приблизительно 1400-1600 респондентов. Такие исслед-ия дают рез-ты с точностью 3-4%. Однако в ряде сл. опрашивается большее число респондентов, что вызвано необходимостью повышения точности измерения (зачастую кандидаты в депутаты побеждают на выборах с перевесом от 1 до 2%). Объем выборки рассчитывается в каждом конкретном исследовательском проекте. В то же время в различных странах существуют определенные, установленные на осн. опыта исследований модели выборок.

После разработки программы и проверки инструментария начинается полевой этап исслед-ия, в рамках которого собираются и кодируются эмп. данные. При кодировке каждой позиции присваивается определенный № в порядке нарастания. Нумеруются лишь альтернативы возможных ответов на вопросы. Полученные коды являются условными числами. Только в такой форме фактическая информация может быть введена в компьютер.

Аналитический этап вкл. ввод, статистическую обработку закодированной информации, обобщение и интерпретацию полученных данных.

На осн. анализа осуществляется интерпретация данных. На этом этапе надо перейти от количественного (статистического) анализа к качественному (содержательному), перевести язык цифр на обычный язык. Также надо осуществить процедуру, обратную операционализации: перейти с обыденного языка, с помощью которого мы трансформировали исходные понятия в переменные и собирали первичную информацию, на язык науки, с помощью которого мы концептуализировали изучаемое политическое явление в начале исследования.

Методы сбора данных

К наиболее распространенным в социологии методам сбора данных относятся наблюдение, опрос и анализ документов. Наблюдение это целенаправленная, непосредственная визуальная регистрация социологом событий политической жизни: собраний, демонстраций, митингов, встреч, конфликтов, переговоров и др. Оно относится к так называемым неконтактным методам сбора первичных данных, поскольку не предполагает прямой или косвенный диалог социолога с представителями различных групп населения.

Набл. бывает вкл. и невкл., структурированным и неструктурированным, лабораторным и полевым. Для фиксации рез-тов набл. обычно разрабатываются специальные карточки и бланки, в которые записываются осн. ха-ики изучаемого события, напр. место и время проведения собрания, число и качественный состав присутствующих (пол, возраст), перечень обсуждаемых вопросов, реакция присутствующих на выступления политиков, общая атмосфера и т.д. Эти данные можно закодировать и обработать с пом. компьютера. Вместе с тем при вкл. наблюдении (участие в работе партии, учреждения) можно обойтись без упомянутых форм и ограничиться ведением дневника. При косвенном набл. за массовыми акциями достаточно делать видеозаписи. Первый вариант набл. можно отнести преимущественно к кол. (жестким), второй и третий – к преимущественно кач. (мягким) методам сбора данных.

Опрос – форма диалога, участниками которого явл. профессиональные социологи и представители различных соц. групп. Особенность опроса в том, что он имеет вербальный х-ер. При опросе мы получаем от людей инф-ию только о тех явл. полит. жизни, которые отражаются их сознанием и могут быть выражены ими в словесной форме, причем на языке их повседневного общения. Этим обусловлено повышенное внимание социологов к формулировкам впр., используемых при анкетировании и интервьюировании. Дж. Гэллап, наиб. авторитетный специалист в обл. проведения массовых опросов, сформулировал след. эмпирические правила построения соц. вопросников:

1) вп. должны быть краткими и касаться существа дела;

2) слова и предложения должны быть простыми по смыслу и общими для повседневного языка всех гр. населения;

3) в впр. не должно быть слов с сильной эмоц. окраской;

4) впр. должны вкл. все возможные альтернативы ответов.

Опросы делятся на письменные (анкетирование) и устные (интервьюирование), массовые и экспертные, групповые и инд., стандартизованные и фокусированные.

Осн. инструментом этого метода является впр. По структуре впр. делятся на открытые, закрытые и полузакрытые. В первом сл. респондентам предоставляется возможность самостоятельно сформулировать ответы на впр., во втором – перечисляются все альтернативы ответов, в третьем – предусматриваются как альтернативы, так и самостоятельные ответы.

По роли в исследовании впр. делятся на фильтрующие, общие, причинные, специфические и оценочные.

Определение: Фильтрующие впр. – это впр., кот. позволяют выяснять, насколько опрашиваемые осведомлены относительно обсуждаемой проблемы.

Определение: Общие (открытые) впр. – это вр., кот. помогают выявлять взгляды респондента на эту проблему.

Определение: Причинные впр. – это впр., кот. определяют факторы, обусловливающие эти взгляды.

Определение: Специфические впр. – это впр, кот. – устанавливают отношение респондента к отд. аспектам проблемы.

Определение: Оценочные впр. – это впр., кот. – определяют интенсивность или устойчивость этого отношения.

Существуют также впр.-ловушки, с пом. которых проверяется искренность ответов на основные вопросы. Опрос также имеет качественные и количественные варианты. Анкетный опрос можно назвать кол. методом, а фокусированное интервью – качественным. В первом случае инф-ция фиксируется системой показателей и шкал, во втором – обычной диктофонной записью, которая в последующем расшифровывается и подвергается качественному анализу.

Специфическим методом сбора данных является фокус-группа. Это вариант группового интервью по опр. проблеме. Фокус-группы используются при изучении эффективности полит. рекламы, особенностей восприятия визуальной полит. инф-ции разл. категориями населения и др.

Фокус-гр. – это разновидность кач. методов сбора данных. Она совмещает групповое интервью и групповую дискуссию.

Анализ документов бывает двух типов:

- традиционный

- формализованный (контент-анализ).

Традиционный анализ документов – это вид кач. анализа, вкл. осмысление и понимание содержания документальных источников (летописей, свидетельств очевидцев исторических событий, фонограмм, кинолент, видеозаписей, решений и протоколов заседаний официальных органов, писем, дневников, биографий).

Документы делятся на:

- статистические, текстовые и иконографические, официальные и личные.

Формализованный анализ документов (писем, стенограмм, газет, радио- и телепередач) основан на переводе качественных характеристик их содержания в количественные. В процессе контент-анализа выбираются смысловые единицы (фиксирующие фрагменты содержания документов) и единицы счета (фиксирующие регулярность появления смысловых единиц в документе). Смысловыми единицами могут быть имена, термины, суждения.

С пом. контент-анализа можно выявить отношение газет к опр. кандидату в депутаты, частоту появления и объем позитивных или негативных мат-ов, посвященных ему. В отеч. социологии накоплен большой опыт использования контент-анализа при изучении СМИ.

Методы анализа данных

В процессе анализа данных осуществляются следующие операций:

- расчет одномерного распределения признаков,

- построение группировок признаков,

- выявление зависимостей между признаками.

При обработке данных прежде всего выявляют одномерные распределения признаков (частоты появления разл. значений этих признаков в полученном массиве данных).

Например, в ходе одного из массовых опросов 1993 г. было установлено, что полностью доверяли правительству 5% респондентов, в основном доверяли 25%, не очень доверяли 36%, совсем не доверяли 25% (остальные затруднились ответить). На основе изучения этого распределения можно получить лишь предварительную информацию об отношении к правительству. Для всесторонней его оценки важно выяснить специфику распределения ответов на указанный вопрос у представителей различных социальных групп, включенных в выборку исследования: руководителей, специалистов, предпринимателей, военнослужащих, рабочих, учащихся, студентов, пенсионеров, безработных. Первым шагом на этом пути служит построение таблиц сопряженности (двумерных распределений) признаков. На осн. двумерных распределений признаков можно строить различные группировки опрошенных в соответствии с их социальными характеристиками (профессия, квалификация, доход, образование и пр.). В итоге получаются простые и комбинированные таблицы данных, а также графики, диаграммы, гистограммы и др.

Однако все эти процедуры на самом деле представляют собой лишь подготовку к настоящему анализу данных. Главное в этом анализе – выявление зависимостей между признаками. Основными методами изучения зависимостей являются анализ статистических таблиц, корреляционный, факторный, кластерный анализ и многомерное шкалирование.

Анализ стат. таблиц основан на оценке отсутствия/наличия взаимосвязи признаков по критерию хи-квадрат и вычислении стандартизованных остатков (величин, которые указывают на степень отклонения наблюдаемых частот от ожидаемых). Вычисление критерия хи-квадрат и стандартизованных остатков осуществляется с помощью пакета SРSS.

Рез-ты анализа стат. таблиц дают возможность сформулировать гипотезы о взаимосвязи признаков изучаемого явл-ия, нуждающихся в доп. проверке с помощью стат. методов.

Корреляционный анализ основан на расчете отклонения значений изучаемого признака от линии регрессии – условной линии, к которой эти значения тяготеют. Чем больше разброс значений, тем слабее связь двух интересующих нас признаков. Чем меньше разброс значений, тем сильнее связь.

Корреляция – это статистическая взаимозависимость между признаками изучаемого явления. Корреляционный анализ представляет собой математическую процедуру, с помощью которой изучается эта взаимозависимость. Он заключается в вычислении коэффициентов корреляции – чисел, знак и величина которых характеризуют направление (прямая/обратная) и интенсивность/тесноту (строгая, сильная, умеренная, слабая, нулевая) взаимозависимости. Показателем интенсивности связи служит значение коэффициента. Считается, что если он равен 1, то взаимозависимость признаков является строгой (полной); если его значение находится в интервале от 1 до 0,8, то это свидетельствует о сильной их взаимозависимости; если в интервале от 0,7 до 0,3 – об умеренной (неярко выраженной) взаимозависимости, а если же оно лежит в интервале от 0,2 до 0,0, то мы имеем дело со слабой или нулевой взаимозависимостью. Есть мнение, что в социологических исследованиях значения коэффициентов корреляции выше 0,5 встречаются не очень часто, поэтому можно принимать во внимание те из них, которые равны или превышают 0,3, т. е. характеризуют умеренную взаимосвязь признаков.

Rоэффициенты корреляции выражают не причинную (обусловленность одного признака другим), а функционалъную (взаимная согласованность изменения признаков) зависимость между признаками. Различают парную (между двумя признаками) и множественную (между несколькими признаками) корреляции.

Для изучения взаимосвязи признаков, измеренных с помощью различных типов шкал, используются разные коэффициенты корреляции. На порядковом уровне измерения признаков применяется коэффициент ранговой корреляции Спирмена, на интервальном уровне обычно используется коэффициент корреляции Пирсона. Коэффициент Спирмена равен +1, когда два ряда проранжированы строго в одном порядке, -1, когда два ряда проранжированы в строго обратном порядке, и равен нулю при полном взаимном беспорядочном расположении рангов.

Коэффициент корреляции Пирсона равен +1 при строгой (полной) прямой взаимозависимости двух признаков (увеличение/уменьшение значений одного признака сопровождается увеличением/уменьшением значений второго признака). Он равен -1 при строгой (полной) обратной взаимозависимости (увеличение/уменьшение значений одного признака сопровождается уменьшением/увеличением значений второго признака). Наконец, величина этого коэффициента равна нулю при отсутствии взаимозависимости признаков. Об интерпретации значений коэффициентов корреляции, отличных от 1 и 0, говорилось в начале этого параграфа.

Как правило, на признаки изучаемого явления влияет множество причин, поэтому для выявления полной картины недостаточно только анализа парных корреляций, нужна группировка этих корреляций и выявление на этой основе комплексов скрытых (латентных) переменных, которые называются факторами.

Необходимость факторного анализа обусловлена тем, что мы не можем воспринимать большое число сопоставляемых пар признаков и вынуждены прибегать к помощи вычислительной техники.

Факторный анализ основан на измерении доли влияния каждого из выделенных нами комплексов (независимых) переменных на изменение изучаемых признаков явления (зависимых переменных) и обнаружении причинной обусловленности этих изменений. Факторы выражают внутренние (скрытые) свойства системы переменных, характеризующих изучаемое явление.

Исходной информацией факторного анализа служит матрица (система чисел, размещенных в прямоугольной таблице в виде п столбцов и т строк) парных коэффициентов корреляции всех отобранных нами переменных. На основе матрицы выявляются скопления переменных, тесно связанных друг с другом и слабо связанных с переменными, входящими в другие скопления. Эти скопления переменных образуют факторы.

Целью факторного анализа служит выявление так называемой простой структуры. Согласно Терстоуну, эта структура должна удовлетворять следующим условиям:

В каждой строке факторной матрицы должно быть хотя бы одно нулевое значение (нулевыми считаются также значения, первый разряд которых начинается с 1).

В каждом столбце факторной матрицы число нулевых значений должно быть не меньше числа факторов.

В каждой паре столбцов должно быть несколько переменных, которые имеют значения, равные нулю в одном из столбцов и не равные нулю – в другом.

В каждой паре столбцов имеется мало переменных, значения которых в обоих из них отличны от нуля.

В качестве примера такой структуры можно привести результаты факторного анализа данных упомянутого выше опроса населения Санкт-Петербурга.

Переменные для факторного анализа отбираются в соответствии с определенными критериями. Считается, что эти переменные должны быть измерены с помощью интервальной шкалы. Для порядковых переменных не существует факторных моделей, поскольку операции сложения для них невозможны. Надо иметь в виду, что в данном случае «допускается лишь эвристическое использование таких моделей без статистической интерпретации результатов. Это значит, что можно подвергать факторному анализу переменные, измеренные с помощью порядковых шкал, однако в данном случае нельзя оперировать собственными значениями факторов и определять более и менее значимые факторы.

На порядковом уровне с помощью факторного анализа можно лишь устанавливать кластерную структуру переменных. Часто предполагается, что порядковым переменным можно присваивать числовые значения, не нарушая их внутренних свойств. Например, можно присвоить числовые значения 5, 4, 3, 2, 1 позициям порядковой шкалы: целиком согласен, согласен, безразличен, не согласен, полностью не согласен. Если искажения корреляций, вносимые при шкалировании порядковых переменных, не слишком велики, вполне законно использовать эти переменные в качестве числовых.

Кластерный анализ – это процедура, позволяющая классифицировать различные объекты. С его помощью можно разбить респондентов на группы, сходные по ряду признаков. На дендрограмме «дерева признаков» признаки соединяются линиями, образуя отдельные пучки («ветви»), связанные с другими пучками («ветвями»). Эти пучки и называют кластерами. Чем короче линия, связьшающая переменные, тем ближе они находятся в пространстве признаков. В процессе кластеризации происходит объединение сходных объектов во все более сложные группы («разветвление»). Кластерный анализ представляет собой разновидность многомерной статистической процедуры, упорядочивающей объекты в относительно однородные группы. Переменные для кластерного анализа выбираются в соответствии с теорией (концепции, гипотезы), которая лежит в основе классификации. Перед началом анализа они должны быть преобразованы в биноминальные, принимающие значение «1» при наличии признака и «0» при его отсутствии. Кроме того, из

Технология эмпирического социологического исследования

Поиск по сайту