Контент-анализ (англ. content analysis – анализ содержания) – количественный анализ текстов и текстовых массивов с целью последующей содержательной интерпретации выявленных числовых закономерностей.
Принято считать, что контент-анализ состоит из трех основных этапов: 1) выделяются единицы анализа, которые затем сводятся в категории анализа и переводятся в машиночитаемый вид; 2) проводится подсчет частотных распределений, применяется математический аппарат для выявления взаимосвязей единиц анализа; 3) осуществляется интерпретация полученных результатов.
Методолого-методическая часть программы разбивается на три этапа. Первым шагом будет определение системы категорий анализа, вторым – соответствующая им единица анализа текста, а третьим – установление единиц счета, т.е. количественной меры единиц анализа (их еще называют индикаторами контент-анализа), позволяющей регистрировать частоту (регулярность) появления признака категории анализа в тексте.
В настоящее время различается четыре методологии контент-анализа: грамматический (лингвистический) - по размеру абзацев, длине фраз, порядку слов в предложении, метрическому составу и другим формальным признакам языка; семантический (социологический) - по экспертным оценкам содержания; документалистический (кибернетический) - по параметрам языка, текста и документа как сообщения (дескрипторы и их нагрузка, компактность, информационная плотность, аспектность, проточность, физический и информационный объемы, информационная емкость и информативность); цитационный - анализ библиографических ссылок в документе.
Проведение контент-анализа требует предварительной разработки ряда исследовательских инструментов. Разные специалисты и источники называют неодинаковое число таких документов. По мнению СИ. Григорьева и Ю.Е. Растова, их должно быть пять: 1) классификатор контент-анализа; 2) протокол итогов анализа (он еще называется — бланк контент-анализа); 3) регистрационная карточка (кодировальная матрица); 4) инструкция исследователю, не посредственно занимающемуся регистрацией и кодировкой единиц счета; 5) каталог (список) проанализированных документов.
|
Классификатором контент-анализа авторы называют общую таблицу, в которую сведены все категории (и подкатегории) анализа и единицы анализа. Ее основное предназначение — предельно четко зафиксировать то, в каких единицах выражается каждая категория, используемая в исследовании.
Протокол (бланк) контент-анализа содержит: во-первых, сведения о документе (его авторе, времени издания, объеме и т.п.); во-вторых, итоги его анализа (количество случаев употребления в нем определенных единиц анализа и следующие отсюда выводы относительно категорий анализа).
Регистрационная карточка представляет собой кодировальную матрицу, в которой отмечается количество единиц счета, характеризующих единицы анализа.
Инструкция кодировщику. Ее содержанием выступает описание правил соотнесения единиц текста с перечнем категорий анализа, а также правил регистрации в Кодировочной карточке. Примером может служить список категорий и элементов регламентации, который называют кодификатором (кодом).
Типичные ошибки анализа документов в социологическом исследовании:
|
1. Исследователь использует документальную информацию в качестве первичной социологической информации без предварительного ее анализа; не проверены: подлинность, достоверность, авторство документа, назначение информации.
2. Анализ документов ведется без предварительного плана, программы.
3. Выбранные для анализа документы имеют сходство с темой исследования лишь по названию. Информация, содержащаяся в них, не связана с гипотезами исследования.
4. Категории анализа не сопоставлены со смысловым содержанием и языком текста документов. В терминологическом обо значении категорий анализа имеется двусмысленность; в одну и ту же категорию анализа попадают существенно различающиеся смысловые единицы текста.
5. Не подготовлены заранее и не апробированы методические документы обзора данных. Возникли трудности регистрации признаков.
6. Не проведен инструктаж среди регистраторов и кодировщиков, они не прошли специальную подготовку.
7. Кодировка не соответствует программе обработки данных.
8. Плохо организовано рабочее место регистратора.
9. Нет списка (каталога) документов, используемых в анализе
№ | Признак, градация признака | Коды | |
1. | Тип автора | ||
— один человек | |||
—два и более человека | |||
— ситуация не ясна | |||
2. | Группа, к которой принадлежит автор | ||
— неформальная группа (семья, друзья и т.д.) | |||
— формальная группа (производственная группа, учебный коллектив и т.д.) | |||
— ситуация не ясна | |||
3. | Пол автора | ||
— автор (авторы)—мужчина (мужчины) | |||
— автор (авторы)—женщина (женщины) | |||
— смешанная группа | |||
— ситуация не ясна | |||
4. | Возраст автора | ||
— молодежь (до 30 лет) | |||
—лица среднего возраста (30—49 лет) | |||
—лица старшего возраста (свыше 50 лет) | |||
— смешанная группа | |||
— ситуация не ясна | |||
5. | Количество проблем, рассматриваемых в письме | ||
—одна | |||
-две | |||
— более двух | |||
6. | Локальность проблем, поднятых в письме | Проблема №1 | Проблема Ns2 |
— мир | |||
— страна | |||
— город | |||
—предприятие, учреждение | |||
— частная жизнь | |||
7. | Сфера общественной жизни (страна, область, город) | ||
—промышленность | |||
—сельское хозяйство | |||
—транспорт | |||
—строительство | |||
— вопросы распределения жилья | |||
— вопросы социального обеспечения | |||
8. | Типы суждений | ||
—суждение оценочное | |||
—суждение конструктивное | |||
—суждение аналитическое | |||
—другие типы суждения |
|