Простая случайная выборка
Данный вид отбора осуществляется следующим образом:
1. Определяется объем выборки при помощи специальной формулы.
2. Составляется полный список элементов генеральной совокупности.
3. При помощи таблицы случайных чисел из списка отбираются рассчитанное ранее число людей, которые будут обследоваться.
Cистематическая выборка
Данный вид отбора осуществляется следующим образом:
1. Рассчитывается объем выборки по специальной формуле.
2. Составляется полный список элементов генеральной совокупности.
3. Определяется шаг выборки.
4. По таблице случайных чисел определяется номер первого респондента.
5. Производится отбор из списка респондентов с данным шагом.
Гнездовая выборка
Гнездовая выборка применяется в том случае, если генеральная совокупность состоит из небольших по численности естественных групп элементов (серий, гнезд).
При использовании данного типа отбора необходимо:
1. Определить объем выборки (число гнезд).
2. Составить полный список гнезд, входящих в генеральную совокупность.
3. По таблице случайных чисел (или систематически) отобрать рассчитанное ранее число гнезд.
4. Выдать задание анкетерам на сплошной опрос всех людей, входящих в каждое из отобранных гнезд.
Чем большее число серий отбирается, тем ошибка гнездовой выборки меньше. Поэтому гнезда должны быть небольшими по численности, иначе осуществить обследование большого их числа будет невозможно. Гнездовую выборку следует применять в тех случаях, когда гнезда схожи по изучаемому признаку.
Стратифицированная выборка
Стратифицированная выборка (районированная, расслоенная, иногда ее называют типической) – выборка, при которой, перед тем как начать отбор, генеральная совокупность разбивается на однородные части (страты) по определенному признаку, а затем из них производится систематический или простой случайный отбор.
|
Признак, по которому производится расслоение генеральной совокупности, называется признаком расслоения. Страты представляют собой группы единиц, имеющие разные значения признака расслоения.
Следует выбирать такие признаки расслоения, которые оказывают существенное влияние на исследуемые признаки. Исследуемыми являются признаки, измерение которых входит в задачи исследования, например, удовлетворенность населения различными аспектами жизни, электоральные предпочтения и т. п.
Лучше, если стратификация будет производиться по двухмерному или трехмерному признаку, например, в двухмерном случае – по полу и возрасту. Иногда данные признаки называют сопряженными. Тогда образуются различные половозрастные страты: мужчины 18–29 лет, женщины 18–29 лет, мужчины 30–49 лет, женщины 30–49 лет и т. д.
4. Квотная выборка
Квотная выборка формируется из единиц определенных категорий (квотных групп), которые должны быть представлены в пропорциях, соответствующих пропорциям в генеральной совокупности. Таким образом происходит целенаправленное согласование распределения определенных признаков в генеральной и выборочной совокупности. Эти признаки называются квотными. Они должны оказывать сильное влияние на исследуемые признаки, то есть признаки, измерение которых входит в задачи исследования. В качестве исследуемых признаков могут выступать мнения, оценки и т. п. В качестве квотных признаков чаще всего используются пол, возраст, образование, так как информация об их распределении в генеральной совокупности наиболее доступна. Квотные группы – это группы людей, которые имеют разные значения квотного признака. В данном случае квотными группами будут выступать мужчины и женщины, возрастные и образовательные группы.
|
В целях повышения репрезентативности рекомендуется формировать группы по сопряженным квотным признакам. Это означает, что каждая группа должна обладать сочетанием значений нескольких признаков.
Для осуществления квотной выборки следует:
1. Определить общий объем выборки.
2. Выбрать квотные признаки.
3. Получить статистические данные о численности каждой квотной группы в генеральной совокупности.
4. Рассчитать объем выборки из каждой квотной группы.
5. Составить задания анкетерам.
Для определения общего объема квотной выборки не существует строгих математических формул, так, как в случайном отборе. Количество респондентов определяется исходя из потребностей анализа информации. Чем большее число социальных групп будет сравниваться, тем большее число респондентов нужно опросить.
Определив общий объем выборки, мы должны рассчитать число людей, которых нужно отобрать из каждой квотной группы.
Для этого следует:
1. Определить долю, которую составляет общий объем выборки в объеме генеральной совокупности (n / N).
2. Умножить эту долю на численность каждой квотной группы.
Процедура расчета объемов выборки из квотных групп абсолютно идентична процедуре расчета объемов выборки из страт.
|
Квотная выборка может быть одноступенчатой и многоступенчатой.
Одноступенчатая квотная выборка может быть извлечена из относительно небольшой либо достаточно однородной генеральной совокупности.
Метод снежного кома используется в качественных исследованиях, когда генеральная совокупность мала и представляет собой специфическую труднодостижимую социальную группу.
Отбор осуществляется следующим образом: человек, который удовлетворяет вашим критериям отбора указывает на потенциальных подходящих кандидатур, которые в свою очередь также могут посоветовать подходящих участников исследования.
Целевой отбор. В данной ситуации единственным критерием отбора выступает соответствие единиц наблюдения предмету нашего исследования.
Стихийный отбор. Представляет собой опрос людей, проводимый без каких-либо четко установленных правил. Чаще всего этот вид отбора не применяется в социологических исследованиях, не является научным, характерен для журналистов.
5. Нужно отметить, что основной недостаток квотной выборки – высокая вероятность систематических ошибок, прежде всего вследствие предоставления анкетеру большей свободы, чем в случае вероятностного отбора.
Именно поэтому для уменьшения систематических смещений в отбор вносятся элементы случайного отбора, то есть применяется процедура рандомизации (от англ. random – случайный. Часто рандомизация рассматривается как процедура случайного отбора. Мы рассматриваем данный термин в узком значении этого слова – как использование случайного отбора на этапах подготовки к формированию квотной выборки). В случае одноступенчатой производственной выборки, например при формировании выборочной совокупности студентов в высшем учебном заведении, данная процедура проводится путем случайного отбора студенческих групп из их списков.
Если квотный отбор используется на последней ступени многоступенчатой выборки, то рандомизация относится к первым ступеням отбора перед тем как начать собственно квотный отбор.
6. Отклонение результатов, полученных с помощью выборочного наблюдения от истинных данных генеральной совокупности.
Ошибка выборки бывает двух видов – статистическая и систематическая. Статистическая ошибка зависит от размера выборки. Чем больше размер выборки, тем она ниже.
Систематическая ошибка зависит от различных факторов, оказывающих постоянное воздействие на исследование и смещающих результаты исследования в определенную сторону.
Ошибка выборки - это погрешность, с которой выборочные данные могут быть перенесены на всю аудиторию. Обычно ошибка выборки не превышает 5% на 95% доверительном интервале.
Доверительная вероятность – вероятность того, что доверительный интервал накроет неизвестное истинное значение параметра, оцениваемого по выборочным данным. В практике исследований чаще всего используют 95%-ую доверительную вероятность
Ошибка выборки (доверительный интервал) – интервал, вычисленный по выборочным данным, который с заданной вероятностью (доверительной) накрывает неизвестное истинное значение оцениваемого параметра распределения.
Доля признака – ожидаемая доля признака, для которого рассчитывается ошибка. В случае, если данные о доле признака отсутствуют, необходимо использовать значение равное 50, при котором достигается максимальная ошибка.
8. Под ремонтом выборки надо понимать сам процесс устранения погрешностей, т.е. расхождения двух совокупностей, теми способами, методами и инструментами, которые предлагает методическая наука.
Таким образом, второй прием выступает практической реализацией первого, аналитического, а оба они составляют два обязательных этапа проведения социологического исследования.
Часто контроль выборки употребляют в расширенном значении, включая в него также ремонт выборки. В этом случае говорят о широком понимании ремонта выборки как первичной статистической обработки данных, включающей коррекцию: а) выборочной совокупности; б) распределений социально-демографических характеристик респондентов; в) резко выделяющихся и пропущенных ответов, а также взвешивание исходных данных. Указанные виды коррекции призваны отремонтировать самое главное — выборку исследования, повысить степень ее репрезентативности. Почему это главное? Анкета может быть исключительно интересной, глубокой и содержательной, но запустили ее на плохом массиве, т.е. нерепрезентативной выборке. Усилия всего коллектива пошли насмарку, так как цена такой информации почти нулевая. Вот почему в рассматриваемых ниже видах коррекции, даже если они касаются заполнения анкеты и к выборке имеют вроде бы косвенное отношение, фокус внимания один-единственный — выборка.
Основная цель ремонта выборки — повышение качества уже собранной информации. Процедура ремонта выборки включает несколько операций.
Коррекция выборочной совокупности. Далеко не всегда отобранные респонденты, по самым разным обстоятельствам, могут или желают отвечать на вопросы. Кто-то заболел или уехал в срочную командировку, другой отказывается по идейным соображениям или не способен отвечать в силу умственной недостаточности. Кого-то трудно застать дома, хотя анкетер приходил к нему не единожды.
Возникает проблема замены респондентов, которая может быть решена с помощью нескольких методов: выбор следующего по списку респондента (например, следующего номера в телефонном справочнике), использование первоначальной выборки больших размеров и формирование повторной выборки. В последнем случае, если процент ответов оказался намного ниже, чем ожидалось, основа выборки расширяется за счет дополнительных имен, найденных, например, случайным образом. Самым эффективным способом считается поиск эквивалентной замены. Если, к примеру, в вашу выборку попал работающий пенсионер такой-то национальности и овдовевший, то желательно подыскать ему в качестве замены другого пенсионера сходного возраста, национальности, овдовевшего и работающего. Нередко подобный способ превращается в трудо- и времязатратное мероприятие. Если список генеральной совокупности невелик и найти замену не удается, следует отказаться от эквивалентного метода и перейти к другому.
Коррекция распределений демографических характеристик респондентов. Если по окончании исследования в паспортичке вашего исследования получилось, что у вас, к примеру, перебор женщин, людей с высшим образованием или пожилых людей в сравнении с теми процентными долями, которые они имеют в генеральной совокупности, то можно применить три способа: 1) удалить те группы респондентов, которые оказались представлены в избыточном количестве; 2) доопросить те группы, которые оказались представленными в недостаточном количестве; 3) математически повысить значение ответов, представленных недостаточно, или снизить — представленных избыточно. Но сначала желательно выяснить, а влияет ли то и другое на содержание ответов. Может быть, все можно оставить и так.
Взвешивание исходных данных — математический способ повышения или понижения значения ответов конкретной группы респондентов (например, незамужних сельских женщин в возрасте от 30 до 45 лет). Взвешивание означает присваивание каждому респонденту определенного веса (коэффициента, на который нужно умножить все мнения-ответы одного или группы респондентов ради восстановления репрезентативности). По мнению А. Балабанова41, взвешивание — единственный способ восстановления репрезентативности в панельных исследованиях без потери точности. Поскольку способов взвешивания существует очень много, то перед социологом возникают достаточно непростые методологические проблемы, которые без соответствующей подготовки и знаний решить невозможно. Весовые коэффициенты можно определять по-разному, а сам процесс присвоения коэффициентов почти невозможно контролировать со стороны, другим исследователям. Самый простой способ — численность конкретной социально-демографической группы, например подростков от 13 до 17 лет, из генеральной совокупности(N) делят на количество респондентов, представляющих данную возрастную группу(п), полагая, что один респондент представляет мнение 5 человек генеральной совокупности.
Генеральная совокупность – это совокупность единиц, относительно которой делаются выводы выборочного обследования. В качестве генеральной совокупности может выступать совокупность жителей страны, отдельного населенного пункта, совокупность работников предприятия и т. п.
Выборочная совокупность (выборка) – это часть генеральной совокупности, сформированная при помощи специальных методов и процедур, результаты обследования которой распространяются на генеральную совокупность.
Объем выборки – это число единиц, входящих в выборочную совокупность.
Объем генеральной совокупности – число единиц, входящих в генеральную совокупность.
Объем выборки или генеральной совокупности может выражаться не только числом людей, но и – в случае многоступенчатой выборки – числом избирательных участков, населенных пунктов, то есть достаточно крупных единиц, которые состоят из единиц наблюдения.
Единицы наблюдения – элементы генеральной совокупности, свойства которых подвергаются непосредственному измерению. При опросах общественного мнения единицей наблюдения является отдельный респондент, при анализе документов единицей наблюдения может быть, например, отдельный экземпляр газеты.
В целях упрощения восприятия материала мы будем основываться на том положении, что единицей наблюдения является респондент, а выборочное исследование предполагает применение такого метода сбора информации, как опрос.
Единицы отбора – составные части (единицы) генеральной совокупности, последовательным отбором которых формируется выборочная совокупность. В качестве единиц отбора могут выступать как единицы наблюдения, так и более крупные единицы.
Одноступенчатая выборка – выборка, при которой выборочная совокупность формируется непосредственно из единиц наблюдения. Так, например, из списков работников завода сразу отбираются люди, принимающие участие в опросе.
Многоступенчатая выборка – выборка, при которой отбору единиц наблюдения предшествует отбор более крупных единиц, при этом на каждой ступени единица отбора меняется. Так, например, при трехступенчатой общегородской выборке на первой ступени могут отбираться избирательные участки, на второй ступени в каждом из отобранных избирательных участков отбираются квартиры, на третьей – в отобранных квартирах отбираются респонденты. На первой ступени единицей отбора является избирательный участок, на второй – квартира, на третьей – респондент.
Репрезентативность выборки – свойство выборочной совокупности воспроизводить характеристики генеральной совокупности.
Отклонение выборочных характеристик от генеральных называется ошибкой репрезентативности или ошибкой выборки. В случае количественных признаков, имеющих единицу измерения, ошибка выборки рассчитывается как разность генеральной и выборочной средней величины. В случае качественных признаков, то есть признаков, не имеющих единицы измерения, ошибка выборки рассчитывается как разность выборочной и генеральной доли (процента).