Теперь перечислим основные социально - демографические параметры в порядке убывания значимости:
· пол,
· возраст,
· социальное положение,
· образование,
· душевой доход.
Душевой доход поставлен на последнее место не потому что имеет наименьшую значимость, а потому, что данные по доходам не всегда валидны. Проблема в том, что в нашей стране не принято разглашать свои доходы. Есть и объективные трудности.
Во-первых, необходимо знать не просто доход а долю общего дохода домохозяйства, приходящуюся на каждого его (домохозяйства) члена, или душевой доход. Когда речь идет о панели эта проблема разрешима. А вот когда исследование разовое, да в нем еще принимает участие только один из членов домохозяйства, то ошибка в определении душевого дохода, обычно очень существенна. Вот почему разовые исследования так часто расходятся с панельными именно в данных по доходам. Естественно рекламистам важно знать эту характеристику как можно точнее, но ни чего не поделаешь, приходится смириться.
Во-вторых, наше общество чрезвычайно социально мобильно. Если сегодня человек работает на достаточно денежной работе, то завтра может ее потерять, или устроиться на еще более денежную. Сообщить это интервьюеру зачастую забывают, пока интервьюер не заметит изменений в быте домохозяйства. Но это все относится только к дневниковой панели. Для пиплметрической же панели это вообще почти невозможно отследить.
Несколько слов об остальных параметрах: социальное положение важно прежде всего потому, что определяет круг общения, который зачастую сильно влияет на медиапредпочтения. Образование тоже определяет медиапредпочтения, но в меньшей степени чем круг общения.
|
Таким образом мы получили ранжированный список соц.дем. параметров.
Репрезентативность
Если Вы хотите чтобы Ваши маркетинговые исследования действительно отражали медиапредпочтения всего населения, то совсем не достаточно опросить просто домохозяек, или старушек у подъездов. Логично предположить, что старушки и их юные внуки смотрят несколько разные телепередачи, или читают не одни и те же газеты. Значит, нужно выяснить мнение всех социально демографических групп населения.
Старая восточная мудрость гласит, "чтобы узнать вкус дыни не обязательно есть ее целиком". Совершенно справедливо и для социологии, но.при этом надо "знать как отрезать кусочек" на примере с дыней. Если мы отрежем кусочек вдоль "экватора" дыни, то мы ни чего не сможем узнать о вкусе около "полюсов", а вот если мы вырежем ломтик в меридиональном направлении, то весь спектр вкуса будет к нашим услугам. Осталось только не спеша попробовать и написать отчет. Социолог скажет, что такой ломтик был репрезентативен относительно "мередионального распределения вкуса дыни". Т.е. в ломтике представлены все пояса вкуса в той же пропорции, что и в самой дыне.
Точно так же и в социологии. Нам нужна выборка, в которой все группы населения представлены пропорционально их распределению в генеральной совокупности (ГС - в нашем случае это все те кого мы хотим исследовать).
Необходимо обратить внимания на то, что генеральная совокупность обязательно должна описываться в заголовке любого исследования в явном виде. Например "Все население региона старше 13 лет" или "Городское население региона старше 10 лет" Если этого нет, мы не знаем границ применимости полученных цифр. Т.е. если в ГС 12% неработающих женщин, то и в выборке обязано быть 12%, если, в ГС шоферов автобусов 0.8%, то и в выборке должно быть столько же. Отсюда следует интересный вывод; "Ни одна выборка не является абсолютно репрезентативной!". Не думаю, что где-нибудь существует выборка репрезентативная по цвету глаз респондентов, или по форме ушей, это просто ни кому не нужно. А вот репрезентативность по наличию домашних животных не помешала бы. Поэтому, всегда указывают относительно каких параметров репрезентативна выборка.
|
Также важно и то, что вописании выборки любого исследования обязательно должна присутствовать фраза "... выборка, репрезентативная по (набор соц.дем. параметров)"
5.3.1. Способы получения выборок.
Есть два основных способа получения выборки: абсолютно случайная выборка, и квотная выборка.
Представьте себе ведро в котором равномерно перемешаны шарики трех разных цветов, и самых разных размеров. Нам нужно узнать средний размер шариков каждого цвета. Мы зачерпываем горсть шариков (это и будет случайная выборка). Сортируем по цвету измеряем размер каждого и вычисляем средние по цветам. Но это только в том случае если шарики очень хорошо перемешаны. Если нет - возможны проблемы.
Та же история, но, мы знаем процентное содержание шариков каждого цвета (квоту) в ведре. Мы можем наугад отобрать по N1,N2, N3 (пропорционально их квотам) шариков каждого цвета (это и есть квотная выборка) измерить и получить средние по цветам. Так конечно надежнее, нет нужды думать о степени перемешанности по цвету. Но нужно знать квоту каждого цвета.
|
Но это все теория. Дело в том, что в реальной жизни очень трудно добиться абсолютной случайности. Поток пешеходов на улицах - имеет довольно строгую закономерность, в зависимости от части дня, конкретной точки, погодных условий, и еще кучи факторов. Расселение жильцов по квартирам тоже довольно закономерно. Случайную выборку получить крайне трудно. Приходится сильно исхитряться.
Наиболее применяем на практике комбинированный метод - случайная, квотная выборка. Это когда сперва
- делают случайную выборку,
- потом проверяют в ней квотность,
- а потом компенсируют нарушения квотности, тем или иным способом.
Итак, описание выборки мы теперь можем написать так "Случайная, квотная выборка, репрезентативная по (набор соц.дем. параметров)".
5.3.2. Рейтинг
Рейтинг - отношение числа людей ответивших положительно на вопрос о просмотре передачи (чтении газеты, и проч.), к объему выборки, выраженное в процентах.
Иными словами, если мы опросили 1 000 человек, и 253 сказали нам, что вчера смотрели программу "Время", то рейтинг вчерашнего "Времени" - 253/1 000 = 25.3%.
Рейтинг того же "Времени" среди мужчин - 152/480 = 31.7% (мужчин в популяции 48%, а ответили положительно, допустим 152 мужчины).
Рейтинг среди женщин соответственно - 101/520 = 19.4%.
По аналогии мы можем определить все соц.дем. характеристики данной передачи.
Часто можно встретить такое определение рейтинга "Рейтинг - отношение числа смотревших передачу к объему ГС", так вот, это неверное определение. Подобным образом можно определить рейтинг только путем референдума (всенародного опроса), а его вряд ли под силу провести даже самой крупной компании. Кроме того, подобное определение как бы исподволь внушает нам, что рейтинг является характеристикой всей ГС. Рейтинг характеризует только нашу выборку, а в каких взаимоотношениях он находится с ГС зависит от того, насколько наша выборка репрезентирует ГС, от методики исследования, объема выборки, и т.д.
Если вы сможете формализовать вашу целевую аудиторию (например, домохозяйки 20 - 50 лет) - то сможете вычислить рейтинг (и не только) в этой целевой аудитории, а следовательно узнать сколько же человек контактировало с Вашей рекламой: р ейтинг в ЦГ надо умножить на объем ЦГ. Получится число людей из ЦГ смотревших данную передачу. Это называется проекцией рейтинга на население (в данном примере на ЦГ). Выражается эта величина обычно в тысячах человек и обозначается (000's).
И вот тут начинаются тонкости. Если мы возьмем ЦГ "мужчины и женщины в возрасте 16-20, с высшим образованием" то сами понимаете, рейтинг будет равен нулю. Не бывает таких (не есть конечно вундеркинды, но их очень мало и вряд ли он попали в выборку). Т.е. на очень мелких ЦГ медиаданные становятся невалидными.
Тут необходимо сказать о точности: есть одно негласное, хотя абсолютно верное правило. "Нельзя опираться на мнение менее чем 70 человек"! Это очень удобное правило. Им крайне легко пользоваться. Если мы встречаем рейтинг в 1.75%, знаем что выборка 1 000 человек, понятно, что данные некорректны. Это правило можно вполне строго доказать с помощью методов теории вероятности (В. Феллера "Введение в теорию вероятностей и ее приложения", том первый).
Теперь о половинке человека. Такое частенько случается с медиаметристами. И происходит это от особенностей расчетов проводимых при получении медиахарактеристик. Итак, на выборке в 1000, валидны рейтинги только более 7% все, что ниже - невалидны (т.е. имеют очень большой доверительный интервал). Доверительный интервал расширяется при уменьшении рейтинга и при уменьшении объема выборки. Да такие рейтинги тоже несут некоторую информацию, однако доверять им можно только с некоторой оглядкой.
Отсюда один интересный момент. Чем сильнее мы ограничиваем ЦГ пересечением соц.дем. параметров, тем менее точны в этой ЦГ рейтинги. Действительно объем выборки в каждой соц.дем. группе меньше чем во всей выборке, а в пересечении соц.дем. групп еще меньше. Значит в соц.дем. группе представленной в выборке менее чем 70 респондентами рейтинги - ни какого смысла не имеют.
Теперь мы можем написать наше описание выборки например так: "В исследовании использована случайная, квотная выборка, репрезентативная по полу и возрасту. Объем выборки - 1 500 человек." и далее "Генеральная совокупность - все городское население Тверской области. (города с населением более 100 000 человек" Т.е. в этом описании должны быть четко обозначены основные параметры исследования, позволяющие судить подходит нам результаты этого исследование для решения наших задач или нет.