Определение объема выборки
Основными факторами, влияющими на объем выборки, являются:
· Точность – степень ошибочности результатов обследования или размер доверительного интервала. Абсолютная точность задается определенным интервалом, в котором должно находиться оцениваемое значение. Относительная точность определяется относительно уровня оценки параметра (Г. Черчилль).
Желаемая величина оцениваемого интервала при оценке параметра совокупности с использованием выборочной статистики. Это максимально допустимое различие между статистикой выборки и параметром генеральной совокупности (Н. Малхотра).
· Достоверность – степень уверенности в том, что оценка близка к истинному значению (Г. Черчилль).
|
|
|
|
|
Рис.1. Факторы, обеспечивающие достоверность исследования (Маркетинг: учеб. пособие/под ред. А.М. Немчина, Д.В. Минаева.)
В качестве одного из базовых понятий теоретической концепции, лежащей в основе определения объема выборки, рассматривается также понятие «выборочное распределение »
Выборочное распределение – распределение значений определенной статистики, исчисленной для всех возможных различимых выборок, которые могут быть выделены из генеральной совокупности по данному плану выборочного контроля (Г. Черчилль).
Распределение значений выборочных статистик, рассчитанных для каждой возможной выборки, которую можно получить из изучаемой совокупности при определенном плане выборочного наблюдения (Н. Малхотра).
|
Определение объема выборки при работе с выборочными долями
Для определения количества опрашиваемых респондентов, в случае если исследователя интересует их доля, может быть применена следующая формула:
где n – необходимый объем выборки;
t – нормированное отклонение, соответствующее доверительному интервалу;
p – вариация признака для выборки, при наличии только 2-х вариантов ответа, чаще всего 50 (%);
q = 100 – p
∆ - допустимая ошибка.
Доверительный интервал – диапазон, в который попадает истинное значение параметра совокупности при данном уровне достоверности (Н. Малхотра).
Это диапазон, крайним точкам которого соответствует определенный процент определенных ответов на какой-то вопрос. Данное понятие тесно связано с понятием «среднеквадратическое отклонение изучаемого признака в генеральной совокупности»: чем оно больше, тем шире должен быть доверительный интервал, чтобы включить в свой состав, например, 95% ответов. (Е.П. Голубков)
Уровень доверительности | 99,7 | ||||||||
Нормированное отклонение, t | 0,84 | 1,03 | 1,29 | 1,44 | 1,65 | 1,96 | 2,08 | 2,58 | 3,0 |
Например, фирмой, выпускающей покрышки, проводится опрос автолюбителей. Целью обследования является определение процента автолюбителей, использующих радиальные покрышки, поэтому на вопрос: «Используете ли вы радиальные покрышки?» — возможно только два ответа: «Да» или «Нет» (шкала наименований). Если предположить, что совокупность автолюбителей обладает низким показателем вариации, то это означает, что почти каждый опрошенный использует радиальные покрышки. В этом случае может быть сформирована выборка достаточно малых размеров. В формуле произведение pq выражает вариацию, свойственную совокупности.
|
Предположим, что 90% единиц совокупности используют радиальные покрышки. Это означает, что рq = 900. Если принять, что показатель вариации выше (р = 70%), то рq = 2100.
Наибольшая вариация достигается в случае, когда половина совокупности (50%) используют радиальные покрышки, а другая (50%) — не использует. В этом случае произведение рq достигает наибольшего значения, равного 2500.
При проведении обследования следует указать точность полученных оценок. Скажем, было установлено, что 44% респондентов используют радиальные покрышки. В этом случае результаты измерения желательно представить в виде: «Процент автолюбителей, использующих радиальные покрышки, составляет 44% плюс-минус...%». Величину допустимой ошибки заранее совместно определяют заказчик исследования и исследователь.
Что касается уровня доверительности, то при проведении маркетинговых исследований, как отмечалось выше, обычно рассматриваются только два его значения: 95% или 99%. Первому значению соответствует значение t = 1,96, второму — t = 2,58. Если выбирается уровень доверительности, равный 99%, то это говорит о том, что мы уверены на 99% (другими словами, доверительная вероятность равна 0,99) в том, что процент членов совокупности, попавших в диапазон ± ∆%, равен проценту членов выборки, попавших в тот же диапазон ошибки.
Принимая вариацию, равную 50%, точность, равную ± 10%, при 95%-ном уровне доверительности, рассчитаем размер выборки:
|
При уровне доверительности, равном 99%, и = ∆±3% n = 1067.
При определении показателя вариации для определенной совокупности прежде всего целесообразно провести предварительный качественный анализ исследуемой совокупности, в первую очередь установить схожесть единиц совокупности в демографическом, социальном и других отношениях, представляющих интерес для исследователя. Возможно проведение пилотного исследования, использование результатов подобных исследований, проведенных в прошлом. При использовании процентной меры изменчивости принимается в расчет то обстоятельство, что максимальная изменчивость достигается для р = 50%, что является наихудшим случаем. К тому же этот показатель радикальным образом не влияет на объем выборки. Учитывается также мнение заказчика исследования об объеме выборки.
Преимущества данного способа определения объема выборки:
· Наличие каких-либо предварительных данных уменьшает количество опрашиваемых и трудоемкость сбора данных
Недостатки:
· Необходимость оценки первого значения и определение объема выборки на основе этой оценки
· Необходимость обращения к предыдущим исследованиям для осуществления этой оценки