Определение объема выборки.




ТЕМА 3. ВЫБОРОЧНОЕ НАБЛЮДЕНИЕ

Лекция 5. Определение объема выборки. Статистическая проверка гипотез. Проверка гипотез о генеральной средней и равенстве двух выборочных средних.

ОПРЕДЕЛЕНИЕ ОБЪЕМА ВЫБОРКИ.

Объем выборки (n), необходимый и достаточный для получения величины ошибки, допустимой для конкретного исследования, рассчитывается на стадии проектирования выборочного наблюдения. Поскольку конечная цель выборочного наблюдения состоит в оценке параметров генеральной совокупности, необходимо стремиться к формированию такой выборки, которая бы обеспечила минимальную ошибку. Как известно, величина ошибки выборки обратно пропорциональна ее объему. Однако увеличение объема выборки снижает эффективность затрат на проведение выборочного наблюдения, поэтому нужно искать компромисс между допустимой величиной ошибки и объемом выборки.

Расчет объема выборки осуществляется, исходя из формулы предельной ошибки выборки. Так:

(5.1)

 

где - предельная ошибка выборки; t – коэффициент доверия; - величина дисперсии; n- объем выборки.

При расчете объема выборкивеличина ошибки задается исследователем, исходя изобъекта и целей исследования, обусловливающих необходимую точность получаемых оценок. Значение коэффициента доверия зависит от устанавливаемого исследователем уровня вероятности и находится в таблице нормального распределения, если планируется выборка большого объема, или в таблице t-распределения Стьюдента, если предполагается выборка малого объема.

Величина дисперсии берется по результатам предыдущих аналогичных исследований, если они проводились, и если за прошедшее время не произошло существенных изменений в изучаемомобъекте. Если подобные исследования ранее не проводились, может быть проведено пилотное (пробное) исследование, и по его результатам рассчитана дисперсия. В противном случае используется «правило трех сигм» (, см. Лекцию 3), исходя из которого в размах вариации (R = max - min) укладывается 6 . Следовательно, величина среднеквадратического отклонения может быть определена: и затем рассчитано значение дисперсии - .

Правило трех сигм справедливо для нормального (симметричного) распределения. Если заведомо известно, что распределение единиц в изучаемой совокупности асимметрично (так, например, распределение населения по величине доходов всегда имеет правостороннюю асимметрию), значение дисперсии рассчитывают, исходя из того, что .

В рассматриваемой формуле расчета объема выборки ошибка выборки берется как абсолютная величина, но на практике она часто задается как относительная. Например, ошибка не должна превышать 2% или 5%. Тогда:

 

 

(5.2)

 

 

где , напомним, что V- это коэффициент вариации.

Приведенные формулы расчета объема выборки ориентированы на повторный отбор. Учитывая формулу расчета ошибки выборки для бесповторного отбора(см. Лекцию 4), расчет объема выборки при таком условии будет осуществляться несколько иначе.

Расчет объема выборки при бесповторном отборе для собственно случайной выборки:

; (5.3)

 

 

расчет объема выборки при бесповторном отборе для стратифицированной выборки:


. (5.4)

 

Если объем выборки определяется, исходя из необходимости оценки доли единиц изучаемой совокупности, обладающих тем или иным значением признака, то используются следующие формулы:


(5.5)

,

 

данная формула предназначена для расчета объема выборки при повторном отборе. Формула (56) учитывает бесповторный отбор:

 

 

(5.6)

 

При расчете объема выборки для оценки показателя доли берется максимальное значение дисперсии – 0,25, исходя из того, что доли единиц обладающих и не обладающих тем или иным признаком равны: 0,5*0,5 = 0,25.

Приведем пример расчета объема выборки.

Допустим, фирма - оператор сотовой связи разрабатывает тарифный план.В рамках этой задачиее интересует средняя продолжительность одного звонка внутри сети и доля звонков длительностью более 2-х минут. Для получения этих характеристик можно провести выборочное наблюдение. Какое число соединений необходимо охватить, чтобы предельная ошибка выборки не превышала 5% средней продолжительности звонка и 5% при определении доли звонков?По результатам прошлого аналогичного исследования коэффициент вариации продолжительности разговора составлял 60%. Рассчитаем необходимый объем выборки с вероятностью - 0,95.

 


=4*3600/25=576 (соединений);

 

 


=4*(0,5*0,5)/0,0025=400 (соединений).

 

 

Чтобы в ходе одного выборочного исследования оценить значения двух интересующих аналитика показателей, очевидно, следует сформировать выборку объемом 576 соединений.



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2018-01-08 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: