Способы отбора и виды выборочного наблюдения




Тема 6. Выборочный метод

Выборочное наблюдение – это вид несплошного наблюдения, которое обеспечивает отбор в случайном порядке части единиц совокупности и возможность последующего распространения полученных данных на всю совокупность единиц. Исходный массив данных называют генеральной совокупностью.

Часть единиц генеральной совокупности, которая непосредственно обследуется при выборочном наблюдении, представляет собой выборочную совокупность.

Числовые характеристики генеральной совокупности (средняя, дисперсия и др.) называют параметрами генеральной совокупности. Оценка параметра – это числовая характеристика, полученная на основе выборки (табл. 6.1).

 

Таблица 6.1. Основные характеристики параметров генеральной совокупности и оценок выборочной совокупности

Характеристики Генеральная совокупность Выборочная совокупность
Объем совокупности (численность единиц)   N   n
Численность единиц, обладающих обследуемым качеством (признаком) М m
Доля единиц, обладающих обследуемым качеством (признаком), выборочная доля
Среднее значение признака
Дисперсия количественного признака
Дисперсия альтернативного признака (доли)
Число серий R r

 

Организационными вопросами выборочного наблюдения являются:

- обоснование границ генеральной совокупности;

- единицы отбора;

- единицы наблюдения;

- способы отбора.

По способу организации различают следующие основные виды выборки:

- собственно-случайная (простая);

- типическая (расслоенная, стратифицированная, районированная);

- серийная (гнездовая);

- многоступенчатая;

- многофазная.

При любом виде выборки отбор единиц производят тремя способами:

- случайный отбор (жеребьевка, таблица случайных чисел);

- отбор единиц по какой-либо схеме (единицы упорядочивают таким образом, чтобы это было не связано с изучаемыми свойствами, далее проводят механический отбор единиц с шагом, равным N: n. Обычно отбор начинают не с первой единицы, а, отступив полшага, чтобы уменьшить возможность смещения выборки;

- сочетание первого и второго способов.

Приведем краткую характеристику отдельных видов выборочного наблюдения.

Простая собственно-случайная выборка. Отбор производят из всей массы единиц совокупности без предварительного разделения ее на какие-либо группы. Применяют индивидуальный отбор единиц, т.е. единица отбора совпадает с единицей наблюдения.

Типическая (расслоенная, стратифицированная, районированная) выборка. В случае, когда генеральная совокупность неоднородна и это влияет на размер изучаемого признака, применяют ее предварительное деление на типические однородные группы (районы).

Группировку проводят по существенным признакам, которые связаны с изучаемыми признаками. При этом общее число единиц выборочной совокупности распределяют между типическими группами следующим образом:

- непропорционально удельному весу каждой группы в генеральной совокупности;

- пропорционально удельному весу каждой группы в генеральной совокупности;

- пропорционально удельному весу в генеральной совокупности с учетом вариации признака по группам.

Затем отдельно из каждой типически однородной группы отбирают установленное число единиц либо механическим, либо собственно-случайным способом отбора.

Цель типической выборки заключается в следующем:

1) обеспечение представительства в выборке соответствующих типичных групп генеральной совокупности по интересующим исследователя признакам;

2) повышение точности результатов выборочного обследования.

Случайная ошибка при типическом отборе меньше, чем при собственно-случайном и механическом, так как этот отбор обеспечивает возможность сохранить в выборке то соотношение между типами (районами), которое имеется в генеральной совокупности.

Серийная выборка (либо кластерный, или гнездовой отбор). Гнездовой отбор – способ формирования выборки, при котором единица отбора состоит из группы или гнезда более мелких единиц, называемых элементами. Таким образом, гнездовая выборочная единица – это группа элементов, которую в процессе извлечения выборки рассматривают как одну единицу. Все элементы, составляющие гнездо, обследуют полностью.

Широкое применение гнездового отбора единиц наблюдения в статистической практике (особенно в статистике сельского хозяйства, торговой статистике и статистике населения).

Серийный отбор значительно проще в организационном отношении и дешевле, чем другие способы. Однако получающаяся в процессе этого отбора случайная ошибка выборки в подавляющем большинстве случаев больше, чем при любом другом способе.

Отбор серий (групп) производят указанными выше способами: собственно-случайным (жеребьевка) и по определенной схеме (механический отбор). В каждой серии (группе) единицы подвергаются сплошному учету.

Серии состоят из единиц, связанных между собой различным образом:

- территориально (районы, поселки и т.п.);

- организационно (предприятия, цеха, бригады);

- во времени (совокупность единиц продукции, выработанной за конкретный отрезок времени).

Серийная выборка обеспечивает экономию в расходах, если обследования распространяются на обширную территорию и гнездами являются территориальные единицы. Серийный отбор используют также при выборочном контроле качества продукции, особенно в случаях применения так называемой мерной тары.

Многоступенчатая выборка. Ее применяют при нескольких стадиях (ступенях) отбора. При этом каждая стадия имеет свою единицу отбора. Число ступеней определяется числом типов единиц отбора; на последней ступени единица отбора совпадает с единицей выборочной совокупности. Ошибка многоступенчатой выборки складывается из ошибок на отдельных ступенях отбора.

Многофазная выборка. Она характеризуется тем, что так же, как и многоступенчатая выборка, включает несколько стадий отбора, но в отличие от последней на всех ее ступенях сохраняется одна и та же единица отбора. Каждая ступень отбора имеет свой объем выборки и свою программу наблюдения. Многофазный отбор широко применяют в выборочных переписях населения, когда одну и ту же совокупность обследуют на различных фазах отбора по разным, обычно расширяющимся от фазы к фазе, программам наблюдения.

Выборочный метод наблюдения согласно рекомендациям Методологических положений по статистике включает следующие этапы:

- определение генеральной совокупности и единиц наблюдения, обладающих первичной информацией, необходимой для решения задач обследования;

- создание основы выборки (списка элементов совокупности);

- формирование выборочной совокупности путем отбора элементов основы;

- распространение собранных по выборке данных на генеральную совокупность.

Последний этап зависит от примененного способа отбора элементов в выборку и формулы оценивания характеристик генеральной совокупности по данным выборки.

 

Ошибки выборки

Расхождение между значениями показателей, полученных по выборке, и соответствующими параметрами генеральной совокупности называют ошибкой репрезентативности. Различают систематические и случайные ошибки выборки.

Случайные ошибки объясняются недостаточно равномерным представлением в выборочной совокупности различных категорий единиц генеральной совокупности.

Систематические ошибки могут быть связаны с нарушением правил отбора или условий реализации выборки.

Измерение ошибок репрезентативности выборочных показателей основано на предположении о случайном характере их распределения при бесконечно большом числе выборок. Количественную оценку надежности выборочного показателя используют, чтобы составить представление о генеральной характеристике. Это осуществляют либо на основе выборочного показателя с учетом его случайной ошибки, либо на основе выдвижения некоторой гипотезы (о величине средней дисперсии, характере распределения, связи) в отношении свойств генеральной совокупности. Для проверки гипотезы оценивают согласованность эмпирических данных с гипотетическими.

Величина случайной ошибки репрезентативности зависит:

1) от объема выборки;

2) степени вариации изучаемого признака в генеральной совокупности;

3) принятого способа формирования выборочной совокупности.

Различают среднюю (стандартную) и предельную ошибки выборки.

Средняя ошибка характеризует меру отклонений выборочных показателей от аналогичных показателей генеральной совокупности. Предельной ошибкой принято считать максимально возможное расхождение выборочной и генеральной характеристик, т.е. максимум ошибки при заданной вероятности ее появления.

По данным выборочной совокупности можно оценить различные показатели (параметры) генеральной совокупности. Наиболее часто используют оценку:

- генеральной средней величины изучаемого признака (для многозначного количественного признака);

- генеральной доли (для альтернативного признака).

Основным принципом применения выборочного метода является обеспечение равной возможности для всех единиц генеральной совокупности быть отобранными в выборочную совокупность. При таком подходе соблюдается требование случайного, объективного отбора и, следовательно, ошибка выборки определяется, прежде всего, ее объемом (n). С увеличением последнего величина средней ошибки уменьшается, характеристики выборочной совокупности приближаются к характеристикам генеральной совокупности.

При одинаковой численности выборочных совокупностей и прочих равных условиях ошибка выборки будет меньше в той из них, которая отобрана из генеральной совокупности с меньшей вариацией изучаемого признака. Уменьшение вариации признака означает снижение величины дисперсии ( – для количественного признака или [ ] – для альтернативного признака).

Зависимость величины ошибки выборки от способов формирования выборочной совокупности определяется по формулам средней ошибки выборки (табл. 6.2).

 

Таблица 6.2. Формулы расчета средней ошибки собственно-случайной

выборки

Способ отбора Формулы расчета для
средней доли
Повторный
Бесповторный

 

На практике величина дисперсии признака в генеральной совокупности, как правило, неизвестна, поэтому в формулы ошибки выборки подставляют дисперсию выборочной совокупности. Выборочная дисперсия несколько меньше генеральной, в математической статистике доказано, что

 

.

 

Если выборочная совокупность имеет большой объем (т.е. n достаточно велико), то соотношение () приближается к единице и выборочная дисперсия практически совпадает с генеральной.

Выборку считают безусловно большой при n > 100 и безусловно малой при n < 30. При оценке результатов малой выборки указанное соотношение выборочной и генеральной дисперсии следует принимать во внимание.

Среднюю ошибку малой выборки можно рассчитать по формуле

 

.

 

При расчете средней ошибки выборки для увеличения точности вместо множителя () следует брать множитель (), но при большой численности генеральной совокупности различие между этими выражениями практического значения не имеет.

При любом способе отбора с определенной вероятностью можно утверждать, что отклонение выборочной средней (или доли) от генеральной средней (или доли) не превысит некоторую величину, которую называют предельной ошибкой выборки.

Соотношение между пределом ошибки выборки (Δ), гарантируемым с некоторой вероятностью F(t), и средней ошибкой выборки имеет вид:

 

или ,

где t – коэффициент доверия, определяемый в зависимости от уровня вероятности F(t).

 

Значение функции F(t) и t определяются на основе специально составленных математических таблиц. Приведем некоторые из них, применяемые наиболее часто:

 

t 1,0 1,96 2,0 2,58 3,0
F(t) 0,683 0,950 0,954 0,990 0,997

 

Таким образом, предельная ошибка выборки отвечает на вопрос о точности выборки с определенной вероятностью, величина которой зависит от значения коэффициента доверия t. Так, при t = 1 вероятность F(t) отклонения выборочных характеристик от генеральных на величину однократной средней ошибки равна 0,683. Следовательно, в среднем из каждой 1000 выборок 683 дадут обобщающие показатели (среднюю, долю), которые будут отличаться от генеральных не более чем на величину однократной средней ошибки. При t = 2 вероятность F(t) равна 0,954, это означает, что из каждой 1000 выборок 954 дадут обобщающие показатели, которые будут отличаться от генеральных не более чем на двукратную среднюю ошибку выборки и т.д.

Наряду с абсолютной величиной предельной ошибки выборки рассчитывают и относительную ошибку, которая определяется как процентное отношение предельной ошибки выборки к соответствующей характеристике выборочной совокупности:

- для средней ;

- для доли .

На практике принято задавать величину Δ, как правило, в пределах 10 % предполагаемого среднего уровня признака.

Расчет средней и предельной ошибок выборки позволяет определить пределы, в которых будут находиться характеристики генеральной совокупности:

 

;

 

.

 

Пределы, в которых с данной степенью вероятности будет заключена неизвестная величина изучаемого показателя в генеральной совокупности, называют доверительным интервалом, а вероятность F(t) – доверительной вероятностью. Чем выше значение Δ, тем больше величина доверительного интервала и, следовательно, ниже точность оценки.

Рассмотрим следующий пример. Для определения среднего размера вклада в банке методом повторной случайной выборки было отобрано 200 валютных счетов вкладчиков. В результате установили, что средний размер вклада – 60 тыс. руб., дисперсия составила 32. При этом 40 счетов оказались до востребования. Необходимо с вероятностью 0,954 определить пределы, в которых находятся средний размер вклада на валютных счетах в банке и доля счетов до востребования.

Рассчитаем среднюю ошибку выборочной средней по формуле для повторного отбора:

 

тыс. руб.

 

Предельная ошибка выборочной средней с вероятностью 0,954 составит

 

тыс. руб.

 

Следовательно, средний размер вклада на валютных счетах в банке находится в пределах тыс. руб.:

 

;

 

.

 

С вероятностью 0,954 можно утверждать, что средний размер вклада на валютных счетах в банке составляет от 59200 до 60800 руб.

Определим долю вклада до востребования в выборочной совокупности:

 

, или 20 %.

 

Средняя ошибка выборочной доли

 

.

 

Предельная ошибка доли с вероятностью 0,954 составит

 

, или 5,6 %.

 

Таким образом, доля счетов до востребования в генеральной совокупности находится в пределах %:

 

;

 

.

 

С вероятностью 0,954 можно утверждать, что доля счетов до востребования в общем числе валютных счетов в банке составляет от 14,4 до 25,6 %.

 



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2016-04-27 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: