Виды и схемы отбора или формирования выборки




Выборочное наблюдение

Определение выборочного наблюдения

Виды и схемы отбора

Ошибки выборки

Способы распространения выборочных результатов на генеральную совокупность

Определение необходимого объема выборки

Определение выборочного наблюдения

Статистические исследования очень трудоемки и дороги, поэтому возникла мысль о замене сплошного наблюдения выборочным.

Основная цель несплошного наблюдения состоит в получении характеристик изучаемой статистической совокупности по обследованной ее части.

Выборочное наблюдение – это метод статистического исследования, при котором обобщающие показатели совокупности устанавливаются только по отдельно взятой части на основе положений случайного отбора.

При выборочном методе изучению подвергается только некоторая часть изучаемой совокупности, при этом подлежащая изучению статистическая совокупность называется генеральной совокупностью.

Выборочной совокупностью или просто выборкой можно называть отобранную из генеральной совокупности часть единиц, которая будет подвергаться статистическому исследованию.

Значение выборочного метода: при минимальной численности исследуемых единиц проведение статистического исследования будет происходить в более короткие промежутки времени и с наименьшими затратами средств и труда.

Если в период обследования будут соблюдены все правила его научной организации, то выборочный метод даст довольно точные результаты, и поэтому данный метод целесообразно применять для проверки данных сплошного наблюдения.

Этот метод получил широкое распространение в государственной и вневедомственной статистике, потому что при исследовании минимальной численности изучаемых единиц позволяет тщательно и точно провести исследование.

Изучаемая статистическая совокупность состоит из единиц с варьирующими признаками. Состав выборочной совокупности может отличаться от состава генеральной совокупности, это расхождение между характеристиками выборки и генеральной совокупности составляет ошибку выборки.

Ошибки, свойственные выборочному наблюдению, характеризуют размер расхождения между данными выборочного наблюдения и всей совокупности. Ошибки, возникающие в ходе выборочного наблюдения, называются ошибками репрезентативности и делятся на случайные и систематические.

Если выборочная совокупность недостаточно точно воспроизводит всю совокупность из–за несплошного характера наблюдения, то это называют случайными ошибками, и их размеры определяются с достаточной точностью на основании закона больших чисел и теории вероятностей.

Систематические ошибки возникают в результате нарушения принципа случайности отбора единиц совокупности для наблюдения.

Виды и схемы отбора или формирования выборки

Размер ошибки выборки и методы ее определения зависят от вида и схемы отбора.

Различают четыре вида отбора совокупности единиц наблюдения:

1) случайный;

2) механический;

3) типический;

4) серийный (гнездовой).

1. Случайный отбор – наиболее распространенный способ отбора в случайной выборке, его еще называют методом жеребьевки, при нем на каждую единицу статистической совокупности заготовляется билет с порядковым номером.

Далее в случайном порядке отбирается необходимое количество единиц статистической совокупности. При этих условиях каждая из них имеет одинаковую вероятность попасть в выборку, например тиражи выигрышей, когда из общего количества выпущенных билетов в случайном порядке наугад отбирается определенная часть номеров, на которые приходятся выигрыши. При этом всем номерам обеспечивается равная возможность попасть в выборку.

2. Механический отбор – это способ, когда вся совокупность разбивается на однородные по объему группы по случайному признаку, потом из каждой группы берется только одна единица. Все единицы изучаемой статистической совокупности предварительно располагаются в определенном порядке, но в зависимости от объема выборки механически через определенный интервал отбирается необходимое количество единиц.

3. Типический отбор – это способ, при котором исследуемая статистическая совокупность разбивается по существенному, типическому признаку на качественно однородные, однотипные группы, затем из каждой этой группы случайным способом отбирается определенное количество единиц, пропорциональное удельному весу группы во всей совокупности.

Типический отбор дает более точные результаты, так как при нем в выборку попадают представители всех типических групп.

4. Серийный (гнездовой) отбор. Отбору подлежат целые группы (серии, гнезда), отобранные случайным или механическим способом. По каждой такой группе, серии проводится сплошное наблюдение, а результаты переносятся на всю совокупность.

Точность выборки зависит и от схемы отбора. Выборка может быть проведена по схеме повторного и бесповторного отбора.

Повторный отбор. Каждая отобранная единица или серия возвращается во всю совокупность и может вновь попасть в выборку. Это так называемая схема возвращенного шара.

Бесповторный отбор. Каждая обследованная единица изымается и не возвращается в совокупность, поэтому она не попадает в повторное обследование. Эта схема получила название невозвращенного шара.

Бесповторный отбор дает более точные результаты, потому что при одном и том же объеме выборки наблюдение охватывает большее количество единиц изучаемой совокупности.

Комбинированный отбор может проходить одну или несколько ступеней. Выборка называется одноступенчатой, если отобранные однажды единицы совокупности подвергаются изучению.

Выборка называется многоступенчатой, если отбор совокупности проходит по ступеням, последовательным стадиям, причем каждая ступень, стадия отбора имеет свою единицу отбора.

Многофазная выборка – на всех ступенях выборки сохраняется одна и та же единица отбора, но проводится несколько стадий, фаз выборочных обследований, которые различаются между собой широтой программы обследования и объемом выборки.

Для отобранных единиц рассчитываются обобщенные показатели (средние или относительные) и в дальнейшем результаты выборочного исследования распространяются на всю генеральную совокупность.

Ошибки выборки

В статистике приняты следующие условные обозначения.

Доля выборки – это отношение числа единиц выборочной совокупности к числу единиц генеральной совокупности:

,

где N – объем генеральной совокупности;

n – объем выборки.

 

Выборочная доля (w), или частность, определяется отношением числа единиц, обладающих изучаемым признаком m, к общему числу единиц выборочной совокупности (n):

Два основных вида обобщающих показателей, которые используют в выборочном методе – это средняя величина количественного признака и относительная величина альтернативного признака.

В генеральной совокупности доля единиц, которая обладает изучаемым признаком, называется генеральной долей (обозначается р), а средняя величина изучаемого варьирующего признака – это генеральная средняя (обозначается ).

Основной задачей при выборочном исследовании является определение ошибок выборки. Ошибка выборки присуща только выборочным наблюдениям.

Для характеристики надежности выборочных показателей различают предельную и среднюю ошибки выборки.

Выборочная средняя и выборочная доля – это случайные величины, принимающие различные значения в зависимости от единиц изучаемой статистической совокупности, которые попали в выборку. Соответственно ошибки выборки – тоже случайные величины и также могут принимать различные значения. Поэтому определяют среднюю из возможных ошибоксреднюю ошибку выборки.

Рассмотрим ошибки при 4-х видах отбора.

1. Собственно-случайная выборка – это отбор единиц из всей генеральной совокупности посредством жеребьевки (например, розыгрыш лотерей) или другим подобным способом (например, по таблице случайных чисел).

Принципом случайности является то, что на включение или исключение объекта из выборки не может повлиять любой фактор, кроме случая.

Собственно-случайный отбор в чистом виде в практике выборочного наблюдения встречается редко, но он является исходным среди всех других видов отбора, в нем заключаются и реализуются основные принципы выборочного статистического наблюдения.

Средняя ошибка выборки определяется объемом выборки: чем больше численность при прочих равных условиях, тем меньше величина средней ошибки выборки. Охватывая выборочным обследованием все большее количество единиц генеральной совокупности, все более точно характеризуем всю генеральную совокупность.

Средняя ошибка выборки зависит от степени варьирования изучаемого признака, в свою очередь степень варьирования характеризуется дисперсией s2. Чем меньше вариация признака и дисперсия, тем меньше средняя ошибка выборки, и наоборот.

При случайном повторном отборе средние ошибки рассчитывают по следующим формулам:

1) для средней количественного признака:

где s2г – средняя величина генеральной дисперсии количественного признака.

2) для доли (альтернативного признака):

В эти формулы входит дисперсия признака в генеральной совокупности. Практически генеральная дисперсия точно не известна, но в теории вероятности доказано, что

,

где s2г – генеральная дисперсия (дисперсия признака в генеральной совокупности);

s2в – выборочная дисперсия того же признака;

Так как величина при достаточно больших n близка к 1, можно считать, что . Тогда средняя ошибка выборки может быть рассчитана:

.

Но в случаях малой выборки (при n<30) коэффициент необходимо учитывать, и среднюю ошибку малой выборки рассчитывать по формуле

.

При случайной бесповторной выборке приведенные формулы корректируются на величину . Тогда средняя ошибка бесповторной выборки:

и .

Т.к. n всегда меньше N, то множитель () всегда меньше 1. Это значит, что средняя ошибка при бесповторном отборе всегда меньше, чем при повторном.

2. Механическая выборка применяется, когда генеральная совокупность каким-либо способом упорядочена (например, списки избирателей по алфавиту, телефонные номера, номера домов, квартир).

Отбор единиц осуществляется через определенный интервал, который равен обратному значению процента выборки. Так при 2% выборке отбирается каждая 50 единица =1/0,02, при 5% каждая 1/0,05=20 единица генеральной совокупности.

Начало отсчета выбирается разными способами: случайным образом, из середины интервала, со сменой начала отсчета. Главное при этом – избежать систематической ошибки. Например, при 5% выборке, если первой единицей выбрана 13-я, то следующие 33, 53, 73 и т.д.

При достаточно большой совокупности механический отбор по точности результатов близок к собственно-случайному. Поэтому для определения средней ошибки механической выборки используют формулы собственно-случайной бесповторной выборки.

3. Для отбора единиц из неоднородной совокупности применяется так называемая типическая выборка. Она используется, когда все единицы генеральной совокупности можно разбить на несколько качественно однородных, однотипных групп по признакам, от которых зависят изучаемые показатели. Например, при обследовании предприятий это могут быть отрасли, подотрасли, при изучении населения – районы, социальные или возрастные группы.

Затем из каждой типической группы собственно-случайной или механической выборкой производится индивидуальный отбор единиц в выборочную совокупность.

Типическая выборка дает более точные результаты. Типизация генеральной совокупности обеспечивает репрезентативность такой выборки, представительство в ней каждой типологической группы, что позволяет исключить влияние межгрупповой дисперсии на среднюю ошибку выборки.

Следовательно, при нахождении ошибки типической выборки согласно правилу сложения дисперсий () необходимо учесть лишь среднюю из групповых дисперсий. Тогда средняя ошибка выборки:

· при повторном отборе

,

· при бесповторном отборе

, где – средняя из внутригрупповых дисперсий в выборке.

4. Серийный (или гнездовой) отбор применяется в случае, когда генеральная совокупность разбита на серии или группы до начала выборочного обследования. Этими сериями могут быть упаковки готовой продукции, студенческие группы, бригады. Серии для обследования выбираются механическим или собственно-случайным способом, а внутри серии производится сплошное обследование единиц.

Поэтому средняя ошибка выборки зависит только от межгрупповой (межсерийной) дисперсии, которая вычисляется по формуле:

где r – число отобранных серий;

– средняя і-той серии.

Средняя ошибка серийной выборки рассчитывается:

При повторном отборе

При бесповторном отборе

, где R – общее число серий.

Средняя ошибка выборки при любом способе отбора зависит главным образом от абсолютной численности выборки и в меньшей степени – от процента выборки.

Предположим, что проводится 225 наблюдений в первом случае из генеральной совокупности в 4500 единиц и во втором – в 225000 единиц. Дисперсии в обоих случаях равны 25. Тогда в первом случае при 5 %-ном отборе ошибка выборки составит:

Во втором случае при 0,1 %-ном отборе она будет равна:

Таким образом, при уменьшении % выборки в 50 раз, ошибка выборки увеличилась незначительно, так как численность выборки не изменилась.
Предположим, что численность выборки увеличили до 625 наблюдений. В этом случае ошибка выборки равна:

Увеличение выборки в 2,8 раза при одной и той же численности генеральной совокупности снижает размеры ошибки выборки более чем в 1,6 раза.

Средняя ошибка выборки показывает возможные отклонения характеристик выборочной совокупности от соответствующих характеристик генеральной совокупности. Если, например средняя продолжительность горения лампочки по выборке составила 300 час, а ошибка выборки μ =10 час, то среднюю продолжительность горения всей партии лампочек, из которой взята выборка, можно ожидать в пределах 300 10 час, т.е. от 290 до 310 ч.

Однако то, что генеральная средняя не выйдет за данные пределы, можно утверждать лишь с определенной степенью вероятности р.

Доказано, что утверждение о том, что генеральные характеристики не отклонятся от выборочных на величину большую, чем ошибка выборки μ, всегда имеет постоянную степень вероятности, равную 0,683. Значит, в 683 случаях из 1000 характеристика генеральной совокупности будет отличаться от характеристики выборки не больше, чем на величину μ, но в остальных 317 случаях из 1000 она может отличаться и в большей степени.

Можно повысить вероятность утверждения, расширив пределы отклонений до удвоенной ошибки 2μ. В примере это значит, что средняя продолжительность горения партии лампочек находится в пределах 300 20, т.е. от 280 до 320 часов. Вероятность утверждения в этом случае равна 0,954, т.е. только в 46 случаях из 1000 отклонение выйдет за пределы . При утроенной μ вероятность повышается до 0,997.

  μ 3,28μ
р 0.683 0.954 0.997 0.999

Значит с определенной степенью вероятности можно утверждать, что отклонения выборочных характеристик от генеральных не превысят некоторой величины, которая называется предельной ошибкой выборки:

,

где t – нормированное отклонение – коэффициент доверия, зависящий от вероятности, с которой гарантируется, что предельная ошибка не превысит t – кратную среднюю ошибку.

Значения доверительной вероятности при различных значениях коэффициента доверия представлены в специально составленных таблицах. Наиболее часто применяемые значения:

t 1.0 1.96 2.0 2.58 3.0
Вероятность 0.683 0.95 0.954 0.99 0.997

где t – нормированное отклонение – коэффициент доверия

Предельная ошибка выборки или ошибка репрезентативности D представляет собой разность соответствующих выборочных и генеральных характеристик:

1) для средней количественного признака:

Dх =| |,

где – генеральная средняя;

– выборочная средняя;

Предельная ошибка выборки позволяет определить доверительные интервалы характеристик генеральной совокупности. Для генеральной средней

или .

Это означает, что с заданной вероятностью можно утверждать, что значение генеральной средней следует ожидать в пределах от до .

2) для доли (альтернативного признака):

D w =| w – p|,

гдеw– выборочная средняя;

р – генеральная доля;

Пределы доли признака в генеральной совокупности р.

Предельная ошибка рассчитывается по следующим формулам:

Показатель Повторный случайный отбор Бесповторный случайный отбор
Предельная ошибка количественного признака
Предельная ошибка доли альтернативного признака

Задача

Олигарх купил партию изделий при условии, что не менее 92 % из них отвечает требованиям стандарта. Выборочная контрольная проверка показала, что из 500 отобранных изделий стандартам отвечает 95 %. Приобретет ли олигарх изделия.

Границы определяются

w = 0,95

при t = 2, р = 95 ± 2 (93 – 97) % при t = 3, р = 95 ± 3 (92 – 98) %



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2017-08-27 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: