Серийная выборка (гнездовая выборка).

В некоторых случаях характер размещения объектов в генеральной совокупности может быть таким, что объекты располагаются сериями однородных объектов (например, продукция, упакованная в мешки, ящики, население – в селения, кварталы – в лесничества и т.п. (Гатаулин, 1992) или для нашего случая – древостои размещены по кварталам, семена распределены по бутылям, ящикам, мешкам и т.п.). В таких случаях формирование выборочной совокупности путем отбора отдельных единиц практически не целесообразно. Проще организовать отбор сериями и провести сплошное обследование отобранных серий. Следовательно, выборочная совокупность будет представлена некоторым числом отобранных серий (лесничеств, бутылей, ящиков, кварталов и т.п.). Серийная или гнездовая выборка применяется в многочисленных задачах лесного дела, где в качестве п.е.в. используют серии или гнезда (суть группы), состоящие из некоторого количества более мелких элементов (отбор проб семян из мест тары в семенохранилище и т.п.).

ПРИМЕР.

Наглядным примером возможной реализации гнездовой выборки выступает организация учета высоты и диаметра сеянцев, выращиваемых по контейнерной технологии в Семеновском лесхозе. Здесь учет удобнее производить, приняв за п.е.в. – гнездо – одну полную кассету с сеянцами, а не разбрасывать всю выборку по её численности равномерно или случайно по одному сеянцу в разных местах.

ПРИМЕР.

Пусть N_c – число серий в генеральной совокупности, а n_c – число отобранных серий (объем выборки). Тогда отбор серий может быть осуществлен по схеме собственно-случайной или механической выборки.

Поскольку отобранные серии подвергаются сплошному обследованию, то по каждому из них может быть вычислена серийная средняя (). Если серии в генеральной совокупности имеют равную численность, то общая средняя по всей выборке определяется как простая средняя арифметическая из серийных средних:

Если численности серий не равны, то требуется статистическое взвешивание серийных средних.

По каждой отобранной серии могут быть вычислены значения дисперсии признака: . Средняя арифметическая из этих дисперсий представляет собой внутрисерийную (остаточную) дисперсию

С другой стороны, колебания серийных средних около общей выборочной средней может быть охарактеризовано межсерийной дисперсией :

Тогда, согласно теореме сложения дисперсий, общая вариация признака может быть представлена следующим образом:

Поскольку внутрисерийная дисперсия вычисляется на основе сплошного обследования отобранных серий (сплошного учета в пределах каждой выделенной серии), то ошибка репрезентативности зависит от межсерийной дисперсии. Поэтому формулы расчета средней ошибки, необходимой численности и предельной ошибки серийной выборки основаны на использовании межсерийной дисперсии (табл. ***). На практике, как правило, применяется бесповторная схема отбора серий.

Особую роль серийная или гнездовая выборка играет в тех случаях, когда применяют территориальный принцип отбора. Так, практически все лесоинвентаризационные работы в той или иной мере связаны с серийной или гнездовой выборкой.

Другие типы выборок

МНОГОСТУПЕНЧАТАЯ ВЫБОРКА. Её характерной чертой является подразделение совокупности на выборочные единицы разных порядков (относительно друг друга). На первой ступени из совокупности извлекают некоторое число (n₁) единиц первого порядка (от общего объема заготовленных в лесхозах семян сосны отбирают определенное количество средних образцов в соответствии с правилами формирования партий семян и отбора от них образцов), затем из каждой единицы первого порядка (среднего образца) отбирают некоторое количество (n₂) единиц второго порядка (четыре пробы по 100 штук семян). Выборочные единицы последней ступени обычно являются элементарными единицами совокупности или их объединениями, т.е. гнездами (каждая проба по 100 шт. семян является объединением элементарных единиц совокупности). На всех остальных вышестоящих ступенях выборочные единицы получают укрупнением единиц последней ступени (на территориальной или иной основе). На каждой ступени отбор может быть случайным или систематическим, выборка – стратифицированной и т.д.

МНОГОФАЗНАЯ ВЫБОРКА. Если в выборочном обследовании нужно определить несколько показателей с различной дисперсией (линейные параметры плодов и их массу; линейные параметры листьев и их площадь; высоту, диаметр ствола и площадь поперечного сечения на высоте 1.3 м, а также его объем и т.п.) или, если задана неодинаковая точность определения различных показателей, что требует неодинакового числа наблюдений, то применяют многофазную выборку. При этом способе выборки для одних признаков используют все единицы выборки, для других только некоторую их часть. Таксация древостоя на пробных площадях предполагает сплошной подеревный перечет по диаметру, но предусматривает определение высоты ствола только у каждого 5-го дерева каждой ступени толщины. Собранные на одних фазах данные могут служить дополнительной информацией на других фазах. Многофазную выборку часто сочетают с типологической и другими.

УРАВНОВЕШЕННЫЕ СЛУЧАЙНЫЕ ВЫБОРКИ. Уравновешенные случайные выборки (могут быть стратифицированными или другими) используют в тех случаях, когда известно среднее значение измеряемого признака в генеральной совокупности. Выборку организуют так, чтобы выборочное среднее было равно среднему в генеральной совокупности. Получают уравновешенную выборку способом замещения. Сначала отбирают случайную выборку нужного объема с нумерацией всех отбираемых единиц. Если выборочное среднее не равно среднему генеральной совокупности (чаще всего бывает именно так), из генеральной совокупности берут еще одну единицу, добавляют её в выборку, а первую по счету измеренную единицу исключают. Рассчитывают новое значение выборочного среднего. Если вновь полученное среднее окажется ближе к среднему генеральной совокупности, то добавленную новую единицу оставляют в выборке вместо исключенной первой. Если наоборот, то новую единицу убирают и оставляют первоначальную. Этот процесс продолжают до полного уравновешивания. Уравновешенные выборки целесообразны при большом числе переменных.

ВЫБОРКИ ПОСЛЕДОВАТЕЛЬНОГО ИЛИ НЕПРЕРЫВНОГО ТИПА. Если планируется осуществление выборочных наблюдений в несколько последовательных этапов (например, для контроля над изменением состояние лесных ресурсов при мониторинге лесов, получения срочных предварительных данных и последующего получения уточненных данных), то применяют выборки последовательного или непрерывного типа.

В зависимости от выборочной схемы они могут быть независимыми, постоянными и с частичным замещением.

НЕЗАВИСИМЫЕ ВЫБОРКИ НЕПРЕРЫВНОГО ТИПА предусматривают отбор, проводимый через определенный период независимо от предыдущих выборок, т.е. формируется абсолютно новая выборка в рамках уже изучаемой генеральной совокупности, включающая в себя новые единицы (объекты) генеральной совокупности.

При ПОСТОЯННЫХ ВЫБОРКАХ НЕПРЕРЫВНОГО ТИТПА используют одни и те же элементы генеральной совокупности (одни и те же деревья) для повторных обмеров, т.е. объекты, составляющие выборку, остаются неизменными, а результаты учета будут соответствовать их новому состоянию.

В случае выборки непрервного типа с частичным замещением на каждом последовательном этапе заменяют её определенную часть, т.е. этот тип выборки является своеобразным объединением идей независимой и постоянной выборок.

ВЗАИМОПРОНИКАЮЩИЕ ВЫБОРКИ. Для анализа лесных объектов представляют интерес взаимопроникающие выборки, когда из генеральной совокупности получают несколько независимых выборок, выбранных одним и тем же методом.

СОПРЯЖЕННЫЕ ВЫБОРКИ. Достаточно распространены в лесных исследованиях и сопряженные выборки. В этом случае измеряют несколько связанных между собой показателей объектов (длина, диаметр, масса плода и длина плодоножки у облепихи, дуба и др., длина шишек, количество кроющих чешуй, количество семян в каждой шишке, масса семян в каждой шишке им т.д. и т.п.).

ЗАКЛЮЧЕНИЕ.

Описанные выше приемы формирования выборочной совокупности каждый в отдельности в чистом виде применяются довольно редко. На практике чаще всего приходится сочетать различные виды и формы статистического наблюдения. Например, типологическая выборка сочетается с механической и с собственно-случайной выборками и т.д. Таким образом, на практике обычно имеет место комбинированное статистическое наблюдение, что ведет к повышению надежности выводов.

Планирование необходимого объема выборки; размер выборки

Организация выборочных исследований предусматривает необходимость решения весьма важной задачи – определения необходимой численности выборки. Корректнее было бы сказать: определение достаточной для обеспечения заданной точности опыта численности выборки. Эта проблема возникает собственно с введением выборочных исследований и связана с более общей проблемой репрезентативности выборочных данных. Выборка состоит лишь из некоторого ограниченного числа единиц, взятых из генеральной совокупности, представленной более многочисленным собранием единиц или объектов. Вместе с тем предметом исследования выступает именно генеральная совокупность, о которой мы хотим получить ту или иную объективную информацию. Однако конкретному исследованию подвергается не собственно генеральная совокупность (генеральная совокупность в целом), а только некоторая её часть – выборка, и полученные вследствие этого факты (результаты учета, обмера, взвешивания и пр.) анализируются. Задача любого выборочного метода состоит в том, чтобы, основываясь на этих выборочных фактах, сделать правильные выводы относительно всей генеральной совокупности. Знания о генеральной совокупности мы получаем посредством изучения выборки из неё.

Проблем статистического анализа не возникает, если не существует варьирования характеристик объектов генеральной совокупности. Если все объекты идентичны друг другу, то выборка, состоящая только из одного такого объекта, даст полную информацию о всей совокупности в целом. На практике всегда имеется выраженное разнообразие, как характеристик самих объектов, так и окружающих их условий. Вследствие этого информация, полученная в ходе выборочных исследований, не может быть безоговорочно отнесена ко всей совокупности. Степень адекватности сведений, полученных в выборочных исследованиях, реальным характеристикам генеральной совокупности определяют точность выборочных исследований (Снедекор, 1961, стр.21). Последняя величина принципиально зависит от двух важнейших и взаимосвязанных между собой факторов:

1) адекватного численного представительства выборки (адекватного соотношения численности выборки и численности генеральной совокупности);

2) соответствия характеристик единиц выборки характеристикам объектов, составляющих генеральную совокупность (адекватного насыщения выборки информацией о генеральной совокупности).

Для ответа на вопрос о необходимом размере выборки следует учитывать ряд обстоятельств.

1. Изменчивость признака зависит от размера генеральной совокупности и, как правило, пропорциональна ему. Следовательно, чем больше генеральная совокупность, тем большей должна быть выборка из неё.

2. Степень изменчивости признака объектов генеральной совокупности определят точность вычисляемых статистик. Чем больше изменчивость признака в генеральной совокупности, тем большей должна быть величины выборки из неё.

3. Кроме этого следует считаться с существующими представлениями о механизмах планирования размера выборок: всякая попытка абсолютно точно определить размер выборки – бесполезна (Снедекор, 1961, стр. 27).

Доверительный интервал среднего значения количественного признака в выборочных исследованиях может быть представлен как:

, а ошибка соответственно –

Эти формулы вы хорошо помните из ранее освоенных курсов дисциплин: «Математические методы и моделирование», «Основы научных исследований».

Чтобы ошибка выборки не превосходила запланированное значение (в большинстве лесоводственных исследованиях принято 5 %), необходимо обеспечить численность собственно выборки (её величину) при существующем уровне изменчивости признака. Соотношение величины выборки и показателя изменчивости при заданном уровне точности можно выразить формулой:

Где:

n – планируемая численность выборки;

t – критерий Стьюдента для принятого уровня вероятности;

S² – дисперсия, известная заранее или предполагаемая, или вычисленная по предварительным тестам совокупности;

- среднее арифметическое количественной переменной;

s_x² – предельная ошибка при определении среднего арифметического.

Зная, что:

, а ,

преобразовав вышеприведенную формулу, получим безразмерную величину, соответствующую по своей смысловой размерности счету или количеству:

Такая форма записи алгоритма вычисления планируемой численности выборки (достаточной численности выборки) приводится в большинстве учебников, учебных пособий и методических указаний статистической направленности.

Для определения размера выборки (n) следует знать вариабильность признака её объектов (S) и запланировать допустимую величину ошибки (s _x), которая должна обеспечить требуемую точность опыта (q) или в традиционной форме индексации Р.

Если стандартное отклонение (S) случайной величины заранее не известно, то по предварительной небольшой выборке устанавливают размах варьирования:

Где:

R – размах варьирования признака;

x _max_. – максимальное значение признака;

x _min_. – минимальное значение признака.

На его основании определяют (приближенно, но достаточно точно) стандартное отклонение (S), используя соотношение, в котором применяют эмпирические коэффициенты (k _n) К. Пирсона (табл. 1), зависящие от величины (численности) рекогносцировочной выборки:

Таблица 1. – Коэффициенты К. Пирсона для разных значений n (по Б.А. Доспехову, 1973; стр. 74 – 75 и по Дж.У. Снедекору, 1961, стр. 53 – 54).

n	k	n	k	n	k	n	k
	0,89		0,40		0,32		0,27
	0,59		0,37		0,31		0,25
	0,49		0,35		0,29		0,23
	0,43		0,34		0,28		0,22

Соответственно:

Эмпирически установлено (Снедекор, 1961, стр. 59, 466), что между размахом или диапазоном изменчивости (R) и стандартным отклонением (S) существует достаточно устойчивое соотношение. С его помощью можно осуществить переход от размаха варьирования (R) к оценке среднеквадратического отклонения (S). Если число наблюдений (n) равно примерно 5, 10, 25, 100, более 500, то грубая оценка стандартного отклонения (S) может быть получена путем деления размаха варьирования (R) на 2, 3, 4, 5, 6 соответственно. Обозначив указанные числовые значения через d _n, получим формулу:

Планирование размера выборки при формировании типической или стратифицированной выборки можно построить на следующих рассуждениях.

1. В качестве оценки генеральной средней (ГС) всей генеральной совокупности, подлежащей анализу (в случае её сплошного учета), берется величина:

2. Приведенная выше формула трансформируется в следующую:

3. Определяется смысловое содержание переменной (w _h) как относительный статистический вес, соответствующий данной страте (или данному страту):

4. Статистический вес (w _h) или доля h -й страты в общей выборке в данном случае предусматривается как коэффициент пропорциональности численностям. Выборочные средние отдельных страт при таком подходе взвешиваются по численностям этих страт. Этот алгоритм применим при пропорциональности распределения наблюдений по слоям стратифицированной совокупности, когда из каждого слоя берется в выборку одна и та же доля, пропорциональная её численности.

5. При таком пропорциональном распределении имеем:

6. Отсюда следует:

7. Тогда численность отдельной частной выборки в системе стратифицированной выборки будет равна:

8. Общая численность всех частных выборок стратифицированной совокупности определяется заданным уровнем точности и степенью изменчивости анализируемого показателя в ней. Этот вопрос мы принципиально рассмотрели выше.

Вопросы и задания для самоконтроля и самопроверки

1. Выборочные методы, как основа получения лесоводственной информации.

2. Выборка и генеральная совокупность в лесоводственных исследованиях.

3. Проблемы и основания для проведения выборочных учетов и наблюдений в лесоводственных исследованиях.

4. Проблемы репрезентативности выборок и способы обеспечения репрезентативности выборок в лесоводственных исследованиях.

5. Ошибка репрезентативности выборочных средних при разных способах построения выборок.

6. Виды и категории выборок.

7. Дайте собственное определение понятия «выборка».

8. Дайте определение понятию «случайная выборка».

9. Дайте определение понятию «собственно случайная выборка».

10. По каким организационным схемам осуществляют формирование случайной выборки?

11. В чем состоят особенности формирования повторной случайной выборки?

12. В чем состоят особенности формирования бесповторной случайной выборки?

13. Дайте определение понятию «типологическая выборка».

14. Пропорционально каким основным параметрам совокупности формируют типологическую выборку?

15. Дайте определение понятию «механическая выборка» или «систематическая выборка».

16. Дайте определение понятию «серийная выборка» или «гнездовая выборка».

17. Дайте определение понятию «многоступенчатая выборка».

18. Дайте определение понятию «многофазная выборка».

19. Дайте определение понятию «уравновешенная выборка».

20. Дайте определение понятию «сопряженная выборка».

Серийная выборка (гнездовая выборка).

Поиск по сайту