ПРАКТИЧЕСКОЕ ЗАНЯТИЕ № 10
Тема 6: «Выборочный метод статистического наблюдения».
Цель занятия: приобрести практические навыки расчета характеристик выборочной совокупности.
КРАТКИЕ ТЕОРЕТИЧЕСКИЕ СВЕДЕНИЯ
Основные понятия теории выборочного наблюдения.
Под выборочным наблюдением понимаетсянесплошное наблюдение, при котором статистическому обследованию подвергаются не все, а отдельные единицы, отобранные с соблюдением определенных условий.
Применение выборочного обследования дает возможность глубже организовать наблюдение, обеспечивает быстроту его проведения, приводит к экономии средств и труда на получение и обработку информации.
Генеральной совокупностью называется вся совокупность единиц наблюдения, относящихся к изучаемой проблеме.
Выборочной совокупностью (выборкой) называется та часть единиц наблюдения генеральной совокупности, которая подлежит непосредственному изучению.
Объемом совокупности называется общее количество единиц наблюдения в совокупности. Объем генеральной совокупности (N) всегда значительно превосходит объем выборки (n).
.
Генеральная и выборочная совокупности могут быть количественной или качественной, что зависит от того, являются ли признаки свойства единиц совокупности количественными или качественными. Это различие предполагает, что для статистического описания совокупности используются либо обобщающие показатели, либо удельные веса (доли).
Между этими показателями генеральной и выборочной совокупности имеется некоторое различие, иначе говоря, существует ошибка в определении показателей выборочной совокупности именно потому, что последняя является частью генеральной совокупности.
Эти ошибки называют ошибками репрезентативности, онипредставляют собой расхождение между показателями выборочной и генеральной совокупности, подчиняются определенным статистическим закономерностям, что и позволяет рассчитывать объем выборочной совокупности.
Ошибки могут быть систематическими и случайными. Систематические ошибки возникают в связи с особенностями принятой системы отбора и обработки данных наблюдений или в связи с нарушением установленных правил отбора. Случайные ошибки являются следствием недостаточно равномерного представления в выборке отдельных видов единиц генеральной совокупности.
Определение возможной и фактически допущенной ошибки выборки играет существенную роль в решении вопроса о возможности применения выборочного метода. Величина ошибки характеризует степень надежности результатов выборки; знание этой величины необходимо при оценке параметров генеральной совокупности. Оценки возможной величины и состава ошибок репрезентативности ложатся в основу планирования проектируемого выборочного наблюдения.
В процессе формирования выборочной совокупности должен быть обеспечен строго объективный подход к отбору единиц. Нарушение этого принципа, когда наблюдению подвергаются единицы, отобранные на основании субъективного мнения исследователя, приводит к тому, что результаты такого наблюдения относятся не ко всей генеральной (сплошной) совокупности, а только к той ее части, которая была подвергнута обследованию.
Рис. 3. Виды отбора единиц совокупности при выборочном статистическом наблюдении.
Случайная выборка обычно проводится с помощью жеребьевки или при помощи таблиц случайных чисел.
Типическая выборка основана на отборе единиц для выборочного наблюдения не из всей генеральной совокупности в целом, а из ее типических групп. При типической выборке генеральная совокупность предварительно разделяется на типы, каждый из которых в выборке представлен квотой, пропорциональной численности типа в генеральной совокупности. Типический отбор дает наиболее репрезентативную выборку.
При простом случайном отборе обеспечивается лишь количественная репрезентация выборки, а при типическом отборе обеспечивается как количественная, так и качественная репрезентация.
Механическая выборка применяется в случаях, когда генеральная совокупность каким-либо образом упорядочена, т.е. имеется определенная последовательность в расположении единиц совокупности (списки избирателей - по алфавиту, номера учреждений уголовно-исполнительной системы - по регионам, номера уголовных дел - в зависимости от подследственности и т.п.). Отбор единиц производят в соответствии с установленной пропорцией через некоторый интервал. Например, при пропорции 1:50 отбирается 2 % - ая выборка.
Серийная выборка используется в тех случаях, когда единицы совокупности объединены в небольшие группы или серии. Смысл такой выборки можно пояснить на примере: чтобы определить средний рост школьников-первоклассников, можно случайным или механическим способом выбрать город, в этом городе - округ, в округе - школу, в ней класс, а затем произвести сплошное измерение роста всех учеников этого класса. То есть сущность серийной выборки заключается в собственно случайном либо механическом отборе серий, внутри которых производится сплошное обследование единиц. В качестве таких серий в уголовно-правовой статистике могут рассматриваться социальные или возрастные группы - при исследовании причин преступности, организационно-правовые формы собственности - при изучении экономических преступлений.
В теории статистики разработаны соответствующие формулы расчета средней ошибки выборки применительно к каждому из перечисленных выше способов ее отбора.
Кроме перечисленных способов отбора, в практике статистических обследований социально-правовых явлений применяется и комбинированный отбор. Например, можно комбинировать типическую и серийную выборки, когда серии отбираются в установленном порядке из нескольких типических групп. Возможна также комбинация серийного и собственно случайного отборов, при которой отдельные единицы отбираются внутри серии в собственно случайном порядке.
Способ (или вид) отбора объектов - решающее условие качества выводов из любого выборочного метода исследования, который, в свою очередь, во многом определяется особенностями предмета исследования.
Основные характеристики выборочной совокупности.
Основная задача выборочного метода – определение ошибки выборки, т.к. если не известен размер ошибки, данные выборки не могут иметь практического значения. Результаты выборочного наблюдения тем точнее, чем меньше колеблемость изучаемого признака.
При выборочном наблюдении по количественному признаку ставится задача определить среднее значение этого признака в выборочной совокупности. Далее возникает вопрос, насколько это среднее значение типично или показательно, т.е. насколько правильно и точно характеризует среднее значение данную совокупность по изучаемому признаку. Для ответа на этот вопрос необходимо вычислить особый показатель - среднее квадратическое отклонение.
Судебная статистика, в частности уголовно-правовая, чаще имеет дело с качественными признаками. При выборочном наблюдении интересующих явлений по качественному признаку, ставится задача установить долю явлений, обладающих этим признаком. Если долю явлений, обладающих данным признаком, обозначить символом , то доля остальных явлений, не обладающих этим признаком, будет определяться как .Действительно, если допустить, что доля осужденных, совершивших хулиганство в состоянии опьянения, составляет 90% (или 0,9), то очевидно, доля хулиганов «трезвенников», будет равна разности: 100% — 90% (или 1-0,9), т.е. 10% (или 0,1).
Разработанная математической статистикой формула колеблемости отдельных вариантов ряда для совокупности явлений, исчисляемых по качественным признакам, выглядит следующим образом:
– дисперсия качественного признака.
Дисперсия – это средний квадрат отклонения изучаемого признака от среднего значения признака.
Напомним, дисперсия количественного признака определяется следующим образом:
.
Среднее квадратическое отклонение можно получить, извлекая квадратный корень из дисперсии:
- для качественного признака,
- для количественного признака.
Основной вопрос выборочного наблюдения заключается в том, насколько средняя выборочной совокупности отличается средней генеральной совокупности, т.е. как велика ошибка репрезентативности.
Ответ на вопрос, каким образом определить размер ошибки выборки, дает математическая теория выборочного метода.
При достаточно большом числе независимых наблюдений можно почти достоверно, утверждать, что отклонение выборочной средней от генеральной будет сколько угодно малым (теорема П.Л. Чебышева). На размерах ошибки выборки будет сказываться, с одной стороны, действие закона больших чисел: чем больше единиц попадает в выборку, тем будет меньше возможная ошибка, а с другой стороны размер ошибки зависит от колеблемости, пестроты обследуемых по определенному признаку единиц совокупности.
Для определения ошибки репрезентативности, обозначаемой в статистике W, рекомендуется пользоваться следующими двумя формулами:
- для количественного признака;
- для качественного признака.
где W - средняя ошибка репрезентативности; - показатель колеблемости количественного признака ( - среднее квадратическое отклонение); п - число единиц, попавших в выборку; Р - доля данного качественного признака в выборке - доля противоположного признака.
Правило трех сигм. Необходимо отметить, что данное правило можно использовать для случайных величин, имеющих нормальный закон распределения. Следующее свойство среднего квадратического отклонения позволяет правильно оценить надежность выборочных показателей. Если площадь, ограниченную кривой нормального распределения, принять за 1 или 100%, то площадь, заключенная в пределах 1 вправо и влево от средней арифметической, составит 0,683 всей площади. Это означает, что 68,3% всех изученных вариант отклоняется от средней арифметической не более чем на 1 , т.е. находится в пределах . Интервал значений от до принято называть первым доверительным интервалом.
Рис 2. Правило трех .
Площадь, заключенная в пределах 2 вправо и влево от средней арифметической, составляет 0,954 всей площади, т.е. 95,4% всех единиц совокупности находится в пределах . Интервал значений от до принято называть вторым доверительным интервалом. Площадь, заключенная в пределах 3 влево и вправо от средней арифметической, составляет 0,997 всей площади, или 99,7% всех единиц совокупности находится в пределах . Интервал значений от до принято называть третьим доверительным интервалом.
ПРАКТИЧЕСКИЕ ЗАДАНИЯ И ПОРЯДОК ИХ ВЫПОЛНЕНИЯ
Для закрепления изученного материала предлагается выполнить практические задания по расчету характеристик выборочной совокупности. Для этого воспользуемся персональным компьютером и офисными приложениями Word и Excel.
Порядок выполнения заданий №1. При выборочном наблюдении получены данные о возрасте осужденных.
Выборочная совокупность
Возраст | |||||||
Количество осужденных |
Необходимо найти ошибку репрезентативности выборочных данных, рассчитать доверительные интервалы при однократной, двукратной и трехкратной ошибке.
Генеральная совокупность
Возраст | |||||||
Количество осужденных |
Определите в какой доверительный интервал попадает среднее значение признака генеральной совокупности.
Решение
Определим среднее значение признака для выборочной совокупности, учитывая, что частоты вариант различны. Поэтому для расчета воспользуемся формулой взвешенной средней арифметической
,
получим .
Далее рассчитаем среднее квадратическое отклонение по данным выборочной совокупности, для этого воспользуемся выражением
,
в результате получаем .
Найдем ошибку репрезентативности выборочных данных
,
где n – объем выборочной совокупности, его можно найти как сумму частот, т.е. .
Определим первый доверительный интервал
или (22,5÷23,1), вероятность попадания в этот интервал, согласно правилу трех сигм, составит 0,638.
Определим второй доверительный интервал
или (22,2÷23,4), вероятность попадания в этот интервал, согласно правилу трех сигм, составит 0,954.
Определим третий доверительный интервал
или (19,9÷23,7), вероятность попадания в этот интервал, согласно правилу трех сигм, составит 0,997.
Для определения в какой доверительный интервал попадает среднее значение признака для генеральной совокупности определим это значение:
.
Значение оказывается в интервале (22,2÷23,4), с вероятностью 0,954.
Порядок выполнения заданий №2. В порядке случайной выборки обследовано 700 заключенных из 4000. В результате наблюдения установлено, что доля заключенных, совершивших преступление в состоянии опьянения, составила 0,7 или 70 %. Необходимо определить ошибку репрезентативности выборочных данных, рассчитать доверительные интервалы, если коэффициенты доверия принимают значения , , .
Решение
Для определения ошибки репрезентативности при исследовании качественного признака необходимо воспользоваться выражением:
,
где п – объем выборки, Р - доля исследуемого качественного признака в выборке (совершение преступления в состоянии опьянения), а - доля противоположного признака.
Подставляя имеющиеся данные получим
или 1,7 %.
Определим первый доверительный интервал
или (68,3% ÷ 71,7%), вероятность попадания в этот интервал, согласно правилу трех сигм, составит 0,638.
Определим второй доверительный интервал
или (66,6% ÷ 73,4%), вероятность попадания в этот интервал, согласно правилу трех сигм, составит 0,954.
Определим третий доверительный интервал
или (64,9% ÷ 75,1%), вероятность попадания в этот интервал, согласно правилу трех сигм, составит 0,997.
Вариант №1
Задание № 1. При выборочном наблюдении получены данные о количестве дел рассмотренных мировыми судьями.
Выборочная совокупность
Число рассмотренных дел | |||||||
Количество судей |
Необходимо найти ошибку репрезентативности выборочных данных, рассчитать доверительные интервалы при однократной, двукратной и трехкратной ошибке.
Генеральная совокупность
Число рассмотренных дел | |||||||
Количество судей |
Определите в какой доверительный интервал попадает среднее значение признака генеральной совокупности.
Задание №2. При выборочном наблюдении обследовано 300 водителей из 2000, нарушивших правила дорожного движения. В результате этого установлено, что доля водителей, совершивших правонарушение в состоянии опьянения составила 0,78 или 78 %. Необходимо определить ошибку репрезентативности выборочных данных, рассчитать первый второй и третий доверительные интервалы.
Вариант №2
Задание № 1. При выборочном наблюдении получены данные о количестве дел рассмотренных мировыми судьями.
Выборочная совокупность
Число рассмотренных дел | |||||||
Количество судей |
Необходимо найти ошибку репрезентативности выборочных данных, рассчитать доверительные интервалы при однократной, двукратной и трехкратной ошибке.
Генеральная совокупность
Число рассмотренных дел | |||||||
Количество судей |
Определите в какой доверительный интервал попадает среднее значение признака генеральной совокупности.
Задание №2. При выборочном наблюдении обследовано 150 водителей из 1000, нарушивших правила дорожного движения. В результате этого установлено, что доля водителей, совершивших правонарушение в состоянии опьянения составила 0,68 или 68 %. Необходимо определить ошибку репрезентативности выборочных данных, рассчитать первый второй и третий доверительные интервалы.
Вариант №3
Задание № 1. При выборочном наблюдении получены данные о количестве дел рассмотренных мировыми судьями.
Выборочная совокупность
Число рассмотренных дел | |||||||
Количество судей |
Необходимо найти ошибку репрезентативности выборочных данных, рассчитать доверительные интервалы при однократной, двукратной и трехкратной ошибке.
Генеральная совокупность
Число рассмотренных дел | |||||||
Количество судей |
Определите в какой доверительный интервал попадает среднее значение признака генеральной совокупности.
Задание №2. При выборочном наблюдении обследовано 200 водителей из 1500, нарушивших правила дорожного движения. В результате этого установлено, что доля водителей, совершивших правонарушение в состоянии опьянения составила 0,83 или 83 %. Необходимо определить ошибку репрезентативности выборочных данных, рассчитать первый второй и третий доверительные интервалы.
Вариант №4
Задание № 1. При выборочном наблюдении получены данные о количестве дел рассмотренных мировыми судьями.
Выборочная совокупность
Число рассмотренных дел | |||||||
Количество судей |
Необходимо найти ошибку репрезентативности выборочных данных, рассчитать доверительные интервалы при однократной, двукратной и трехкратной ошибке.
Генеральная совокупность
Число рассмотренных дел | |||||||
Количество судей |
Определите в какой доверительный интервал попадает среднее значение признака генеральной совокупности.
Задание №2. При выборочном наблюдении обследовано 120 водителей из 800, нарушивших правила дорожного движения. В результате этого установлено, что доля водителей, совершивших правонарушение в состоянии опьянения составила 0,75 или 75 %. Необходимо определить ошибку репрезентативности выборочных данных, рассчитать первый второй и третий доверительные интервалы.
Вариант №5
Задание № 1. При выборочном наблюдении получены данные о количестве дел рассмотренных мировыми судьями.
Выборочная совокупность
Число рассмотренных дел | |||||||
Количество судей |
Необходимо найти ошибку репрезентативности выборочных данных, рассчитать доверительные интервалы при однократной, двукратной и трехкратной ошибке.
Генеральная совокупность
Число рассмотренных дел | |||||||
Количество судей |
Определите в какой доверительный интервал попадает среднее значение признака генеральной совокупности.
Задание №2. При выборочном наблюдении обследовано 100 водителей из 900, нарушивших правила дорожного движения. В результате этого установлено, что доля водителей, совершивших правонарушение в состоянии опьянения составила 0,73 или 73 %. Необходимо определить ошибку репрезентативности выборочных данных, рассчитать первый второй и третий доверительные интервалы.
Вариант №6
Задание № 1. При выборочном наблюдении получены данные о количестве дел рассмотренных мировыми судьями.
Выборочная совокупность
Число рассмотренных дел | |||||||
Количество судей |
Необходимо найти ошибку репрезентативности выборочных данных, рассчитать доверительные интервалы при однократной, двукратной и трехкратной ошибке.
Генеральная совокупность
Число рассмотренных дел | |||||||
Количество судей |
Определите в какой доверительный интервал попадает среднее значение признака генеральной совокупности.
Задание №2. При выборочном наблюдении обследовано 140 водителей из1200, нарушивших правила дорожного движения. В результате этого установлено, что доля водителей, совершивших правонарушение в состоянии опьянения составила 0,69 или 69 %. Необходимо определить ошибку репрезентативности выборочных данных, рассчитать первый второй и третий доверительные интервалы.
Вариант №7
Задание № 1. При выборочном наблюдении получены данные о количестве дел рассмотренных мировыми судьями.
Выборочная совокупность
Число рассмотренных дел | |||||||
Количество судей |
Необходимо найти ошибку репрезентативности выборочных данных, рассчитать доверительные интервалы при однократной, двукратной и трехкратной ошибке.
Генеральная совокупность
Число рассмотренных дел | |||||||
Количество судей |
Определите в какой доверительный интервал попадает среднее значение признака генеральной совокупности.
Задание №2. При выборочном наблюдении обследовано 130 водителей из 1400, нарушивших правила дорожного движения. В результате этого установлено, что доля водителей, совершивших правонарушение в состоянии опьянения составила 0,7 или 70 %. Необходимо определить ошибку репрезентативности выборочных данных, рассчитать первый второй и третий доверительные интервалы.
Вариант №8
Задание № 1. При выборочном наблюдении получены данные о количестве дел рассмотренных мировыми судьями.
Выборочная совокупность
Число рассмотренных дел | |||||||
Количество судей |
Необходимо найти ошибку репрезентативности выборочных данных, рассчитать доверительные интервалы при однократной, двукратной и трехкратной ошибке.
Генеральная совокупность
Число рассмотренных дел | |||||||
Количество судей |
Определите в какой доверительный интервал попадает среднее значение признака генеральной совокупности.
Задание №2. При выборочном наблюдении обследовано 160 водителей из 1300, нарушивших правила дорожного движения. В результате этого установлено, что доля водителей, совершивших правонарушение в состоянии опьянения составила 0,66 или 66 %. Необходимо определить ошибку репрезентативности выборочных данных, рассчитать первый второй и третий доверительные интервалы.
Вариант №9
Задание № 1. При выборочном наблюдении получены данные о количестве дел рассмотренных мировыми судьями.
Выборочная совокупность
Число рассмотренных дел | |||||||
Количество судей |
Необходимо найти ошибку репрезентативности выборочных данных, рассчитать доверительные интервалы при однократной, двукратной и трехкратной ошибке.
Генеральная совокупность
Число рассмотренных дел | |||||||
Количество судей |
Определите в какой доверительный интервал попадает среднее значение признака генеральной совокупности.
Задание №2. При выборочном наблюдении обследовано 110 водителей из 1600, нарушивших правила дорожного движения. В результате этого установлено, что доля водителей, совершивших правонарушение в состоянии опьянения составила 0,63 или 63 %. Необходимо определить ошибку репрезентативности выборочных данных, рассчитать первый второй и третий доверительные интервалы.
Вариант №10
Задание № 1. При выборочном наблюдении получены данные о количестве дел рассмотренных мировыми судьями.
Выборочная совокупность
Число рассмотренных дел | |||||||
Количество судей |
Необходимо найти ошибку репрезентативности выборочных данных, рассчитать доверительные интервалы при однократной, двукратной и трехкратной ошибке.
Генеральная совокупность
Число рассмотренных дел | |||||||
Количество судей |
Определите в какой доверительный интервал попадает среднее значение признака генеральной совокупности.
Задание №2. При выборочном наблюдении обследовано 160 водителей из 1800, нарушивших правила дорожного движения. В результате этого установлено, что доля водителей, совершивших правонарушение в состоянии опьянения составила 0,57 или 57 %. Необходимо определить ошибку репрезентативности выборочных данных, рассчитать первый второй и третий доверительные интервалы.
Задание на самостоятельную подготовку.
К следующему практическому занятию повторите материал по теме «Выборочный метод статистического наблюдения», для закрепления и углубления полученных знаний воспользуйтесь предложенной литературой.
Литература:
основная:
1. Савюк Л.К. Правовая статистика [Текст]: учебник / Л.К. Савюк. – 2-е изд., перераб. и доп. – М.: Юристъ, 2006. – 637 с.
2. Лунеев В.В. Юридическая статистика [Текст]: учебник / В.В. Лунеев. – 2-е изд., перераб. и доп. – М.: Юристъ, 2004. – 392 с.
дополнительная:
3. Лялин В.С. Правовая статистика [Текст]: учебник / В.С. Лялин. – М.: ИВЭСЭП, 2006. – 235 с.
4. Правовая статистика [Текст]: учебник / В.Н. Демидов и др.; под ред. С.Я. Казанцева, С.Я. Лебедева. – М.: ЮНИТИ-ДАНА, Закон и право, 2007. – 255 с.
5. Ефимова М.Р., Петрова Е.В., Румянцев В.Н. Общая теория статистики [Текст]: учебник / М.Р. Ефимова, Е.В. Петрова, В.Н. Румянцев – 2-е изд., испр. и доп. – М.: ИНФРА-М, 2001. – 416 с.
6. Горемыкина Т.К. Общая и правовая статистика [Текст]: учебное пособие / Т.К. Горемыкина. – М.: МГИУ, 2001. – 175 с.