Основные характеристики выборочной совокупности.




ПРАКТИЧЕСКОЕ ЗАНЯТИЕ № 10

Тема 6: «Выборочный метод статистического наблюдения».

 

Цель занятия: приобрести практические навыки расчета характеристик выборочной совокупности.

 

КРАТКИЕ ТЕОРЕТИЧЕСКИЕ СВЕДЕНИЯ

Основные понятия теории выборочного наблюдения.

 

Под выборочным наблюдением понимаетсянесплошное наблюдение, при котором статистическому обследова­нию подвергаются не все, а отдельные единицы, ото­бранные с соблюдением определенных условий.

Применение выборочного обследования дает возможность глубже организовать наблюдение, обеспечивает быстроту его проведения, приводит к экономии средств и труда на получение и обработку ин­формации.

Генеральной совокупностью называется вся совокупность единиц наблюдения, относящихся к изучаемой проблеме.

Выборочной совокупностью (выборкой) называется та часть единиц наблюдения генеральной совокупности, которая подлежит непосредственному изучению.

Объемом совокупности называется общее количество единиц наблюдения в совокупности. Объем генеральной совокупности (N) всегда значительно превосходит объем выборки (n).

 

.

 

Генеральная и выборочная сово­купности могут быть количественной или качественной, что зависит от того, являются ли признаки свойства единиц совокупности ко­личественными или качественными. Это различие предполагает, что для статистического описания совокупности используются либо обобщающие показатели, либо удельные веса (доли).

Между этими показателями генеральной и выборочной совокупности име­ется некоторое различие, иначе говоря, существует ошибка в опреде­лении показателей выборочной совокупности именно потому, что последняя является частью генеральной сово­купности.

Эти ошибки называют ошибками репрезентативности, онипредставляют со­бой расхождение между показателями выборочной и генеральной совокуп­ности, подчиняются определенным статистическим закономерностям, что и позволяет рассчитывать объем выборочной совокупности.

Ошибки могут быть систематическими и случайными. Систематические ошибки возникают в связи с особенностями принятой системы отбора и об­работки данных наблюдений или в связи с нарушением установлен­ных правил отбора. Случайные ошибки являются следствием недостаточно равномер­ного представления в выборке отдельных видов единиц генеральной совокупности.

Определение возможной и фактически допущенной ошибки вы­борки играет существенную роль в решении вопроса о возможности применения выборочного метода. Величина ошибки характеризует степень надежности результатов выборки; знание этой величины не­обходимо при оценке параметров генеральной совокупности. Оценки возможной величины и состава ошибок репрезентативности ложатся в основу планирования проектируемого выборочного наблюдения.

В процессе формирования выборочной совокупности должен быть обеспечен строго объективный подход к отбору единиц. Нару­шение этого принципа, когда наблюдению подвергаются единицы, отобранные на основании субъективного мнения исследователя, приводит к тому, что результаты такого наблюдения относятся не ко всей генеральной (сплошной) совокупности, а только к той ее части, которая была подвергнута обследованию.

 

 

Рис. 3. Виды отбора единиц совокупности при выборочном статистическом наблюдении.

 

Случайная выборка обычно проводится с помощью жеребьевки или при помощи таблиц случайных чисел.

Типическая выборка основана на отборе единиц для выборочного наблюдения не из всей генеральной сово­купности в целом, а из ее типических групп. При типиче­ской выборке генеральная совокупность предварительно разделяется на типы, каждый из которых в выборке представлен квотой, пропор­циональной численности типа в генеральной совокупности. Типический отбор дает наиболее репрезентативную выборку.

При простом случайном отборе обеспечивается лишь количественная репрезентация выборки, а при типическом отборе обеспечивается как количественная, так и качественная репрезентация.

Механическая выборка применяется в случаях, когда генеральная совокупность каким-либо образом упорядочена, т.е. имеется опреде­ленная последовательность в расположении единиц совокупности (списки избирателей - по алфавиту, номера учреждений уголовно-испол­нительной системы - по регионам, номера уголовных дел - в зави­симости от подследственности и т.п.). Отбор единиц производят в соответствии с установленной пропорцией через некоторый ин­тервал. Например, при пропорции 1:50 отбирается 2 % - ая выборка.

Серийная выборка используется в тех случаях, когда единицы совокупности объединены в не­большие группы или серии. Смысл такой выборки можно пояснить на примере: чтобы определить средний рост школьников-первоклас­сников, можно случайным или механическим способом выбрать го­род, в этом городе - округ, в округе - школу, в ней класс, а затем произвести сплошное измерение роста всех учеников этого класса. То есть сущность серийной выборки заключается в собственно случайном либо механическом отборе серий, внутри которых произ­водится сплошное обследование единиц. В качестве таких серий в уголовно-правовой статистике могут рассматриваться социальные или возрастные группы - при исследовании причин преступности, организационно-правовые формы собственности - при изучении экономических преступлений.

В теории статистики разработаны соответствующие формулы расчета средней ошибки выборки применительно к каждому из пе­речисленных выше способов ее отбора.

Кроме перечисленных способов отбора, в практике статистиче­ских обследований социально-правовых явлений применяется и комбинированный отбор. Например, можно комбинировать типиче­скую и серийную выборки, когда серии отбираются в установленном порядке из нескольких типических групп. Возможна также комбина­ция серийного и собственно случайного отборов, при которой от­дельные единицы отбираются внутри серии в собственно случайном порядке.

Способ (или вид) отбора объектов - решающее условие качества выводов из любого выборочного метода исследования, который, в свою очередь, во многом определяется особенностями предмета ис­следования.

 

Основные характеристики выборочной совокупности.

Основная задача выборочного метода – определение ошибки выборки, т.к. если не известен размер ошибки, данные выборки не могут иметь практического значения. Результаты выборочного на­блюдения тем точнее, чем меньше колеблемость изучае­мого признака.

При выборочном наблюдении по количественному приз­наку ставится задача определить среднее значение этого признака в выборочной совокупности. Далее возникает вопрос, насколько это среднее значение типично или показательно, т.е. насколько правильно и точно характе­ризует среднее значение данную совокупность по изучаемому признаку. Для от­вета на этот вопрос необходимо вычис­лить особый показатель - среднее квадратическое отклонение.

Судебная статистика, в частности уголовно-правовая, чаще име­ет дело с качественными признаками. При выборочном наблюдении интересующих явлений по качественному признаку, ставится задача установить долю явлений, обладающих этим признаком. Если долю явлений, обладающих данным призна­ком, обозначить символом , то доля остальных явлений, не обла­дающих этим признаком, будет определяться как .Действительно, если допустить, что доля осужденных, совершивших хулиганство в со­стоянии опьянения, составляет 90% (или 0,9), то очевидно, доля ху­лиганов «трезвенников», будет равна разности: 100% — 90% (или 1-0,9), т.е. 10% (или 0,1).

Разработанная математической статистикой формула колеблемо­сти отдельных вариантов ряда для совокупности явлений, исчисляе­мых по качественным признакам, выглядит следующим образом:

 

– дисперсия качественного признака.

 

Дисперсия – это средний квадрат отклонения изучаемого признака от среднего значения признака.

Напомним, дисперсия количественного признака определяется следующим образом:

 

.

 

Среднее квадратическое отклонение можно получить, извлекая квадратный корень из дисперсии:

 

- для качественного признака,

 

- для количественного признака.

Основной вопрос выборочного наблюдения заключается в том, насколько средняя выборочной совокупности отличается средней гене­ральной совокупности, т.е. как велика ошибка репрезентативности.

Ответ на вопрос, каким образом определить размер ошибки вы­борки, дает математическая теория выборочного метода.

При достаточно большом числе независимых наблюдений мож­но почти достовер­но, утверждать, что отклонение выборочной средней от гене­ральной будет сколько угодно малым (теорема П.Л. Чебышева). На размерах ошибки выборки будет сказываться, с одной стороны, действие закона больших чисел: чем больше единиц попадает в выборку, тем будет меньше возможная ошибка, а с другой стороны размер ошибки зависит от колеблемости, пе­строты обследуемых по определенному признаку единиц совокуп­ности.

Для определения ошибки репрезентативности, обозначае­мой в статистике W, рекомендуется пользоваться следующими двумя формулами:

 

- для количественного признака;

 

- для качественного признака.

где W - средняя ошибка репрезентативности; - показатель колеб­лемости количественного признака ( - среднее квадратическое от­клонение); п - число единиц, попавших в выборку; Р - доля данного качественного признака в выборке - доля противо­положного признака.

Правило трех сигм. Необходимо отметить, что данное правило можно использовать для случайных величин, имеющих нормальный закон распределения. Следующее свойство среднего квадратического отклонения позво­ляет правильно оценить надежность выборочных показателей. Если пло­щадь, ограниченную кривой нор­мального распределения, принять за 1 или 100%, то площадь, заключенная в пределах 1 вправо и влево от средней арифметической, составит 0,683 всей площади. Это означает, что 68,3% всех изученных вариант откло­няется от средней арифметической не более чем на 1 , т.е. находится в пре­делах . Интервал значений от до принято называть первым доверительным интервалом.

 

 

Рис 2. Правило трех .

 

Площадь, заключенная в преде­лах 2 вправо и влево от средней арифметической, составляет 0,954 всей площади, т.е. 95,4% всех единиц совокупности находится в пре­делах . Интервал значений от до принято называть вторым доверительным интервалом. Площадь, заключенная в пределах 3 влево и вправо от средней арифметической, составляет 0,997 всей площади, или 99,7% всех единиц совокупности находится в пределах . Интервал значений от до принято называть третьим доверительным интервалом.

 

ПРАКТИЧЕСКИЕ ЗАДАНИЯ И ПОРЯДОК ИХ ВЫПОЛНЕНИЯ

 

Для закрепления изученного материала предлагается выполнить практические задания по расчету характеристик выборочной совокупности. Для этого воспользуемся персональным компьютером и офисными приложениями Word и Excel.

Порядок выполнения заданий №1. При выборочном наблюдении получены данные о возрасте осужденных.

 

Выборочная совокупность

Возраст              
Количество осужденных              

 

Необходимо найти ошибку репрезентативности выборочных данных, рассчитать доверительные интервалы при однократной, двукратной и трехкратной ошибке.

 

Генеральная совокупность

Возраст              
Количество осужденных              

 

Определите в какой доверительный интервал попадает среднее значение признака генеральной совокупности.

 

Решение

 

Определим среднее значение признака для выборочной совокупности, учитывая, что частоты вариант различны. Поэтому для расчета воспользуемся формулой взвешенной средней арифметической

 

,

 

получим .

Далее рассчитаем среднее квадратическое отклонение по данным выборочной совокупности, для этого воспользуемся выражением

 

,

 

в результате получаем .

Найдем ошибку репрезентативности выборочных данных

,

где n – объем выборочной совокупности, его можно найти как сумму частот, т.е. .

Определим первый доверительный интервал

 

 

или (22,5÷23,1), вероятность попадания в этот интервал, согласно правилу трех сигм, составит 0,638.

Определим второй доверительный интервал

 

 

или (22,2÷23,4), вероятность попадания в этот интервал, согласно правилу трех сигм, составит 0,954.

Определим третий доверительный интервал

 

 

или (19,9÷23,7), вероятность попадания в этот интервал, согласно правилу трех сигм, составит 0,997.

Для определения в какой доверительный интервал попадает среднее значение признака для генеральной совокупности определим это значение:

 

.

 

Значение оказывается в интервале (22,2÷23,4), с вероятностью 0,954.

 

Порядок выполнения заданий №2. В порядке случайной выборки обследовано 700 заключенных из 4000. В результате наблюдения установлено, что доля заключенных, совершивших преступление в состоянии опьянения, составила 0,7 или 70 %. Необходимо определить ошибку репрезентативности выборочных данных, рассчитать доверительные интервалы, если коэффициенты доверия принимают значения , , .

 

Решение

 

Для определения ошибки репрезентативности при исследовании качественного признака необходимо воспользоваться выражением:

 

,

 

где п – объем выборки, Р - доля исследуемого качественного признака в выборке (совершение преступления в состоянии опьянения), а - доля противо­положного признака.

Подставляя имеющиеся данные получим

 

или 1,7 %.

 

Определим первый доверительный интервал

 

 

или (68,3% ÷ 71,7%), вероятность попадания в этот интервал, согласно правилу трех сигм, составит 0,638.

Определим второй доверительный интервал

 

 

или (66,6% ÷ 73,4%), вероятность попадания в этот интервал, согласно правилу трех сигм, составит 0,954.

Определим третий доверительный интервал

 

 

или (64,9% ÷ 75,1%), вероятность попадания в этот интервал, согласно правилу трех сигм, составит 0,997.

Вариант №1

 

Задание № 1. При выборочном наблюдении получены данные о количестве дел рассмотренных мировыми судьями.

 

Выборочная совокупность

Число рассмотренных дел              
Количество судей              

 

Необходимо найти ошибку репрезентативности выборочных данных, рассчитать доверительные интервалы при однократной, двукратной и трехкратной ошибке.

 

Генеральная совокупность

Число рассмотренных дел              
Количество судей              

 

Определите в какой доверительный интервал попадает среднее значение признака генеральной совокупности.

 

Задание №2. При выборочном наблюдении обследовано 300 водителей из 2000, нарушивших правила дорожного движения. В результате этого установлено, что доля водителей, совершивших правонарушение в состоянии опьянения составила 0,78 или 78 %. Необходимо определить ошибку репрезентативности выборочных данных, рассчитать первый второй и третий доверительные интервалы.

 

Вариант №2

 

Задание № 1. При выборочном наблюдении получены данные о количестве дел рассмотренных мировыми судьями.

 

Выборочная совокупность

Число рассмотренных дел              
Количество судей              

 

Необходимо найти ошибку репрезентативности выборочных данных, рассчитать доверительные интервалы при однократной, двукратной и трехкратной ошибке.

 

Генеральная совокупность

Число рассмотренных дел              
Количество судей              

 

Определите в какой доверительный интервал попадает среднее значение признака генеральной совокупности.

 

Задание №2. При выборочном наблюдении обследовано 150 водителей из 1000, нарушивших правила дорожного движения. В результате этого установлено, что доля водителей, совершивших правонарушение в состоянии опьянения составила 0,68 или 68 %. Необходимо определить ошибку репрезентативности выборочных данных, рассчитать первый второй и третий доверительные интервалы.

Вариант №3

 

Задание № 1. При выборочном наблюдении получены данные о количестве дел рассмотренных мировыми судьями.

 

Выборочная совокупность

Число рассмотренных дел              
Количество судей              

 

Необходимо найти ошибку репрезентативности выборочных данных, рассчитать доверительные интервалы при однократной, двукратной и трехкратной ошибке.

 

Генеральная совокупность

Число рассмотренных дел              
Количество судей              

 

Определите в какой доверительный интервал попадает среднее значение признака генеральной совокупности.

 

Задание №2. При выборочном наблюдении обследовано 200 водителей из 1500, нарушивших правила дорожного движения. В результате этого установлено, что доля водителей, совершивших правонарушение в состоянии опьянения составила 0,83 или 83 %. Необходимо определить ошибку репрезентативности выборочных данных, рассчитать первый второй и третий доверительные интервалы.

Вариант №4

 

Задание № 1. При выборочном наблюдении получены данные о количестве дел рассмотренных мировыми судьями.

 

Выборочная совокупность

Число рассмотренных дел              
Количество судей              

 

Необходимо найти ошибку репрезентативности выборочных данных, рассчитать доверительные интервалы при однократной, двукратной и трехкратной ошибке.

 

Генеральная совокупность

Число рассмотренных дел              
Количество судей              

 

Определите в какой доверительный интервал попадает среднее значение признака генеральной совокупности.

 

Задание №2. При выборочном наблюдении обследовано 120 водителей из 800, нарушивших правила дорожного движения. В результате этого установлено, что доля водителей, совершивших правонарушение в состоянии опьянения составила 0,75 или 75 %. Необходимо определить ошибку репрезентативности выборочных данных, рассчитать первый второй и третий доверительные интервалы.

Вариант №5

 

Задание № 1. При выборочном наблюдении получены данные о количестве дел рассмотренных мировыми судьями.

 

Выборочная совокупность

Число рассмотренных дел              
Количество судей              

 

Необходимо найти ошибку репрезентативности выборочных данных, рассчитать доверительные интервалы при однократной, двукратной и трехкратной ошибке.

 

Генеральная совокупность

Число рассмотренных дел              
Количество судей              

 

Определите в какой доверительный интервал попадает среднее значение признака генеральной совокупности.

 

Задание №2. При выборочном наблюдении обследовано 100 водителей из 900, нарушивших правила дорожного движения. В результате этого установлено, что доля водителей, совершивших правонарушение в состоянии опьянения составила 0,73 или 73 %. Необходимо определить ошибку репрезентативности выборочных данных, рассчитать первый второй и третий доверительные интервалы.

Вариант №6

 

Задание № 1. При выборочном наблюдении получены данные о количестве дел рассмотренных мировыми судьями.

 

Выборочная совокупность

Число рассмотренных дел              
Количество судей              

 

Необходимо найти ошибку репрезентативности выборочных данных, рассчитать доверительные интервалы при однократной, двукратной и трехкратной ошибке.

 

Генеральная совокупность

Число рассмотренных дел              
Количество судей              

 

Определите в какой доверительный интервал попадает среднее значение признака генеральной совокупности.

 

Задание №2. При выборочном наблюдении обследовано 140 водителей из1200, нарушивших правила дорожного движения. В результате этого установлено, что доля водителей, совершивших правонарушение в состоянии опьянения составила 0,69 или 69 %. Необходимо определить ошибку репрезентативности выборочных данных, рассчитать первый второй и третий доверительные интервалы.

 

Вариант №7

 

Задание № 1. При выборочном наблюдении получены данные о количестве дел рассмотренных мировыми судьями.

 

Выборочная совокупность

Число рассмотренных дел              
Количество судей              

 

Необходимо найти ошибку репрезентативности выборочных данных, рассчитать доверительные интервалы при однократной, двукратной и трехкратной ошибке.

 

Генеральная совокупность

Число рассмотренных дел              
Количество судей              

 

Определите в какой доверительный интервал попадает среднее значение признака генеральной совокупности.

 

Задание №2. При выборочном наблюдении обследовано 130 водителей из 1400, нарушивших правила дорожного движения. В результате этого установлено, что доля водителей, совершивших правонарушение в состоянии опьянения составила 0,7 или 70 %. Необходимо определить ошибку репрезентативности выборочных данных, рассчитать первый второй и третий доверительные интервалы.

Вариант №8

 

Задание № 1. При выборочном наблюдении получены данные о количестве дел рассмотренных мировыми судьями.

 

Выборочная совокупность

Число рассмотренных дел              
Количество судей              

 

Необходимо найти ошибку репрезентативности выборочных данных, рассчитать доверительные интервалы при однократной, двукратной и трехкратной ошибке.

 

Генеральная совокупность

Число рассмотренных дел              
Количество судей              

 

Определите в какой доверительный интервал попадает среднее значение признака генеральной совокупности.

 

Задание №2. При выборочном наблюдении обследовано 160 водителей из 1300, нарушивших правила дорожного движения. В результате этого установлено, что доля водителей, совершивших правонарушение в состоянии опьянения составила 0,66 или 66 %. Необходимо определить ошибку репрезентативности выборочных данных, рассчитать первый второй и третий доверительные интервалы.

Вариант №9

 

Задание № 1. При выборочном наблюдении получены данные о количестве дел рассмотренных мировыми судьями.

 

Выборочная совокупность

Число рассмотренных дел              
Количество судей              

 

Необходимо найти ошибку репрезентативности выборочных данных, рассчитать доверительные интервалы при однократной, двукратной и трехкратной ошибке.

 

Генеральная совокупность

Число рассмотренных дел              
Количество судей              

 

Определите в какой доверительный интервал попадает среднее значение признака генеральной совокупности.

 

Задание №2. При выборочном наблюдении обследовано 110 водителей из 1600, нарушивших правила дорожного движения. В результате этого установлено, что доля водителей, совершивших правонарушение в состоянии опьянения составила 0,63 или 63 %. Необходимо определить ошибку репрезентативности выборочных данных, рассчитать первый второй и третий доверительные интервалы.

Вариант №10

 

Задание № 1. При выборочном наблюдении получены данные о количестве дел рассмотренных мировыми судьями.

 

Выборочная совокупность

Число рассмотренных дел              
Количество судей              

 

Необходимо найти ошибку репрезентативности выборочных данных, рассчитать доверительные интервалы при однократной, двукратной и трехкратной ошибке.

 

Генеральная совокупность

Число рассмотренных дел              
Количество судей              

 

Определите в какой доверительный интервал попадает среднее значение признака генеральной совокупности.

 

Задание №2. При выборочном наблюдении обследовано 160 водителей из 1800, нарушивших правила дорожного движения. В результате этого установлено, что доля водителей, совершивших правонарушение в состоянии опьянения составила 0,57 или 57 %. Необходимо определить ошибку репрезентативности выборочных данных, рассчитать первый второй и третий доверительные интервалы.

Задание на самостоятельную подготовку.

К следующему практическому занятию повторите материал по теме «Выборочный метод статистического наблюдения», для закрепления и углубления полученных знаний воспользуйтесь предложенной литературой.

 

Литература:

 

основная:

1. Савюк Л.К. Правовая статистика [Текст]: учебник / Л.К. Савюк. – 2-е изд., перераб. и доп. – М.: Юристъ, 2006. – 637 с.

2. Лунеев В.В. Юридическая статистика [Текст]: учебник / В.В. Лунеев. – 2-е изд., перераб. и доп. – М.: Юристъ, 2004. – 392 с.

дополнительная:

3. Лялин В.С. Правовая статистика [Текст]: учебник / В.С. Лялин. – М.: ИВЭСЭП, 2006. – 235 с.

4. Правовая статистика [Текст]: учебник / В.Н. Демидов и др.; под ред. С.Я. Казанцева, С.Я. Лебедева. – М.: ЮНИТИ-ДАНА, Закон и право, 2007. – 255 с.

5. Ефимова М.Р., Петрова Е.В., Румянцев В.Н. Общая теория статистики [Текст]: учебник / М.Р. Ефимова, Е.В. Петрова, В.Н. Румянцев – 2-е изд., испр. и доп. – М.: ИНФРА-М, 2001. – 416 с.

6. Горемыкина Т.К. Общая и правовая статистика [Текст]: учебное пособие / Т.К. Горемыкина. – М.: МГИУ, 2001. – 175 с.



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2017-10-11 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: