Генеральная и выборочная совокупности




Генеральная совокупность случайной величины Х – множество возможных значений случайной величины Х. Под законом распределения (распределением) генеральной совокупности Х понимают закон распределения вероятностей случайной величины Х.

Выборочной совокупностью, или просто выборкой, называют совокупность случайно отобранных объектов.

Объемом совокупности (выборочной или генеральной) называют число объектов этой совокупности. Например, если из 1000 деталей отобрано для обследования 100 деталей, то объем генеральной совокупности N=1000, а объем выборки n=100.

Генеральную совокупность называют конечной или бесконечной в зависимости от того, конечна или бесконечна совокупность составляющих ее элементов.

О свойствах генеральной совокупности можно судить по выборке. Однако при этом она должна быть представительной (репрезентативной ), т.е. объекты выборки должны хорошо представлять генеральную совокупность. Репрезентативность выборки обеспечивается случайностью отбора. Это означает, что любой объект выборки отобран случайно, при этом все объекты имеют одинаковую вероятность попасть в выборку. Существует несколько способов, обеспечивающих репрезентативность выборки, например, можно организовать случайную выборку с возвратом (случайная повторная) и случайная выборку без возврата (случайная бесповторная). При этом в случайной выборке с возвратом испытания независимы, а в выборке с возвратом испытания зависимы.

 

Предварительная обработка результатов эксперимента

1. Вариационный ряд

Пусть - выборка объёма n из генеральной совокупности X. Её можно упорядочить, расположив значения в неубывающем порядке;

Последовательность чисел , удовлетворяющая условию , где - наименьший, - наибольший из элементов выборки, называется вариационным рядом выборки, или вариационным рядом.

Среди элементов выборки могут быть одинаковые. Так бывает, когда наблюдаемая случайная величина Х – дискретная, либо когда Х - непрерывная, но её значения при измерениях округляют.

Пусть среди элементов выборки выделены m<n их различных значений, расположенных в порядке возрастания. Обозначим их . Значения называются вариантами. Пусть каждое из них повторяется соответственно раз, причём .

Числа , показывающие, сколько раз встречаются варианты в ряде наблюдений, называются частотами, а отношение их к объему выборки - частостями, или относительными частотами:

.

Статистическим рядом для выборки называют таблицу, которая в первой строке содержит значения (), а во второй – соответствующие им частоты или частости:

 

Статистические данные, представленные в виде статистического ряда, называют группированными.

Пример 1. В результате тестирования группа абитуриентов набрала баллы:

5, 3, 0, 1, 4, 2, 5, 4, 1, 5. Записать полученную выборку в виде: а) вариационного ряда; б) статистического ряда.

а) Проранжировав статистические данные (т. е. исходный ряд), получим вариационный ряд ():

(0, 1, 1, 2, 3, 4, 4, 5, 5, 5)

б) Подсчитав частоту и частость вариантов =0, =1, =2,

=3, =4, =5, получим статистическое распределение выборки (дискретный статистический ряд):

           
           

()

или

           

()

Статистическое распределение выборки является оценкой неизвестного распределения.

В случае, когда число значений случайной величины Х велико или признак является непрерывным (т. е. когда СВ Х может принять любое значение в некотором интервале), составляют интервальный статистический ряд.

Интервальным статистическим рядом, соответствующим полученной случайной выборке, называется упорядоченная последовательность интервалов , i=1,2,…k с указанием количества mi значений xi, попавших в них.

Число интервалов k можно рассчитать по формуле Стёрджеса:

Величина интервала определяется как:

За начало первого интервала рекомендуется брать величину .

 

Пример 2. Измерили рост 30 наудачу отобранных студентов. Результаты измерений:

178, 160, 154, 183, 155, 153, 167, 186, 163, 155,

157, 175, 170, 166, 159, 173, 182, 167,171, 169,

179, 165, 156, 179, 158, 171, 175, 173, 164, 172

Построить интервальный статистический ряд.

Решение: =153, =186, интервалов.

. Начальное значение .

   
   
   
   
   
   

 

Одним из способов обработки вариационного ряда является построение эмпирической функции распределения.

Эмпирической функцией распределения (функцией распределения выборки) называют функцию F*(x), определяющую для каждого значения x относительную частоту события X<x.

Для нахождения значений эмпирической функции удобно записать в виде:

- число наблюдений, меньших Х.

Пример.

 

Эмпирическая функция распределения является оценкой вероятности события (X<x), т.е. оценкой теоретической функции распределения.

 

 

 



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2021-04-15 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: