Выборка
Выборка или выборочная совокупность — множество случаев, с помощью определённой процедуры выбранных из генеральной совокупности для участия в исследовании.
Характеристики выборки:
· Качественная характеристика выборки – кого именно мы выбираем и какие способы построения выборки мы для этого используем.
· Количественная характеристика выборки – сколько случаев выбираем, другими словами объём выборки.
Пусть задана случайная выборка наблюдений . Статистикой называется произвольная измеримая функция выборки , которая не зависит от неизвестных параметров распределения.
Условие измеримости статистики означает, что эта функция является случайной величиной, то есть определены вероятности ее попадания в интервалы и другие борелевские множества на прямой.
Наиболее содержательный аспект данного понятия, отличающий его от прочих случайных величин, зависящих от выборки, заключается в том, что от неизвестных параметров эта функция не зависит, то есть исследователь может по имеющимся в его распоряжении данным найти значение этой функции, а, следовательно — основывать на этом значении оценки и прочие статистические выводы.
Эмпирическая функция распределения (выборочная функция распределения) — естественное приближение теоретической функции распределения данной случайной величины, построенное по выборке. Пусть задана случайная выборка наблюдений Построим по выборке ступенчатую функцию , возрастающую скачками величины в точках Построенная функция называется эмпирической функцией распределения. Для задания значений в точках разрыва формально определим её так:
, n(A) – частота попадания Xi в А.
Замечание: при этом эмпирическая функция непрерывна справа.
Свойства эмпирической функции распределения
Эмпирическое распределение для фиксированного
Поскольку случайная величина имеет распределение Бернулли с вероятностью успеха (где - теоретическая функция распределения случайной величины ), а последовательность - схема Бернулли с вероятностью успеха , то по отношению к этой последовательности есть частота попаданий левее x.
Из сказанного вытекает, что эмпирическое распределение служит естественным приближением к теоретической функции распределения.
Математическое ожидание и дисперсия эмпирического распределения
Математическое ожидание эмпирической функции распределения
§
таким образом эмпирическое распределение является несмещённой оценкой теоретической функции распределения .
Дисперсия эмпирического распределения
§
Асимптотические свойства эмпирической функции распределения
1. По усиленному закону больших чисел сходится почти наверное к теоретической функции распределения :
почти наверное при
2. Выборочная функция распределения является асимптотически нормальной оценкой функции распределения при условии, что :
при
2. Вариационный ряд
Вариационный ряд — упорядоченная по величине последовательность выборочных значений наблюдаемой случайной величины
равные между собой элементы выборки нумеруются в произвольном порядке; элементы вариационного ряда называются порядковыми (ранговыми) статистиками; число λ m = m / n называется рангом порядковой статистики
Вариационный ряд используется для построения эмпирической функции распределения.
Порядковые статистики в математической статистике - это упорядоченная по возрастанию выборка. Это статистика, занимающая строго определенное место в ранжированной совокупности.
Пусть - конечная выборка из распределения , Перенумеруем последовательность в порядке возрастания, так что
.
Случайная величина называется -ой порядковой статистикой исходной выборки.
Очевидно из определения:
· ;
· .
Ранговые статистики
Значение называется рангом элемента выборки , если .
Ранговой статистикой называется любая статистика, которая является функцией от рангов элементов , а не от их значений . Переход от значений к их рангам позволяет строить непараметрические статистические тесты, которые не опираются на априорные предположения о функции распределения выборки. Они имеют гораздо более широкую область применения, чем параметрические статистические тесты.
- функция распределения порядковой статистики.
Средний ранг
Аналогом выборочного среднего является средний ранг: