Эмпирическая функция распределения




Реферат №8

Вариационные ряды и их графическое изображение

Вариационный ряд.

Результаты измерений, опытов и т.д (в математической статистике здесь употребляют слово выборка) являются труднообозримым набором данных. Для дальнейшего изучения выборку подвергают перегруппировке.

Вариационным рядом называется последовательность всех элементов выборки, расположенных в неубывающем порядке. Одинаковые элементы повторяются.

По этому ряду уже можно сделать несколько выводов. Например, средний элемент вариационного ряда (медиана) может быть оценкой наиболее вероятного результата измерения. Первый и последний элемент вариационного ряда (т.е. минимальный и максимальный элемент выборки) показывают разброс элементов выборки. Иногда если первый или последний элемент сильно отличаются от остальных элементов выборки, то их исключают из результатов измерений, считая, что эти значения получены в результате какого-то грубого сбоя, например, техники.

2. Группировочный статистический ряд.

Этот ряд даёт представление о том, как распределены результаты измерений между максимальным и минимальным значением. Для того чтобы дать строгое определение группированного статистического ряда, рассмотрим его построение.

Пусть N – число элементов выборки, x 0– минимальный элемент выборки, xN – максимальный элемент выборки. Разобьем отрезок [ x 0, xN ] на n равных частей, где

n =1+3.31 lg N (формула Старджесса)

Таким образом, получим набор непересекающихся промежутков

Δ1 = [ x 0, x 1), Δ2 = [ x 1, x 2), …, Δ n -1 = [ xn -2, xn - 1), Δ n = [ xn - 1, xN ]

Длина каждого промежутка (шаг) Δ k = [ xk-1, xk), где k = 1, 2, …, n, вычисляется по формуле

Найдём число элементов выборки, попадающих в каждый из промежутков. Пусть mk – число элементов выборки, попавших в промежуток Δ k. Это число также называют абсолютной частотой попадания в промежуток Δ k.

Группировочный статистический ряд характеризуется также:

относительной частотой – отношение числа элементов выборки, попавших в промежуток Δ k к общему числу элементов, т.е. mk / N

Совокупность промежутков и соответствующих им частот (абсолютных и относительных) называют группированным статистическим рядом. Обычно сами промежутки заменяют их серединами, которые вычисляются по формуле , а в качестве частот берут приведённые частоты.

Графическое представление группированного статистического ряда.

Существует несколько способов графического изображения рядов (гистограмма, полигон, кумулята), выбор которых зависит от цели исследования и от вида вариационного ряда.

Гистограмма служит только для представления интервальных вариационных рядов и имеет вид ступенчатой фигуры из прямоугольников с основаниями, равными длине интервалов Δ, и высотами, равными mk абсолютным частотам.

Полигон представляет собой ломаную, соединяющую точки плоскости с координатами: первая - середина промежутка, вторая – абсолютным частотам mk или относительная частота mk / N

Эмпирическая функция распределения

Полигон частот иногда называют эмпирической функцией плотности вероятности , а функцию плотности, которая в действительности соответствует нашему процессу и которую мы оцениваем f (x) – генеральной функцией плотности вероятности.

Смысл этой функции заключён в следующем (см. рис.1.): площадь фигуры, ограниченной графиком функции плотности вероятности f (x), снизу осью абсцисс Ох, слева – прямой x = a, справа прямой x = b равна вероятности P того, что измеряемая величина, значения которой мы получаем в ходе эксперимента, примет значения от a до b:

Функцию F (x) называется генеральной функцией распределения, а кривая, ее оценивающая и получающаяся из выборки, называется эмпирической функцией распределения.

Для построения эмпирической функции распределения нужно вычислить накопленные частоты для каждого промежутка группированного статистического ряда wx:

Пусть х некоторое число. Тогда количество вариант mk значения которых меньше х, называется накопленной частотой, т.е.

Для первого промежутка эта частота равна 0, для для второго - относительной частоте попадания в первый промежуток, для третьего– сумме относительных частот попадания в первый и второй промежутки, для четвертый – сумме относительных частот попадания в первый, второй и третий промежутки и т.д.

Кумулянта есть графическое изображение вариационного ряда, когда на вертикальной оси откладываются накопленные частоты или частности, а на горизонтальной - значения признака или середину промежутка.

Отношение накопленной частоты к общему числу наблюдений N называется относительной накопленной частотой или накопленной частостью wk / N.

Ломанная, соединяющая точки, первая координата которых – середина промежутка, а вторая равна относительной накопленной частоте и будет эмпирической функцией распределения.

 



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2017-12-29 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: