Построение теоретического закона распределения по опытным данным.




Проверка гипотезы о виде закона распределения

Критерий Пирсона

(К.Пирсон (1857-1936) английский математик, статик, биолог, философ)

Одной из важнейших задач математической статистики является установление теоретического закона распределения случайной величины, характеризующей изучаемый признак по опытному (эмпирическому) распределению, представляющему вариационный ряд.

Между теоретическим и эмпирическим распределениями неизбежны расхождения. При этом, возникает естественный вопрос: объясняются ли эти расхождения только случайными обстоятельствами, связанными с ограниченным числом наблюдений т. е. являются незначимыми, или они являются значимыми и связаны с тем, что теоретический закон распределения выбран неправильно. Ответ на этот вопрос дается применением критериев согласия.

В наиболее часто используемом на практике критерии согласия Пирсона в качестве меры расхождения рассматривается случайная величина , равная сумме квадратов отклонений относительных эмпирических частот (статистических вероятностей) , вычисленных по выборке объема от относительных теоретических частот , рассчитанных по предполагаемому распределению:

(1)

где ‑ число интервалов эмпирического распределения (вариационного ряда); ‑ количество значений случайной величины , попавших в -ый интервал.

Числа называются соответственно эмпирическими и теоретическими частотами.

Р. Фишером была доказана следующая теорема.

Теорема. Если проверяемая гипотеза о виде распределения верна, то при большом объеме выборки критерий (1) имеет приблизительно -распределение с степенью свободы, где ‑ число интервалов эмпирического распределения, ‑ число оцениваемых параметров распределения.

В теореме указывается, что критерий (1) имеет -распределение только при больших объемах выборки . Поэтому в каждом частичном интервале вариационного ряда должно содержаться не менее 5-10 наблюдений (значений случайной величины ). В противном случае соседние интервалы следует объединить.

Схема применения критерия сводится к следующему:

1. Определяется мера расхождения эмпирических и теоретических час-

тот по формуле (1);

2. Для выбранного уровня значимости по таблице -

распределения находится критическое значение при числе степеней свободы .

3. Если фактически наблюдаемое значение больше критического,

т. е. , то гипотеза отвергается, если , гипотеза не противоречит опытным данным.

 

 

Пример. Результаты исследований прочности на сжатие (случайная величина )

200 образцов бетона представлены в виде сгруппированного вариационного ряда.

Интервалы прочности, Среднее значение интервала, Частота
190-200 200-210 210-220 220-230 230-240 240-250    

Требуется проверить нулевую гипотезу о нормальном законе распределения прочности на сжатие при уровне значимости .

Решение. Из условия следует, что точные параметры гипотетического нормального закона с функцией распределения (41)

неизвестны, поэтому гипотезу можно сформулировать следующим образом: прочность на сжатие является функцией нормального распределения с параметрами

.

Для проверки гипотезы вычислим точечные оценки математического ожидания и среднего квадратического отклонения нормально распределенной случайной величины:

 

Вычислим теоретические вероятности попадания значений случайной величины в частичные интервалы по теореме 11.7 для нормального распределения

 

,

где

Дальнейшие вычисления, необходимые для определения расчетного значения приведены в расчетной таблице.

По таблице ‑ распределения (приложение 3) при заданном уровне значимости и числе степеней свободы , критическое знание

.

Расчетная таблица

Интервалы изменения случайной величины Часто-ты Нормирован-ные интервалы Теоретические вероятности  
190-200     0,045     0,11
200-210     0,142 28,4 5,76 0,20
210-220     0,281 56,2 0,04 0,00
220-230     0,299 59,8 17,61 0,29
230-240     0,171 34,2 17,64 0,52
240-250   0,062 12,4 2,56 0,23
    1,000 200,0  

Так как , то нет оснований для отклонения нулевой гипотезы о нормальном законе распределения прочности бетона на сжатие с параметрами

В некоторых случаях уровень значимости предварительно не задается, а по имеющейся выборке рассчитывается значение критерия. Затем определяется тот максимальный уровень значимости, при котором критерий еще попадает в область принятия гипотезы. Этот максимальный уровень значимости, при котором гипотеза принимается, называется критическим уровнем значимости. Если критический уровень ниже заданного уровня значимости , то гипотеза отклоняется.

Вывод: Анализ результатов показывает, что критерий Пирсона имеет наименьшее значение = 0,63441 и ему соответствует самое большое значение критического уровня значимости p =0,42574 в случае проверки гипотезы о нормальном распределении случайной величины. Таким образом, в окончательном варианте следует принять гипотезу о том, что исследуемая случайная величина подчинена нормальному закону распределения.



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2016-08-20 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: