В математической статистике гипотезу о принадлежности закона распределения к нормальному называют основной (нулевой) гипотезой. Статистическую проверку этой гипотезы по выборке производят при помощи критериев согласия. Такие критерии позволяют определить вероятность того, что при выполнении предполагаемого закона распределения наблюдающиеся в выборке отклонения от этого закона являются случайными, а не свидетельствуют об ошибочности гипотезы. Если такая вероятность велика, то отклонения от предполагаемого закона признаются случайными, а нулевая гипотеза о законе распределения не опровергается.
В исследовательской практике применяются самые различные критерии согласия, которые оформлены в виде государственных стандартов (напр., ГОСТ 11.006-74 “Прикладная статистика.Правила проверки согласия опытного распределения с теоретическим”).
Проверка основной гипотезы с применением критериев согласия необходима чаще всего для обоснования возможности принятия тех или иных статистических решений. Наибольшее применение получили критерии согласия Колмогорова, Пирсона, Смирнова и др. Среди них наиболее общим, применяющимся для проверки не только нормального закона, но и других, является критерий Пирсона или критерий c2 (“хи - квадрат”).
В основе метода сравнения по критерию c2 лежит сравнение фактически наблюдаемых частот с теоретическими, которые вычисляются в предположении нормального распределения. Как правило, эти частоты отличаются друг от друга.
Теоретические частоты вычисляются с применением функции Лапласа (интеграла вероятности) Ф0(Z), где Z - нормированная переменная, определяемая по формуле:
Zi= (Xi -M) / s.
В этой формуле М - математическое ожидание, s - стандартное отклонение. Наименьшее значение Zi= Z1 получают равным - ¥, а наибольшее + ¥. Тогда теоретические вероятности попадания в i-тый интервал (теоретические частости) вычисляются по следующей формуле:
. (5)
После того, как полученные значения теоретических вероятностей попадания умножим на объем выборки N, получим значения теоретических частот. Допустим, что в предположении нормального распределения генеральной совокупности вычислены теоретические частоты. При уровне значимости a требуется проверить нулевую гипотезу: генеральная совокупность распределена нормально. Уровень значимости a - это вероятность ошибочно отвергнуть нулевую гипотезу, когда она верна.
В качестве критерия для сравнения теоретических и фактических частот (а тем самым - проверки основной гипотезы) используют случайную величину:
, (6)
где через обозначены теоретические частоты попадания в интервал, а К - означает число интервалов. Случайной эта величина является вследствие случайности выборки и значений фактических частот . Чем ближе друг к другу фактические и теоретические частоты для каждого интервала, тем меньше величина , а это служит признаком близости фактического и предполагаемого законов распределения.
Решение
Задание для оценки наиболее вероятных параметров выборки по критериям согласия. Удельные электрические сопротивления для песчаников девона карагасской свиты в Ом м (Восточный Саян, Агульская площадь).
Вариант 5
Исходные значения распределяются по логнормальному закону, поэтому для дальнейших расчетов необходимо рассчитать логарифмы исходных значений.
N | |
K | 8,721266 |
∆X | 0,107616 |
M | 2,236028 |
δ | 0,222988 |
Интервал групирования | |||||||
№ | от | до | ц.интерв (Vci) | частота(n) | частость (P) | Vci*n | (Xci-M)^2)*n |
1,857332 | 1,964948 | 1,91114 | 0,104265 | 42,04508 | 2,322149 | ||
1,964948 | 2,072564 | 2,018756 | 0,146919 | 62,58143 | 1,463421 | ||
2,072564 | 2,18018 | 2,126372 | 0,21327 | 95,68674 | 0,541101 | ||
2,18018 | 2,287796 | 2,233988 | 0,189573 | 89,35952 | 0,000166 | ||
2,287796 | 2,395412 | 2,341604 | 0,090047 | 44,49047 | 0,211779 | ||
2,395412 | 2,503028 | 2,44922 | 0,118483 | 61,2305 | 1,136269 | ||
2,503028 | 2,610644 | 2,556836 | 0,066351 | 35,7957 | 1,440847 | ||
2,610644 | 2,71826 | 2,664452 | 0,042654 | 23,98007 | 1,651922 | ||
2,71826 | 2,825876 | 2,772068 | 0,028436 | 16,63241 | 1,724032 | ||
Zi | Zi+1 | Ф(Zi) | Ф(Zi+1) | Теор частости(Рi) | Теор частоты n |
-1,69828 | -1,21567 | -0,4554 | -0,388 | 0,0674 | 14,2214 |
-1,21567 | -0,73306 | -0,388 | -0,2673 | 0,1207 | 25,4677 |
-0,73306 | -0,25045 | -0,2673 | -0,0987 | 0,1686 | 35,5746 |
-0,25045 | 0,232155 | -0,0987 | 0,091 | 0,1897 | 40,0267 |
0,232155 | 0,714764 | 0,091 | 0,2611 | 0,1701 | 35,8911 |
0,714764 | 1,197373 | 0,2611 | 0,3849 | 0,1238 | 26,1218 |
1,197373 | 1,679982 | 0,3849 | 0,4535 | 0,0686 | 14,4746 |
1,679982 | 2,162591 | 0,4535 | 0,4846 | 0,0311 | 6,5621 |
2,162591 | 2,6452 | 0,4846 | 0,4959 | 0,0113 | 2,3843 |
Рисунок 5 Логнормальное распределение практических частот
Рис. 6 логнормальный закон распределения теоретических частот
Рисунок 7. Сравнение графиков практических и теоретических частот
Вывод: По полученным результатам можно сделать вывод о том, что данное распределение не относится к нормальному. По критерию Пирсона > , нулевую гипотезу отвергаем; по критерию Колмогорова, также существует значительная вероятность расхождения от нормального закона.