Распределение Лапласа зависит от двух параметров n и p; характеристики распределения выражаются через эти параметры: a = np, . При расчетах вручную используют таблицы дифференциальной и интегральной функции Лапласа . Тогда , где . Эта формула обычно называется как "локальная теорема Лапласа". Интегральная функция Лапласа используется для вычисления вероятности попадания m в заданный интервал: P (m 1 £ m £ m 2) = Ф(tm 2) – Ф(tm 1). Эта формула обычно называется как "интегральная теорема Лапласа". При расчетах на компьютере для этих же целей используется функция Excel: НОРМРАСП(m; a; sm;0) – возвращает значения вероятности Pn (m) и НОРМРАСП(m; a; sm;1) – возвращает значения интегральной функции распределения Лапласа F (m) = Ф(tm) + 0,5 (функция F (m) отличается постоянным слагаемым от функции Ф(tm)). Считается, что предельные формулы Лапласа можно применять при n ³ 30, a = np ³ 5 и nq ³ 5. Интегральную формулу Лапласа можно уточнить, если расширить интервал [ m 1; m 2] на полшага влево и вправо: P (m 1 £ m £ m 2) = F (m 2 + 1 / 2) – F (m 1 – 1 / 2). Предлагается прямыми расчетами проверить точность локальной, интегральной и скорректированной интегральной формул Лапласа для n = 10, 20, 30, 40, 50 и p = 0,3. Фрагмент рабочего листа Excel приведен ниже.
A | B | C | D | E | F | G | H | I | J | |
Распределение Лапласа | ||||||||||
Pn(m)=НОРМРАСП(m;a;Sm;0) | a=np | Sm=КОРЕНЬ(npq) | ||||||||
P(m1£m£m2)=НОРМРАСП(m2;a;Sm;1)–НОРМРАСП(m1;a;Sm;1) | Интегральная теорема | |||||||||
P(m1£m£m2)=НОРМРАСП(m2+1/2;a;Sm;1)–НОРМРАСП(m1-1/2;a;Sm;1) (Скорректированная) | ||||||||||
Бернулли | ||||||||||
n = | Ф(2)-Ф(-1)= | 0,81859 | P([m1;m2]) | n=10 | n=20 | n=30 | n=40 | n=50 | ||
p = | 0,3 | Bernully | 0,8401 | 0,87577 | 0,90647 | 0,87422 | 0,83588 | |||
q = | 0,7 | M-Sm= | 1,550862 | Laplas | 0,73571 | 0,80996 | 0,86082 | 0,83047 | 0,79069 | |
a = M = | M+2Sm= | 5,898275 | Correct | 0,84183 | 0,87469 | 0,90419 | 0,87395 | 0,83753 | ||
Dm = | 2,1 | m1 = | Error% | -12,43% | -7,51% | -5,04% | -5,00% | -5,41% | ||
Sm = | 1,449138 | m2 = | ErrCorr% | 0,21% | -0,12% | -0,25% | -0,03% | 0,20% | ||
Б е р н у л л и | ||||||||||
m | n=10 | F(m) | Laplas | P(a) | n=10 | n=20 | n=30 | n=40 | n=50 | |
0,028248 | 0,028248 | 0,032298 | Bernully | 0,26683 | 0,19164 | 0,15729 | 0,13657 | 0,12235 | ||
0,121061 | 0,149308 | 0,106215 | Laplas | 0,27530 | 0,19466 | 0,15894 | 0,13765 | 0,12312 | ||
0,233474 | 0,382783 | 0,216969 | Correct | 0,26993 | 0,19275 | 0,15790 | 0,13697 | 0,12263 | ||
0,266828 | 0,649611 | 0,275296 | Error% | 3,17% | 1,58% | 1,05% | 0,79% | 0,63% | ||
0,200121 | 0,849732 | 0,216969 | ErrCorr% | 1,16% | 0,58% | 0,39% | 0,29% | 0,23% | ||
0,102919 | 0,952651 | 0,106215 | ||||||||
0,036757 | 0,989408 | 0,032298 | ||||||||
0,009002 | 0,998410 | 0,006100 | ||||||||
0,001447 | 0,999856 | 0,000716 | ||||||||
0,000138 | 0,999994 | 5,22E-05 | ||||||||
5,909E-06 | 1,000000 | 2,36E-06 |
Слева в столбцах А, В расположен блок расчетов по формуле Бернулли (сейчас принято n = 10). В соседнем столбце С приведены значения кумуляты (накопленных вероятностей) F (m) = S Pn (k), вычисленных по реккурентной формуле F (m) = F (m –1) + Pn (m), где F (0) = Pn (0) = qn . С помощью кумуляты одним вычитанием определяются вероятности попадания случайной величины m в любые заданные интервалы P (m 1 £ m £ m 2) = F (m 2) – F (m 1–1). Так, вероятность P (2£ m £6) можно вычислить как разность F (6) – F (1) = 0,989408 – 0,149308 = 0,840140; это же значение можно получить непосредственно, складывая вероятности Pn (m) для m = 2, 3, 4, 5, 6 (цифры на сером фоне в столбце В). В следующем столбце D вычислены вероятности по локальной формуле Лапласа. По результатам расчетов построены графики распределения Бернулли и распределения Лапласа с теми же характеристиками. Изменяя n в ячейке В6, можно наблюдать, насколько хорошо распределение Бернулли описывается предельным распределением Лапласа. Ниже приведены два сравнительных графика для n = 10 и n = 20, откуда видно, что уже при n ³ 20 распределение Бернулли для р = 0,3 практически совпадает с предельным распределением. Таким образом, мы убедились, что локальная формула Лапласа достаточно точная.
Переходим к проверке точности расчетов по интегральной формуле Лапласа. Рассмотрим вероятность попадания случайной величины m в интервал [M – Sm; M + 2Sm]. Теоретически указанная вероятность вычисляется как разность Ф(2) – Ф(-1) = 0,81859. Однако формула эта выведена для непрерывного распределения, а распределение Лапласа – дискретное. Поэтому теоретическое значение (или близкое к нему) может быть получено только для очень большого n > 200. Проверим это утверждение. Выше над блоком расчетов по формуле Бернулли в столбцах C, D вычислены границы интервала: M – Sm = 1,551 и M + 2Sm = 5,898; полученные границы округлены до ближайших целых m 1 = 2, m 2 = 6. Необходимо сравнить точное значение P (2£ m £6) = 0,8401, полученное ранее с помощью кумуляты распределения Бернулли, с соответствующим значением по интегральной формуле Лапласа P (2£ m £6) » НОРМРАСП(6;a;Sm;1)–НОРМРАСП(2;a;Sm;1) = 0,73571. По сравнению с точным значением (0,8401) ошибка составила -12,43%. Эти расчеты оформлены в виде таблицы в строках 6–11 столбцы E, F. При изменении n в ячейке B6 все цифры в столбце F автоматически корректируются. Для того, чтобы сохранить результаты предыдущих расчетов, они были cкопированы Специальной вставкой – Только значения в продолжение таблицы вправо (столбцы G, H, I, J). Рассматривая заполненную таблицу (диапазон E6:J11), убеждаемся в довольно медленном приближении предельной формулы к точному значению. Теперь мы можем оценить эффективность скорректированной интегральной формулы Лапласа P (2 £ m £ 6) = НОРМРАСП(6,5;a;Sm;1)–НОРМРАСП(1,5;a;Sm;1), которая уже для n = 10 привела к практически точному значению 0,8418 (погрешность 0,21%). Эффективность скорректированной формулы была также проверена на вычислении вероятности моды (наивероятнейшего значения m = a = np). Эти расчеты выполнены в таблице диапазона E13:J18. Интегральная функция Лапласа здесь дает значение 0, поэтому в таблице использовалась локальная формула Лапласа. Погрешности локальной формулы небольшие и быстро убывают с увеличением n (при n = 20 погрешность составляет всего 1,6%). Скорректированная интегральная формула оказалась еще более точной; она дает практически точные значения уже при n = 10.