Изучение распределения Лапласа средствами Excel

Распределение Лапласа зависит от двух параметров n и p; характеристики распределения выражаются через эти параметры: a = np, . При расчетах вручную используют таблицы дифференциальной и интегральной функции Лапласа . Тогда , где . Эта формула обычно называется как "локальная теорема Лапласа". Интегральная функция Лапласа используется для вычисления вероятности попадания m в заданный интервал: P (m ₁ £ m £ m ₂) = Ф(t_m ₂) – Ф(t_m ₁). Эта формула обычно называется как "интегральная теорема Лапласа". При расчетах на компьютере для этих же целей используется функция Excel: НОРМРАСП(m; a; s_m;0) – возвращает значения вероятности Pn (m) и НОРМРАСП(m; a; s_m;1) – возвращает значения интегральной функции распределения Лапласа F (m) = Ф(t_m) + 0,5 (функция F (m) отличается постоянным слагаемым от функции Ф(t_m)). Считается, что предельные формулы Лапласа можно применять при n ³ 30, a = np ³ 5 и nq ³ 5. Интегральную формулу Лапласа можно уточнить, если расширить интервал [ m ₁; m ₂] на полшага влево и вправо: P (m ₁ £ m £ m ₂) = F (m ₂ + ¹ / ₂) – F (m ₁ – ¹ / ₂). Предлагается прямыми расчетами проверить точность локальной, интегральной и скорректированной интегральной формул Лапласа для n = 10, 20, 30, 40, 50 и p = 0,3. Фрагмент рабочего листа Excel приведен ниже.

A	B	C	D	E	F	G	H	I	J
Распределение Лапласа
Pn(m)=НОРМРАСП(m;a;Sm;0)	a=np	Sm=КОРЕНЬ(npq)
P(m1£m£m2)=НОРМРАСП(m2;a;Sm;1)–НОРМРАСП(m1;a;Sm;1)	Интегральная теорема
P(m1£m£m2)=НОРМРАСП(m2+1/2;a;Sm;1)–НОРМРАСП(m1-1/2;a;Sm;1) (Скорректированная)
Бернулли
n =		Ф(2)-Ф(-1)=	0,81859	P([m1;m2])	n=10	n=20	n=30	n=40	n=50
p =	0,3			Bernully	0,8401	0,87577	0,90647	0,87422	0,83588
q =	0,7	M-Sm=	1,550862	Laplas	0,73571	0,80996	0,86082	0,83047	0,79069
a = M =		M+2Sm=	5,898275	Correct	0,84183	0,87469	0,90419	0,87395	0,83753
Dm =	2,1	m1 =		Error%	-12,43%	-7,51%	-5,04%	-5,00%	-5,41%
Sm =	1,449138	m2 =		ErrCorr%	0,21%	-0,12%	-0,25%	-0,03%	0,20%
Б е р н у л л и
m	n=10	F(m)	Laplas	P(a)	n=10	n=20	n=30	n=40	n=50
	0,028248	0,028248	0,032298	Bernully	0,26683	0,19164	0,15729	0,13657	0,12235
	0,121061	0,149308	0,106215	Laplas	0,27530	0,19466	0,15894	0,13765	0,12312
	0,233474	0,382783	0,216969	Correct	0,26993	0,19275	0,15790	0,13697	0,12263
	0,266828	0,649611	0,275296	Error%	3,17%	1,58%	1,05%	0,79%	0,63%
	0,200121	0,849732	0,216969	ErrCorr%	1,16%	0,58%	0,39%	0,29%	0,23%
	0,102919	0,952651	0,106215
	0,036757	0,989408	0,032298
	0,009002	0,998410	0,006100
	0,001447	0,999856	0,000716
	0,000138	0,999994	5,22E-05
	5,909E-06	1,000000	2,36E-06

Слева в столбцах А, В расположен блок расчетов по формуле Бернулли (сейчас принято n = 10). В соседнем столбце С приведены значения кумуляты (накопленных вероятностей) F (m) = S P_n (k), вычисленных по реккурентной формуле F (m) = F (m –1) + P_n (m), где F (0) = P_n (0) = qⁿ. С помощью кумуляты одним вычитанием определяются вероятности попадания случайной величины m в любые заданные интервалы P (m ₁ £ m £ m ₂) = F (m ₂) – F (m ₁–1). Так, вероятность P (2£ m £6) можно вычислить как разность F (6) – F (1) = 0,989408 – 0,149308 = 0,840140; это же значение можно получить непосредственно, складывая вероятности P_n (m) для m = 2, 3, 4, 5, 6 (цифры на сером фоне в столбце В). В следующем столбце D вычислены вероятности по локальной формуле Лапласа. По результатам расчетов построены графики распределения Бернулли и распределения Лапласа с теми же характеристиками. Изменяя n в ячейке В6, можно наблюдать, насколько хорошо распределение Бернулли описывается предельным распределением Лапласа. Ниже приведены два сравнительных графика для n = 10 и n = 20, откуда видно, что уже при n ³ 20 распределение Бернулли для р = 0,3 практически совпадает с предельным распределением. Таким образом, мы убедились, что локальная формула Лапласа достаточно точная.

Переходим к проверке точности расчетов по интегральной формуле Лапласа. Рассмотрим вероятность попадания случайной величины m в интервал [M – Sm; M + 2Sm]. Теоретически указанная вероятность вычисляется как разность Ф(2) – Ф(-1) = 0,81859. Однако формула эта выведена для непрерывного распределения, а распределение Лапласа – дискретное. Поэтому теоретическое значение (или близкое к нему) может быть получено только для очень большого n > 200. Проверим это утверждение. Выше над блоком расчетов по формуле Бернулли в столбцах C, D вычислены границы интервала: M – Sm = 1,551 и M + 2Sm = 5,898; полученные границы округлены до ближайших целых m ₁ = 2, m ₂ = 6. Необходимо сравнить точное значение P (2£ m £6) = 0,8401, полученное ранее с помощью кумуляты распределения Бернулли, с соответствующим значением по интегральной формуле Лапласа P (2£ m £6) » НОРМРАСП(6;a;Sm;1)–НОРМРАСП(2;a;Sm;1) = 0,73571. По сравнению с точным значением (0,8401) ошибка составила -12,43%. Эти расчеты оформлены в виде таблицы в строках 6–11 столбцы E, F. При изменении n в ячейке B6 все цифры в столбце F автоматически корректируются. Для того, чтобы сохранить результаты предыдущих расчетов, они были cкопированы Специальной вставкой – Только значения в продолжение таблицы вправо (столбцы G, H, I, J). Рассматривая заполненную таблицу (диапазон E6:J11), убеждаемся в довольно медленном приближении предельной формулы к точному значению. Теперь мы можем оценить эффективность скорректированной интегральной формулы Лапласа P (2 £ m £ 6) = НОРМРАСП(6,5;a;Sm;1)–НОРМРАСП(1,5;a;Sm;1), которая уже для n = 10 привела к практически точному значению 0,8418 (погрешность 0,21%). Эффективность скорректированной формулы была также проверена на вычислении вероятности моды (наивероятнейшего значения m = a = np). Эти расчеты выполнены в таблице диапазона E13:J18. Интегральная функция Лапласа здесь дает значение 0, поэтому в таблице использовалась локальная формула Лапласа. Погрешности локальной формулы небольшие и быстро убывают с увеличением n (при n = 20 погрешность составляет всего 1,6%). Скорректированная интегральная формула оказалась еще более точной; она дает практически точные значения уже при n = 10.

Изучение распределения Лапласа средствами Excel

Поиск по сайту