Схема Бернулли. Биномиальная формула
Несколько раз бросаем монету. Появление герба, скажем, при четвертом бросании не зависит от того, каковы были результаты при первом, при втором и при третьем бросаниях. Мы имеем дело с независимыми испытаниями. Решим теперь такую задачу.
При проведении некоторого однократного испытания вероятность появления события А равна р, а непоявления q= 1— р.
Какова вероятность того, что при n повторных испытаниях событие А произойдет т раз? Это событие запишем так: «Sn = m»
Станем искать P(Sn = m).
Событие, состоящее в том, что при п независимых испытаниях А происходило т раз, а не происходило п—т раз, можем себе представить в виде п клеток, m из которых заполнены буквой А, а п — m— буквой . Например, одно из таких представлений, которое назовем событием В1, может быть таким, как на рисунке.
Таких событий, когда m клеток заполнено буквой А, а п—m клеток — буквой может произойти столько, сколько перестановок с повторениями можно построить из m букв А и п —mбукв . Если число таких событий обозначим N, то по формулам комбинаторики
N =
Нас интересующее событие «Sn=m» представляет собой объединение N событий В1, В2, В3,..., BN. Они равновозможны и попарно несовместимы, поэтому
P(Sn=m)=P(Bl)+P(B2) +...+P(BN) = N*P(Bl).
Но
Поскольку испытания независимы в совокупности и Р(А)=р, Р()=q, то
Объединяя полученные результаты, находим формулу Бернулли:
Pn(m) = P(Sn = m) = pmqn-m.
Это так называемое биноминальное распределение вероятностей. Рассуждения, которые к нему привели, часто называют схемой Я. Бернулли, по имени математика, который первым ее рассмотрел.
Наиболее вероятное число наступления события в схеме Бернулли
С помощью полученной формулы можно найти значение Sn = т0, которому соответствует наибольшая вероятность.
|
Поскольку то
Р(Sn=m)>P(Sn=m— 1) при т<(п+1)р,
P(Sn=m)<P(Sn=m— 1) при m>(n+1)p,
Р(Sn=m)=P(Sn=m—1) при т = (п+1)р,
если (п+1) р — целое число.
Поэтому вероятнейшее значение Sn = m0 должно удовлетворить условию
(n + 1)р —1<m0<(n + 1)р. Поскольку р = 1 — q, то
пр — q<= т0 <= пр +p.
Формула Муавра-Лапласа
Рассмотрим пример: Медиками установлено, что 94% лиц, которым сделаны прививки против туберкулеза, приобретают иммунитет против этого заболевания. Какова вероятность того, что среди 100 000 граждан, получивших прививки, 5800 не защищены от заболевания туберкулезом?
Эту задачу можно было бы решить с помощью формулы Бернулли.
В нашем случае п = 100 000, т = 5800, р = 0,06, <? = 0,94. Если интересующие нас события обозначим А, то
Р(А) = Р(S100 000 = 5800)= .(0,06)5800.(0,94)94 200.
Нетрудно убедиться в том, что попытка получить окончательный результат непосредственным вычислением — изнурительный труд, даже если воспользоваться логарифмами или ЭВМ. Как быть?
Аналогичную проблему рассматривали Муавр и Лаплас. Нет надобности раскрывать перед читателем всю сложность их рассуждений, но маленькое окошко в эту тайну откроем.
Математики того времени знали формулу
Cnm = = =
Cnm =
Называлась она формулой Стирлинга, хотя имеются данные, что раньше этого шотландца данную формулу знал Муавр. (Доказательство формулы см. в разделе «комбинаторика» 2 часть)
Локальная теорема Лапласа
Теперь приступим к доказательству локальной теоремы Муавра — Лапласа, особенно не заботясь о строгости самой процедуры доказательства.
|
Теорема гласит:
Пусть:
1) событие А при отдельном испытании может произойти с вероятностью р, а не произойти с вероятностью q = 1 — р;
2) проведено п независимых испытаний.
Если п и т таковы, что - р -> 0, а х = есть ограниченная величина при п, стремящемся к бесконечности, то
Pn(m) =
Доказательство.
Известно, что в случае |x| <1 (согласно формуле суммы бесконечной убывающей геометрической прогрессии 1-x+x2-x3+…= )
Когда х близко к нулю, можно пользоваться приближенным соотношением
1-х.
Скажем, при x=0,1 левая часть равенства дает результат 0,90909..., а правая — 0,9. При х=— 0,1 левая часть даст 1,111..., а правая — 1,1. Когда х близко к нулю, погрешность будет незначительна, т. е.
ln(l + z) » z—z2/2
Из формулы Бернулли (P(Sn = m)= pmqn-m), используя формулу Стирлинга, получаем:
Cnm = =
Введем обозначение b m = m — пр.
Значит, т = пр+bт, п — т = п — пр — bm = п (1— р)— b m = nq — b m.
Заменяя т и п — т полученными аналогами, находим:
P(Sn = m) =
P(Sn = m) =
Из условия теоремы m/n— р -> 0 следует, что с возрастанием п, bm/n —>0.
Знаменатель дроби в скобках обозначаем К(т;n), т. е.
Тогда ln К (m; п) = (пр +bm+ )*ln(l + ) + (nq — bm + )*ln(l- ).
Поскольку при возрастании п, ->- 0, то ln(l + z) » z—z2/2 в ln(1+ ) и ln(l— ) заменяем их приближенными выражениями:
Приводим подобные члены и группируем по степеням . Получаем:
ln К(m;п) Поскольку p+q =1, то
Но из условий теоремы следует:
1) ->0;
2) ограничено.
Таким образом,
Возвращая полученное значение знаменателя в дробь, получаем, что нужно
Обозначим Тогда Pn(m) =
Функция j (х) используется очень часто и ее значения заранее просчитаны и представлены в статистических таблицах. Образец графика этой функции (см. рис.).
|
Формула Пуассона
Формула Муавра — Лапласа базируется на приближенной формуле Стирлинга. Когда р близко к 0 или 1, формула дает результаты, которые существенно отклоняются от результатов, получаемых по формуле Бернулли. Рассмотрим случай, когда при возрастании п вероятность р появления интересующего нас события убывает, a np=k — постоянное число.
Именно такая ситуация возникает, когда имеем дело с редко происходящими событиями.
По формуле Бернулли и условию q = 1— p имеем:
P(Sn = m)=- Поскольку р= , то
Если обозначим
то
P(S n = m) = a n b n.
Установим предельные значения а n и b n при неограниченном возрастании п. Ясно, что
lim b n = 1, а n =(1 — )n = Обозначим h = — . Тогда
Поскольку k >=0, то при п->+ оо, h->— oo
Пусть h +1 = — х, тогда при h->—оо, x->оо. Получаем:
Значит, если п велико, то
a n » e-k, b п » 1.
Подставляя эти значения в (6.13), находим формулу Пуассона:
P(Sn = m) » e-k
Интегральная теорема Лапласа
Решим следующую задачу:
Задача. Какова вероятность того, что при п испытаниях событие А произойдет не менее a и не более bраз? Используя правило сложения вероятностей, имеем:
P(a<=Sn<=b) = P(Sn=a) + P(Sn=a+l) +... + P(Sn=b-l) + P(Sn=b).
Отсюда приступаем к доказательству интегральной теоремы Лапласа, которая гласит: Пусть:
1) событие А при отдельном испытании может произойти с вероятностью р, а не произойти с вероятностью q = 1 — р;
2) проведено п независимых испытаний.
Если п и т таковы, что при п, стремящемся к бесконечности:
а) — р -> 0;
б) есть ограниченная величина, то
P(a£Sn£b) » Ф() - Ф ()'
где Ф (х) — первообразная функция от j (х), которая была получена выше.
Доказательство.
При обозначениях
По определению первообразной функции Ф (х) имеет место равенство Ф'(x)= j (x).
Пусть = ∆ x = xi+1—xi для всех i =1, 2, 3,.... k — 1.
Можем записать:
P(Sn = a) » -, где х1= ,
P(Sn = a + l) » , где х2 =
P(Sn = b —1) » , где xk-1 =
P(Sn = b)) » , где
Тогда
Но поскольку Ф'(х)= j (х), то по формуле конечных приращений
j(x1)∆ x » Ф (х2)- Ф (х1)
j(x2)∆ x » Ф (х3)- Ф (х2)
j(x3)∆ x » Ф (х4)- Ф (х3)
…
j(xk-1)∆ x » Ф (хk)- Ф (хk-1)
Подставляя (6.18) в соотношение (6.17), получаем:
Р( a£Sn£b ) »Ф (х2)- Ф (х1) + Ф (х3)- Ф (х2) +... + Ф (хk)- Ф (хk-1) + j(xk-1)∆ x.
После сокращения подобных членов получим:
Р(а < Sn <b ) » Ф (хk) - Ф (х1) + j(xk-1)∆ x.
Но поскольку ∆х->0, xk = и x1 = , то
Р( a£Sn£b ) » Ф() — Ф(),
что и требовалось доказать.
Функция у = Ф(х), первообразная функции y=j (х), так же широко используется, и в справочниках приводится таблица ее значений.