Классификация по асимптотическим свойствам вероятностей Рjj(n)
а) невозвратные
б) возвратные нулевые
в) ненулевые
Классификация по арифметическим свойствам вероятностей Рjj(n)
а) периодические
б) непериодические
Упражнения
В задачах 22–24 выяснить, будет ли цепь с матрицей вероятностей перехода за один шаг P периодической. Для периодических цепей указать период.
22. P =
23. P =
24. P =
В задачах 25–27 указать возвратные и невозвратные состояния.
25. P = .
26. P =
27. P =
4. Симметричное случайное блуждание
Пример 1. Рассмотрим одномерное случайное блуждание по целочисленной решетке (). Симметричное одномерное случайное блуждание (р = q = ) возвратно.
Доказательство.
P00(2n+1) = 0, P00(2n) = , n = 0,2,…
По формуле Стирлинга, n! nne–n , P00(2n) .
Состояние возвратно при p = q = , т.к. .
Пример 2. Рассмотрим двумерное случайное блуждание по целочисленной решетке на плоскости. Симметричное двумерное случайное блуждание возвратно.
Доказательство.
Рассмотрим все траектории: из 0 в 0, состоящие из i перемещений вправо, i влево, j вверх и j вниз, 2i+2j=2n. Вероятность за один шаг переместиться в любом из четырех направлений равна .
(*) P00(2n) = , n = 1,2,3,…; P00(2n+1) = 0, n = 0,1,…
Умножим числитель и знаменатель в (*) на (n!)2 , получим
P00(2n) = , но ; докажем это.
Рассмотрим равенство (1+x)2n = (1+x)n (1+x)n и приравняем коэффициенты при xn: , но Т.о., P00(2n) = и по формуле Стирлинга
(n! ) тогда
P00(2n) ,
, состояние возвратно.
Пример 3. Симметричное случайное блуждание по трём измерениям невозвратно.
Доказательство.
P00(2n+1) = 0, n = 0, 1, …, P00(2n) = .
Умножим числитель и знаменатель на (n!)2, получим:
P00(2n) = .
Если то P00(2n) ≤ .
Мы использовали то, что
= 1.
Max Cn достигается (при больших n) при i = j ~ , тогда Сn ~
|
P00(2n) ≤ Применим, как выше, формулу Стирлинга (сделать это самостоятельно!) и получим, что P00(2n)
Тогда < => состояние невозвратное.
Теорема 2. Симметричное случайное блуждание возвратно в пространствах одного и двух измерений и невозвратно в пространстве трёх и более измерений.
Лемма. Одномерное случайное блуждание образует возвратную цепь Маркова тогда и только тогда, когда р = q = .
Доказательство леммы.
В примере 1 были получены вероятности P00(2n+1) = 0, P00(2n) = . При р = q = , P00(2n) = , .
При p ≠ q, , т.к. (4pq)n = n, < 1, а ряд по признаку Даламбера.
Доказательство теоремы.
Для одномерного случая (k=1) утверждение теоремы доказано в лемме. Рассмотрим теперь двумерный случай (k=2). Блуждание можно представить в виде суммы двух независимых компонент:
x(n) = (x1(n), 0)+(0, x2(n)), где xi(n)– одномерные последовательности.
Тогда x(n+1) = x(n) + ξn, где ξn принимает четыре значения: ().
P00(2n) = P(x(2n) = (0,0)/x(0) = (0,0)) = P(x1(2n) = 0/x1(0) = 0)∙P(x2(2n) = 0/x2(0) = 0) = , состояние возвратно.
При k = 3: P00(2n) = O , , состояние невозвратно.
При k > 3: P00(2n) = O , состояние невозвратно.
Несимметричное случайное блуждание (при p ≠ q) невозвратно для любого k (т.к. (4pq)n = n, < 1, ).
Упражнения
Шары.
N черных и N белых шаров размещены в двух урнах по N шаров в каждой. Число черных шаров в первой урне определяет состояние системы. На каждом шагу случайно выбирается по одному шару из каждой урны, и эти выбранные шары меняются местами.
а) найти все вероятности перехода за один шаг,
б) классифицировать состояния.
Прямая.
Точка движется по прямой и в течение каждой очередной секунды движения может или сместиться на единицу расстояния или остаться на месте. Даны: 1) вероятность p смещения для первой секунды; 2) вероятность а (а = const) смещения для любой рассматриваемой секунды, если известно, что в течение предыдущей секунды точка смещалась, 3) вероятность b (b = const) смещения для любой рассматриваемой секунды, если известно, что в течение предыдущей секунды точка оставалась на месте. Найти вероятность смещения точки в течение (n+1)–й секунды.
|
Плоскость.
Точка движется по плоскости и в течение секунды может сместиться или на единицу расстояния по горизонтали, и на единицу расстояния по вертикали, или пройти диагональ единичного квадрата (смещение на единицу по горизонтали и единицу по вертикали), или остаться на месте. Вероятность горизонтального и вертикального смещений одинакова и для любой секунды (кроме первой) равна: 1) а, если в предыдущую секунду произошли оба смещения; 2) b, если в предыдущую секунду произошло только одно смещение по горизонтали или по вертикали: 3) c, если в предыдущую секунду точка оставалась на месте. Составить уравнение цепи Маркова для определения вероятностей горизонтального (вертикального) смещения точки в течение (n+1)–й секунды.
31. Серия успехов.
Пусть имеется последовательность независимых испытаний, в каждом из которых вероятность появления события А равна p, (0<p <1), непоявление события А обозначим через В (В = не А). Под изучаемой системой будем понимать всевозможные комбинации из А и B в сериях последовательных испытаний. Будем считать, что система в момент t находится в состоянии Ek (k = 0, 1, 2,...), если в испытаниях с номерами t, t –1,t – 2,..., t –k+1 появилось А, а в испытании с номером t – k появилось В. Система в данный момент t находится в состоянии Е0, если исходом испытания с номером t является В.
|
В начальный момент 0 система находилась в состоянии Е0.
Написать матрицу переходных вероятностей, вычислить матрицу перехода через n шагов.
Частицы.
В некоторой области пространства имеются однородные частицы. Состояние изучаемой системы определяется числом частиц в данной области. В течение промежутка времени длиной 1 каждая частица независимо от других может покинуть эту область с постоянной вероятностью q. Кроме того, в области может появиться в течение единицы времени r
новых частиц (r = 0, 1, 2,,,,) с вероятностью, определяемой законом Пуассона с параметром λ.
Найти матрицу переходных вероятностей.
5. Теорема солидарности
Теорема 3. В неразложимой Марковской цепи все состояния принадлежат одному типу: если хоть одно возвратно, то и все возвратны; если хоть одно нулевое, то и все нулевые; если хоть одно периодическое с периодом d, то и все периодичны с периодом d.
Доказательство: Пусть k, j – два разных состояния. Существуют такие числа s, t, что Pkj(s) > 0, Pjk(t) > 0. По формуле полной вероятности
Pkk(s + t + n) = Pkk(s+n+t) =
Pkk(s + t + n) ≥ Pkj(s)Pjj(n)Pjk(t) (1)
Аналогично, Pjj (s + t + n) = Pjj(t + n + s) ≥ Pjk(t)Pkk(n)Pkj(s) (2)
Обозначим Pkj(s) = A, Pjk(t) = B. Тогда
Pkk(s + t + n) ≥ ABPjj(n) (1/)
Pjj(t + n + s) ≥ ABPkk(n) (2/)
Pjj(n) ≤ Pkk(s + t + n) (1//).
Обозначим s+t+n = u, тогда n = u–s–t.
Pjj(u) ≥ ABPkk(u – s – t) (2//)
Равенство (2//) справедливо для любых u, не меньших n, поэтому справедливо и для n:
Pjj(n) ≥ ABPkk(n – s – t) (2///)
Объединим (1//) и (2///):
ABPkk(n–s–t) ≤ Pjj(n) ≤ Pkk(n+s+t).
ABPkk(n – s – t) ≤ Pjj(n) ≤ Pkk(n + s + t).
1) Пусть k– нулевое, тогда , но тогда и , следовательно, j – нулевое.
2) Пусть k– возвратное, т.е.
j – возвратное.
3) Пусть k – периодичное состояние с периодом dk, т.е. Pkk(u) > 0, следовательно, существует такое b, что u = bdk.
Pkk(t + s) ³ Pkj(s)Pjk(t) = AB > 0 Þ t + s = adk.
Рассмотрим j. Если для некоторого n Pjj(n) > 0, то Pkk(n + t + s) > 0 Þ n + t + s = cdk.
n + adk = cdk Þ n = (c – a)dk Þ цепь периодическая с периодом dj, где dj ≥ dk. Аналогично можно показать, что dk ≥ dj Þ dk = dj ¨
Если состояния цепи Маркова периодичны с периодом d > 1, то цепь называется периодической. Изучение периодических цепей в значимой мере может быть сведено к изучению непериодических.
Теорема 4. Если цепь Маркова периодическая с периодом d, то множество состояний разбивается на d подклассов y0, y1,..., yd–1 таких, что с вероятностью 1 за один шаг система переходит из класса yn в yn+1, из класса yd–1 система переходит в y0.
Доказательство: Выберем любое состояние, например 1. Построим с помощью этого состояния подклассы y0, y1,..., yd–1 следующим образом: i Î ya, 0 ≤ ≤ d–1, если существует целое число k > 0 такое, что P1i(kd + a) >0. Покажем, что никакое состояние не может принадлежать сразу двум подклассам. Для этого достаточно доказать, что если i Î ya и для некоторого s P1i(s) > 0, то s = a(mod d). Действительно, существует
t1 > 0 такое, что Pi1(t1) > 0. Тогда P11(kd + a + t1) ³ P1i(kd+a)Pi1(t1) > 0. Кроме этого, P11(s + t1) ³ P1i(s)Pi1(t1) > 0. Значит, kd + a + t1 = ad и s + t1 = bd Þ
kd + a + bd – s = ad; a = s + d(a – b – k) Þ a = s(mod d).
Т.к. из состояния 1 можно с положительной вероятностью попасть в любое
i, то содержит все множество состояний. Докажем теперь, что система из ya за один шаг с вероятностью 1 переходит в ya+1 (+1 понимается по mod d). Для этого надо показать, что для I Î ya . Достаточно получить, что Pij = 0, если iÎya, jÏya+1. От противного, пусть iÎya, jÏya+1 , Pij > 0. Тогда P1j(kd+a+1) ³ P1i(kd+a)Pij(1) > 0, так как Pij(1) = Pij, но тогда jÎya+1 – противоречие. ¨
Из теоремы видно, что матрица периодической цепи будет иметь вид
Из периодической цепи Маркова с периодом d можно образовать d новых цепей Маркова. Состояниями –ой цепи будут состояния из подкласса ya. Вероятности перехода задаются равенствами . В силу только что доказанной теоремы . Новая цепь уже не будет иметь подклассов.
Упражнения
33. Доказать, что в неразложимой конечной цепи Маркова не может быть нулевых состояний.
34. Доказать, что в неразложимой конечной цепи Маркова не может быть невозвратных состояний.
35. Могут ли все состояния цепи Маркова со счетным числом состояний быть невозвратными?
36. Доказать, что для конечной цепи Маркова состояние возвратно тогда и только тогда, когда оно существенно.
37. Доказать, что, если в цепи Маркова состояние εj возвратно, то система с вероятностью 1 за бесконечное число шагов бесконечно много раз возвратится в εj. Если состояние εj невозвратно, то система с вероятностью 1 за бесконечное число шагов лишь конечное число раз возвратится в εj. Другими словами, после некоторого конечного числа шагов система никогда больше не возвратится в εj.
38. Пусть ξt – номер состояния в цепи Маркова в момент времени t; P(ξ0 = 1) = 1,
матрица переходных вероятностей имеет вид .
Положим
Показать, что последовательность ηt является цепью Маркова, найти ее матрицу вероятностей перехода.
39 – 41. Пустьξ1, ξ2,… – независимые случайные величины, P(ξt = 1) = 1 – P(ξt = –1) = p.
Является ли цепью Маркова последовательность ηt, если:
39. ηt = ξt∙ ξt+1.
40. ηt = ξ1∙ ξ2∙… ∙ξt.
41. ηt = φ(ξt,ξt+1), где φ(–1, –1) = 1, φ(–1, 1) = 2, φ(1, –1) = 3, φ(1, 1) = 4.
6. Эргодичность и стационарные распределения
Определение 11. С остояние εj, для которого существует , не зависящий от i, называется эргодическим.
Замечание. Позднее будет показано, что не зависящий от i существует для любого возвратного состояния εj, не являющегося ни нулевым, ни периодическим. Таким образом, термин «эргодическое состояние» – это синоним для «возвратное, не нулевое, не периодическое состояние».
Смысл эргодичности. Существуют вероятности попадания системы в состояние εj через большой промежуток времени, причем они не зависят от начального состояния системы.
Определение 12. Цепь Маркова называется эргодическо й, если для любых i, j существует (все состояния эргодические).
Определение 13. Распределение вероятностей {ak} называется стационарным распределением цепи Маркова, если для любого n справедливо: (n).
Пример 4. Пусть дана однородная цепь Маркова с матрицей переходных вероятностей P= Стационарным распределением для него является (a1, a2) = (2/3, 1/3). Проверим, что (1).
(2/3, 1/3) ∙
Это верно и для n = 2, 3, 4:
P2 =
(2/3, 1/3) ∙ =
P3 =
(2/3, 1/3) ∙ =
P4 =
(2/3, 1/3) ∙ =
Упражнение. Найдите общий вид матрицы P(n) = Pn = и убедитесь в стационарности распределения. Найдите пределы элементов матрицы Pn и убедитесь, что
Замечание. Если для однородной цепи Маркова справедливо: , то {ak} – стационарное распределение.
Пример 5. Пусть дана однородная эргодическая цепь Маркова с матрицей переходных вероятностей
P=
Найти стационарное распределение.
Решение. Ищем решениеуравнения(a1, a2)∙P = (a1, a2).
(a1, a2)∙ (a1, a2),
1/3a1 + 1/4 a2 = a1, 2/3a1 + 3/4 a2 = a2, а также a1 + a2 = 1.
Решая систему, находим: a1 = 3/11, a2 = 8/11.
Выясним общие условия существования стационарного распределения.
Теорема 5. Неразложимая непериодическая цепь Маркова принадлежит одному из следующих классов:
а) или все состояния невозвратные, или все нулевые. В этом случае и не существует стационарного распределения;
б) или все состояния эргодические, т.е., . В этом случае {Uk}– стационарное распределение, и не существует никаких других стационарных распределений.
Доказательство: Рассмотрим случай б). Заметим, что поэтому «обрезанная» сумма не превышает 1, и это верно и в пределе. Так как , N получаем, что U1+…+UN ≤ 1.
Далее, для любых j, k, m, n справедливо: . Положим n = 1: . Если мы сужаем множество индексов в правой части, то справедливо неравенство:
, где А = {1, 2,…, N}. Пусть теперь m → ∞. По теореме о мажорируемой сходимости можно переходить к пределу. Поскольку , , то , что верно для любого А, то есть, для любого N, и в пределе при N→ ∞ получим .
Докажем, что имеет место равенство.
Если для каких–то k , то, просуммировав, получим: , однако они равны, так как состоят из одних и тех же слагаемых. Т.о.,
Следовательно, это стационарное распределение.
Докажем единственность. Пусть {Vk} удовлетворяет (*), . Умножим на pkj = pkj(1).: , просуммируем по k. . Но =Vj, а . Получили: . Опять умножим обе части на pjk= pjk(1), , просуммируем по j. , (3) и т.д. по индукции. Пусть покажем, что , просуммируем по k. Заменим индекс j на k, получим:
Пусть n → ∞, с учетом того, что в пределе получаем Vk = (V1+…)Uk = Uk (так как сумма вероятностей стационарного распределения равна единице).
Таким образом, стационарное распределение {Vk} совпадает с {Uk}, то есть, стационарное распределение единственно.
В случае а), если все состояния или невозвратные, или нулевые, предположим, что распределение {Vk} стационарно. Тогда, как показано выше, имеет место уравнение . Но противоречие. Поэтому стационарное распределение для неразложимой цепи может существовать только в эргодическом случае.