R - блок фундаментальной матрицы с размерностью r.




ЛЕКЦИЯ

МАРКОВСКИЕ ЦЕПИ



 
 





 
 












 
 




Зависимость суммарного дохода от числа шагов


Управляемая МЦ с двумя состояниями S1 и S2.

прямая V1(n) показывает зависимость суммарного дохода, если система “стартовала” из состояния S1. Соответственно, прямая V2(n) изображает ту же зависимость для состояния S2.

Обе прямые описываются линейными уравнением: Vi(n)=ng+Vi(0),

где

g - угловой коэффициент прямой Vi(n);

Vi(0) - доход в i -том состоянии в конце процесса.


№1

Перед испытуемым находятся два табло с синими и зелеными лампочками. Последовательности зажигания описываются Марковскими цепями с матрицами перехода за один шаг

1) 2) .

Испытуемый должен нажать на кнопку, если на обоих табло зажегся зеленый свет.

Определить с какой вероятностью после двух правильных нажатий подряд он может ожидать ситуацию, когда не надо нажимать?

Ответ: 2/9.

 

№2

Известно, что если погоду в данной местности характеризовать только следующими состояниями: облачно, дождь и хорошая погода, то запись текущей погоды образует марковскую цепь с матрицей вероятностей перехода . Предскажите погоду на один и на два дня вперед, если сегодня погода хорошая. Имеет ли смысл пользоваться монетой, для того, чтобы решить, брать ли с собой зонтик, выходя из дому? Предполагается, что погода устойчива в течение дня.

Ответ: (0,42;0,52;0,06). Нет.


Для иллюстрации приведем конкретный числовой пример: пусть известны значения переходных вероятностей матрицы с одним поглощающим состоянием: ; ; ; ; ; ; ; .

Переходная матрица в блочной системе будет выглядеть так:

В данном случае

; ; ;

Проделаем необходимые вычисления:

;

;

.

В данном случае компоненты вектора означают, что если процесс начинается с состояния , то общее среднее число шагов процесса до поглощения будет равно 3,34 и, соответственно, если процесс начинается с состояния , то - 2,26.

В конкретных задачах, конечно, более информативным результатом будет не количество шагов, а какие-либо временные или экономические показатели. Этот результат легко получить, если связать пребывание в каждом состоянии с соответствующими характеристиками. Очевидно, набор этих характеристик составит вектор, на который нужно умножить слева.

Так, если задать в нашем примере время пребывания в состоянии , а в состоянии - , то общее время до поглощения будет равно:

В случаях, когда марковская цепь включает несколько поглощающих состояний, возникают такие вопросы: в какое из поглощающих состояний цепь попадет раньше (или позже); в каких из них процесс будет останавливаться чаще, а в каких - реже? Оказывается, ответ на эти вопросы легко получить, если снова воспользоваться фундаментальной матрицей.

Обозначим через вероятность того, что процесс завершится в некотором поглощающем состоянии при условии, что начальным было состояние . Множество состояний снова образует матрицу, строки которой соответствуют невозвратным состояниям, а столбцы - всем поглощающим состояниям. В теории ДМЦ доказывается, что матрица В определяется следующим образом:

(8.9)

Где

М - фундаментальная матрица с размерностью S;

R - блок фундаментальной матрицы с размерностью r.

 
 

Рассмотрим конкретный пример системы с четырьмя состояниями , два из которых- - поглощающие, а два - - невозвратные (рис.10):

Рис. 8.10. Система с четырьмя состояниями

Для наглядности и простоты вычислений обозначим переходные вероятности следующим образом:

; ;

Остальные значения вероятностей будут нулевыми. Каноническая форма матрицы перехода в этом случае будет выглядеть так:

Фундаментальная матрица после вычислений примет вид:

Тогда, согласно формуле (9), матрица вероятностей поглощения вычисляется так:

.

Поясним вероятностный смысл полученной матрицы с помощью конкретных чисел. Пусть , а . Тогда после подстановки полученных значений в матрицу получим:

Таким образом, если процесс начался в , то вероятность попадания его в равна , а в - . Отметим одно интересное обстоятельство: несмотря на то, что, казалось бы, левое поглощающее состояние (“левая яма”) находится рядом с , но вероятность попадания в нее почти в два раза меньше, чем в “удаленную яму” - . Этот интересный факт подмечен в теории ДМЦ, и объясняется он тем, что , то есть процесс имеет как бы “правый уклон”. Рассмотренная выше модель называется в теории ДМЦ моделью случайного блуждания. Такими моделями часто объясняются многие физические и технические явления и даже поведение игроков во время различных игр.

В частности, в рассмотренном примере объясняется тот факт, что более сильный игрок может дать заранее значительное преимущество (“фору”) слабому противнику и все равно его шансы на выигрыш будут более предпочтительными.

Кроме указанных выше средних характеристик вероятностного процесса с помощью фундаментальной матрицы можно вычислить моменты и более высоких порядков. В частности, дисперсия числа пребывания в том или ином состоянии - D определяется с помощью следующей матрицы:

(10)

Где

- диагональная матрица, т.е. матрица, полученная из М путем оставления в ней лишь диагональных элементов и замены остальных элементов нулями. Например, приведенная выше матрица (7а) будет иметь вид:

В свою очередь, матрица М представляет собой матрицу, полученную из М путем возведения в квадрат каждого ее элемента, то есть для (7а) будем иметь:

Аналогичным образом определяема и дисперсия для общего количества раз пребывания в том или ином состоянии . Обозначим ее :

(11)

Эргодические цепи

Оказывается, из этого условия вытекают некоторые замечательные свойства регулярных ДМЦ:

1. Степени при стремятся к стохастической матрице .

2. Каждая строка матрицы представляет один и тот же вероятностный вектор

(12)



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2019-05-16 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: