Решение матричной игры графическим способом




Рассмотрим матричную игру в смешанных стратегиях, в которой у игрока А две стратегии. Платёжная матрица такой игры будет иметь вид = . Изобразим графически, как определяются выигрыши игрока А в смешанных стратегиях для одной стратегии игрока В, стратегии В1 (рис. 1). На оси абсцисс будем откладывать точки определяющие смешанную стратегию игрока А, а именно, точке сопоставим смешанную стратегию игрока А = . Через точки =0 и =1 проведём перпендикулярно оси А1А1 и А2А2, на которых будем откладывать проигрыши игрока В при стратегиях А1 и А2 соответственно, если игрок В выберет стратегию В1 (рис. 1). Эти точки обозначим В1. Тогда на отрезке В1В1 будут определяться выигрыши игрока А для его смешанных стратегий = . Если игрок В выберет чистую стратегию В1, в точке с координатами отрезка В1В1

 
 

будет определять выигрыш игрока А для смешанной стратегии . Этот выигрыш равен: = .

Также строится и отрезок для стратегии В2, который обозначим В2В2 (рис. 2). На нём будут лежать точки, определяющие выигрыши игрока для его смешанных стратеги, если игрок В выберет стратегию В2.

Построим отрезок для второй стратегии игрока В (рис. 2). Для двух стратегий В1 и В2 гарантированный выигрыш игрока А составит = . Точки, определяющие гарантированные выигрыши игрока А будут лежать на ломанной, ограничивающей оба отрезка снизу. Это ломанная В1ВВ2 (рис. 2).

Если также отложить отрезки для всех стратегий игрока В (рис. 3), то ломанная, ограничивающая эти отрезки снизу будет определять гарантированные выигрыши игрока А для смешанных стратегий в матричной игре с платёжной матрицей = . Выигрыш на этой ломанной определяется значениями = . На рисунке 3 рассмотрен пример для четырёх стратегий. На нём ломаная, ограничивающая отрезки В1В1, В2В2, В3В3 и В4В4 снизу, будет ломанная В3А1АВ2.

Игрок А выберет ту смешанную стратегию, при которой гарантированный выигрыш будет наибольшим. Поэтому, на ломанной он выберет точку с наибольшим значением выигрыша, это точка . На рисунке 3 она изображена как точка пересечения отрезков В1В1 и В2В2. По отрезкам В1В1 и В2В2 определяются проигрыши игрока В, если он выбирает стратегии В1 и В2. Игроку В выгодно использовать эти стратегии, так как он будет получать меньший проигрыш по сравнению с другими своими стратегиями. Стратегии В1 и В2 будем называть активными для игрока В, а остальные стратегии игрока В, которые не проходят через точку А, пассивными. Игрок А может предположить, что игроку В выгодно придерживаться активных стратегий В1 и В2.

Найдём оптимальную стратегию игрока А. Составляем систему уравнений для активных стратегий игрока В, предполагая, что выигрыш игрока А по активным стратегиям игрока В равняется наибольшему гарантированному выигрышу игрока А, цене игры . В систему уравнений добавляется условие нормировки, определяющее, что сумма вероятностей игрока А для его смешанной стратегии равняется единицы.

Для нашего случая получаем систему уравнений: . Эта задача называется задачей для игрока А.

Если точка А будет точкой пересечения трёх и более отрезков, то все стратегий, отрезки которых пересекают точку А будут активными, для всех стратегий записывается условие, что для оптимальной стратегии игрока А его выигрыш равен .

Для игрока В ставится задача, исходя из условий, что его проигрыш для активных стратегий равняется . Для пассивных стратегий игрока В вероятности выбора равна нулю. Поэтому сумма вероятностей выбора активных стратегий равна единице. Для матричной игры, которую мы рассматриваем, задача игрока В будет иметь вид: . Значение в обеих задачах должно быть одинаковым. Это является и контрольным вычислением для правильности решения матричной игры.

Когда оптимальной стратегией является чистая стратегия игрока А, то условие проигрыша игрока В равного составляется только для этой чистой стратегии игрока А, которая оказалась оптимальной.

Рассмотрим матричную игру, в которой, игрок В имеет две стратегии. В этой задаче на оси абсцисс точки определяют смешенные стратегии игрока В (рис. 4), а именно, стратегии игрока В = . На осях В1В1 и В2В2 (рис. 4) откладываются выигрыши игрока А для его чистых стратегий, если игрок В выбирается свои чистые стратегии В1 и В2 соответственной. Отрезки, соединяющие выигрыши игрока А для одной стратегии игрока А, будут определять проигрыши игрока В для его смешанных стратегий, если игрок А выберет соответствующую чистую стратегию.

Ломанная, определяющая гарантированные проигрыши игрока В, будет ограничивать отрезки, определяющие для игрока А его выигрыши при чистых стратегиях, сверху. Точка ломанной , имеющая самый наименьший гарантированный проигрыш, определяет оптимальную стратегию игрока В. Также определяются активные стратегии игрока А. Отрезки этих стратегий пересекают точку В.

В этом случае задача игрока В определяется из условий, что его гарантированный проигрыш для активных стратегий игрока А равен = и сумма вероятностей выбора обеих стратегий игроком В равна единице.

Задача для игрока А определяется из условий, что для его активных стратегий выигрыш при выборе игроком В своих чистых стратегий равняется , а сумма вероятностей для активных стратегий игрока А равна единице.

В случае, когда оптимальной смешанной стратегией игрока В является его чистая стратегия. Тогда для игрока А записывается условие, что для этой чистой стратегии выигрыш игрока А для его активных стратегий равняется .

Пример 1. Для матричной игры с платёжной матрицей = определить оптимальные стратегии игроков и цену игры графическим способом.

Решение. Построим график для определения проигрышей игрока В для различных смешанных стратегий игрока А (рис. 5). На оси А1А1 отметим проигрыши игрока В для его стратегий, если игрок А выберет стратегию А1. Отмечаем точку В1 с координатой равной –3, точку В2 с координатой 4 и точку В3 с координатой –1. На оси А2А2 отметим проигрыши игрока В, если игрок А выберет стратегию А2: В1 (2), В2 (–3), В3 (1). Соединяем соответствующие точки на разных осях, получаем отрезки В1В1, В2В2 и В3В3. Определяем ломанную, ограничивающую отрезки снизу. Это ломанная В1АВ2. На ломанной выбираем точку с наибольшим выигрышем игрока А. Это точка А. Она является точкой пересечения отрезков В1В1 и В2В2. Для игрока В стратегии В1 и В2 активные, а стратегия В3 – пассивная. Вероятность =0.

Составляем задачу для игрока В. Записываем условия для каждой стратегии игрока А, что, математическое ожидание проигрыша игрока В для его активных стратегий равняется цене игры. А также условие нормировки для активных стратегий. . Решим эту систему уравнений. Из первых двух уравнений = = . Тогда или . Выражение для подставляем в третье уравнение: . Находим значение : = = . Находим значение : = = . Подставляем значения и в первое уравнение: = = = . Второе уравнение используем для проверки решения системы:

= = = . Система уравнений решена верно.

Составляем задачу для игрока А. Записываем условия равенства математического ожидания выигрыша игрока А для каждой активной стратегии игрока В и условие нормировки для всех стратегий. . Из первых двух уравнений: = . Тогда или . Из третьего уравнения: . = = . = = . Подставляем в первое уравнение: = = = . Во втором уравнении = = = = . Задача для игрока В решена верно. Ответ: = ; = ; = .

Пример 2. Для матричной игры с платёжной матрицей = определить оптимальные стратегии игроков и цену игры графическим способом.

Решение. В этой задаче построим график для определения выигрышей игрока А (рис. 6). На осях В1В1 и В2В2 отметим выигрыши игрока А, если игрок А выберет стратегии А1 и А2 соответственно. На оси В1В1 точки: А1 (–3), А2 (4), А3 (–1); на оси В2В2 точки: А1 (2), А2 (–3), А3 (1). Строим отрезки А1А1, А2А2 и А3А3. Строим ломанную, ограничивающую отрезки сверху. Это ломанная А2 ВВ1А1. На ломанной точка с наименьшим проигрышем игрока В будет точка В. Это точка пересечения отрезков А2А2 и А3А3. Стратегии А2 и А3 активные, а стратегия А1 – пассивная. Вероятность =0.

Составим задачу для игрока А. . Из первых двух уравнений: = . Тогда или . Из третьего уравнения: . = = . = = . Находим цену игры: = = = = . Проверка: = = = . Составим задачу для игрока В. . = = . Тогда или . Выражение для подставляем в третье уравнение: . Находим значение : = = . Находим : = = . Подставляем значения и в первое уравнение: = = = . Ответ: = ; = ; = .

Пример 3. Для матричной игры с платёжной матрицей = определить оптимальные стратегии игроков и цену игры графическим способом.

Решение. Строим график для определения выигрышей игрока А (рис. 7). На осях В1В1 и В2В2 отмечаем выигрыши игрока А. На оси В1В1 точки: А1 (–3), А2 (4), А3 (–1); на оси В2В2 точки: А1 (2),

А2 (–1,5), А3 (1). Строим отрезки А1А1, А2А2 и А3А3. Ограничивающую отрезки сверху ломанной А2 ВА1. На ломанной выбираем точку В. Это точка пересечения отрезков А1А1, А2А2 и А3А3. Все три стратегии А1, А2 и А3 активные. В задаче для игрока А записываем условие равенства математического ожидания выигрыша цене игры всех активных стратегий игрока А для каждой стратеги игрока В.

Задача для игрока А. . Из первых двух уравнений: = = . Тогда или . Из третьего уравнения: . = = . = = . Находим цену игры: = = = . Проверка: = = = = . Переменные , и больше равны нуля и меньше равны единице. Положим = . Тогда для выполняются двойные неравенства: , , . Найдём решения второго и третьего двойных неравенств.

; .

. Для переменной выполняются ограничения: .

Решением задачи для игрока А будут стратегии = , где ; = .

 

Составим задачу для игрока В из условия равенства математического ожидания проигрыша игрока В цене игры для активных стратегий игрока А. . = = . Тогда или . Выражение для подставляем в третье уравнение: . Находим значение : = . Находим : = = . Подставляем значения и в первое уравнение: = = . Сделаем проверку в третьем уравнении: = . Решение для задачи игрока В: = ; = = .

Ответ: = , где ; = ; = .

 



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2016-04-12 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: