Решение матричных игр 2х2 в смешанных стратегиях и моделирование результатов
Краткая теоретическая справка
Если матричная игра не имеет седловой точки, то решение находят в смешанных стратегиях.
Смешанной стратегией игрока называется вектор Х(p1, p2, …, pm), координатами которого являются вероятности (относительные частоты) использования игроком своих чистых стратегий. Так как события, заключающиеся в выборе игроком своих чистых стратегий образуют полную группу, то сумма их вероятностей равна 1, т.е.:
p1 + p2 + … + pm = 1.
Рассмотрим матричную игру 2х2, которая задана платежной матрицей:
.
Если эта игра не имеет седловой точки, то ее решение составляет пара оптимальных стратегий Х*(p1, p2) и Y*(q1, q2). Причем использование игроком А своей оптимальной стратегии гарантирует ему получение среднего выигрыша не меньшего, чем цена игры n. При этом, если игрок В использует свою оптимальную стратегию, то средний выигрыш игрока будет равен n, если игрок В не использует свою оптимальную стратегию, то средний выигрыш игрока А будет больше n.
Записанное выше положение имеет вероятностный смысл, т.е. средний выигрыш будет тем ближе к n, чем больше партий сыграют игроки: средний выигрыш стремится к n по вероятности (другими словами, средний выигрыш будет не точно равен n, а примерно равен и чем больше партий, тем меньше отклонение). Кроме того, определение смешанной стратегии требует выбирать чистые стратегии игроками случайно в соответствии с вероятностями (относительными частотами) их использования (условие секретности выбора чистой стратегии).
Для решения матричных игр 2х2 можно использовать аналитический и геометрический методы.
|
Аналитический метод решения игры 2х2.
Чтобы найти оптимальную смешанную стратегию игрока А: Х*(p1, p2) и соответствующую цену игры n, необходимо решить систему уравнений:
(1) |
Первое уравнение определяет математическое ожидание выигрыша игрока А при использовании им стратегии Х*(p1, p2) против стратегии В1; второе уравнение определяет математическое ожидание выигрыша игрока А при использовании им стратегии Х*(p1, p2) против стратегии В2; третье уравнение – свойство компонентов смешанной стратегии игрока.
Аналогично для игрока В. Чтобы найти оптимальную смешанную стратегию игрока В: Y*(q1, q2) и соответствующую цену игры n, необходимо решить систему уравнений:
(2) |
Цена игры n общая для обоих игроков, поэтому при решении систем уравнений (1) и (2) должно получиться одинаковое значение n.
Геометрический метод решения игры 2х2.
В точках х = 0, х = 1 оси О х восстановим перпендикуляры и обозначим их А1 и А2 – в соответствии со стратегиями игрока А (см. рис 1).
Рис. 1. Графическая интерпретация матричной игры 2х2 для игрока А.
Изобразим стратегию В1. На прямой А1 отложим а11, а на прямой А2 отложим а21. Соединим эти точки и получим прямую В1В1 (см. рис. 1). Аналогично изобразим стратегию В2, отложив на прямой А1 значение а12, а на прямой А2 значение а22.
Каждой точке на отрезке [0; 1] соответствует смешанная стратегия игрока А, причем р2 – расстояние от этой точки до нуля, а р1 – расстояние от этой точки до точки 1 (см. рис. 1).
Ломанная В2МВ1 (на рисунке 1 выделена полужирно) определяет минимальные возможные средние выигрыши игрока А при использовании им своих смешанных стратегий. Точка М (самая высокая точка ломанной) – определяет наилучший средний выигрыш игрока А из всех минимальных. Она соответствует оптимальной смешанной стратегии игрока А. При этом:
|
если М (х, у), то р1 = 1 – х, р2 = х, n = y.
Таким образом, задача сводится к нахождению координат точки М, которая является точкой пересечения прямых В1В1 и В2В2. Для нахождения уравнений прямых В1В1 и В2В2.можно воспользоваться уравнением прямой, проходящей через две точки:
,
с учетом того, что прямую В1В1 определяют точки В1(0; a11), В1(1; а21), а прямую В2В2 определяют точки В2(0; a12), В2(1; а22).
Для игрока В оптимальная смешанная стратегия находится аналогично, но точка М определяется не самой высокой точкой нижней ломанной, а самой низкой точкой высокой ломанной – полужирная ломанная на рисунке 2.
Рис. 2. Графическая интерпретация матричной игры 2х2 для игрока В.
Найдя координаты точки М (х, у), как точки пересечения прямых А1А1 и А2А2, компоненты оптимальной смешанной стратегии игрока В и цену игры: Y*(q 1, q 2), n можно найти по следующим формулам:
q1 = 1 – x, q2 = x, n = y.