Решаем КНБ с неравным соотношением




До настоящего момента мы по умолчанию считали, что игра симметрична: и у игрока, и у противника одинаковое количество ходов, и мы оба выигрываем или теряем одинаковое количество очков или единиц чего-либо, и всё это подчиняется единому своду правил. Но не все интранзитивные игры одинаково симметричны. Например, давайте представим, что я создал вариант КНБ, в котором в каждом раунде я открываю новую карту, которая меняет выигрыши. В этом раунде, согласно моей карте,мой противник получаетдва очка за победу, выкинув Камень, а я – нет (я бы набрал обычное количество очков). Как это все меняет?
Вообще-то это здорово усложняет ситуацию, поскольку теперь оба игрока должны просчитывать вероятности фигур противника, а эти вероятности уже могут измениться! Скажем, игрок А получает бонус в виде двух очков за победу с Камнем, а игрок Б – нет. Какова оптимальная стратегия для обоих игроков? И какое преимущество у игрока А, и есть ли оно вообще? Давайте выясним это, составив две таблицы выигрышей.

Таблица игрока А будет выглядеть так:

  кБ бБ нБ
КА   -1 +2
БА +1   -1
НА -1 +1  

Таблица игрока Б будет выглядеть так:

  кА бА нА
КБ   -1 +1
ББ +1   -1
НБ -2 +1  

Здесь мы можем предположить, что КА=БА=НА и КБ=ББ=НБ, а также, что кА+БА+нА = кБ+бБ+нБ = 1. Тем не менее, мы не можем предположить, что КA=БA=НA=КБ=ББ=НБ=0, потому что мы на самом деле не знаем, равны ли выигрыши для игрока А и игрока Б. Более того, интуиция подсказывает нам, что они скорее всего неравны! И вот мы получили устрашающую систему уравнений:

КA = 2нБ – бБ

БA = кБ – нБ

НA = бБ – кБ

КБ = нA – бA

ББ = кA – нA

НБ = бA – 2кA

КA = БA = НA

КБ = ББ = НБ

кA + бA + нA = 1

кБ + бБ + нБ = 1

Можно пойти сложным путем и использовать метод замены, но куда проще применить матрицы. Вот как мы поступим: перепишем таблицы выигрышей как матрицы. Вот первая:

КА 0 -1 +2

[ БА +1 0 -1 ]

НА -1 +1 0

Столбец представляет левую сторону первых трех уравнений выше, строка – это кА, третий – бА, а четвертый – нА. Давайте для того, чтобы было более понятно, внесем два изменения: во-первых, сместим столбец вправо, что облегчить работу с ним; во-вторых, поскольку КА=БА=НА, давайте просто заменим их все одной переменной Х, которая будет представлять чистый выигрыш игрока А:

0 -1 +2 X

[ +1 0 -1 X ]

-1 +1 0 X

Это упрощенный метод записи всех трех уравнений, при котором мы опускаем имена переменных, но при этом выстраиваем их в одинаковом порядке, так что каждая колонка представляет отдельную переменную:

0кБ -1бБ +2нБ = X

1кБ +0бБ -1нБ = X

-1кБ +1бБ +0нБ = X

Алгебра говорит нам, что мы можем умножать все в уравнении на константу, и значения останутся прежними (что означает, что мы можем умножить любой столбец матрицы на любую величину, и он останется верным, если мы умножаем все четыре пункта в столбце на одну и ту же величину). Также алгебра говорит нам, что мы можем сложить обе стороны уравнения, и результат будет верным, что означает, что мы можем сложить все элементы двух строк, и получившаяся строка будет верным (и мы можем использовать ее, чтобы приплюсовать к тем строкам, которые уже у нас имеются, или даже заменить существующую строку новым результатом). Также мы можем поменять строки местами, потому что их значения все равно останутся верными вне зависимости от порядка. Нам нужно поместить эту матрицу в так называемую треугольную форму, то есть форму, в которой все, что под диагональю, равняется нулю, а сами диагонали (отмеченные здесь звездочкой) должны нулю не равняться:

*???

[ 0 *?? ]

0 0 *?

Итак, сначала мы перестроим их, поменяв местами верхнюю и среднюю строки:
-1 +1 0 X

[ 0 -1 +2 X ]

+1 0 -1 X

Чтобы избавиться от +1 в нижнем ряду, мы сложим верхнюю и среднюю строкии заменим результатом

-1 +1 0 X

+ +1 0 -1 X

0 +1 -1 2*X

Теперь наша матрица выглядит так:
-1 +1 0 X

[ 0 -1 +2 X ]

0 +1 -1 2*X

Теперь нам нужно избавиться от +1 в нижнем ряду, так что мы складываем среднюю и нижнюю строки и заменяем нижнюю строку результатом:
-1 +1 0 X

[ 0 -1 +2 X ]

0 0 +1 3*X

Теперь мы можем записать все в виде стандартных уравнений и решить, начиная снизу вверх, с помощью метода замены:

>>+1(нБ) = 3*X, таким образом, нБ = 3*X

>>-1(бБ) +2(нБ) = X, таким образом, -1(бБ)+2(3*X) = X, таким образом, бБ = 5*X

>>-1(кБ) + 1(бБ) = X, таким образом, кБ = 4*X

На данном этапе нам необязательно знать значение Х, но что мы знаем, так то, что соотношение для игрока Б таково: 3 Ножниц к 5 Бумаги к 4 Камням. Поскольку нБ+бБ+кБ = 1, это означает:

кБ = 4/12 бБ = 5/12 нБ = 3/12

Мы можем использовать такую же технику для второй серии уравнений, чтобы вычислить оптимальное соотношение для игрока А. Таблица выигрышей будет выглядеть так:

  кА бА нА
КВ   -1 +1
БВ +1   -1
НВ -2 +1  

Матрица будет выглядеть следующим образом:
0 -1 +1 КБ

[ +1 0 -1 ББ ]

-2 +1 0 НБ

Мы снова перестраиваем все, и, поскольку КБ=ББ=НБ, давайте введем для них новую переменную Y (X не будем использовать, чтобы избежать путаницы с предыдущим случаем; помните, что в этом случае выигрыш для одного и другого игроков может различаться). Давайте на этот раз поменяем местами верхнюю и нижнюю строки, а также заменим выигрыши Y:

-2 +1 0 Y

[ +1 0 -1 Y ]

0 -1 +1 Y

Чтобы избавиться от +1 в центральной строке, перед тем, как складывать центральную строку с верхней, мы должны умножить этустроку на 2 (или же умножить верхнююстроку на ½, но мне кажется, что умножать на целые числа легче, чем на дроби):

-2 +1 0 Y

+ +1*2 0*2 -1*2 Y*2

0 +1 -2 Y*3

Теперь наша матрица выглядит так:

-2 +1 0 Y

[ 0 +1 -2 Y*3 ]

0 -1 +1 Y

Сложив вторую и третью строки, чтобы избавиться от -1 в нижней, мы получим:

-2 +1 0 Y

[ 0 +1 -2 Y*3 ]

0 0 -1 Y*4

Опять пойдем снизу вверх и используем замену:
>>нA = -Y*4

>>бA – 2нA = Y*3, таким образом, бA = -Y*5

>>-2кA + бA = Y, таким образом, -2кA = 6Y, таким образом, кA = -Y*3

Итак, может показаться немного странным, что у нас тут сплошные отрицательные числа вместо положительных в прошлом случае. Возможно, это всего лишь побочный эффект того факта, что средний выигрыш для игрока А скорее всего положителен, тогда как выигрыш игрока Б скорее всего отрицателен. Так или иначе, это все выносится за скобки, так как все, что нас интересует, это относительное соотношение Камня к Ножницам к Бумаге. Для игрока А это соотношение – 3 Камня к 4 Ножницам к 5 Бумаги.

кA = 3/12 бA = 5/12 нA = 4/12

Это слегка отличается от оптимального варианта для игрока Б:
кБ = 4/12 бБ = 5/12 нБ = 3/12

Итак, мы можем использовать эти данные для того, чтобы вычислить конкретное преимущество для игрока А. Мы могли бы сделать это, нарисовав таблицу 12х12 и проверив все 144 комбинации, высчитав их все при помощи вероятности, или мы могли бы применить метод Монте-Карло, или просто вставить эти величины в существующие уравнения. Мне представляется наиболее легким последний метод, поскольку у нас уже есть пара уравнений из более ранних примеров, которые прямо относятся к этим:
нA = -Y*4, таким образом, Y = -1/12

кБ = X*4, таким образом, X = +1/12

Мы знаем, что КA = БA = НA и что КБ = ББ = НБ, значит, выигрыш для игрока А равен +1/12, а для игрока Б — -1/12. Это весьма логично и действует как дополнительная проверка: поскольку это все еще игра с нулевой суммой, мы знаем, что выигрыш А должен быть равен отрицательному результату Б. В симметричной игре у них обоих бы получился 0, но эта игра несимметрична. Таким образом, если оба игрока играют оптимально, преимущество удивительно мало: всего лишь один лишний выигрыш из 12 раундов!



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2017-06-11 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: