Лекция №2: Элементы теории игр
Понятие об играх и стратегиях
Классификация игр
Запись матричной игры в виде платёжной матрицы
Понятие о нижней и верхней цене игры.
Решение игр в чистых стратегиях
Понятие о матричных играх со смешанным расширением
Решение матричных игр со смешанным расширением методами линейного программирования
Понятие об играх и стратегиях
Определение. "Игра (в математике) - это идеализированная математическая модель коллективного поведения: несколько игроков влияют на исход игры, причем их интересы различны".
Регулярное действие, выполняемое игроком во время игры, называется ходом. Совокупность ходов игрока, совершаемых им для достижения цели игры, называется стратегией.
Классификация игр
Классификацию игр можно проводить: по количеству игроков, количеству стратегий, характеру взаимодействия игроков, характеру выигрыша, количеству ходов, состоянию информации и т.д.
В зависимо сти от количества игр оков различают игры двух и п игроков. Первые из них наиболее изучены. Игры трёх и более игроков менее исследованы из-за возникающих принципиальных трудностей и технических возможностей получения решения.
По количеству стратегий игры делятся на конечные и бесконечные. Если в игре все игроки имеют конечное число возможных стратегий, то она называется конечной. Если же хотя бы один из игроков имеет бесконечное количество возможных стратегий, игра называется бесконечной.
По характеру взаимодействия игры делятся на бескоалиционные: игроки не имеют права вступать в соглашения, образовывать коалиции; коалиционные (кооперативные) - могут вступать в коалиции. В кооперативных играх коалиции заранее определены.
По харак те ру выигрыш ей игры делятся на: игры с нулевой суммой (общий капитал всех игроков не меняется, а перераспределяется между игроками; сумма выигрышей всех игроков равна нулю) и игры с ненулевой.
По виду функций выигрыша игры делятся на: матричные, биматричные, непрерывные, выпуклые и др.
Матричная игра - это конечная игра двух игроков с нулевой суммой, в которой задаётся выигрыш игрока 1 в виде матрицы (отрока матрицы соответствует номеру применяемой стратегии игрока I, столбец номеру применяемой стратегии игрока 2; на пересечении строки п столбца матри- цы находится выигрыш игрока 1, соответствующий применяемым стратегиям).
Для матричных игр доказано, что любая из них имеет решение и оно может быть легко найдено путём сведения игры к задаче линейного программирования.
Биматричная игра - это конечная игра двух игроков с ненулевой суммой, в которой выигрыши каждого игрока задаются матрицами отдельно для соответствующего игрока (в каждой матрице строка соответствует стратегии игрока 1, столбец - стратегии игрока 2, на пересечении строки и столбца в первой матрице находится выигрыш игрока 1, во второй матрице - выигрыш игрока 2.)
Непрерывной считается игра, в которой функция выигрышей каждого игрока является непрерывной. Доказано, что игры этого класса имеют решения, однако не разработано практически приемлемых методов их нахождения.
Если функция выигрышей является выпуклой, то такая игра называется выпуклой. Для них разработаны приемлемые методы решения, состоящие в отыскании чистой оптимальной стратегии (определённого числа) для одного игрока и вероятностей применения чистых оптимальных стратегий другого игрока. Такая задача решается сравнительно легко.
Запись матричной игры в виде платёжной матрицы
В общем виде матричная игра может быть записана следующей платёжной матрицей,
где: А i- названия стратегий игрока 1,
Вj — названия стратегий игрока 2,
aij- значения выигрышей игрока 1 при выборе им i - й стратегии, а игроком 2 – j-й стратегии
Поскольку данная игра является игрой с нулевой суммой, значение выигрыша для игрока 2 является величиной, противоположной по знаку значению выигрыша игрока 1.
Bl | B2 | ... | Bn | |
Al | a11 | a12 | a1n | |
A2 | a21 | a22 | a2n | |
Am | am1 | am2 | amn |
Рис. 1.1. Общий вид платёжной матрицы матричной игры
Понятие о нижней и верхней цене игры.
Решение игры в чистых стратегиях
Каждый из игроков стремится максимизировать свой выигрыш с учётом поведения противодействующего ему игрока. Поэтому для игрока 1 необходимо определить минимальные значения выигрышей в каждой из стратегий, а затем найти максимум из этих значений, то есть определить величину
VH = max i min j aij,
или найти минимальные значения по каждой из строк платёжной матрицы, а затем определить максимальное из этих значений. Величина VH называется максимином матрицы или нижней ценой игр ы.
Величина выигрыша игрока 1 равна, по определению матричной игры, величине проигрыша игрока 2. Поэтому для игрока 2 необходимо определить значение
VВ = min j max i aij,
или найти максимальные значения по каждому из столбцов платёжной матрицы, а затем определить минимальное из этих значений. Величина VB называется минимаксом матрицы или верхней ценой игры.
В случае, если значения VH и VB не совпадают, при сохранении правил игры (коэффициентов aij) в длительной перспективе, выбор стратегий каждым из игроков оказывается неустойчивым. Устойчивость он приобретает лишь при равенстве VH = VB = V. В этом случае говорят, что игра
имеет решение в чистых стратегиях, а стратегии, в которых достигается V - оптимальными чистыми стратегиями. Величина V называется чистой ценой игры.
Например, в матрице
Bl | B2 | B3 | B4 | Min j | |
Al | |||||
A2 | |||||
A3 | |||||
Max i |
Рис. 1.2. Платёжная матрица, в которой существует решение в чистых стратегиях
существует решение в чистых стратегиях. При этом для игрока 1 оптимальной чистой стратегией будет стратегия А1, а для игрока 2 - стратегия В4.
Bl | B2 | B3 | B4 | Min j | |
Al | |||||
A2 | |||||
A3 | |||||
Max i |
Рис. 1.3. Платёжная матрица, в которой не существует решения в чистых стратегиях
В матрице (рис. 1.3) решения в чистых стратегиях не существует, так как нижняя цена игры (максимальный гарантированный выигрыш игрока 1) достигается в стратегии А1 и её значение равно 2, в то время как верхняя цена игры (минимум потерь игрока 2) достигается в стратегии В4 и её значение равно 3.