Платёжная матрица теории игр




Лекция 7: ИСПОЛЬЗОВАНИЕ ТЕОРИИ ИГР В ПРИНЯТИИ УПРАВЛЕНЧЕСКИХ РЕШЕНИЙ

7.1. Постановка задачи

7.2. Методы оценки выбора решения

 

 

7.1.. При решении ряда практических задач приходится анализировать ситуации, в которых сталкиваются две (или более) враждующие стороны, преследующие различные цели, причем результат любого мероприятия каждой из сторон зависит от того, какой образ действий выберет противник. Такие ситуации можно отнести к конфликтным ситуациям.

Эти ситуации принятия решений отличаются от рассмотренных ранее, где природа не рассматривается в роли недоброжелателя.

 

Теория игр является математической теорией конфликтных ситуаций, при помощи которой можно выработать рекомендации по рациональному образу действий участников конфликта.

 

В экономике конфликтные ситуации встречаются часто и имеют многообразный характер. К ним относятся, например, взаимоотношения между поставщиком и потребителем, покупателем и продавцом, банком и клиентом. В этих примерах конфликтная ситуация порождается различием интересов партнеров и стремлением каждого из них принимать решения, которые реализуют поставленные цели в наибольшей степени. При этом каждому приходится считаться не только со своими целями, но и с целями партнера, и учитывать неизвестные заранее решения, которые эти партнеры будут принимать.

 

ИГРОЙ называется всякая конфликтная ситуация, изучаемая в теории игр и представляющая собой упрощенную, схематизированную модель ситуации.

Всякая игра включает в себя три элемента: участников игры – игроков, правила игры, оценку результатов действий игроков. Количественная оценка результатов игры называется платежом.

Допустимые действия каждого из игроков, направленные на достижение некоторой цели, называются правилами игры.

Стратегией игрока называется совокупность правил, определяющих выбор варианта действий при каждом личном ходе в зависимости от сложившейся ситуации.

Игра называется парной, если в ней участвуют два игрока, и множественной, если число игроков больше двух. Первые из них наиболее изучены. Игры трёх и более игроков менее исследованы из-за возникающих принципиальных трудностей и технических возможностей получения решения.

 

Важнейшее ограничение теории игр - единственность выигрыша как показателя эффективности, в то время как в большинстве реальных экономических задач имеется более одного показателя эффективности.

 

Для задания такой игры достаточно выписать так называемую платежную матрицу, в которой строки соответствуют стратегиям первого игрока, а столбцы – стратегиям второго игрока. Элементами матрицы служат выигрыши первого игрока.

В этой игре, как было сказано выше, участвуют два игрока А и В, имеющих противоположные интересы: выигрыш одного равен проигрышу другого. Так как выигрыш игрока А равен выигрышу игрока В с обратным знаком, мы можем интересоваться только выигрышем игрока А.

Естественно, А хочет максимизировать свой выигрыш, а В – минимизировать свой проигрыш. Пусть у игрока А имеется n возможных стратегий А1, А2,...,Аn, а у противника – m – возможных стратегий В1, В2,..., Вm (такая игра называется игрой n´m). Обозначим аij выигрыш игрока А в случае, если мы пользуемся стратегией Аi, а противник – стратегией Вj. Предположим, что для каждой пары стратегий (Аi, Вj) выигрыш (или средний выигрыш) аij нам известен. Тогда в принципе можно составить прямоугольную таблицу (матрицу), в которой перечислены стратегии игроков и соответствующие выигрыши (табл.1).

Таблица 1

Платёжная матрица теории игр

B A В1 В2 ... Вm
А1 а11 а12   а1m
А2 а21     а2m
...        
Аn an1     аnm

 

Если такая таблица составлена, то говорят, что игра приведена к матричной форме. Такая таблица называется платежной матрицей или просто матрицей игры.

 

Понятие о нижней и верхней цене игры:

 

Каждый из игроков стремится максимизировать свой выигрыш с учётом поведения противодействующего ему игрока. Поэтому для игрока 1 необходимо определить минимальные значения выигрышей в каждой из стратегий, а затем найти максимум из этих значений, то есть определить величину:

α = maxi minj aij,

 

или найти минимальные значения по каждой из строк платёжной матрицы, а затем определить максимальное из этих значений. Величина α называется максимином матрицы или нижней ценой игры. Величина α – это тот гарантированный минимум, который мы можем себе обеспечить, придерживаясь своей наиболее осторожной стратегии.

 

Величина выигрыша игрока 1 равна, по определению матричной игры, величине проигрыша игрока 2. Поэтому для игрока 2 необходимо определить значение:

 

β = minj maxi aij.

 

 

или найти максимальные значения по каждому из столбцов платёжной матрицы, а затем определить минимальное из этих значений. Величина β называется минимаксом матрицы, верхней ценой игры.

Соответствующая выигрышу стратегия противника называется его минимаксной стратегией. Придерживаясь своей наиболее осторожной минимаксной стратегии, противник гарантирован, что в любом случае он проиграет не больше β..

В случае, если значения α и β не совпадают, выбор стратегий каждым из игроков оказывается неустойчивым. Устойчивость он приобретает лишь при равенстве α = β = V.

В этом случае говорят, что игра имеет решение в чистых стратегиях, а стратегии, в которых достигается V - оптимальными чистыми стратегиями. Величина V называется чистой ценой игры (или седловой точкой).

 

Платежная матрица теории игр

 

Имеет седловую точку Не имеет седловую точку

(решение в чистых стратегиях) (решение в смешанных стратегиях)

 

7.2. Методы оценки выбора решения

 



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2017-06-21 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: