В связи с возможными изменениями погоды определить стратегию фирмы в выпуске продукции, обеспечивающую ей максимальный доход.




Шаг:3

Сравним нижнюю и верхнюю цены игры, в данной задаче они различаются, т.е. α ≠ β, платежная матрица не содержит седловой точки. Это значит, что игра не имеет решения в чистых минимаксных стратегиях, но она всегда имеет решение в смешанных стратегиях.

Смешанная стратегия,это чередуемые случайным образом чистыестратегии, с определенными вероятностями (частотами).

Смешанную стратегию игрока "А" будем обозначать

A1 A2 A3 A4


S A=


 

p1 p2 p3 p4


 

где A1, A2, A3, A4 - стратегии игрока "A", а p1, p2, p3, p4 - соответственно вероятности (частоты), с которыми эти стратегии применяются, причем p1 + p2 + p3 + p4 = 1.

Аналогично смешанную стратегию игрока "В" будем обозначать

B1 B2

S B= q1 q2

где B1, B2 - стратегии игрока "B", а q1, q2 - соответственно вероятности, с которыми эти стратегии применяются, причем q1 + q2 = 1.

Оптимальная смешанная стратегия для игрока "А" та, которая обеспечивает ему максимальный выигрыш. Соответственно для "B" - минимальный проигрыш. Обозначаются эти стратегии S A* и S B* соответственно. Пара оптимальных стратегий образует решение игры.

В общем случае в оптимальную стратегию игрока могут входить не все исходные стратегии, а только некоторые из них. Такие стратегии называются активными стратегиями.

Шаг:4

Для определения оптимальных стратегий игроков проведем упрощение платежной матрицы.

Сравнивая стратегии A1 и A3 (см. Табл.2) видим, что A1 является заведомо невыгодной относительно A3, поэтому удалим стратегию A1из платежной матрицы и получим игру представленную в таблице 3.

Таблица 3

         
    Стратегии "B"
         
         
Стратегии "A"   B1   B2
         
A2       -1
         
A3        
         
A4        
         

Сравнивая стратегии A2 и A3 (см. Табл.3) видим, что A2 является заведомо невыгодной относительно A3, поэтому удалим стратегию A2из платежной матрицы и получим игру представленную в таблице 4.

Таблица 4

 

         
    Стратегии "B"
         
         
Стратегии "A"   B1   B2
         
A3        
         
A4        
         
         

Из последней таблицы (табл. 4) видно, что игроку "A" следует искать свою оптимальную стратегию, смешивая случайным образом стратегии A3 и A4, а игроку "B" стратегии B1 и B2.

Шаг:5

Найдем оптимальную смешанную стратегию для игрока S A*= A3 A4  
     
"A": p 3 p 4  
   
     
         

 

где: p 3, p 4 - вероятности (частоты) с которыми применяются соответственно стратегии A3 и A4

 

Из теории игр известно, что если игрок "А" использует свою оптимальную стратегию, а игрок "B" остается в рамках своих активных стратегий, то средний выигрыш остается неизменным и равным цене игры v независимо от того как игрок "В" использует свои активные стратегии. А в нашем случае обе стратегии активные, иначе игра бы имела решение в чистых стратегиях. Поэтому если предположить, что игрок "В" будет пользоваться чистой стратегией B1, то средний выигрыш v составит:

k31p3 + k41p4 = v (1)

где: k ij - элементы платежной матрицы.

 

C другой стороны, если предположить, что игрок "В" будет пользоваться чистой стратегией B2, то средний выигрыш составит:

k32p3 + k42p4 = v (2)

Приравняв левые части уравнений (1) и (2) получим:

 

k31p3 + k41p4 = k32p3 + k42p4

А с учетом того, что p 3 + p 4 = 1 имеем:

k31p3 + k41(1 - p3) = k32p3 + k42(1 - p3)

 

Откуда несложно найти оптимальную частоту стратегии A3:

 

p 3=   k 42- k 41   (3)
k 31+ k 42- k 32- k 41  
В данной задаче:        
p 3= 4 - 2   = 1
5 + 4 - 3 - 2    

 

Вероятность р 4 найдем вычитанием р 3 из единицы:

 

p 4= 1 - p 3=1 - 1 = 1
   

Шаг:6              
Вычислим цену игрыподставив р 3, р 4в уравнение(1):          
  1 1 7        
v = k31p3 + k41p4 = 5· 2 + 2 · 2 =          
Шаг:7              
Найдем оптимальную смешанную стратегию для игрока S B*=   B1 B2
 
     
"B":         q 1 q 2
         
           
               

где: q 1, q 2 - вероятности (частоты) с которыми применяются соответственно стратегии B1 и B2

 

Из теории игр известно, что если игрок "B" использует свою оптимальную стратегию, а игрок "A" остается в рамках своих активных стратегий, то средний выигрыш остается неизменным и равным цене игры v независимо от того как игрок "А" использует свои активные стратегии. Поэтому если предположить, что игрок "A" будет пользоваться чистой стратегией A3, то средний выигрыш v составит:

k31q1 + k32q2 = v (4)

 

Поскольку цена игры v нам уже известна и учитывая, что q 1 + q 2 = 1, то

оптимальная частота стратегии B1 может быть найдена как:
q 1= v - k 32     (5)
k 31- k 32  
     
В данной задаче:            
  7 - 3   1
q 1=2 =
             
    - 3  
     

 

Вероятность q 2 найдем вычитанием q 1 из единицы:

 

q 2= 1 - q 1=1 - 1 = 3
   
       

 

Ответ:Нижняя цена игры: α = 3 Верхняя цена игры: β = 4 7    
Цена игры: v = 2    
  A3 A4
Оптимальная стратегия игрока "А": S A* = 1 1
     
  B1 B2
 
 
Оптимальная стратегия игрока "B": S B* = 1 3
     
     


2. Торговая фирма разработала несколько вариантов плана продаж товаров на предстоящей ярмарке с учетом конъюнктуры рынка и спроса покупателей. Получающиеся от их возможных сочетаний показатели дохода представлены в таблице.

Определить оптимальную стратегию фирмы в продаже товаров на ярмарке.Если существует риск (вероятность реализации плана П1b%, П2с %, П3d %),то какую стратегию фирме следует считать оптимальной?

Рассмотрим игру двух лиц, интересы которых противоположны. Такие игры называют антагонистическими играми двух лиц. В этом случае выигрыш одного игрока равен проигрышу второго, и можно описать только одного из игроков.

Предполагается, что каждый игрок может выбрать только одно из конечного множества своих действий. Выбор действия называют выбором стратегии игрока.

Если каждый из игроков выбрал свою стратегию, то эту пару стратегий называют ситуацией игры. Следует заметить, каждый игрок знает, какую стратегию выбрал его противник, т.е. имеет полную информацию о результате выбора противника.

Чистой стратегией игрока I является выбор одной из n строк матрицы выигрышей А, а чистой стратегией игрока II является выбор одного из столбцов этой же матрицы.

1. Проверяем, имеет ли платежная матрица седловую точку. Если да,товыписываем решение игры в чистых стратегиях.Считаем, что игрок I выбирает свою стратегию так, чтобы получить максимальный свой выигрыш, а игрок II выбирает свою стратегию так, чтобы минимизировать выигрыш игрока I.

Игроки B1 B2 B3 a = min(Ai)
         
A1        
         
A2        
         
A3        
         
b = max(Bi)        
         

Находим гарантированный выигрыш, определяемый нижней ценой игры a = max(ai) = 2, которая указывает на максимальную чистую стратегию A1. Верхняя цена игры b = min(bj) = 3.

 

Что свидетельствует об отсутствии седловой точки, так как a ≠ b, тогда цена игры находится в пределах 2 ≤ y ≤ 3. Находим решение игры в смешанных стратегиях. Объясняется это тем, что игроки не могут объявить противнику свои чистые стратегии: им следует скрывать свои действия. Игру можно решить, если позволить игрокам выбирать свои стратегии случайным образом (смешивать чистые стратегии).

 

2. Проверяем платежную матрицу на доминирующие строки и доминирующие столбцы.

 

Иногда на основании простого рассмотрения матрицы игры можно сказать, что некоторые чистые стратегии могут войти в оптимальную смешанную стратегию лишь с нулевой вероятностью.

 

Говорят, что i-я стратегия 1-го игрока доминирует его k-ю стратегию, если aij ≥ akj для всех j Э N и хотя бы для одного j aij > akj. В этом случае говорят также, что i-я стратегия (или строка) – доминирующая, k-я – доминируемая. Говорят, что j-я стратегия 2-го игрока доминирует его l-ю стратегию, если

 

для всех j Э M aij ≤ ail и хотя бы для одного i aij < ail. В этом случае j-ю стратегию(столбец)называют доминирующей, l-ю –доминируемой.

 

В платежной матрице отсутствуют доминирующие строки.

В платежной матрице отсутствуют доминирующие столбцы.

 

Так как игроки выбирают свои чистые стратегии случайным образом, то выигрыш игрока I будет случайной величиной. В этом случае игрок I должен выбрать свои смешанные стратегии так, чтобы получить максимальный средний выигрыш.

 

Аналогично, игрок II должен выбрать свои смешанные стратегии так, чтобы минимизировать математическое ожидание игрока I.

 

3. Находим решение игры в смешанных стратегиях.

 

Запишем систему уравнений. Для игрока I

2p1+4p2+3p3 = y

3p1+2p2+2p3 = y

 

3p1+p2+4p3 = y p1+p2+p3 = 1

Для игрока II

2q1+3q2+3q3 = y

4q1+2q2+q3 = y

3q1+2q2+4q3 = y

q1+q2+q3 = 1

 

Решая эти системы методом Гаусса (решение см. ниже), находим: y = 25/8

 

p1 = 5/8 (вероятность применения 1-ой стратегии). p2 = 1/4 (вероятность применения 2-ой стратегии). p3 = 1/8 (вероятность применения 3-ой стратегии).

 

Оптимальная смешанная стратегия игрока I: P = (5/8; 1/4; 1/8) q1 = 3/8 (вероятность применения 1-ой стратегии).

 

q2 = 1/2 (вероятность применения 2-ой стратегии). q3 = 1/8 (вероятность применения 3-ой стратегии).

Оптимальная смешанная стратегия игрока II: Q = (3/8; 1/2; 1/8)

 

Цена игры: y = 25/8

 

Исходные данные:

     
     
     
     
     
     

 

Поскольку необходимо минимизировать затраты, то модифицируем матрицу умножением всех элементов на (-1) и затем сложением их с максимальным элементом матрицы (4) так, чтобы матрица не содержала бы отрицательных элементов. Тем самым сводим решение к поиску минимальной функции.

 

     
     
     
     
     
     

 

Критерий Байеса.

По критерию Байеса за оптимальные принимается та стратегия (чистая) Ai, при которой максимизируется средний выигрыш a или минимизируется средний риск r.

Считаем значения ∑(aijpj)

 

∑(a1,jpj) = 2•35 + 1•35 + 1•35 = 140 ∑(a2,jpj) = 0•35 + 2•35 + 3•35 = 175 ∑(a3,jpj) = 1•35 + 2•35 + 0•35 = 105

Ai П1 П2 П3 ∑(aijpj)
         
         
A1        
         
A2        
         
A3        
         
pj        
         

 

Выбираем из (140; 175; 105) максимальный элемент max=175 Вывод: выбираем стратегию N=2.

Таким образом, в результате решения статистической игры по различным критериям чаще других рекомендовалась стратегия A2.

3. Фирма производит пользующиеся спросом детские платья и костюмы, реализация которых зависит от состояния погоды. Затраты фирмы в течение апреля-мая на единицу продукции составят: платья — А ден. ед., костюмы — В ден. ед. Цена реализации составит С ден. ед. и D ден. ед. соответственно.

По данным наблюдений за несколько предыдущих лет, фирма может реализовать в условиях теплой погоды Е шт. платьев и К шт. костюмов, при прохладной погоде — М шт. платьев и N шт. костюмов.

В связи с возможными изменениями погоды определить стратегию фирмы в выпуске продукции, обеспечивающую ей максимальный доход.

Задачу решить графическим методом и с использованием критериев игр с природой, приняв степень оптимизма α, указанную в таблице.

Решение:

Фирма располагает двумя стратегиями: А1 – в этом году будет теплая погода, А2 – в этом году будет прохладная погода.

Если фирма примет стратегию А1 и в действительности будет теплая погода (стратегия природы В1), то выпущенная продукция (1370 платьев и 530 костюмов) будет реализована и доход составит:

1390 (20 - 11) + 580 (85- 38) = 39770

Если же погода будет прохладной (стратегия природы В1), то костюмы будут проданы полностью, а платья только в количестве 450 шт. и часть платьев останется нереализованной. Доход составит:

465 (20- 11) + 580 (85 - 38) – 11 (1390 - 465) = 21270

Если фирма примет стратегию А2 и погода будет холодной, то доход составит:

465 (20 –11) + 960 (85 - 38) = 49305

При теплой погоде составит:

465 (20- 11) + 580 (85 - 38) – 38 (580 - 465) = 27075

Поскольку необходимо минимизировать затраты, то модифицируем матрицу умножением всех элементов на (-1) и затем сложением их с максимальным элементом матрицы (49305) так, чтобы матрица не содержала бы отрицательных элементов. Тем самым сводим решение к поиску минимальной функции.

 

   
   
   
   

 

 

Критерий Вальда.

 

По критерию Вальда за оптимальную принимается чистая стратегия, которая в наихудших условиях гарантирует максимальный выигрыш, т.е.

a = max(min aij)

 

Критерий Вальда ориентирует статистику на самые неблагоприятные состояния природы, т.е. этот критерий выражает пессимистическую оценку ситуации.

Ai П1 П2 min(aij)
       
A1      
       
A2      
       

 

Выбираем из (9535; 0) максимальный элемент max=9535 Вывод: выбираем стратегию N=1.

Критерий Севиджа.

 

Критерий минимального риска Севиджа рекомендует выбирать в качестве оптимальной стратегии ту, при которой величина максимального риска минимизируется в наихудших условиях, т.е. обеспечивается:

a = min(max rij)

 

Критерий Сэвиджа ориентирует статистику на самые неблагоприятные состояния природы, т.е. этот критерий выражает пессимистическую оценку ситуации.

Находим матрицу рисков.

Риск –мера несоответствия между разными возможными результатамипринятия определенных стратегий. Максимальный выигрыш в j-м столбце bj = max(aij) характеризует благоприятность состояния природы.

1. Рассчитываем 1-й столбец матрицы рисков.

r11 = 9535 - 9535 = 0; r21 = 9535 - 0 = 9535;

2. Рассчитываем 2-й столбец матрицы рисков.

r12 = 28035 - 28035 = 0; r22 = 28035 - 22230 = 5805;

Ai П1   П2
       
A1      
       
A2      
       
       

Результаты вычислений оформим в виде таблицы.

Ai П1 П2 max(aij)
       
A1      
       
A2      
       

 

Выбираем из (0; 9535) минимальный элемент min=0 Вывод: выбираем стратегию N=1.

 

Критерий Гурвица.

 

Критерий Гурвица является критерием пессимизма - оптимизма. За оптимальную принимается та стратегия, для которой выполняется соотношение:

max(si)

где si = y min(aij) + (1-y)max(aij)

 

При y = 1 получим критерий Вальде, при y = 0 получим – оптимистический критерий (максимакс).

 

Критерий Гурвица учитывает возможность как наихудшего, так и наилучшего для человека поведения природы. Как выбирается y? Чем хуже последствия ошибочных решений, тем больше желание застраховаться от ошибок, тем y ближе к 1.

Рассчитываем si.

s1 = 0.3•9535+(1-0.3)•28035 = 22485 s2 = 0.3•0+(1-0.3)•22230 = 15561

 

Ai П1 П2 min(aij) max(aij) y min(aij) + (1-y)max(aij)
           
A1          
           
A2          
           

 

Выбираем из (22485; 15561) максимальный элемент max=22485 Вывод: выбираем стратегию N=1.

Таким образом, в результате решения статистической игры по различным критериям чаще других рекомендовалась стратегия A1.

4. Решить задачу с использованием "дерева" решений.

 

Фирма планирует построить среднее или малое предприятие по производству пользующейся спросом продукции. Решение о строительстве определяется будущим спросом на продукцию, которую предполагается выпускать на планируемом предприятии.

 



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2018-01-30 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: