Пространство стратегий статистика и функция выигрыша.




X — множество стратегий статистика, аналогичное множеству стратегий в антагонистических играх. Если множество X — дискретное, X = (x ,…, x ), тогда можно рассматривать множество ситуаций и множество выигрышей статистика в этих ситуациях: (x , z ), i = , j =

П = (a ) n*m

Эта функция П называется функцией потерь. Значение функции потерь позволяет игроку 1 (статистику) принимать предпринимать правильные действия.

Пример: Задача о яйцах и креме.

  Состояние яйца
Действие Z1 - хорошее Z2- испорченное
долить в остальные 5 яиц, x1 крем из 6 яиц крема нет, загублено 5 хороших яиц
вылить разбитое яйцо на блюдце для контроля, x2 крем из 6 яиц, но надо мыть посуду (блюдце) крем из 6 яиц, надо мыть блюдце "с отвращением"
выбросить яйцо, не глядя, x3 крем из пяти яиц, загублено 1 яйцо крем из 5 яиц

 

Если каким-либо образом оцифровать описание ситуации в виде значений функций потерь, то получим игру с природой.

В описании игры с природой наблюдается полная аналогия с антагонистической игрой. Статистик может принимать чистые стратегии x X и их вероятностные оценки p = p(x ) P, (X, P) — пространство стратегий статистика.

А = (a ), i = ; j =

X = ,…, , m — чистые стратегии статистика;

n — чистые состояния природы;

Z = ,…,

Если используются смешанные стратегии, то каждому из состояний чистой стратегии сопоставляется значение p , i = . Определим вероятность использования смешанных стратегий.

x~ ,…,

q~ ,…, — вероятность состояний природы.

Если эти вероятности известны, то можно определить сравнительные вероятности статистика в этой игре:

M[S , S ] = a *p *q

S — множество (X*P)

S — множество (Z*Q)

p = ; q =

M[S , S ] = p *A*q

Задачу статистика в этой игре можно определить как нахождение такого S , при котором его выигрыш M[S , S ] max. Эта стратегия S может быть как чистой, так и смешанной.

Исходя из этого, в матрице платежей (a ) можно рассматривать доминирующие и доминируемые стратегии.

Доминирование по строкам и доминирование по столбцам теряет смысл, т. к. природа не выиграет и не проиграет, её безразлично её состояние.

С учётом этого матрица платежей X = ,…, не в полной мере характеризует достоинства и недостатки каждой стратегии игроков.

Используют другую форму описания игры, которая более полно отражает степень удачливости в выборе игроков. Одним из таких показателей является матрица рисков:

A =

Номер столбца матрицы совпадает с состоянием природы, номер строки характеризует стратегию игрока. B = max a — максимальный выигрыш статистика при данном состоянии природы j.

R = (r ), i = , j =

r = B - a — разница между максимальным выигрышем и выигрышем, который получит статистик, выбирая стратегию x .

Матрица рисков: R = . В матрице рисков хотя бы один из элементов в каждом столбце должен равняться нулю.

 

Пример: А = ; R =

Если условием выбора стратегии является максимум среднего выигрыша, то по матрице рисков R min. Если же вероятности состояния природы известны (q ), то условие максимума среднего выигрыша и условие минимума среднего риска дают одни и те же стратегии.

Если V = ; V = max V или r = ; r =min r , то решение будут одинаковыми.

 

Пример: Матрица платежей: А = ; q = (0,2; 0,5; 0,3)

V = 1*0,2+ 3*0,5+ 1*0,3 = 2

V = 2*0,2+ 0,5+ 1,2 = 2,1

V = 2,1; V является предпочтительной стратегией: она даёт больший средний выигрыш x .

R = r = 0,2+ 0,9 = 1,1

r = 1 x — риск минимален.

О вероятностях состояния природы в лучшем случае известны их некоторые оценки q’. На практике достоверность этих оценок является слишком низкой для того, чтобы использовать их при оценке качества выбора решений статистика.

В таких условиях лучше:

1. Не пользоваться этими оценками и для выбора решения использовать критерий, который не пользуется понятием вероятности состояния природы;

2. Cчитать все состояния природы равновероятными q = 1/n, i= .

Критерий, позволяющий принять задачу выбора решения, называется критерием выбора решений при неопределённости.

 



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2021-04-20 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: