Допустим, что рассматривается смешанная стратегия:
P(x)= (a).
Возможно два случая:
Нельзя найти ’(а) — другая стратегия, когда потери:
L(V, ’) L(V, ), V Z
Если такая стратегия ’(a) существует, то стратегия (а) допустима.
(а) a = x (a ) p(x )
Стратегия (а) — допустимая, если нельзя найти другую стратегию ’(a): L(V, ’) L(V, ) — условие недопустимости стратегии (а).
Допустимая стратегия не обязательно является предпочтительной. Допустимую стратегию удобно рассматривать в рамках S-игры.
Если V=(V V ), то потери можно рассмотреть на плоскости.
Множество значений этих потерь можно сопоставить с выпуклой линейной оболочкой S*.
Рассмотрим некоторую точку S S*, проведём отрезок из начальных координат в эту точку. Очевидно, что все точки, расположенные на этом луче и множество S* будут давать потери, меньшие, чем потери S*. Наименьшие потери будут а точке S , которая является пересечением луча и нижней левой границы выпуклой оболочки.
Допустимыми могут быть стратегии, принадлежащие участку линейной оболочки, который является дугой AB. Все стратегии, которые определяются точками линейного множества S*, не принадлежащие её левой нижней границе, можно исключить из рассмотрения. А точки, принадлежащие дуге АВ, в некотором смысле эквивалентны, т. к. при перемещении по этим точкам можно уменьшить потери в одном состоянии и увеличить в другом (сразу всё уменьшить невозможно).
Пример: «задача о технологической линии»
Нижняя левая граница состоит из точек C , C и С
WC +(1-W)C WC +(1-W)C
Смешанная стратегия (а) = (W, 1-W, 0), (a) = (0, W, 1-W)
Определим потери статистика для этих стратегий: L(V , ) = W*0 + 1*(1-W) = 1-W, L(V , ) = 5*W + 3(1-W) = 3 + 2W
L(V , ) = 1*W + 3(1-W) = 3 – 2W
L(V , ) = 3W + 2(1-W) = 2+ W
|
Рассмотрим возможные пути выбора смешанных стратегий статистика.
1. Принцип минимакса (min max);
2. Байесовский принцип.
Принцип минимакса ориентирует статистика на выбор такой смешанной стратегии (а), при которой его потери в наихудшем состоянии природы минимальны.
Применим этот принцип для выбора W в задаче.
1 случай:
В наихудшем состоянии природы эти потери определяются прямой V : W = 0 *(0 1 0), потери равны 3.
2 случай:
3 -2W = 2 + W
1 = 3W; W = 1/3
* (0 1/3 2/3); V = 7/3 (цена игры).
В наихудшем состоянии природы потери определяются верхней границей, минимум в точке О.
Иногда значение функции потерь удобно приводить к определённому нулевому уровню. Очевидно, для нахождения состояния природы L(V , a ) L(V , a )
Этот минимум определяет минимальные затраты, которые может понести статистик при каждом состоянии природы.
L’(V, ) = L(V, ) - L(V, a)
В предыдущей задаче о ПДК потери определялись следующим образом:
V | a1 | a2 | a3 |
V1 | 1-0=1 | 3-0=3 | |
V2 | 5-2=3 | 3-2=1 | 2-2=0 |
Очевидно, что принцип минимакса можно применять и для дополнительных потерь.
Байесовский принцип направлен на принятие решения, исходя из априорных оценок вероятностей состояния природы.
q(V) (V)
Если q — априорная вероятность состояния природы, то можно говорить о потерях:
L(, ) =
Матрица потерь статистика в игре:
* =
(V ), i =
L(, ) = L(V , a ) * (a ) * (V ) min
Наилучшей стратегией будет та, при которой байесовские потери L(, ) будут минимальными. Аналогично можно применить байесовский принцип при дополнительных потерях.
Пример: (та же задача)
1 ситуация:
(V ) = 0,6. Найдём оптимальную байесовскую стратегию в этой задаче.
|
(V ) = 0,4
L() = (1-W)*0,6 + (3 + 2W)*0,4 = 1,8 + 0,2W 1,8 при W = 0.
(0, 1, 0) – нужно применять вторую технологию.
2 ситуация:
L() = 0,6*(3-2W) + 0,4(2 + W) = 2,6 – 0,8W min W=1