Критерий максимального ожидаемого платежа
Принятие решений по критерию максимального ожидаемого платежа основывается на модельном представлении операции в виде платежной матрицы. Выбор наилучшего решения осуществляется по максимальному значению ожидаемого платежа среди ожидаемых платежей для всех возможных решений.
1. Считаем ожидаемый платеж для каждой строке по формуле ai = ai1*p1+ai2*p2+…+ain*pn
2. Выбираем максимальное его значение по строкам.
Альтернативы | Состояния Природы | МОП | |||
c1 | c2 | … | cn | ||
A1 | a11 | a12 | … | a1n | a1=a11p1+a12p2+…+a1npn |
A2 | a21 | a22 | ... | a2n | a2=a21p1+a22p2+..+a2npn |
… | … | … | … | … | … |
An | an1 | an2 | … | ann | an=an1p1+an2p2+…+annpn |
веротности | p1 | p2 | … | pn | p1+p2+…+pn=1 |
критерий минимального ожидаемого риска
Данный метод принятия решения основывается на матрице рисков и величине ожидаемого риска, вычисляемого для каждого решения.
1. Считаем ожидаемый риск для каждой строки по формуле ri =ri1*p1+ri2*p2+…+rin*pn
2. Выбираем самое маленькое его значение по строкам, это и есть ответ.
Альтернативы | Состояния Природы | МОР | |||
c1 | c2 | … | cn | ||
A1 | r11 | r12 | … | r1n | r1=r11p1+r12p2+…+r1npn |
A2 | r21 | r22 | … | r2n | r2=r21p1+r22p2+…+r2npn |
… | … | … | … | … | … |
An | rn1 | rn2 | … | rnn | rn=rn1p1+rn2p2+…+rnnpn |
Вероятности | p1 | p2 | … | pn | p1+p2+…+pn=1 |
§ Неопределенность
Модели принятия решений в условиях полной неопределенности характеризуются наличием нескольких состояний Природы, нескольких альтернатив, а также тем, что вероятности наступления состояний Природы неизвестны. При принятии решения допускается, что вероятности по умолчанию одинаковы.
· Лаплас
Особенность этого критерия заключается в том, что любое состояние природы может наступить с одинаковой вероятностью.
|
Алгоритм:
1. построить платежную матрицу
2. в каждой строке платежной матрицы посчитать сумму платежей для каждого состояния природы. Т.е. li(критерий Лапласа) = ai1 + ai2 … + ain
3. выбрать максимальное значение критерия Лапласса, что и будет наилучгим решением
· Вальд
Максиминный критерий Вальда (или критерий пессимизма) – при выборе решений ЛПР ориентируется на наступление наихудших условий.
Выбранное решение по этому критерию позволяет получить выгоду даже при наступлении неблагоприятного состояния природы. Этот критерий применим для осторожного и не склонного к риску ЛПР.
Алгоритм применения критерия Вальда:
1. построить платежную матрицу
2. в каждой строке платежной матрицы (i) выбрать минимальную вел-ну платежа
3. из всех минимальных платежей выбрать самый максимальный платеж, что и будет наилучшим решением.
ai =max{min aij}
· Максимасный
Критерий оптимизма. ЛПР, который принимает решения согласно этому критерию, склонен к риску и считает, что обязательно наступит такое состояние природы, при котором его выигрыш будет максимальным.
Алгоритм:
1. строим платежную матрицу
2. в каждой строке платежной матрицы, соответствующей определенной альтернативе выбрать максимальное значение (платежа)
3. из всех максимальных платежей выбрать самое максимальное значение, что и будет наилучшим решением
ai =max{mах aij}
· Сэвидж
Критерий относится к пессимистичным критериям. ЛПР, который принимает решения по этому критерию, считает, что надо готовится к наступлению наихудшего состоянию природы. Отличие этого критерия в том, что он оперирует с матрицей рисков, построенной на основе матрицы платежей.
|
Алгоритм:
1. построить платежную матрицу
2. в каждом столбце платежной матрицы надо определить максимальный платеж, после чего вычесть из максимального платежа поочередно каждое значение из этого столбца.
C1 |
Риск | r1 |
8-2 | |
8-8 | |
8-5 |
3. строим матрицу рисков
4. в каждой строке матрицы рисков (i), соответствующей определенному возможному решению, выбираем максимальный риск
5. из всех найденных максимальных рисков выбираем самый минимальный, решение соответствующее ему и будет наилучшим.
· Гурвиц
В критерии Гурвица по платежной матрице для каждого возможного решения(в каждой строке) вычисляем выражение:
H = max {α* min aij + (1- α) max aij }, где коэффициент α определяется ЛПР исходя из своих индивидуальных соображений и своей склонности к риску. 0≤α≤1.
Алгоритм:
1. Построить платежную матрицу
2. В каждой строке платежной матрицы решения выбрать минимальный платеж (как в критерии Вальда) и максимальный платеж (как в максимаксном критерии)
3. Назначить критерии α
4. Для каждого решения рассчитать H = max {α* min aij + (1- α) max aij }
5. Решение, соответствующее максимальному значению H и будет наилучшим
· Принятие решений в условиях неопределенности
o Природа
Природа – объективно существующие условия или обстановка, в которых приходится принимать решения, на которые человек не может оказать воздействие и которые наступают независимо от его действий.
Особенности:
1. объективность – т.е. независимость от желаний и действий человека
|
2. нейтральность – т.е. активно не противостоит действиям человека, не игрок
o Платежная матрица
Структурирует операцию, проводимую в условиях неопределенности, относительно наступления тех или иных состояний природы, помогает ЛПР смоделировать множество альтернатив и состояний природы и принять обоснованное решение.
Альтернативы | Платежи при различных состояниях природы | |||
С1 | С2 | … | Сn | |
A1 | A11 | A12 | … | A1n |
A2 | A21 | A22 | … | A2n |
… | … | … | … | … |
am | Am1 | Am2 | … | amn |
Составляется след образом:
· Исходя из проводимой операции или мероприятия, в котором необходимо принимать решения, определяется состояние природы
· Определяются все возможные состояния природы, которые могут реализовываться в действительности
· Вырабатываются все возможные варианты решений
· Определяется формула для расчета величины платежа (выигрыша или проигрыша)
· Последовательно, одно за другим, начиная с первого, просматривается каждое решение при каждом состоянии природы и определяются значения платежей.
o Дерево решений
Дерево решений используется в моделях принятия решений в условиях риска и отражают структуру проблемы, где необходимо принять решение.
Дерево решений – это графическое представление процесса принятия решения, в котором отображаются все возможные варианты решений, состояния природы, вероятности их наступления, а так же платежи при различных состояниях природы и возможных решений.
Дерево решений состоит из узлов и ветвей, которые в свою очередь могут быть трех видов.
Виды узлов:
1. узел решений – момент времени, когда ЛПР принимает решение
2.
Узел событий - соответствует моменту времени, в котором исходы решений носят случайный характер
3. конечный узел, которым заканчиваются все ветви решений или ветви событий
Ветви:
1. Ветви решений исходят из узла решений и соответствуют возможным решениям, возле ветвей решений проставляются величины затрат, связанные с принятием данного решения.
2. Ветви событий исходят из узла событий и соответствуют случайным исходам решений.
3. Конечные ветви заканчивают дерево решений и оканчиваются конечным узлом
o Многокритериальные задачи
1. F1(x)=>max(min)
F2(x)=>max(min)
………………………..
Fn(x)=>max(min)
2. XэОДР
3. Субъективность (А1>A2>A3)
Методы решения
1. Метод ведущего критерия
o Ранжировать критерии в порядке валености F1>F2…>Fn
o Берется каждый критерий Fi, и для него решается обычная задача оптимизации Fi=>max(min)
o Находится max или min Fi каждого
o Выбираете главный критерий F1, а все остальные критерии становятся ограниченными
Если Fi=> max, то
Fi>= Fimax-∆F1
Если Fi=> min,то
Fi<=Fimin+∆F1, где ∆F1 – уступка
o Конечный вид задачи
F1=> max (min)
Fi<=Fi min+ ∆Fi
2. Метод последовательных уступок
o F1>F2>…>Fn
o Оставляем самый высокий критерий, остальное отбрасываем. Решаем задачу обычную для самого важного, F1=> max(min)
o Находим F1 max(min)
o ЛПР назначает уступку ∆F1
Если F1=>max,то F1>=F1max-∆F1
Если F1=>min,то F1<=F1max+∆F1
o F2=>max(min)
F1>=F1max-∆Fi
F2<=F1min+∆Fi
F2 max F2 min
Уст ∆F2
F2>=F2max-∆F2
F2<=F2min+∆F2
o F3=>max(min)
F1>=F1max-∆F1
F1<=F1min+∆F1
F2>=F2max-∆F2
F2<=F2min+∆F2
F3max F3min
…………………………..
Fn=>max(min)
Fn-1>= Fn-1max-∆ Fn-1
F Fn-1<=F Fn-1min+∆ Fn-1
3. Метод свертывания критериев в 1 глобальный критерий
F1,F2,…,Fn
F=W1F1+W2F2+…+WnFn
W- весовые коэффициенты, W1+W2+…+Wn=1. Они выбираются в зависимости от предпочтений ЛПР.
Fi max Fi’=Fi\Fmax, если Fi=>max
Fi’= 1-Fi/Fi max, если Fi=>min
Обезразмеривание:
a. Определяются все Fi max
b. Выделяют те критерии, которые максимируют и те, которые минимизируют
c. Обезразмеривают
d. ЛПР назначает весовые коэффициенты
e. Формируется глобальный критерий по формуле, и F=>max
4. Метод Парето
Если для X’ и X” э Х справедливо, то X’ > X”
Оптимальное решение- множество несравнимых между собой решений.
F(x’)>=F(x”), если Fi(x’)>=Fi>=(x”), i=k Fi(x’)>Fi(x”)
5. Метод лексикографических отношений
X’>x”, если F1(x’)>F1(F”), или F1(x’)=F1(x”), a F2(x’)>F2(X”)
или F1(x’)=F1(x”), F2(x’)=F2(x”) или F1(x’)=F1(x”), F2(x’)=F2(x”), F3(x’)>F(x”) или F1(x’)=F1(x”),…,
Fn-1(x’)=F n-1(x”), Fn(x1)>Fn(x”)
6. Метод Т. Саати, анализ иерархий