Общее решение задачи определения оптимального момента перехода на статистическую диагностику




Обратная индукция – чтобы приблизить задачу к практике, напомним, что может рассматриваться как , поскольку жизненный цикл ОД конечен, хотя можно получить решение задачи и для случая , когда может быть . Но в этом на практике просто нет необходимости.

Обозначим класс всех моментов остановки , таких, что , и определим

 

 

Считаем, что существует для всех . Придерживаясь предыдущей терминологии, скажем, что момент оптимален в , если и .

Для решения задачи вычисления и интегрируемой стохастической последовательности текущих выигрышей от бучения системы диагностики воспользуемся следующим «вложением», характерным для динамического программирования. Пусть для каждого обозначает множество всех моментов остановки , таких, что .


 

Заметим, что и . Теперь покажем, как в найти оптимальный момент остановки (т.е. момент перехода на статистическую диагностику). Если , то задача тривиальна, так как является единственным правилом остановки в , и поэтому . Для интуитивно ясно, что следует сравнить с и использовать правило

 

 

Эти рассуждения мотивируют следующую теорему динамического программирования, которая формализует принцип обратной индукции.

Пусть – фиксированное положительное целое число. Определим последовательность , полагая

 

(2.1)

 

Пусть для каждого равно первому , такому, что

 

. (2.2)

 

Тогда и


 

следовательно,

 

 

Чтобы определить оптимальный момент перехода на статистические методы, необходимо согласно (2.2) уметь как-то определять . Методологически это довольно просто делается по рекуррентному уравнению (2.1). Однако реализовать (2.1) в непосредственном виде на ЭВМ можно лишь в плоском случае, т.е. когда достаточная статистика вполне описывается лишь двумя числовыми гиперпараметрами и сама история диагноза одномерна (т.е. сводится только к записи значений контролируемой величины). Но в случае большой размерности истории диагноза и в случае многомерности вектора гиперпараметров соотношение (2.1) реализовать на ЭВМ просто невозможно. Поэтому надо иметь какой-то другой метод получения удовлетворительного решения задачи. Далее рассмотрим такой метод.

Монотонный случай – Выше рассматривался случай . Ниже можно считать . Это позволит упростить обозначения за счет отбрасывания индекса N.

Пусть дана интегрируемая последовательность . Обозначим через класс всех моментов остановки , для которых . Практически это всегда выполняется. Тогда по определению .

Если , и для каждого

 

(2.3)


на множестве , то

 

(2.4)

 

на множестве .

Справедливо также следующее обращение этого утверждения: если , то для любого при справедливы неравенства (2.3) и (2.4). Физически эти соотношения характеризуют случай, когда является более выгодным моментом перехода на статистическую диагностику, чем момент .

Если – момент остановки, такой, что для каждого

 

на ,

 

то является субмартингалом. Если кроме того, существует и

 

(2.5)

 

то выполняется (2.3)

Другими словами, если момент sостанавливает субмартингал, то остановленный субмартингал остается субмартингалом. Это вполне естественно, поскольку в момент перехода на статистические методы последнее значение замораживается.

Если и для каждого на ,


(2.3.6)

 

то справедливо (2.4).

Другими словами, если s останавливает обучение, когда уже появилась супермартингальность, то любое запаздывание (остановка по , где ) только усугубляет все дело (снижает выигрыш от перехода на статистическую диагностику).

Существует один случай, в котором есть естественный претендент на оптимальный момент остановки. Это так называемый монотонный случай, в котором стохастическая последовательность удовлетворяет следующим условиям. Положим

 

 

т.е. множество – множество тех траекторий обучения, на которых в момент уже появилась супермартингальность. Предположим, что имеет место монотонный случай, если

В этом случае момент остановки равен первому , такому, что

 

(2.7)

 

заслуживает специального рассмотрения с точки зрения оптимальности. В дополнительной литературе приводятся примеры, которые показывают, что момент остановки (2.7) не всегда оптимален. Но эти примеры слишком конструктивны и практически не встречаются в диагностической практике. К тому же можно выдвинуть ряд ограничений, которые вполне выполнимы на практике, и внутри этих ограничений МО (2.7) оптимален. Эти ограничения формируются следующим образом. Предположим, что в монотонном случае момент , определяемый в (2.7), принадлежит классу . Тогда, если выполняется (2.5), то для которых справедливо (2.6). Условие (2.5) означает отсутствие очень больших положительных выбросов в последовательности до момента , а условие (2.6) – отсутствие больших отрицательных выбросов до момента . На практике эти допущения вполне выполняются, поскольку даже если выбросы и будут, они маловероятны и при интегрировании в (2.5), (2.6) будут нивелированы бесконечно малыми значениями их вероятностей.

Таким образом, на практике, если имеет место монотонный случай, то момент из (2.7) является оптимальным моментом перехода на статистические методы диагностики.

Остается оценить, как часто практические задачи обучения системы диагностики являются монотонными. Если это случается всегда, то (2.7) даст полное решение всей задачи. Причем это решение легче реализовать в многомерном случае, чем обратную индукцию.



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2019-12-28 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: