и технологических процессов

6.1. Постановка задач параметрической оптимизации

Оптимальное проектирование – это процесс принятия наилучших (оптимальных в некотором смысле) решений с помощью ЭВМ. Данная проблема возникает и требует решения на всех этапах проектирования и во многом определяет технико-экономическую эффективность и технологичность проектируемых изделий.

На каждом этапе проектирования конструкции или технологии РЭС в начале работы приходится принимать решения в условиях неопределенности. Чаще всего это относится к построению или выбору варианта структуры объекта проектирования при в рамках блочно-иерархического подхода, то есть к задачам структурной оптимизации.

Выбор варианта структуры во многом снимает неопределeнность, что позволяет строить математическую модель и проводить на ее основе параметрическую оптимизацию, то есть подбор наилучшего набора значений управляемых параметров (например, номиналов индуктивностей, емкостей, резисторов, параметров активных элементов, координат компонентов на плате и др.), при которых выполняются ограничения (технические требования технического задания) и достигают своих экстремальных значений (максимума или минимума) критерии качества объекта проектирования (наиболее важные с точки зрения проектировщика схемные и конструктивные выходные параметры объекта проектирования, по которым оценивается его качество), например, частотные характеристики, коэффициент передачи, потребляемая и выходная мощности, габариты, длина соединительных проводников, перегрев, температура и т. п.). Если параметрическая оптимизация проходит достаточно с небольшими временными затратами (несложные устройства, использование упрощенных математических моделей, отсутствие жестrих требований на точность результатов и т. д.), может быть выполнен некоторый перебор различных структур построения проектируемого объекта, т.е. осуществлена структурная оптимизация устройства.

Решение задачи проектирования радиоэлектронного устройства с оптимальными характеристиками с использованием методов параметрической оптимизации включает три этапа:

1 – компьютерное моделирование устройства;

2 – составление целевой функции с выбором критериев оптимальности;

3 – поиск экстремума полученной целевой функции и определение оптимальных внутренних параметров устройства.

Моделирование (анализ) РЭС требует наличия соответствующих математических моделей и проводится в основном численными методами. Главным критерием моделирования наряду с необходимой точностью и адекватностью модели является быстродействие, скорость расчета на ЭВМ выходных параметров устройства.

Этап составления целевой функции при оптимизации устройства является самым творческим и неформальным. Целевая функция строится на основе выходных параметров устройства (характеристик), которые необходимо оптимизировать.

Таким образом, оптимальное проектирование РЭС сводится к составлению или выбору целевой функции, многократному анализу характеристик (выходных параметров) устройств и затем минимизации или максимизации целевой функции с применением в различных методов оптимизации, выбор конкретного из которых обусловлен спецификой данной решаемой задачи.

Критерии качества и ограничения задачи параметрической оптимизации прямо либо опосредованно зависят от выходных параметров объекта проектирования Y = (y₁,y₂., …, y_m).

В простейшем случае в качестве критериев качества могут быть выбраны наиболее существенные с точки зрения проектировщика выходные параметры. Все остальные выходные параметры при этом необходимо учесть в виде ограничений. Критерии качества в литературе принято называть также целевыми функциями, критериями оптимальности, частными критериями качества, функциями цели и т.п.

Обозначим критерии качества K_i _,= K_i(x₁, x₂.,…, x_n), i= 1,…, s, где s – количество критериев качества, а K_i(X) – либо один из выходных параметров Y = (y₁, y₂.,…, y_m), либо K_i(X) = f(X), где зависимость f(X) задана.

Все ограничения задачи параметрической оптимизации получаются на основе анализа технических требований к параметрам объекта проектирования, содержащихся в ТЗ. Рассмотрим формализацию ограничений на примере выходных параметров Y (для внутренних параметров Х справедливы аналогичные рассуждения).

Технические требования имеют вид y_j = TT_j + Dj, где TT_j – желаемое значение параметра y_j, а D j – его допустимый разброс (j = 1, …, m).

Математическая постановка задачи параметрической оптимизации как задачи математического программирования имеет вид

K_i=K_i(X) → extr,

g_l(X) £ , (6.1)

i = 1, …, s, l = 1, …, L.

Множество наборов значений управляемых параметров Х, удовлетворяющих ограничениям g₁(X) £ , l = 1, …, L называют областью работоспособности, или областью допустимых значений управляемых параметров.

Если функция K_i(X) имеет один минимум или максимум в заданной области работоспособности, то ее называют одноэкстремальной (унимодальной), если несколько, то -многоэкстремальной.

Каждый минимум (максимум) многоэкстремальной функции называют локальным, наименьший (наибольший) из них – глобальным.

Если ограничения на внутренние параметры g_l(X) отсутствуют, то задача оптимизации называетсябезусловной, в противном случае – условной.

При практическом проектировании РЭС встают задачи поиска как безусловных, так и условных экстремумов унимодальных и многоэкстремальных функций.

Рассмотрим в качестве примера типичное ТЗ на разработку аналогового устройства – усилителя: «Коэффициент усиления К₀ на средних частотах должен быть не менее 10000, входное сопротивление R_вх не менее 1 МОм, выходное сопротивление R_вых не более 200 кОм, верхняя граничная частота f_в не менее 100 кГц, температурный дрейф нуля U_др не более 50 мкВ/град; усилитель должен нормально функционировать в диапазоне температур от –50 до +60 ⁰С, напряжения источников питания +5 и –5 В, предельные отклонения напряжений не более + 0,5 %, усилитель эксплуатируется в стационарной установке, габариты платы 60х40 мм». В данном случае выходными параметрами являются Y = { Кo,R_вх, R_вых, f_в, U_др }.

К внешним воздействиям относятся температура окружающей среды и напряжения источников питания. Управляемыми параметрами являются параметры элементов схемы.

Область работоспособности

XР = { X ô10000 - Кo Ð 0,1- R_вх Ð 0, R_вых -200 Ð 0,100- fв Ð 0, 50 - U_др Ð 0}.

Особенность технического задания для дискретных объектов (например, цифровых устройств) заключается в форме записи ограничений (условий работоспособности), которые могут иметь вид логических уравнений, таблиц истинности или даже текстовую форму.

Целью решения задачи параметрической оптимизации является определение такого набора значений параметров, при котором критерии качества достигают своих наилучших (минимальных или максимальных) значений.

Задача параметрической оптимизации (6.1) является многопараметрической, многокритериальной и содержит ограничения, все эти факторы определяют проблемы, возникающие в процессе ее решения. В зависимости от вида критериев качества и ограничений, проводят классификацию задач параметрической оптимизации (задач математического программирования). Если целевая функция и ограничения – линейные функции вида С₀ + С₁Х₁+ С₂Х₂+…+ С_nХ_n, то задача оптимизации называется задачей линейного программирования, в противном случае – задачей нелинейного программирования.

Если целевая функция квадратичная, а ограничения – линейные функции, то задача (6.1) называется задачей квадратичного программирования.

Если целевая функция и ограничения имеют произведения Х₁Х_{2 …}Х_n, то задачу (6.1) называют задачей геометрического программирования.

Если целевую функцию можно представить в виде суперпозиции функций f₁ (f₂ (f₃ …(f_k (Х))…)), то задача (6.1) – это задача динамического программирования.

Если целевая функция и ограничения целочисленные функции то задача (6.1) – это задача целочисленного программирования

В зависимости от вида используемых математических моделей, задача оптимизации может быть детерминированной или стохастической, непрерывной или дискретной, аналитической или алгоритмической, при этом для каждого класса задач имеется свой, в достаточной степени апробированный, математический аппарат. Так, для задач линейного программирования успешно применяется симплекс-метод.

Характерной особенностью задач оптимизации в САПР является тот факт, что классические методы нахождения экстремума практически неприменимы, так как в большинстве случаев используются алгоритмические модели. В связи с этим вычисление значений критериев качества и их производных производится численными методами. Поэтому наиболее универсальными и эффективными для задач нелинейного программирования являются методы поисковой оптимизации.

Для обеспечения возможности применения методов поиска к решению задачи оптимизации необходимо некоторым образом упростить математическую постановку задачи: перейти от многокритериальной задачи оптимизации к однокритериальной и от задачи с ограничениями – к задаче безусловной оптимизации.

Как правило, при проектировании сложных систем задача параметрической оптимизации является многокритериальной, в этом случае для построения целевой функции используются специальные методы перехода к однокритериальной задаче оптимизации, а именно: вероятностный, аддитивный, мультипликативный, минимаксный методы и метод выделения главного критерия.

Для того, чтобы оценить, насколько хорошо удовлетворяют требованиям ТЗ значения частных критериев качества при заданном наборе значений внутренних параметров X = (x₁, x₂.,…,x_n), нужно построить обобщенный критерий качества (обобщенную целевую функцию) f(Х), которая одновременно учитывает требования ко всем частным критериям.

Иными словами, от многокритериальной задачи параметрической оптимизации в виде:

K₁(X)®extr

.. (6.2)

Ks(X) ® extr,

g_l(X)≤ , l = 1,…, L,

необходимо перейти к однокритериальной задаче:

f (X)® extr,

g_l(X) ≤ , l =1,…, L, (6.3)

X=(x₁, x₂.,…,x_n).

Наиболее часто на практике используются следующие методы построения целевой функции (методы векторной свертки частных критериев): метод главного критерия, аддитивный, мультипликативный, минимаксный и вероятностный.

В методе выделения главного критерия проектировщик выбирает один, наиболее важный с его точки зрения частный критерий качества, который и принимается за обобщенную целевую функцию. Требования к остальным частным критериям учитывают в виде ограничений F(Х) = K_t(X), где t – номер наиболее важного частного критерия.

В аддитивном методе каждому из частных критериев качества ставится в соответствие весовой коэффициент характеризующий важность данного критерия с точки зрения проектировщика.

При построении целевой функции в аддитивном методе используется соотношение: если f (X) ® max, то – f (X) ® min.

Чтобы построить минимизируемую целевую функцию f ^¯(X) ® min, все минимизируемые частные критерии K^¯i (X) () включают в аддитивную функцию со знаком плюс, то есть прибавляют к целевой функции, а все максимизируемые критерии K⁺_i(X) () включают в аддитивную функцию со знаком минус, то есть вычитают из целевой функции:

(6.4)

или, для максимизируемой целевой функции:

(6.5)

где s – общее число частных критериев,

t – количество минимизируемых критериев.

В нашем примере четыре частных критерия, то есть s = 4,

t = 2:

K₁(X) ® max,

K₂(X) ® max,

K₃(X) ® min,

K₄(X) ® min.

Пусть l₁ = l₂ = l₃ = l₄ = 0,25, тогда

f(X) = 0,25×K₁(X)+0,25×K₂(X)-0,25×K₃(X)-0,25×K₄(X) ® max,

или

f(X) = -0,25×K₁(X)-0,25×K₂(X)+ 0,25×K₃(X)+ 0,25×K₄(X) ® min.

Каждый частный критерий включаетcя в аддитивную целевую функцию по правилу: умножается на весовой коэффициент и входит в целевую функцию со знаком плюс или минус.

В мультипликативном методе используется правило: если f(X) ® max, то 1/ f(X) ® min при условии, что f(X) ¹ 0. В отличие от аддитивного метода, частные критерии не складывают, а перемножают.

В отличие от аддитивного метода, частные критерии не складывают, а перемножают. Кроме того, в мультипликативном методе не используют весовые коэффициенты. Целевая функция строится в виде дроби.

Если f(X) ® min, то в числитель дроби включают произведение всех минимизируемых критериев, а в знаменатель – произведение всех максимизируемых критериев:

(6.6)

или, если целевую функцию нужно максимизировать:

(6.7)

В нашем примере с применением мультипликативного метода свертки критериев целевые функции:

, (6.8)

. (6.9)

Кроме того, в мультипликативном методе не используют весовые коэффициенты. Целевая функция строится в виде дроби.

Минимаксный метод построенияобобщенной целевой функции получил свое название потому, что в нем минимизируется максимальное отклонение частного критерия качества от его наилучшего, желаемого значения (технического требования, оговоренного в ТЗ).

, (6.10)

где X = (x₁, x₂.,…,x_n), то есть

(6.11)

Логика минимаксного построения целевой функции заключается в том, что в каждый момент времени в качестве главного выбирается тот из частных критериев качества K_i(X), который в наибольшей степени удален от своего желаемого (оптимального) значения K_i^*. В нашем примере (s = 4) при желаемых значениях K₁^* = 0,2; K₂^* = 1000; K₃^* = 25; K₄^* = 1 по минимаксному методу получим:

Другими словами, минимизируется “самый плохой” из частных критериев.

Рассмотрим три ситуации, изображенных на рис. 6.1.

Рис. 6.1

На оси у откладывается величина ôK_i(X)-K_i^*ô/K_i^* для всех частных критериев (i = 1, 2, 3, 4 для нашего примера). В случае а) хуже всего удовлетворяет требованиям ТЗ критерий K₃(Х), поэтому f(X)=ôK₃(X)- K₃^*ô/ K₃^*, то есть в течение некоторого времени усилия оптимизации будут направлены на приближение критерия K₃(X) к его желаемому значению K₃^*. При этом могут ухудшиться значения других критериев. Например, в случае б) для дальнейшей оптимизации будет выбран критерий K₁(X).

Процесс продолжают до тех пор, пока все частные критерии не будут достаточно (с требуемой точностью) близки к своим желаемым значениям (случай в), изображенный на рис. 6.1. При этом приведение критериев к нормированному виду ô K_i(X)-K_i^* ô/ K_i^* необходимо, чтобы в равной степени учитывать изменение критериев независимо от их абсолютных величин (как слишком больших, так и слишком малых, возможно различающихся на несколько порядков).

В случае вероятностного (статистического) метода построения обобщенной целевой функции выбирают f(X) = P(X) ® max, где P(X) – вероятность выполнения условий работоспособности, то есть вероятность того, что при наборе значений внутренних параметров X = (x₁, x₂.,…,x_n) выходные параметры объекта проектирования будут удовлетворять требованиям ТЗ. Для определения вероятности Р(Х) на практике обычно используют метод статистических испытаний (метод Монте-Карло).

Для перехода от задачи параметрической оптимизации с ограничениями к задаче без ограничений, или задаче безусловной оптимизации

Ф(Х) ® extr (6.12)

используется один из следующих методов: метод неопределенных множителей Лагранжа; метод штрафных функций; метод барьерных функций.

В методе неопределенных множителей Лагранжа вводятся дополнительные переменные y₁, y₂.,…, y_L, которые называют неопределенными множителями Лагранжа. Их количество равно числу ограничений L в задаче оптимизации. Целевая функция (функция Лагранжа) с учетом ограничений строится по формуле:

(6.13)

где X = (x₁, x₂.,…, x_n), Y = (y₁, y₂.,…, y_m), y_l > 0, l = 1, …, L.

Формула (6.14) применима, если задача параметрической оптимизации ставится как задача максимизации, при этом для полученной целевой функции Ф(X, Y) необходимо найти седловую точку, то есть по переменным X = (x₁, x₂.,…,x_n) проводится поиск максимума, а по переменным Y = (y₁, y₂.,…, y_m) – поиск минимума, то есть

(6.14)

Основной проблемой при использовании метода Лагранжа является значительное увеличение размерности задачи параметрической оптимизации.

В методе штрафных функций целевую функцию задачи безусловной оптимизации получают по формуле:

Ф(Х) = f(X)+ q k(X) ® extr, (6.15)

где X = (x₁, x₂.,…, x_n) – набор управляемых параметров,

q k(X) - штрафная функция,

k - номер итерации (шага) в методе поисковой оптимизации.

На практике задачи параметрической оптимизации решаются в основном итерационными (пошаговыми) методами, которые называют методами поисковой оптимизации. При этом на каждом шаге поиска значение штрафной функции q k(X) уточняется (рассчитывается заново) по формуле:

(6.16)

где r_k = 10^k. Формула (6.16) применима, если задача параметрической оптимизации ставилась как задача минимизации.

Логика построения штрафной функции заключается в следующем: внутри области работоспособности ХР g _l(X) < 0, l = 1, …, L, на границе – g_l(X) = 0, а вне ХР g_l (X) > 0 (рис. 6.2).

Рис. 6.2. Построение штрафной функции

Целевая функция задачи безусловной оптимизации Ф(Х) должна быть максимально близкой к целевой функции f(Х) задачи с ограничениями внутри области работоспособности XР = {X = (x₁, x₂, …, x_n)ôgl(X) Ð 0, l = 1,…,L } и быть значительно хуже (больше) функции f(Х) вне области работоспособности, то есть при g_l(X) > 0.

Действительно, внутри области работоспособности ХР g_l(X) Ð 0, l = 1,…,L, поэтому max{0, gl(X)} = 0 для всех ограничений, то есть внутри области работоспособности Ф(Х) = f(Х). Если ограничения выполнены, то никакого штрафа на целевую функцию не накладывается. В противном случае, если имеются нарушения одного или нескольких ограничений g_t(X) > 0, 1 Ð t Ð L, то каждое из них дает свой вклад в штрафную функцию qk(X) в виде квадрата слагаемого [ max{0,gt(Х)} ], где max{0,gt(Х)}=gt(Х). Метод штрафных функций часто называют методом внешней точки, потому что при проведении дальнейшей оптимизации поисковыми методами для метода штрафных функций не важно, принадлежит ли начальная точка поиска области работоспособности ХР.

В методе барьерных функций на границе области работоспособности ХР ставится непреодолимый барьер (целевая функция задачи безусловной оптимизации Ф(Х) возрастает до бесконечности на границе области ХР). Поэтому начальная точка поиска обязательно должна принадлежать области работоспособности, если при построении целевой функции задачи безусловной оптимизации был применен метод штрафных функций, или метод внутренней точки. Целевую функцию Ф(Х) в методе барьерных функций получают по формуле

Ф(Х)=f(X)+ q k(X) ® extr, (6.17)

где k - номер итерации поискового метода, весовой коэффициент r_k =10^- ^k, а барьерная функция q k(X) вычисляется по формуле

(6.18)

Действительно, при приближении к границе ХР g_l(Х) 0, так как Х Î ХР (метод внутренней точки) g_l (X) < 0, l = 1, …, L, поэтому g_l(Х) → –¥. Именно поэтому в формуле (2.56) используется знак минус: qk(X) возрастает до бесконечности при приближении к границе области работоспособности.

Главный недостаток метода барьерных функций заключается в том, что начальную точку поиска приходится выбирать внутри области работоспособности ХР, что представляет собой сложную задачу при малых размерах области ХР.

Таким образом, при небольшом количестве управляемых параметров Х и ограничений g_l(X), целесообразно применять метод неопределенных множителей Лагранжа, если проверка принадлежности начальной точки поиска области ХР не слишком трудоемкая задача, то применяем метод барьерных функций, в противном случае – метод штрафных функций, который, хотя и является более универсальным, но впоследствии, в ходе поисковой оптимизации требует большего числа итераций по сравнению с методом барьерных функций.

6.2. Методы поисковой оптимизации

В связи со сложностью и малой изученностью объектов проектирования и критерии качества, и ограничения задачи параметрической оптимизации, как правило, слишком сложны для применения классических методов поиска экстремума. Поэтому на практике предпочтение отдается методам поисковой оптимизации. Рассмотрим основные этапы любого метода поиска.

Исходными данными в методах поиска являются требуемая точность метода e и начальная точка поиска Х⁰.

Затем выбирается величина шага поиска h, и по некоторому правилу происходит получение новых точек Х^k⁺¹ по предыдущей точке Х^k при k = 0, 1, 2, … Получение новых точек продолжают до тех пор, пока не будет выполнено условие прекращения поиска. Последняя точка поиска считается решением задачи оптимизации. Все точки поиска составляют траекторию поиска.

Методы поиска отличаются друг от друга процедурой выбора величины шага h (шаг может быть одинаковым на всех итерациях метода или рассчитываться на каждой итерации), алгоритмом получения новой точки и условием прекращения поиска.

Для методов, использующих постоянную величину шага, h следует выбирать значительно меньше точности e. Если при выбранной величине шага h не удается получить решение с требуемой точностью, то нужно уменьшить величину шага и продолжить поиск из последней точки имеющейся траектории.

В качестве условий прекращения поиска принято использовать следующие:

1) все соседние точки поиска хуже, чем предыдущая;

2) ç Ф(X^k⁺¹)–Ф(X ^k) ç £ e, то есть значения целевой функции Ф(Х) в соседних точках (новой и предыдущей) отличаются друг от друга на величину не больше, чем требуемая точность e;

3) , i = 1, …, n, то есть все частные производные в новой точке поиска практически равны 0, то есть отличаются от 0 на величину, не превышающую точности e.

Алгоритм получения новой точки поиска Х^k ⁺¹по предыдущей точке Х^k свой для каждого из методов поиска, но всякая новая точка поиска должна быть не хуже предыдущей: если задача оптимизации является задачей поиска минимума, то Ф(Х^k⁺¹) £ Ф(Х^k).

Методы поисковой оптимизации принято классифицировать по порядку производной целевой функции, используемой для получения новых точек. Так, в методах поиска нулевого порядка не требуется вычисления производных, а достаточно самой функции Ф(Х). Методы поиска первого порядка используют первые частные производные, а методы второго порядка используют матрицу вторых производных (матрицу Гессе).

Чем выше порядок производных, тем более обоснованным является выбор новой точки поиска и тем меньше число итераций метода. Но при этом трудоемкость каждой итерации из-за необходимости численного расчета производных.

Эффективность поискового метода определяют по числу итераций и по количеству вычислений целевой функции Ф(Х) на каждой итерации метода.

Рассмотрим наиболее распространенные методы поиска, расположив их в порядке уменьшения числа итераций.

Для методов поиска нулевого порядка справедливо следующее: в методе случайного поиска нельзя заранее предсказать количество вычислений Ф(Х) на одной итерации N, а в методе покоординатного спуска N £ 2× n, где n - количество управляемых параметров X = (x₁, x₂.,…,x_n).

Для методов поиска первого порядка справедливы следующие оценки: в градиентном методе с постоянным шагом N = 2×n; в градиентном методе с дроблением шага N=2× n + n ₁, где n₁ – число вычислений Ф(Х), необходимых для проверки условия дробления шага; в методе наискорейшего спуска N = 2×n + n₂, где n₂ – число вычислений Ф(Х), необходимых для расчета оптимальной величины шага; а в методе Давидона - Флетчера - Пауэлла (ДФП) N = 2× n + n₃, где n₃ – число вычислений Ф(Х), необходимых для расчета матрицы, приближающей матрицу Гессе (для величин n₁, n₂, n₃ справедливо соотношение n₁< n₂< n₃).

И, наконец, в методе второго порядка - методе Ньютона N = 3×n².

При получении данных оценок предполагается приближенное вычисление производных по формулам конечных разностей, то есть для вычисления производной первого порядка нужно два значения целевой функции Ф(Х), а для второй производной – значения функции в трех точках.

На практике широкое применение нашли метод наискорейшего спуска и метод ДФП, как методы с оптимальным соотношением числа итераций и их трудоемкости.

Начнём рассмотрение методов поиска нулевого порядка. В методе случайного поиска исходными данными являются требуемая точность метода e, начальная точка поиска Х⁰= (x₁⁰, x₂⁰, …, x_n⁰) и величина шага поиска h.

Поиск новых точек производится в случайном направлении, на котором и откладывается заданный шаг h, таким образом получают пробную точку и проверяют, является ли пробная точка лучшей, чем предыдущая точка поиска. Для задачи поиска минимума это означает, что:

(6.19)

Если данное условие выполнено, то пробную точку включают в траекторию поиска (). В противном случае, пробную точку исключают из рассмотрения и производят выбор нового случайного направления из точки Х^k, k = 0, 1, 2, … (рис. 6.3).

Несмотря на простоту данного метода, его главным недостатком является тот факт, что заранее неизвестно, сколько случайных направлений потребуется для получения новой точки траектории поиска Х^k⁺¹, что делает затраты на проведение одной итерации слишком большими.

Кроме того, поскольку при выборе направления поиска не используется информация о целевой функции Ф(Х), число итераций в методе случайного поиска очень велико.

Рис. 6.3. К методу случайного поиска

В связи с этим метод случайного поиска используется для исследования малоизученных объектов проектирования и для выхода из зоны притяжения локального минимума при поиске глобального экстремума целевой функции.

В отличие от метода случайного поиска, в методе покоординатного спуска в качестве возможных направлений поиска выбирают направления, параллельные осям координат, причем движение возможно как в сторону увеличения, так и уменьшения значения координаты.

Исходными данными в методе покоординатного спуска являются величина шага h и начальная точка поиска Х⁰= (x₁⁰, x₂.⁰,…, x_n⁰). Движение начинаем из точки Х⁰ вдоль оси x₁ в сторону увеличения координаты. Получим пробную точку (x₁^k+h, x₂^k,…, x_n^k), k = 0. Сравним значение функции Ф(Х) с значением функции в предыдущей точке поиска Х^k.

Если (мы предполагаем, что требуется решить задачу минимизации Ф(Х), то пробную точку включают в траекторию поиска ().

В противном случае, пробную точку исключаем из рассмотрения и получаем новую пробную точку, двигаясь вдоль оси x₁ в сторону уменьшения координаты. Получим пробную точку (x₁^k–h, x₂^k,…, x_n^k). Проверяем, если , то продолжаем движение вдоль оси x₂ в сторону увеличения координаты. Получим пробную точку (x₁^k+h, x₂^k,…, x_n^k), и т.д.

При построении траектории поиска повторное движение по точкам, вошедшим в траекторию поиска, запрещено.

Получение новых точек в методе покоординатного спуска продолжается до тех пор, пока не будет получена точка Х^k, для которой все соседние 2× n пробных точек (по всем направлениям x₁, x₂, …, x_n в сторону увеличения и уменьшения значения координаты) будут хуже, то есть . Тогда поиск прекращается и в качестве точки минимума выбирается последняя точка траектории поиска Х*= Х^k.

Рассмотрим работу метода покоординатного спуска на примере (рис. 2.21): n = 2, X = (x₁, x₂), Ф (x₁, x₂) ® min, Ф(x₁, x₂) = (x₁– 1)²+ (x₂ – 2)², h = 1, Х⁰= (0, 1).

Начинаем движение вдоль оси x₁ в сторону увеличения

координаты. Получим первую пробную точку

(x₁⁰+h, x₂⁰) = (1, 1), Ф () = (1-1)²+ (1-2)²= 1,

Ф(Х⁰) = (0-1)²+ (1-2)²= 2,

то есть

Ф() < Ф(Х⁰) ® Х¹ = (1, 1).

Рис. 6.4

2. Продолжаем движение вдоль оси x₁ от точки Х¹ в сторону увеличения координаты. Получим пробную точку

=(x₁¹+h, x₂¹) = (2, 1), Ф() = (2-1)²+ (1-2)²= 2,

Ф(Х¹) = (1-1)²+ (1-2)²= 1,

то есть Ф() > Ф(Х¹) – пробная точка с координатами (2, 1) исключается из рассмотрения, а поиск минимума продолжается из точки Х¹.

3. Продолжаем движение вдоль оси x₂ от точки Х¹ в сторону увеличения координаты. Получим пробную точку

= (x₁¹, x₂¹+h) = (1, 2), Ф() = (1-1)²+ (2-2)²= 0,

Ф(Х¹) = (1-1)²+ (1-2)²= 1,

то есть

Ф() < Ф(Х¹) ® Х² = (1, 2).

4. Продолжаем движение вдоль оси x₂ от точки Х² в сторону увеличения координаты. Получим пробную точку

= (x₁², x₂² +h) = (1, 3), Ф() = (1-1)²+ (3-2)²= 1,

Ф(Х²) = (1-1)²+ (2-2)²= 0,

то есть Ф() > Ф(Х²) – пробная точка с координатами (1, 3) исключается из рассмотрения, а поиск минимума продолжается из точки Х².

5. Продолжаем движение вдоль оси x₁ от точки Х² в сторону увеличения координаты. Получим пробную точку

= (x₁²+ h, x₂²) = (2, 2), Ф() = (2-1)²+ (2-2)²=1,

Ф(Х²) = (1-1)²+ (2 - 2)²= 0,

то есть Ф(Х^{^}) > Ф(Х²) – пробная точка с координатами (2, 2) исключается из рассмотрения, а поиск минимума продолжается из точки Х².

6. Продолжаем движение вдоль оси x₁ от точки Х² в сторону уменьшения координаты. Получим пробную точку

= (x₁²- h, x₂²) = (0, 2), Ф() = (0-1)²+(2-2)²= 1,

Ф(Х²) = (1-1)²+ (2 - 2)²= 0,

то есть Ф() > Ф(Х²) – пробная точка с координатами (0, 2) исключается из рассмотрения, а поиск минимума закончен, так как для точки Х² выполнено условие прекращения поиска. Точкой минимума функции Ф(x₁, x₂) = (x₁ – 1)²+ (x₂ – 2)²является Х^* = Х².

В методах поиска первого порядка в качестве направления поиска максимума целевой функции Ф(Х) выбирается вектор градиент целевой функции grad (Ф(Х^k)), для поиска минимума – вектор антиградиент -grad (Ф(Х^k)). При этом используется свойство вектора градиента указывать направление наискорейшего изменения функции:

Для изучения методов поиска первого порядка важно так

и технологических процессов

Поиск по сайту