Кодирование и декодирование хромосом

Для решения задачи глобальной трассировки используются генетические методы оптимизации. Представим решение в виде хромосомы. Кодирование осуществляется следующим образом. Хромосома состоит из генов. Количество генов в хромосоме H_i равно количеству ребер минимальных связывающих деревьев для всех цепей, расположенных на КП. Значением гена является номер варианта из заданного набора вариантов маршрутов, связывающих на графе G соответствующие вершины.

Например, дано КП, на котором расположено множество цепей Т = {t₁, t₂, t₃}, рис. 2.

Так как мы используем графовую модель, то КП можно представить соответственно рис. 3.

Для цепи t₁ множество связуемых вершин – Х₁ = {x₆, x₂, х₁₁}. Для цепи t₂ множество связуемых вершин – Х₂ = {x₇, x₉, x₁₃}. Для цепи t₃ множество связуемых вершин – Х₃ = {x₅, x₁₄}. С помощью алгоритма Прима для каждой цепи строится минимальное связывающее дерево МСД. Для каждой из цепей это выглядит так:рис. 4.

После этого для каждого ребра r_ij МСД формируется набор вариантов маршрутов, связывающих на графе G соответствующие вершины.

Ребро г₁₁ (то есть первое ребро МСД для цепи 1) имеет два варианта прохождения маршрута r₁₁ = {v₁₁₁, v₁₁₂}: v₁₁₁={x₆,x₁,x₂}, v₁₁₂={x₆,x₇,x₂}.

Ребро r₁₂ (второе ребро цепи 1) имеет один вариант V₁₂₁={x₆,x₁₁}

Ребро г₂₁ (то есть первое ребро МСД для цепи 2) имеет два варианта прохождения маршрута r₂₁={v₂₁₁,v₂₁₂}: v₂₁₁={x₇,x₈,x₁₃} v₂₁₂={x₇,x₁₂,x₁₃}.

Ребро r₂₂ имеет два варианта v₂₂₁={x₁₃,x₈,x₉}, v₂₂₂={x₁₃,x₁₄,x₉}.

Ребро г₃₁ (то есть первое ребро МСД для цепи 3) имеет три варианта прохождения маршрута, r₃₁ = {v₃₁₁, v₃₁₂, v₃₁₃}, v₃₁₁={x₅,x₁₀,x₉,x₁₄}; v₃₁₂={x₅,x₄,x₉,x₁₄}; v₃₁₃={x₅,x₁₀,x₁₅,x₁₄}.

Для решения представленного на рис. 2. структура хромосомы имеет вид рис. 5

Рис. 5

Число генов равно 5. Гены g₁ и g₂ соответствуют ребрам r₁₁и r₁₂ дерева D₁; g₃ и g₄ соответствуют ребрам r₂₁и r₂₂ дерева D₂; g₅ соответствует ребру r₃₁дерева D₃. Значение g₁ равно 2, т.к. для реализации r₁₁ выбран вариант V₁₁₂. g₂ равно 1, т.к. r₁₂ реализован вариантом V₁₂₁. Аналогично, т.к. r₂₁,r₂₂ и r₃₁ реализованы соответственно вариантами V₂₁₁, V₂₂₁ и V₃₁₃, то g₃=1, g₄=1, g₅=3.

Отметим, что между структурой и видом хромосомы с одной стороны и решением (распределением соединений на КП) с другой стороны существует взаимно - однозначное соответствие. Отличительной особенностью предложенной структуры хромосомы является то, что отсутствует какая либо зависимость между генами, обусловленная самой структурой. Это свойство исключает возможность появления нелегальных хромосом, подобно тому, как это происходит с хромосомами, представляющими собой списковые структуры. В свою очередь это упрощает реализацию рассматриваемых ниже генетических операторов.

Пусть L – число всех ребер всех МСД. L= число выводов – число цепей. Тогда объем V₁ ОЗУ, необходимой для хранения информации об вариантах реализации ребер МСД, будет , где n_v – число вариантов реализации одного ребра.

Объем V₂ ОЗУ необходимый для одной хромосомы . К₂ помимо всего прочего учитывает необходимость хранения фитнесса хромосомы.

Для популяции состоящей из М хромосом .

Таким образом, общий объем памяти имеет линейную зависимость и при заданных параметрах n_v и M пространственная сложность алгоритма ~ O(L).

3.2 Формирование исходной популяции

Для организации генетического поиска формируется исходная популяция особей P={H_i|i=1,2,..,M}, где М размер популяции. Популяция Р- представляет собой репродукционную группу – совокупность индивидуальностей, любые две из которых H_iÎP и H_jÎP, i ¹ j могут размножаться выступая в роли «родителей». Предварительно с помощью процедуры FORM осуществляется разбиение КП на области и формирование модели КП в виде графа W=(X,U). Далее для каждой цепи t_i Î Т строится алгоритмом Прима один из вариантов минимального связывающего дерева D_i={r_i, l_i=1, … n_i}

Затем для каждого r_ij синтезируется набор V_ij вариантов маршрутов в ортогональном графе G, реализующих ребро r_ij_.Пусть n_ij=| V_ij | - число вариантов реализации ребра r_ij_.

Определяется длина L хромосомы, являющейся носителем информации о конкретном решении:

Параметр L определяет число генов в хромосоме. С помощью графика соответствия Q устанавливается соответствие Г(G, Q, R) между генами хромосомы и ребрами минимальных связывающих деревьев для всех цепей.

G={g_n| n=1, 2,…,L}; R={r_ij| i=1, 2, …,n_i, j=1,2, … n_i}

Образом Г(r_ij) является ген g_n. Прообразом Г^-1(g_n) является ребро r_ij Значением гена g_n, будет номер варианта реализации ребра r_ij=Г^-1(g_n).

Ген g_n может принимать любое значение от 1 до n_ij.

В работе используется принцип случайного формирования исходной популяции.

Для этого в пределах каждой хромосомы Н_к каждый ген g_n принимает случайное значение в пределах от 1 до n_ij, где n_ij число вариантов реализации ребра r_ij=Г^-1(g_n).

Управляемыми параметрами при формировании популяции является М - размер популяции, n_max - максимальное число вариантов реализации ребер, т.е. ("ij) [n_ijn_max]. Если возможное число вариантов n_ij больше n_max то возникает возможность формирования альтернативных наборов вариантов V_ij для r_ij. Кроме того существует возможность построения альтернативных МСД D_i для одной и той же цепи t_i.

Все это дает возможность для комбинирования при синтезе исходной популяции. Известно, что для выхода из локальных оптимумов используется механизм смены исходных популяций.

В простейшем случае это можно реализовать с помощью повторной, случайной генерации.

3.3 Генетические операторы

Для получения нового решения (индивидуальности) используются генетические операторы: кроссинговер и мутация.

Кроссинговер заключается во взаимном обмене генами между «родителями» - хромосомами предварительно выбранной пары.

В нашем случае все хромосомы гомологичны, т.к. имеют одну и ту же структуру, одну и ту же длину и несут информацию об одном и том же наборе МСД. Гены, расположенные в одном и том же локусе хромосом, гомологичны, т.к. несут информацию об одном и том же ребре хромосомы.

Предварительно задается величина P_K – вероятность кроссинговера и вводится флажок FG с двумя состояниями «выполнять», «не выполнять». Исходное состояние FG «не выполнять». При выполнении кроссинговера последовательно просматриваются локусы выбранной пары хромосом. С вероятностью P_k «флажок» FG переходит в состояние «выполнять». Если FG перешел в состояние «выполнять», то производится обмен генами между парой хромосом в текущем локусе, далее «флажок» переходит в состояние «не выполнять», а затем осуществляется переход к следующему локусу.

Такой алгоритм кроссинговера обеспечивает мультиобмен. Число пар обменивающихся генов определяется параметром P_k.

Операция мутации заключается в изменении значения гена. Алгоритм мутации реализуется следующим образом.

Предварительно, для каждого гена g_n, определяется диапазон его возможных значений от 1 до y_n, где y_n – число сформированных вариантов реализации ребра .

Задается параметр P_M – вероятность мутации и «флажок» FG с двумя состояниями «выполнять» и «не выполнять». Исходное состояние FG – «не выполнять».

Последовательно выбираются хромосомы из текущей популяции. В пределах выбранной хромосомы последовательно просматриваются гены. После перехода к очередному гену, FG с вероятностью P_M переходит в состояние «выполнять». Если FG перешел в состояние «выполнять», то случайным образом ген g_n принимает одно из значений в заданном диапазоне, за исключением значения, которое ген имеет перед мутацией. Далее FG переходит в состояние «не выполнять» и выбирается следующий ген хромосомы, или следующая хромосома.

Для улучшения процесса поиска лучшего решения введем дифференцируемое значение показателя , принимающего различные значения в зависимости от значения гена.

Введем для гена g_n оценку , где l_n – число ребер u_i_,входящих в маршрут v_ijk реализующий ребро , соответствующее гену g_n. - число таких u_i,, входящих в v_ijk,для которых показатель загрузки c_i имеет отрицательное значение.

К_n меняется от 0 до 1. Чем больше K_n_,тем “хуже” маршрут v_ijk, и тем больше оснований к его смене.

Значение показателя с учетом К_n для гена g_n определяется следующим образом

параметр D связан с P_m следующим соотношением

т.е. D меняется от 0 до (1-P_m).

В предельном случае

Как видно из алгоритмов, реализующих процедуры кроссинговера и мутации, временная сложность операторов кроссинговера и мутации применительно к одной хромосоме имеют линейную зависимость, , где L – длина хромосомы.

3.4 Общая структура генетического поиска для глобальной

трассировки

В соответствии с методикой описанной выше на первых подготовительных этапах осуществляется разбиение КП на плоскости. Для всех цепей строятся минимальные связывающие деревья. Для всех ребер МСД формируются наборы вариантов реализующих их соединений. Управляющими параметрами генетической адаптации являются: М – размер исходной популяции, Т – число генераций, P_K – вероятность кроссинговера, P_m – вероятность мутации.

После сформирования исходной популяции П_и для каждой индивидуальности рассчитывается фитнесс.

Алгоритм расчета фитнесса имеет следующий вид: в качестве исходных данных используется вектор А={a_l| l=1,2, …}, где a_l – пропускная способность ребра u_l. Для расчета фитнесса используется вектор B, имеющий ту же размерность, что и вектор А. Вначале элементы имеют нулевое значение. Вектор В служит для учета загрузки ребер U_r всеми цепями.

Значения растут последовательно и, после просмотра всех генов, b_l является значением числа цепей, проходящих через u_l.

Имея вектора А и В, рассчитываются значения показателей c_l=a_l-b_l для каждого ребра u_l. На основании значений c_l расcчитываются критерии F₁, F₂ и F₃.

Если учесть, что число вариантов имеет фиксированное значение и обычно, не превышает 4-6, то трудоемкость подсчета вектора В линейна и пропорциональна длине хромосом. Трудоемкость процедуры поиска c_min также линейна. В связи с этим трудоемкость t_ф расчета фитнесса для одной хромосомы имеет линейную зависимость от длины хромосомы t_ф~O(L).

После расчета фитнесса для исходной популяции применяется оператор кроссинговера.

Селекция родительских пар хромосом осуществляется либо на основе «принципа рулетки», либо на основе рейтинга популяции.

С этой целью все хромосомы популяции сортируются в соответствии с рассчитанными значениями фитнесса. После этого осуществляется селекция пары родственных хромосом по правилу: i - я с i+1 – ой.

Для каждой новой индивидуальности, образованной в результате кроссинговера, расчитывается фитнесс. После кроссинговера текущая популяция П_Т включает исходную П_И и популяцию П_К, образовавшуюся в результате выполнения кроссинговера.

П_Т=П_И+П_К.

Далее ко всем индивидуальнастям П_Т применяется оператор мутации. Для всех индивидуальностей популяции П_М, образовавшихся в результате мутации расчитывается фитнесс. Заключительным этапом в пределах одного поколения является процесс редукции популяции П_Т=П_И+П_К+П_Мдо размеров П_И на основе селективного отбора. Селекция осуществляется на основе “принципа рулетки”.

Вероятность выбора индивидуальности определяется как:

С помощью коэффициентов К_i, которые для «лучших» индивидуальностей имеют большие значения, чем у «худших», достигаются увеличение вероятности выбора «лучших» индивидуальностей.

Временная сложность алгоритма определяется общими (подготовительными) затратами to и затратами в пределах каждого поколения td. Общие затраты складываются из затрат на построении минимальных связывающих деревьев td,формирование вариантов реализации ребер tb,и формирования исходной популяции tи: to=td+tb+tи.

Затраты на построение МСД находятся в зависимости от числа МСД. С другой стороны при построении конкретного МСД затраты пропорциональны квадрату числа связываемых вершин. Учитывая, что число ребер n всех МСД пропорционально числу МСД, можно считать, что оценка ВСА t_о лежит в пределах О(n)-O(n²), причем чем больше n тем ближе к О(n).

Затраты в пределах поколения tn складываются из затрат на операторы кроссинговера tк, мутации tm,расчета фитнесса tф и селекции tс.

Как уже указывалось выше затраты tк,tм и tф при обработке одной хромосомы имеют линейную зависимость от n. tс имеет линейную зависимость от объема популяции М. Тогда временные затраты в пределах поколения имеют оценку О(n×M). Для Т генераций временная сложность алгоритма имеет оценку О(n×M×T). Учитывая что параметры М и Т сравнимы или значительно меньше n, можно считать, что оценка временной сложности всего алгоритма в целом лежит в пределах О(n²)-O(n³).

Кодирование и декодирование хромосом

Поиск по сайту