Тема: «Построение экспериментальной математической модели биологического процесса с использованием метода наименьших квадратов»




Курсовая работа

Дисциплина: “Компьютерные технологии в медико-биологических исследованиях”

Тема: «Построение экспериментальной математической модели биологического процесса с использованием метода наименьших квадратов»

 

Вариант 12

 

 

Работу выполнил

студент гр. М6О-404Б-17

Ташов Арслан

 

Преподаватель:

Евдокименков В. Н.

 

Москва

2020

Раздел 1. Основы метода наименьших квадратов.

Постановка задачи и описание предлагаемой модели

Постановка задачи опирается на следующие предположения:

Полагаем, что состояние объекта формируется под влиянием некоторой совокупности входных воздействий xi (i=1, …, n), называемых в дальнейшем входными переменными модели. Реакция объекта на произведенное воздействие оценивается путем измерения в ходе исследований скалярной характеристики y, называемой в дальнейшем выходной переменной модели.

Совокупность входных переменных модели в дальнейшем будем представлять в виде вектора входных переменных, компонентами которого являются входные воздействия: X = (x1, x2, …, xn)Т.

Целью является получение аналитической зависимости, описывающей связь между входными xi, и выходной у переменными модели на основе выражения вида

y = a1f1(x) + a2f2(x) + … + akfk(x)

В этом выражении а1, а2, …, аk – неизвестные параметры модели, оценки которых должны быть получены на основе обработки результатов проведенных МБИ; f1(x), f2(x), …, fk(x) – скалярные функции, предполагаемые заданными.

– вектор размера (k × 1), компонентами которого являются неизвестные параметры моделей.

– вектор функции размера (k × 1), компоненты которого предполагаются заданными.

Тогда, с учетом введенными обозначений, искомая модель может быть описана векторным выражением вида.

y = aT × f(x)

С целью получения оценок параметров модели а1, а2, …, аk проводится серия из N экспериментов, в ходе которых на вход объекта подаются точно известные входные воздействия xj, где j = 1, …, N – номер эксперимента, и измеряются значения yj (j = 1, …, N), выражающие реакции объекта на эти воздействия.

Результаты проведенных экспериментов с помощью предлагаемой модели могут быть описаны следующим образом:

y1 = aTf(x1) + ε1 = a1f1(x1) + a2f2(x1) +…+ akfk(x1) + ε1

y2 = aTf(x2) + ε2 = a1f1(x2) + a2f2(x2) +…+ akfk(x2) + ε2

………………………………………………………………

yN = aTf(xN) + εN = a1f1(xN) + a2f2(xN) +…+ akfk(xN) + εN

Введем некоторые векторные и матричные обозначения с целью более компактного описания результатов проведенных экспериментов.

F - матрица размера (N × k), где N – количество проведенных экспериментов, а k – количество неизвестных параметров модели.

Строки этой матрицы представляют собой значения функций, присутствующих в модели, рассчитанные для того набора входных переменных, который использовался в конкретном эксперименте.

Кроме того, введем векторa

размера (N×1), компонентами которого являются измеренные в ходе экспериментов значения выходной переменной;

размера (N×1), компонентами которого являются случайные ошибки измерения выходной переменной в ходе экспериментов.

Используя введенные векторные и матричные обозначения, результаты проведенных экспериментов в компактном виде можно представить следующим образом:

Y = F ∙ a + ε

Тот факт, что в приведенном выражении присутствует случайный вектор ε, указывает на необходимость использования статистических методов для получения оценок неизвестных параметров модели. Наиболее распространенным из таких методов является метод наименьших квадратов (МНК).

Широкое использование МНК обусловлено тем, что реализация этого метода опирается на очень слабые предположения о статистических свойствах ошибок измерений, которые практически всегда выполняются в условиях реального исследования. Эти предположения сводятся к трем утверждениям:

1) Отсутствует систематическая составляющая ошибок измерения. Фактически это означает, что математическое ожидание ошибок измерений равно нулю:

М [εj] = 0 для ∀ j = 1,…,N

2) Ошибки εi, εj, с которыми проводится измерение выходной переменной, в разных экспериментах не коррелированы или статистически независимы:

М [εi­ ∙ εj] = 0 для ∀ i ≠ j

3) Измерения значений выходной переменной являются равноточными, т.е. дисперсия ошибок измерений во всех экспериментах одинакова:

для ∀ j = 1,…,N

Доказано, что оптимальным в смысле приведенного критерия является вектор оценок параметров модели, который рассчитывается на основе выражения:

â = С∙FTY

C – дисперсионная матрица: С = (FT∙F)-1 – квадратная симметричная (по способу определения) матрица размера (k×k)

Анализ точности полученной модели

В качестве характеристики точности модели используется дисперсия σY2 оценки значений выходной переменной с помощью модели – чем больше эта дисперсия, тем больше рассчитанное с помощью модели значение выходной переменной отличается от его истинного значения, тем более грубой является модель.

Оценим значение этой дисперсии.

σY2 = М[(Y-mY)2]

Это выражение можно записать иначе

σY2 = М[(Y-mY)T(Y-mY)]

Y = âT ∙ f(x)

mY = M[Y] = M[âT ∙ f(x)] = M[âT] ∙ f(x) = mâT ∙ f(x)

Y - mY = (â - mâ)T ∙ f(x)

(Y - mY)T = fT(x) ∙ (â - mâ)

Тогда выражение для дисперсии σY2 примет вид

σY2 = М[fT(x) ∙ (â-mâ) ∙ (â - mâ)T ∙ f(x)] = fT(x) ∙ М[(â-mâ) ∙ (â - mâ)T] ∙ f(x)

Поскольку М[(â-mâ) ∙ (â - mâ)T] = Кâ = C ∙ σ2, окончательное выражение для σY2:

σY2 = fT(x)Cf(x)σ2

Для получения доверительных интервалов, к которым с заданной вероятностью, близкой к единице, принадлежат неизвестные нам истинные значения коэффициентов модели, используются скалярные величины вида

В этом выражении аi – истинное значение параметра модели;

âi – оценка этого параметра, полученная с помощью МНК на основе приведенного ранее выражения.

Sâi - выборочная оценка среднеквадратичного отклонения (СКО), соответствующая оценки параметра модели.

Выражение для дисперсии , характеризующей точность оценки âi:

,

где Сii – соответствующий диагональный элемент дисперсионной матрицы С;

σ2 – дисперсия ошибок измерения.

Опираясь на это выражение, выборочную оценку дисперсии можно записать так:

,

где S2 – выборочная оценка дисперсии ошибок измерения выходной переменной. Эта выборочная оценка рассчитывается на основе выражения:

Это выражение и есть выборочная оценка дисперсий.

Тогда выборочная оценка СКО Sâi может быть получена на основе выражения:

Оказывается, что определенная таким образом случайная величина Ti в ситуации, когда ошибки измерений подчиняются нормальному закону, имеет теоретическое t-распределение (распределение Стьюдента) с числом степеней свободы, равном N-k, где N – число проведенных экспериментов, k – число неизвестных параметров модели.

Допустим, что Tα – значение квантили, соответствующее доверительной вероятности α = 0,95. Тогда с вероятностью 0,95 должно выполняться неравенство

Отсюда находим границы доверительного интервала, к которому с вероятностью 0,95 принадлежат неизвестные нам истинные значения коэффициента ai:

âi – Tα∙Sâi­ ≤ ai ≤ âi + Tα∙Sâi­

Оценка адекватности полученной экспериментальной модели

Для того, чтобы иметь возможность в дальнейшем оценить адекватность полученной модели, экспериментальное исследование должно быть организовано следующим образом: для каждого конкретного набора входных переменных xj должна быть проведена серия экспериментов i = (m≥2), в результате которых будет получен набор значений выходной переменной yj1, yj2, …, yjm для одного и того же набора входных переменных xj.

Анализ адекватности модели базируется на вычислении двух оценок S12, S22 одной и той же дисперсии – дисперсии ошибок измерений. Причем способ вычисления оценки S12 таков, что её величина зависит от адекватности модели. Способ вычисления оценки S22 таков, что её величина никак не связана с адекватностью модели.

Оценка рассчитывается по формуле:

Здесь

Оценка S22 рассчитывается на основе выражения:

Дальнейший анализ адекватности экспериментальной модели базируется на переходе от оценок S12, S22 к скалярной величине F (to pay respects), которая рассчитывается на основе выражения:

Из вида этой величины следует, что признаком адекватности модели является значение F близкое к единице. Любое нарушение адекватности модели будет сопровождаться ростом значения F. Другими словами, чем более грубой является модель, тем большее значение будет принимать величина F.

Определенная таким образом величина F обладает следующим свойством: если полученная модель является адекватной, случайная величина F имеет теоретическое F-распределение (распределение Фишера) с числом степеней свободы (N-k), (N(m-1)).

F-распределение, как и распределение Стьюдента, относится к классу теоретических распределений, связанных с нормальным. Для него в таблицах математической статистики приведены значения квантилей Fα, как правило соответствующих доверительным вероятностям α = 0.95, 0.99, 0.999.

Допустим, что Fα – значение квантили F-распределения, соответствующее вероятности 0.95. Тогда с вероятностью 0.95 можно утверждать, что предложенная модель адекватна, если имеет место неравенство

F ≤ Fα


Раздел 2. Результаты работы.

Постановка задачи.

Исследуемый процесс характеризуется набором входных переменных Х1, Х2, Х3 и соответствующим им значением выходной переменной у. В процессе проведения эксперимента получены измерения выходной переменной в шести точках наблюдения. Причем, в каждой точке наблюдения при фиксированных значениях входных переменных Х1, Х2, Х3 проведена серия экспериментов, в результате которых сформированы реализации выходной переменной yij, i = 1, …, 6; j = 1, …, 5.

Таблица экспериментальных значений:

X1 X2 X3 yi1 yi2 yi3 yi4 yi5
  0.5 0.6 0.4 6.17 5.26 6.46 6.09 4.43
    1.3 0.5 10.28 9.69 8.44 9.24 9.74
  1.5 1.1 2.1 9.67 10.54 9.84 11.02 9.28
    1.2 1.4 7.79 9.57 9.54 8.73 8.66
  0.5 1.4 1.2 7.97 7.66 7.64 6.67 8.52
    1.4 1.6 8.76 8.55 6.94 10.29 8.36

Цель работы: требуется на основе экспериментальных данных построить математическую модель исследуемого процесса, предполагая, что связь между выходом процесса у и значениями входных переменных может быть представлена параметрической моделью следующего вида:

y(X1, X2, X3) = aTf(X) = a0eX1 + a1X2 + a2X3 + a3,

где а0, а1, а2, а3 – неизвестные параметры модели, оценки которых должны быть получены на основе обработки экспериментального материала.

Реализация метода

Конкретизация векторных обозначений с учетом индивидуального задания:

– вектор неизвестных параметров модели;

– вектор функций;

Расчет вектора усредненных значений выходной переменной:

Расчет дисперсионной матрицы С = (FTF)-1

Алгебраические дополнения Aij элементов матрицы С’:

А11 = (-1)1+1М11 = 4.86

А12 = А21 = (-1)1+2М12 = -13.1

А13 = А31 = (-1)1+3М13 = 4.34

А14 = А41 = (-1)1+4М14 = -6.62

А22 = (-1)2+2М22 = 305.61

А23 = А32 = (-1)2+3М23 = -62.22

А24 = А42 = (-1)2+4М24 = 236.87

А33 = (-1)3+3М33 = 61.13

А34 = А43 = (-1)3+4М34 = -15.67

А44 = (-1)4+4М44 = 334.94

Определитель матрицы С’: |C’| = 102.32

Таким образом, дисперсионная матрица

Вектор оценок параметров модели:

Вектор оценок значений выходной переменной в шести точках:

Оценка точности модели.

Значение выборочной дисперсии: S2 = 0,17

Критическое значение распределения Стьюдента: Т(0,95; 2) = 4,3

Границы доверительных интервалов:

0,1 ≤ а0 ≤ 0,9

-2,04 ≤ а1 ≤ 4,06

0,08 ≤ а2 ≤ 2,82

0,57 ≤ а3 ≤ 6,97

Оценка адекватности модели.

Дисперсия ошибок модели: S12 = 0,17

Дисперсия ошибок измерений: S22 = 0,68

Значение статистики Фишера: F = 0,25

Критическое значение F-распределения: F(0,95; 2; 24) = 3,4

Зависимость, отражающая соотношение между значениями выходной переменной, рассчитанной по модели, и измеренными значениями.

Зависимость, отражающая распределение значений дисперсий оценки выходной координаты.



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2021-01-23 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: