Статистические методы планирования активного эксперимента являются одним из эмпирических способов получения математического описания статики сложных объектов исследования (рис. 1), т.е. уравнения связи отклика объекта у и независимых управляемых нормированных1 входных переменных
(факторов) z = (z 1, z 2,..., zn) [1, 4].
1 Понятие "нормированный фактор" будет рассмотрено ниже.
sg 2{ y } |
При этом математическое описание объекта может быть представлено в виде некоторого полинома
– отрезка ряда Тейлора, в который разлагается неизвестная (искомая) зависимость в окрестности основ-ной точки z 0:
n | n | n | |||||||||||||||||||||
M { y }= ϕ(z 1, z 2, ..., zn)= β0+∑β i z i +∑ | β il zi zl + ∑β il zi 2 + ..., | (1) | |||||||||||||||||||||
i =1 | i; l =1 | i =1 | |||||||||||||||||||||
i < l | |||||||||||||||||||||||
где β i = | ∂ϕ | ; | β il = | ∂2ϕ | ; | β il = | 1 ∂2ϕ | – теоретические коэффициенты модели. | |||||||||||||||
∂ zi | ∂ zi ∂ zi | 2 ∂ zi 2 | |||||||||||||||||||||
Рис. 1 Схема объекта контроля (управления)
Вследствие наличия неуправляемых и даже неконтролируемых факторов ε (рис. 1) изменение вели-чины у носит случайный характер, поэтому функциональная зависимость ϕ(z) не дает точной связи ме-
жду управляемыми факторами и откликом уg объекта в каждом g- м опыте, а лишь между управляемыми факторами и математическим ожиданием случайной величины у:
M { yg }= ϕ( | (2) |
Здесь zg = (z 1 g, z 2 g,..., zng) – g -я точка пространства независимых управляемых факторов (факторного
пространства). В таком случае по результатам эксперимента можно отыскать уравнение регрессии в форме некоторого полинома
n | n | n | ||||||||||
ˆ | = | bo | + | ∑ bi z i | + | ∑ bil zi zl | + | + | ..., | (3) | ||
y | ∑ bii zi | |||||||||||
i =1 | i; l =1 | i =1 | ||||||||||
i < l |
где выборочные коэффициенты регрессии b 0, bi, bil, bii,... являются лишь оценками для теоретических коэффициентов β0, β i, β il, β ii,... соответственно, а y ˆ – оценкой для M { y }.
Для построения линейных и неполных степенных математических моделей применяют полный факторный эксперимент или дробный факторный эксперимент, обладающие ортогональной матрицей планирования. Математическое описание поверхности отклика y объекта в окрестности точки базового
(номинального) режима, задаваемого вектором x 0 с реальными (размерными) значениями факторов (x 10, x 20,..., xn 0), можно получить варьированием каждого из факторов xi на двух уровнях, отличающихся
от базового уровня xi 0 на величину интервала варьирования ∆ xi. Интервал варьирования по каждому управляемому фактору выбирают так, чтобы приращение величины отклика у к базовому значению у 0 при реализации xi 0 ± ∆ xi можно было выделить на фоне "шума" при небольшом числе параллельных
опытов.
Для использования полного и дробного факторного экспериментов необходимо выполнение сле-дующих основных предпосылок.
1 Результаты наблюдений y 1, y 2, …, yN отклика в N точках факторного пространства представ-
ляют собой независимые нормально распределенные случайные величины, т.е. на них воздействуют нормально распределенные случайные помехи ε (рис. 1) с нулевым математическим ожиданием
M {ε}=0.
2 Дисперсии σ2 { y g } (g =1, 2,..., N) равны. Это означает, что получаемые при проведении многократ-
ных повторных наблюдений над величиной yg в точках zg выборочные оценки однородны, дис-
персия же σ2 { y g } не зависит от математического ожидания M { yg }, т.е. не отличается от дисперсии, полу-
ченной при повторных наблюдениях в любой другой точке zg факторного пространства (воспроизво-
димость с равной точностью).
3 Независимые управляемые факторы z 1, z 2, …, zn измеряются с пренебрежимо малыми ошибками по сравнению с ошибкой в определении y.
1 ПОЛНЫЙ ФАКТОРНЫЙ ЭКСПЕРИМЕНТ
Полным факторным экспериментом (ПФЭ)называется эксперимент,реализующий все возможныенеповторяющиеся комбинации уровней п независимых управляемых факторов, каждый из которых варьируют на двух уровнях [4]. Число этих комбинаций N = 2 n определяет тип ПФЭ. Для упрощения дальнейшее изложение построим на примере планирования типа N = 23, т.е. на примере объекта с тремя (n = 3) независимыми управляемыми факторами x 1, х 2, х 3. При планировании эксперимента проводят преобразование размерных управляемых независимых факторов хi в безразмерные (нормированные)
zi =(xi − xi 0) /∆ xi. | (4) |
Это дает возможность легко построить ортогональную матрицу планирования (МП) и значительно облегчает дальнейшие расчеты, так как в этом случае верхние и нижние уровни варьирования zi в и zi н в относительных единицах равны соответственно +1 и –1 независимо от физической природы факторов, значений основных уровней xi в и xi н и интервалов варьирования факторов ∆ хi.
Например, пусть некоторый входной фактор xi (допустим, температура) имеет номинальное значе-
ние xi 0 = 75 oC, | интервал | варьирования | ∆ xi =15 oC. | Тогда верхнему уровню варьирования |
xi в= xi 0+ ∆ xi =90oC | будет | соответствовать, | согласно | формуле (4), нормированное значение |
zi в=(90oC−75oC)/15oC= +1,а нижнему уровню xi н=60oC–нормированное значение zi н= −1.
Если для трехфакторной задачи теоретическое уравнение регрессии относительно нормированных факторов имеет вид
M { y }=β0 + ∑ β i zi + ∑β il zi zl +β123 z 1 z 2 z 2 | , | (5) | |
i =1 | i; l =1 | ||
i < l |
(т.е. степенями факторов выше первой можно пренебречь), то ПФЭ дает возможность найти раздельные (не смешанные друг с другом) оценки коэффициентов β i. Так как изменение выходной величины у но-сит случайный характер, то имеется возможность определить лишь выборочные коэффициенты регрес-сии bi, bil для оценивания теоретических коэффициентов β i, β il. Процесс нахождения модели (идентифи-кации) методом ПФЭ состоит из: 1) планирования эксперимента; 2) проведения эксперимента на объек-те исследования; 3) проверки воспроизводимости (однородности выборочных дисперсий sg 2) экспери-
мента; 4) получения математической модели объекта с проверкой статистической значимости оценок выборочных коэффициентов регрессии; 5) проверки адекватности математического описания.
1.1 Планирование эксперимента. Матрицу планирования ПФЭ для рассматриваемого примера(n
= 3) можно представить в виде табл. 1.
Таблица 1
g | z 0 | z 1 | z 2 | z 3 | z 1 z 2 | z 1 z 3 | z 2 z 3 | z 1 z 2 z | |
+1 | –1 | –1 | –1 | +1 | +1 | +1 | –1 | ||
+1 | +1 | –1 | –1 | –1 | –1 | +1 | +1 | ||
+1 | –1 | +1 | –1 | –1 | +1 | –1 | +1 | ||
+1 | +1 | +1 | –1 | +1 | –1 | –1 | –1 | ||
+1 | –1 | –1 | +1 | +1 | –1 | –1 | +1 | ||
+1 | +1 | –1 | +1 | –1 | +1 | –1 | –1 | ||
+1 | –1 | +1 | +1 | –1 | –1 | +1 | –1 | ||
+1 | +1 | +1 | +1 | +1 | +1 | +1 | +1 |
Ее составляют по следующим правилам.
1 Каждая g -я строка матрицы содержит набор координат zig точки, в которой проводится g -й опыт
(i = 1, 2,..., п; g = 1, 2,..., N).
2 Вводят фиктивную переменную z 0= +1 для определения свободного члена b 0 уравнения регрес-
сии.
3 Поскольку переменные zi принимают лишь значения +1 и –1, все взаимодействия zizl (i, l = 1, 2, 3;
i ≠ l) могут принимать только такие же значения.
4 В первой строке (g = 1) все управляемые факторы выбирают на нижнем уровне, т.е. zi = –1. По-следующие g -e варианты варьирования при составлении МП выбирают так: при построчном переборе всех вариантов частота смены знака факторов для каждого последующего фактора zi +1 вдвое меньше, чем для предыдущего zi (см. табл. 1), т.е. знаки первого столбца чередуются через один, второго – через два, третьего – через четыре.
Три столбца управляемых факторов образуют собственно план эксперимента (обведено жирной чертой в табл. 1), а остальные столбцы МП получаются перемножением соответствующих значений управляемых факторов и необходимы для расчета оценок соответствующих коэффициентов при взаи-модействиях.
Аналогично могут быть получены планы для сколь угодно большого числа п независимых управ-ляемых факторов.
1.2 Проведение эксперимента на объекте исследования. Так как изменение отклика y носитслучайный характер, то в каждой точке xg приходится проводить т параллельных опытов и результаты
наблюдений yg 1, yg 2,..., ygm усреднять:
m | ||||||
g = | ∑ ygk. | (6) | ||||
y | ||||||
m k =1 |
Пусть в рассматриваемом случае число параллельных опытов в каждой строке МП m = 3. Перед реализацией плана на объекте необходимо рандомизировать (расположить в случайном порядке) вари-анты варьирования факторов, т.е. с помощью таблицы равномерно распределенных случайных чисел или компьютерной программы для проведения процесса рандомизации определить последовательность реализации вариантов варьирования плана в N × m опытах.
Далее проводят эксперимент, и результаты наблюдений эксперимента соответственно вариантам
варьирования плана записывают в столбцы yg 1, | yg 2 , yg 3 | табл. 2, а в столбце | g записывают осредненные | |||||||||||||||
y | ||||||||||||||||||
значения. | Таблица 2 | |||||||||||||||||
Параллельные опыты | ||||||||||||||||||
g | z 0 | z 1 | z 2 | z 3 | yg 1 | yg 2 | yg 3 | g | sg 2 | |||||||||
y | ||||||||||||||||||
+1 | –1 | –1 | –1 | 20,5 | 23,1 | 22,2 | 21,9 | 1,74 | ||||||||||
+1 | +1 | –1 | –1 | 15,4 | 14,9 | 13,8 | 0,67 | |||||||||||
+1 | –1 | +1 | –1 | 26,5 | 28,7 | 25,4 | 14,7 | 2,82 | ||||||||||
+1 | +1 | +1 | –1 | 32,0 | 32,8 | 34,0 | 1,01 | |||||||||||
+1 | –1 | –1 | +1 | 28,0 | 29,0 | 30,5 | 26,8 | 1,58 | ||||||||||
+1 | +1 | –1 | +1 | 27,1 | 28,5 | 29,0 | 0,97 | |||||||||||
+1 | –1 | +1 | +1 | 36,2 | 34,9 | 38,0 | 32,9 | 2,42 | ||||||||||
+1 | +1 | +1 | +1 | 32,4 | 32,0 | 33,0 | 0,25 | |||||||||||
29,1 | ||||||||||||||||||
28,2 | ||||||||||||||||||
36,3 | ||||||||||||||||||
32,4 | ||||||||||||||||||
1.3 Проверка воспроизводимости эксперимента есть не что иное,как проверка выполнения вто-
рой предпосылки регрессионного анализа об однородности выборочных дисперсий sg 2. Задача состоит в
проверке гипотезы о равенстве генеральных дисперсий σ2 { y 1}= σ2 { y 2} =... = σ2 { y N } при опытах соответст-венно в точках z 1,..., zN. Оценки дисперсий находят по известной формуле
m | |||||
sg 2= | ∑( ygk − | g)2. | (7) | ||
y | |||||
m −1 k =1 |
Рассчитанные для рассматриваемого примера по формуле (7) значения sg 2 занесены в последний
столбец табл. 2.
Например, для первой строки получим
s 12=31−1[(20,5−21,93)2+(23,1−21,93)2+(22,2−21,93)2]≈1,74.
Так как все оценки дисперсий получены по выборкам одинакового объема т = 3, то число степеней свободы для всех них одинаково и составляет
ν1вос = m – 1. | (8) |
В этом случае для проверки гипотезы об однородности оценок sg 2 дисперсий следует пользоваться
критерием Koxpэнa,который основан на законе распределения отношения максимальной оценки дис-персии к сумме всех сравниваемых оценок дисперсий, т.е.
max{ sg 2 }
G = Ng. (9)
∑ sg 2 { y }
g =1
Если вычисленное по данным эксперимента (эмпирическое) значение критерия G окажется меньше критического значения G кр, найденного по табл. П.1 (приложения) для ν1вос = m – 1 и ν2вос = N и выбран-ного уровня значимости q вос (обычно q вос = 0,05), то гипотеза об однородности выборочных дисперсий отвечает результатам наблюдений. При этом всю группу выборочных дисперсий sg 2 можно считать
оценками для одной и той же генеральной дисперсии σ2{ у } воспроизводимости эксперимента, откуда наилучшая ее оценка имеет вид
s вос2{ y }= | N | { y } | |||
∑ sg 2 | (10) | ||||
N g =1 | |||||
с числом степеней свободы | |||||
νвос = N (m – 1). | (11) |
Если проверка воспроизводимости эксперимента дала отрицательный результат, то остается при-знать его невоспроизводимость относительно управляемых факторов вследствие наличия неблагопри-ятных флуктуаций неуправляемых и неконтролируемых факторов. При этом следует либо увеличить число параллельных опытов для вариантов варьирования с большими значениями выборочных диспер-сий sg 2, либо использовать в дальнейшем модификацию метода наименьших квадратов, пригодную при
невыполнении предпосылки о воспроизводимости эксперимента. | ν1вос | |||||||||
В | нашем | случае | по | формуле | (9) | G =2,82 11,46≈0,25. | Для | = | ||
= m – 1 = 2, ν2вос = N = 8 и выбранного уровня значимости q вос = 0,05 найденное из табл. П.1 критическое значение критерия Кохрэна G кр = 0,5157. Поскольку удовлетворяется условие G < G кр, то воспроизводи-
мость результатов эксперимента выполняется. При этом найденная по формуле (10) оценка дисперсии воспроизводимости s вос2 { y }≈1,44.
1.4 Получение математической модели объекта. При ПФЭ получаются независимые оценки b 0, bi, bil соответствующих коэффициентов моделиβ0,β i,β il,т.е. b 0→ β0, bi → β i, bil → β il. Эти оценки легконайти по формулам
N | N | |||||||||||
b 0= | ∑ z 0 g | g , | bi = | ∑ zig | g, (i =1, 2,..., n), | (12) | ||||||
y | y | |||||||||||
N g =1 | N g =1 | |||||||||||
N | ||||||||||||
bil = | ∑ zig zlg | (i, l =1, 2,..., n; i ≠ l). | (13) | |||||||||
N g =1 |
Для нашего примера, используя данные табл. 1 и 2, получим:
b 0=18(21,93+14,70+26,87+32,93+...)≈27,83;
b 1=18(−21,93+14,70−26,87+32,93−...)≈ −0,75; b 2≈4,33; b 3≈3,72;
b 12=18(21,93−14,70−26,87+32,93+...)≈1,30; b 13≈ −0,46; b 23≈ −1,46; b 123≈ −2,03.
После определения оценок b коэффициентов регрессии необходимо проверить гипотезы об их зна-чимости, т.е. проверить соответствующие нуль-гипотезы β = 0. Проверку таких гипотез производят с помощью критерия Стьюдента, эмпирическое значение которого
ti = | bi | s { b }, | (14) | |||||
где | ||||||||
s 2{ b }= | s вос2 | { y } | – | (15) | ||||
Nm | ||||||||
дисперсия оценки b коэффициента уравнения регрессии. Если найденная величина параметра ti превы-шает значение t кр, определенное из табл. П.2 для числа степеней свободы νзн = N (m – 1), при заданном уровне значимости q зн (обычно q зн = 0,05), то проверяемую нуль-гипотезу Н 0: β = 0 отвергают и соот-ветствующую оценку bi коэффициента признают значимой. В противном случае, нуль-гипотезу не отвергают и оценку b считают статистически незначимой, т.е. β = 0.
Статистическая незначимость оценки bi коэффициента регрессии может быть обусловлена следую-щими причинами:
1) данный i -й фактор не имеет функциональной связи с откликом y, т.е. β i = 0;
2) уровень хi 0 базового режима x 0 находится в точке частного экстремума функции отклика по фак-
тору хi, и тогда β i = ∂∂ y = 0;
zi
3) интервал варьирования ∆ xi выбран слишком малым;
4) вследствие влияния неуправляемых и неконтролируемых факторов велика ошибка воспроизво-димости эксперимента.
Ортогональное планирование позволяет определять доверительные границы независимо для каждо-го из коэффициентов регрессии. Поэтому если какая-либо из оценок коэффициентов окажется незначи-мой, то ее можно отбросить без пересчета всех остальных. После этого математическую модель объекта составляют в виде уравнения связи отклика у и факторов xi, включающего только значимые оценки ко-эффициентов.
Для нашего примера дисперсия оценки коэффициентов в соответствии с формулой (15)
s 2{ b }= | ⋅1,44 ≈ 0,06. Рассчитанные по формуле (14) | эмпирические значения критерия Стьюдента ti | |||||||||||||||
⋅ | |||||||||||||||||
приведены в табл. 3. | Таблица 3 | ||||||||||||||||
bi | b 0 | b 1 | b 2 | b 3 | b 12 | b 13 | b 23 | b 123 | |||||||||
ti | 113,81 | 3,08 | 17,7 | 15,2 | 5,30 | 1,89 | 5,98 | 8,30 | |||||||||
Для числа степеней свободы νзн = N (m – 1) = 8⋅(3 – 1) = 16 и уровня значимости q зн = 0,05 критиче-ское значение критерия Стьюдента, найденное из табл. П.2, t кр = 2,119. Поэтому значимыми признают все оценки коэффициентов уравнения регрессии, кроме оценки b 13, так как для нее не выполняется ус-
ловие t 13 > t кр.
Тогда окончательно искомая математическая модель изучаемого объекта запишется в виде
y ˆ=27,83−0,75 z 1+4,33 z 2+3,72 z 3+1,3 z 1 z 2−1,46 z 2 z 3−2,03 z 1 z 2 z 3. (16)
1.5 Проверка адекватности математического описания. Чтобы проверить гипотезу об адекват-
ности математического описания опытным данным, достаточно оценить отклонение предсказанной по полученному уравнению регрессии величины отклика y ˆ g от результатов наблюдений yg в одних и тех
же g -х точках факторного пространства.
Для нашего примера значения y ˆ g, полученные в результате подстановки соответствующих величин факторов zi в g -х точках факторного пространства в найденную ранее математическую модель (16), приведены в последнем столбце табл. 4.
Таблица 4
ˆ | |||||||||
yg ("экспери- | |||||||||
g | z 0 | z 1 | z 2 | z 3 | yg ("мо- | ||||
мент") | дель") | ||||||||
+1 | –1 | –1 | –1 | 21,93 | 22,40 | ||||
+1 | +1 | –1 | –1 | 14,70 | 14,24 | ||||
+1 | –1 | +1 | –1 | 26,87 | 27,32 | ||||
+1 | +1 | +1 | –1 | 32,93 | 32,48 | ||||
+1 | –1 | –1 | +1 | 29,17 | 28,70 | ||||
+1 | +1 | –1 | +1 | 28,20 | 28,66 | ||||
+1 | –1 | +1 | +1 | 36,37 | 35,90 | ||||
+1 | +1 | +1 | +1 | 32,47 | 32,94 |
Например, для первой строки табл. 4: | ˆ | = | 27,83 | − | 0,75 | ⋅ − | 1) | + | 4,33 | × | |
y 1 | ( | ||||||||||
×(− 1) + 3,72 ⋅(− 1) + 1,3⋅(+ 1) − 1,46 ⋅(+ 1) − 2,03⋅(− 1)≈ 22,40. |
Рассеяние результатов наблюдений вблизи уравнения регрессии, оценивающего истинную функ-цию отклика, можно охарактеризовать с помощью дисперсии адекватности
= | m | N | − ˆ | |||||||
∑( yg | , | (17) | ||||||||
s ад | ||||||||||
yg) | ||||||||||
N − d g =1 |
где d – число членов аппроксимирующего полинома (значимых оценок коэффициентов модели объек-та). Дисперсия адекватности определяется с числом степеней свободы
νад = N – d. | (18) |
Для нашего примера в соответствии с формулой (17) получим
s ад2=8−37⋅[(21,93−22,40)2+(14,70−14,24)2+...]≈5,13.
Проверка гипотезы об адекватности состоит, по сути дела, в выяснении соотношения между дис-персией адекватности s ад2 и оценкой дисперсии воспроизводимости отклика s вос2. Если эти оценки дис-
персий однородны, то математическое описание адекватно представляет результаты опытов; если же нет, то описание считается неадекватным. Проверку гипотез