<<

стр. 2
(всего 3)

СОДЕРЖАНИЕ

>>

? ?
i =1
?
С учетом того, что y i = b0 + b1 x1i + b2 x2 i и значений частных произ-
водных (8.46), после арифметических преобразований получаем
n n n

? x1i + b2 ? x2i = ? yi ,
b0 n + b1
i =1 i =1 i =1
n n n n
? x1i + b1 ? ? x1i x2i = ? x1i yi ,
x1i2 + b2
b0 (8.48)
i =1 i =1 i =1 i =1
n n n n

? x2i + b1 ? x1i x2i + b2 ? ? x2 i yi .
x2 i2 =
b0
i =1 i =1 i =1 i =1

Решая полученную систему уравнений относительно b0, b1 и b2,
находим наилучшую аппроксимацию для соотношения (8.45). Силу
линейной связи между переменными Х1 и Х2 можно оценить на осно-
вании выборочного коэффициента корреляции
n

? (x1i ? x1 )(x2i ? x2 )
i =1
r * ( x1 , x2 ) = . (8.49)
(n ? 1) ? s ( x1 ) ? s ( x2 )




27
ЛЕКЦИЯ 9
Дисперсионный анализ, его задачи. Проведение однофакторного и двух-
факторного дисперсионного анализа.

9.1. Задачи дисперсионного анализа. Однофакторный диспер-
сионный анализ
Средние значения измеряемых величин зависят от комплекса ос-
новных факторов (качественных и количественных), определяющих
условия проведения опыта, и случайных факторов. Задачей дисперси-
онного анализа и является изучение влияния тех или иных факторов
на изменчивость средних. В зависимости от числа источников диспер-
сии (числа рассматриваемых факторов) различают однофакторный и
многофакторный дисперсионный анализ. Многофакторный дисперси-
онный анализ более эффективен по сравнению с классическим мето-
дом исследования, при котором изменяется только один фактор при
постоянстве всех остальных, что не позволяет определить влияние
взаимодействия различных факторов на результаты эксперимента.
При дисперсионном анализе каждое наблюдение используется для
одновременной оценки всех факторов и их взаимодействий. Суть дис-
персионного анализа заключается в выделении и оценке отдельных
факторов, влияющих на значения среднего. При этом суммарная вы-
борочная дисперсия разлагается на составляющие, обусловленные
действием независимых факторов. Влияние данного фактора призна-
ется значимым, если соответствующая ему выборочная дисперсия
значимо отличается от дисперсии воспроизводимости, обусловленной
случайными ошибками. Проверка значимости оценок дисперсий про-
водится по критерию Фишера.
В дальнейшем примем, что:
1) случайные ошибки нормально распределены;
2) эксперименты равноточны;
3) изучаемые факторы влияют только на изменчивость средних,
но не на дисперсию наблюдений (она постоянна).
При дисперсионном анализе рассматриваются факторы двух ви-
дов: со случайными уровнями и с фиксированными. В первом случае
выбор уровней фактора производится из бесконечной совокупности
возможных значений. Если все уровни выбираются случайным обра-
зом, то математическая модель объекта называется моделью со слу-
чайными уровнями факторов. Если же каждый фактор может прини-
мать только некоторые из фиксированных значений, то говорят о мо-
дели с фиксированными уровнями факторов. В случае модели сме-


28
шанного типа одна группа факторов рассматривается на случайных
уровнях, а другая — на фиксированных.
Рассмотрим влияние на результаты опытов единичного фактора А,
принимающего k различных значений (фактор А имеет k фиксирован-
ных уровней ai, i = 1, 2, …, k). Обозначим через yij результат j-опыта в
серии из ni числа измерений ( j = 1, 2, …, ni), выполненных на i-уровне
фактора А (табл. 2).
Таблица 2


Исходные данные для однофакторного дисперсионного анализа
Номер Уровни фактора А
наблюдения а1 а2 … аk
1 y11 y21 … yk1
2 y12 y22 … yk2
… … … … …

n y1n y 2n y kn
Итоги: B1, C1 B2, C2 … Bk, Ck

Предположим, что результат каждого опыта можно представить в
виде следующей модели:
yij = µ + ? i + ?ij , (9.1)
где µ — суммарный эффект во всех опытах; ?i — эффект, обуслов-
ленный влиянием фактора А на i-уровне; ?ij — случайная ошибка опы-
та на i-уровне. Примем также, что наблюдения на фиксированном
уровне фактора А нормально распределены относительно среднего
значения (µ + ?i) с общей дисперсией ?2ош.. Для того чтобы решить
вопрос о значимости влияния фактора А, следует проверить нулевую
гипотезу равенства математических ожиданий сумм (µ + ?i) на раз-
личных уровнях этого фактора:
H 0 : m1 = m2 = ... = mk = m , (9.2)
где mi = M{µ + ?i}.
Рассмотрим случай, когда на каждом уровне выполнено равное
число опытов (n1 = n2 = … = nk = n). Общее число опытов равно
N = n1 + n2 + ... + nk = kn . (9.3)
Обозначим сумму результатов всех опытов (итогов) на i-уровне через




29
n

? yij ,
Bi = (9.4)
j =1

а сумму квадратов итогов на i-уровне через
n

? yij 2 .
Ci = (9.5)
j =1

Тогда среднее значение наблюдений на i-уровне равно
n

? yij Bi
j =1
yi = = , (9.6)
n n
а общее среднее для всей выборки из N наблюдений —
k n k k
1 1 1
?? ? ?
y= yij = yi = Bi . (9.7)
N k i =1 kn i = 1
i =1 j =1

Общая выборочная дисперсия опытов определяется выражением
k n

?? ( yij ? y) 2 ?k 2?
1? ?
n k n
1?
?? ?? ?=
?? yij ?
i =1 j =1
yij 2
s2 = =
N ? 1 ? i =1 ?
N ? i =1 ?
N ?1
? ?
j =1 j =1
? ?
? ?
?k ??
2
?k
1? 1
? ?
Bi ? ? ,
Ci ? ?
= (9.8)
N ? 1 ? i =1 N ? i =1 ? ?
? ??
?
? ?
а выборочная дисперсия на i-уровне —
?n ??
2
?n
n
1 1? 1
? ? ?
yij ? ? =
yij 2 ? ?
si2 = ( yij ? yi ) 2 =
n ? 1 ? j =1 n ? j =1 ? ?
n ? 1 j =1
? ??
?
? ?

1? Bi2 ?
= ?Ci ? ?. (9.9)
n ?1 ? n?

Если выборочные дисперсии si2 однородны (проверка по крите-
рию Кохрена), то лучшей оценкой дисперсии ?2ош., характеризующей
влияние случайных факторов, будет выборочная дисперсия


30
k
1
? si2
2
=
sош (9.10)
k i =1

с числом степеней свободы fош = k(n – 1) = N – k. Приближенно оце-
нить дисперсию фактора А можно следующим образом:
? 2 ? s 2 ? sош .
2
(9.11)
A
Для получения более точной оценки рассмотрим отклонение сред-
них на фиксированных уровнях от общего среднего:
k 2 2

? ( y ? y)
? ош sош
1 2
? ?2 2
+ ? ?A + . (9.12)
i A
k -1 n n
i =1

В данном случае под дисперсией фактора А понимают математиче-
ское ожидание среднего квадрата отклонений, обусловленного влия-
нием этого фактора. Выборочная дисперсия
k

?
n
s2 = ( yi ? y ) 2 ? n? 2 + sош
2
(9.13)
A A
k -1
i =1

с числом степеней свободы fA = k – 1 используется для проверки нуле-
вой гипотезы (9.2) по критерию Фишера.
При этом, если нулевая гипотеза ( H 0 : ? 2 = ? ош ) верна, выполня-
2
A
ется следующее условие:
(s )
2 2
sош ? F1? p , (9.14)
A

т. е. различие между дисперсиями s 2 и sош является незначимым, и
2
A
следовательно влияние фактора А на результаты опытов тоже незна-
чимо (сопоставимо с эффектом случайности). При проверке гипотезы
используется односторонний критерий, так как альтернативной гипо-
тезой является H1 : ? 2 > ? ош . Если же
2
A

(s )
2 2
sош > F1? p , (9.15)
A

то нулевая гипотеза о равенстве математических ожиданий сумм
(µ + ?i) отвергается (влияние фактора А значимо). Чтобы выяснить,
какие средние различны, можно использовать критерий Стъюдента,
сравнивая средние попарно. Оценить влияние фактора А можно на
основании (9.13):
s 2 ? sош
2
?2 =A . (9.16)
A
n


31
Если на каждом уровне выполнено разное число опытов, выбороч-
ная дисперсия фактора А рассчитывается по формуле
?k 2?
? ?
k

? ?
Bi2 1 ?
1? ?
?
s2 = ?? Bi ? ?, (9.17)
?
A
N? ?
k -1 n
? i =1 i ?
? ?
i =1
? ?
а выборочная дисперсия, характеризующая влияние случайных фак-
торов, по формуле
k k

? ? fi ,
2
f i si2
=
sош (9.18)
i =1 i =1
2
где fi = ni – 1. Число степеней свободы sош равно fош = N – k.
Если дисперсия s 2 значимо отличается от дисперсии sош , т. е. вы-
2
A
полняется неравенство (9.15), то дисперсия фактора А оценивается по
формуле

( )
k ?1 2
?2 ? 2
s A ? sош . (9.19)
A
N ?1

9.2. Двухфакторный дисперсионный анализ
Рассмотрим влияние на результаты опытов двух факторов А и В.
Фактор А исследуется на k уровнях (i = 1, 2, …, k), фактор В — на m
уровнях ( j = 1, 2, …, m). Пусть при каждом сочетании уровней факто-
ров выполнено n параллельных опытов (q = 1, 2, …, n). Тогда общее
число опытов равно N = nkm. Обозначим через yijq результат q-го опы-
та, выполненного на i-уровне фактора А и j-уровне фактора В.
Предположим, что результат каждого опыта можно представить
следующим образом:
yijq = µ + ? i + ? j + ? i? j + ?ijq , (9.20)
где µ — общее среднее (суммарный эффект во всех опытах); ?i и ?j —
эффекты, обусловленные влиянием фактора А на i-уровне и фактором
В на j-уровне соответственно; ?ijq — случайная ошибка опыта, распре-
деленная нормально с нулевым математическим ожиданием и диспер-
2
сией ?ош ; ?i?j — эффект взаимодействия факторов. Величина ?i?j
характеризует отклонение среднего в (ij)-серии опытов от суммы пер-
вых трех членов в ур-и (9.20), а соответствующую ей дисперсию ? 2AB
можно оценить только при наличии параллельных опытов.


32
При отсутствии параллельных опытов (табл. 3) или в случае, если
эффектом взаимодействия факторов пренебрегают, для описания ре-
зультатов экспериментов используется линейная модель
yij = µ + ? i + ? j + ?ij . (9.21)

Таблица 3

Исходные данные для двухфакторного дисперсионного анализа
без параллельных опытов. Факторы А и В исследуются на 3 уровнях
Уровни Уровни фактора А
фактора В а1 а2 а3 (аk) Средние:
'
b1 y11 y21 y31 (yk1) y1
'
b2 y12 y22 y32 (yk2) y2
' '
b3 (bm) y13 y23 y33 (ykm) y3 ( y m )
––
Средние: y1 y2 y3 ( y k )

'
Обозначим через y i и y j средние по столбцам и по строкам:
m k

? yij ? yij
j =1 i =1
'
yi = , yj = , (9.22)
m k
а через y — среднее всех опытов:
k m k
1 1
?? ? yi .
y= yij = (9.23)
km i = 1 k
j =1 i =1

Рассмотрим влияние факторов А и В на рассеяние средних по
столбцам и по строкам соответственно относительно общего среднего.
Рассеяние в средних по строкам не зависит от фактора А, так как все
его уровни усреднены, и определяется влиянием фактора В и случай-
ных факторов.
Тогда с учетом того, что дисперсия среднего в k раз меньше дис-
персии случайной ошибки единичного измерения, имеем


? ( y ? y) .
m
2
? ош 1 2
'
2
?B + ? (9.24)
j
m ?1
k
j =1

Аналогичным образом можно показать, что



33
k

? ( y ? y)
2
?ош 1 2
?2 + ? . (9.25)
A i
k ?1
m
i =1

Таким образом, чтобы оценить дисперсии факторов А и В, необходи-
мо знать дисперсию случайной ошибки.
Оценить влияние случайных факторов при отсутствии параллель-
ных опытов можно следующим образом. Рассеяние результатов опы-
тов в i-столбце относительно его среднего обусловлено влиянием фак-
тора В и фактора случайности:
m

? ( yij ? y i ) 2 ? ?2 + ?ош .
1
si2 = 2
(9.26)
B
m ?1
j =1

Равенство (9.26) станет более точным, если использовать средне-
взвешенное значение дисперсии по всем столбцам:
k

?
1
? 2 + ? ош ?
2
si2 . (9.27).
B
k
i =1

Вычитая (9.24) из (9.27), получим


? ( y ? y)
k m

?
2
? ош 1 1 2
'
2
si2
? ош ? ? ? , (9.28)
j
m ?1
k k
i =1 j =1

или после арифметических преобразований
? ?
?( )
k m

?
1 2
?(m ? 1) y j ? y ? ? sош . (9.29)
'
2
si2 ? k 2
?ош ?
(k ? 1)(m ? 1) ? ?
? ?
i =1 j =1

Полученную оценку для дисперсии случайной ошибки с числом сте-
2
пеней свободы fош = (k – 1)(m – 1) обозначим через sош . Определим
также следующие выборочные дисперсии:
k
( y i ? y ) 2 ? m?2A + sош ,
?
m
2 2
sA = (9.30)
k ?1
i =1




?( y )
m
k 2
'
2
? k? 2 + sош
2
sB = ?y (9.31)
B
j
m ?1
j =1

с числом степеней свободы fA = (k – 1) и fB = (m – 1).


34
Проверка нулевой гипотезы о незначимости влияния факторов А и
В проводится по критерию Фишера: если
s2 2
sB
A
? F1? p ( f A , f ош ) и (или) 2 ? F1? p ( f B , f ош ) , (9.32)
2
sош sош
то влияние фактора признается незначимым (?i = 0 и (или) ?j = 0).
Если одно (или оба) из неравенств (9.32) не выполняется, то влия-
ние соответствующего фактора (факторов) значимо. Определить, ка-
кие именно средние различны, можно по критерию Стъюдента.
Рассмотрим теперь случай, когда при каждом сочетании уровней
факторов А и В выполнено n параллельных опытов (u = 1, 2, …, n), что
дает возможность оценить влияние взаимодействия этих факторов на
результаты опытов.
Так, например, в табл. 3 вместо одного значения y11 появится серия
значений y111, y112, …, y11n . Обозначим через y ij среднее в ячейке
(среднее серии параллельных опытов):
n

?y
1
y ij = (9.33)
iju
n
u =1

Тогда
m k

? ?y
1 1
'
yi = y ij , y j = , (9.34)
ij
m k
j =1 i =1

k m k

?? ?y
1 1
y= y ij = (9.35)
i
km k
i =1 j =1 i =1

и дисперсии s 2 и s B рассчитываются по формулам (9.30) и (9.31).
2
A
В качестве оценки дисперсии воспроизводимости используем средне-
взвешенное значение дисперсий результатов в каждой ячейке
k m

??
1
2 2
=
sош sij , (9.36)
mk
i =1 j =1

где
n
( yiju ? y ij ) 2 .
?
1
2
sij = (9.37)
n ?1
u =1




35
2
Число степеней свободы дисперсии sош равно fош = mk (n – 1).
Введем также выборочную дисперсию, характеризующую влияние
взаимодействия факторов
?k m 2?
?( )
m

?? ( )
n ? y j ? y ? , (9.38)
2 '
s2 ? y ij ? y i ? k
AB
(k ? 1)(m ? 1) ? ?
? i =1 j =1 ?
j =1

с числом степеней свободы fAB = (k – 1)(m – 1).
Проверка значимости влияния факторов и их взаимодействия про-
водится по критерию Фишера, но неодинаково для моделей с фикси-
рованными и случайными уровнями:
1. Для модели с фиксированными уровнями выборочные диспер-
сии s 2 , s B и s 2 сравниваются с оценкой дисперсии воспроизводимо-
2
A AB
2
сти sош . Если выполняются неравенства
(s ) (s )
sош > F1? p ( f A , f ош ) , sош > F1? p ( f B , f ош ) ,
2 2 2 2
A B

(s )
sош > F1? p ( f AB , f ош ) ,
2 2
(9.39)
AB

то влияние факторов и их взаимодействия значимо.
2. Для модели со случайными уровнями проверка значимости
взаимодействия факторов проводится так же, как и для для модели с
фиксированными уровнями. Влияние факторов значимо, если выпол-
няются следующие неравенства:
(s )
s 2 > F1? p ( f A , f AB ) ,
2
A AB

(s )> F ( f B , f AB ) .
2
s2 (9.40)
1? p
B AB




36
ЛЕКЦИЯ 10
Планирование эксперимента при дисперсионном анализе. Постановка за-
дачи при планировании экстремальных экспериментов. Полный фактор-
ный эксперимент типа 22: матрица планирования, вычисление коэффици-
ентов уравнения регрессии.



10.1. Планирование эксперимента при дисперсионном анализе
При двухфакторном дисперсионном анализе минимальное число
опытов (в условиях линейной модели), обеспечивающее перебор всех
возможных сочетаний уровней факторов, определяется произведени-
ем числа их уровней: N = km. Подобный эксперимент называется пол-
ным факторным экспериментом (ПФЭ). Если изучается влияние на
процесс k факторов при одинаковом числе уровней n, то необходимое
число опытов при ПФЭ равно
N = nk . (10.1)
Так, если k = 2 и n = 3 (табл. 3, лекция 9), то N = 32 = 9.
Эксперимент, в котором пропущены некоторые сочетания уров-
ней, называется дробным факторным экспериментом (ДФЭ). Сокра-
щение числа опытов неизбежно приводит к потере части информации,
при этом обычно пренебрегают эффектами взаимодействия факторов.
Рассмотрим трехфакторный дисперсионный анализ при одинако-
вом числе уровней n для каждого фактора. Пусть n = 2. Тогда при
ПФЭ потребуется провести N = 23 = 8 опытов (табл. 4).

Таблица 4
3
Полный факторный эксперимент 2
Уровни а1 а2
факторов b1 b2 b1 b2
c1 *y111 y121 y211 *y221
c2 y112 *y122 *y212 y222

При отсутствии параллельных опытов результаты наблюдений
можно представить в виде линейной модели
yijq = µ + ? i + ? j + ? q + ? ijq , (10.2)
при этом линейные эффекты оказываются смешанными с эффектами
взаимодействия: эффект А с ВС взаимодействием, эффект В с АС взаи-
модействием, эффект С с АВ взаимодействием. Однако число опытов


37
в условиях линейной модели можно существенно сократить при ис-
пользовании ДФЭ, спланированного по схеме латинского квадрата.
Латинским квадратом n x n называют квадратную таблицу, со-
ставленную из n элементов (чисел или букв) таким образом, чтобы
каждый элемент повторялся в каждой строке и каждом столбце только
один раз. Из двух элементов образуется латинский квадрат 2 x 2:
AB c1 c2
или ; (10.3)
BA c2 c1
из трех — латинский квадрат 3 x 3:
c1 c2 c3
ABC
B C A или c2 c3 c1 . (10.4)
C AB c3 c1 c2
Стандартными латинскими квадратами называются квадраты, у ко-
торых первые строка и столбец построены или в алфавитном порядке,
или в порядке натурального ряда (квадраты (10.3) и (10.4)). Получены
эти квадраты путем одношаговой циклической перестановки.
При ДФЭ по схеме латинского квадрата вводится в планирование
третий фактор, при этом основой служит ПФЭ типа n2. Так, при n = 2
на ПФЭ типа 22 (для факторов А и В) накладывается латинский квад-
рат 2 x 2 (табл. 5). План эксперимента, соответствующий табл. 5, на-
зывается матрицей планирования и представлен в табл. 6. Число опы-
тов при этом сокращается до четырех вместо восьми при ПФЭ.


Таблица 5

2 x 2 латинский квадрат
В
А
b1 b2
a1 c1 c2
a2 c2 c1

Хотя латинский квадрат 2 x 2 является частью плана, всю табл. 5
также называют латинским квадратом. В нем каждый элемент повто-
ряется только один раз в каждой строке и каждом столбце, что в рав-
ной степени сказывается при подсчете средних по строкам и столб-
цам. Приведенный в табл. 6 план представляет собой половину — по-
луреплику от ПФЭ типа 23 (вошедшие в полуреплику опыты отмечены
в табл. 4 звездочками).


38
Таблица 6

План ДФЭ по схеме латинского квадрата 2 x 2
(k = 3, n = 2, N = 4)
Номер Итоги
А В С
опыта
1 а1 b1 c1 y111
2 а1 b2 c2 y122
3 а2 b1 c2 y212
4 а2 b2 c1 y221

Аналогично планируется ДФЭ по схеме латинского квадрата 3 x 3
(табл. 7). За основу взят ПФЭ типа 32, третий фактор (С) введен в рас-
смотрение по схеме латинского квадрата (10.4). ДФЭ 32 можно рас-
сматривать как 1/3 реплику от ПФЭ типа 33.
Таблица 7

Латинский квадрат 3 x 3
A B
b1 b2 b3
a1 c1 c2 c3
y1 y2 y3
a2 c2 c3 c1
y4 y5 y6
a3 c3 c1 c2
y7 y8 y9

В общем случае при планировании дробного факторного экспери-
мента по схеме латинского квадрата число опытов по сравнению с
ПФЭ уменьшается в n раз (так, если n = 4, то при ПФЭ N =43 = 64, а
при ДФЭ по схеме латинского квадрата 4 x 4 — N = 42 = 16).
Дисперсионный анализ латинского квадрата, выполненного без
параллельных опытов, проводится аналогично двухфакторному дис-
персионному анализу. При этом для факторов А и В рассматривается
их влияние на рассеяние средних по столбцам и по строкам относи-
тельно общего среднего соответственно, а для фактора С — на рас-
сеяние средних по латинским буквам Сq. Так, например, для ДФЭ,
представленного в табл. 7, средние по латинским буквам равны
y1 + y6 + y8 y2 + y4 + y9 y3 + y5 + y7
C1 = , C2 = , C3 = . (10.5)
3 3 3

39
Значимость линейных эффектов проверяют по критерию Фишера.
Адекватность принятой линейной модели можно проверить, выполнив
для каждого сочетания уровней факторов (для каждой ячейки латин-
ского квадрата) одинаковое число параллельных опытов. При этом
наличие параллельных наблюдений используется только для оценки
случайной ошибки опыта. Если эффекты взаимодействия незначимы,
то остаточная дисперсия будет незначимо отличаться от дисперсии
воспроизводимости, обусловленной ошибкой опыта.

10.2. Постановка задачи при планировании экстремальных
экспериментов
Решение экстремальных задач физической химии и химической
технологии (например, определение оптимальных условий проведе-
ния опыта и протекания процесса, оптимального состава материалов)
возможно на основе математической модели объекта — функции от-
клика, связывающей выходной параметр, характеризующий результа-
ты эксперимента, с переменными, определяющими условия проведе-
ния опыта (факторами):
y = ? (x1, x2,…, xk). (10.6)
На основе теоретического анализа физико-химических процессов
при наличии достаточной информации об их механизмах можно со-
ставить детерминированную математическую модель объекта. Однако
при проведении большинства исследований механизмы процессов,
протекающих в изучаемых объектах, остаются неизвестными, поэтому
для решения задач оптимизации необходимо использовать методы ма-
тематической статистики.
При статистическом подходе математическая модель объекта или
процесса представляется в виде полинома, т.е. отрезка ряда Тейлора, в
который разлагается неизвестная функция (10.6):
k k k

? ? ? ? jj x 2 +
y = ?0 + ? jxj + ?uj xu x j + j
j =1 u , j =1 j =1
u? j
k

??
+ + ... , (10.7)
iuj xi xu x j
i ,u , j =1
i?u ? j

где



40
? ? (0) ? ? (0)
?0 = ? (0), ? j = , ?uj = ,
? xj ? xu ? x j

? ? ( 0) ? ? (0)
? jj = , ?iuj = . (10.8)
? xi ? xu ? x j
2
2? x j
Из-за воздействия случайных факторов на результаты опыта при
обработке и анализе экспериментальных данных для полиномиальной
модели (10.7) находят выборочные коэффициенты регрессии b0, bj, buj,
bjj, buij, которые являются оценками соответствующих теоретических
коэффициентов. Уравнение регрессии записывается в виде
k k k k

? ? ? ?b
?
b jj x 2 +
y = b0 + bj x j + buj xu x j + + ...
iuj xi xu x j
j
j =1 u , j =1 j =1 i ,u , j =1
u? j i?u ? j
k

?b
+ + ... ,
iuj xi xu x j (10.9)
i ,u , j =1
i?u ? j

где b0 — свободный член; bj — линейные эффекты; buj — эффекты
парного взаимодействия; bjj — квадратичные эффекты; buij — эффекты
тройного взаимодействия.
В зависимости от целей исследования и имеющейся информации
можно ограничиться расчетом только части коэффициентов, пренеб-
регая влиянием остальных эффектов (например, в условиях линейной
модели значимыми считаются только линейные эффекты, квадратич-
ной модели — линейные и квадратичные эффекты, при этом в обоих
случаях принимается, что эффекты взаимодействия факторов пренеб-
режимо малы).
Следует отметить, что на основании оценок теоретических коэф-
фициентов нельзя определить аналитическое выражение функции от-
клика и, следовательно, получить информацию о механизме процесса.
Полиномиальные модели используются только для решения задач оп-
тимизации и управления процессами.
Под планированием эксперимента понимают оптимальное (наибо-
лее эффективное) управление ходом эксперимента с целью получения
максимально возможной информации на основе минимально допус-
тимого количества опытных данных. Весь эксперимент обычно разби-
вается на несколько этапов. Информация, полученная после каждого
этапа, используется для планирования исследований на следующем
этапе. Планирование эксперимента позволяет варьировать все факто-


41
ры и получать одновременно количественные оценки всех эффектов,
и при этом, в отличие от классического регрессионного анализа, из-
бежать корреляции между коэффициентами уравнения регрессии.

10.3. Полный факторный эксперимент типа 22: матрица пла-
нирования, вычисление коэффициентов уравнения регрессии
При полном факторном эксперименте (ПФЭ) число опытов равно
числу всех возможных комбинаций уровней факторов и при одинако-
вом числе уровней для каждого фактора определяется формулой
N = nk , (10.10)
где n — число уровней, k — число факторов ( j = 1, 2, …, k). ПФЭ 2k
называется такое проведение опытов, при котором каждый из k фак-
торов рассматривается только на двух уровнях. При этом уровни фак-
торов представляют собой границы варьирования данного параметра.
Допустим, что изучается влияние на выход продукта (y) двух па-
раметров (факторов): температуры (z1) в интервале 50–100 оС и давле-
ния (z2) в диапазоне 1–2 атм. При реализации ПФЭ требуется выпол-
нить N = 22 = 4 опыта. Произведем кодирование факторов (замену пе-
ременных):
z j ? zo
j
xj = , (10.11)
?zj
где
z max + z min z max ? z min
j j j j
zo = , ?zj = , (10.12)
j
2 2
z max и z min — верхняя и нижняя границы варьирования j-фактора.
j j
oo
Точка ( z1 , z 2 ) называется центром плана, или основным уровнем; ве-
личины ? z1 и ? z2 — интервалами варьирования по осям z1 и z2.
Как следует из уравнений (10.11) и (10.12), для переменных х1 и х2
нижний уровень равен –1, верхний — +1, координаты центра плана
равны нулю. В табл. 8 представлен план ПФЭ 22, который в безраз-
мерном масштабе может быть интерпретирован в виде четырех вер-
шин квадрата (рис. 1).




42
Таблица 8

Полный факторный эксперимент 22
№ Факторы Факторы Выход
опыта в натуральном в безразмерном продукта, y
масштабе масштабе
z1 (oC) z2 (атм) x1 x2
1 50 1 –1 –1 y1
2 50 2 –1 +1 y2
3 100 1 +1 –1 y3
4 100 2 +1 +1 y4




Рис. 1. Полный факторный эксперимент 22

Вычислим коэффициенты линейного уравнения регрессии
?
y = b0 + b1 x1 + b2 x2 . (10.13)
Для нахождения b0 в план ПФЭ надо ввести столбец фиктивной пере-
менной х0 = 1; соответствующая матрица планирования представлена
в табл. 9. В математической статистике доказывается, что при плани-
ровании эксперимента по предложенной схеме и нахождении коэф-
фициентов уравнения регрессии по методу наименьших квадратов
любой коэффициент определяется скалярным произведением столбца
y на соответствующий столбец факторов хj в безразмерном масштабе
(табл. 9), деленным на число опытов в матрице планирования:
N

?x ji yi
i =1
bj = . (10.14)
N




43
Таблица 9

Матрица планирования ПФЭ типа 22
с фиктивной переменной
№ опыта х0 х1 х2 y
1 +1 –1 –1 y1
2 +1 –1 +1 y2
3 +1 +1 –1 y3
4 +1 +1 +1 y4

Так, значение коэффицента b1 определяется выражением
4

?
[? y1 + y 2 ? y3 + y 4 ]
1
b1 = x1i yi = . (10.15)
4 4
i =1

Если ввести в рассмотрение эффект парного взаимодействия, то
уравнение регрессии примет вид
?
y = b0 + b1 x1 + b2 x2 + b12 x1 x2 . (10.16)
Для нахождения коэффициента b12 необходимо расширить матрицу
планирования, представленную в табл. 9, добавив в нее столбец x1x2,
характеризующий эффект взаимодействия (табл. 10).
Таблица 10


Расширенная матрица планирования ПФЭ типа 22
№ опыта х0 х1 х2 х1х2 y
1 +1 -1 -1 +1 y1
2 +1 -1 +1 -1 y2
3 +1 +1 -1 -1 y3
4 +1 +1 +1 +1 y4

Значения фактора взаимодействия в безразмерном масштабе опре-
деляются произведением соответствующих значений факторов x1 и x2:
( x1 x2 )i = x1i ? x2i . (10.17)
Коэффициент b12 определяется так же, как и линейные эффекты:
N

?
1 1
b12 = ( x1 x2 )i yi = [ y1 ? y2 ? y3 + y4 ] . (10.18)
N 4
i =1




44
ЛЕКЦИЯ 11
Матрица планирования ПФЭ 23. Проверка значимости коэффициентов и
адекватности уравнения регрессии, полученных при обработке результа-
тов ПФЭ 22 и 23. Дробный факторный эксперимент. Планы типа 2k-1.

11.1. Матрица планирования полного факторного эксперимен-
та типа 23
Рассмотрим планирование ПФЭ типа 23, при котором исследуется
влияние на результат опыта уже трех факторов. При реализации тако-
го ПФЭ требуется выполнить N = 8 опытов. Проведем кодирование
факторов по уравнениям (10.11) – (10.12). План проведения опытов
представлен в табл. 11, геометрически в безразмерном масштабе он
может быть интерпретирован в виде восьми вершин куба (рис. 2).


Таблица 11

Полный факторный эксперимент 23
№ Факторы в безразмерном масштабе Выход
опыта продукта, y
x1 x2 x3
1 –1 –1 –1 y1
2 +1 –1 –1 y2
3 –1 +1 –1 y3
4 +1 +1 –1 y4
5 –1 –1 +1 y5
6 +1 –1 +1 y6
7 –1 +1 +1 y7
8 +1 +1 +1 y8

Уравнение регрессии с учетом эффектов взаимодействия факторов
запишется в следующем виде:
?
y = b0 + b1 x1 + b2 x2 + b3 x3 + b12 x1 x2 + b13 x1 x3 +
+ b23 x2 x3 + b123 x1 x2 x3 , (11.1)
где коэффициенты b12, b13 и b23 характеризуют эффекты парного взаи-
модействия, b123 — эффект тройного взаимодействия.
Для нахождения коэффициентов уравнения (11.1) необходимо со-
ставить расширенную матрицу планирования ПФЭ с фиктивной пере-
менной, представленную в табл. 12.


45
Рис. 2. Полный факторный эксперимент 23


Таблица 12

Расширенная матрица планирования ПФЭ типа 23
№ x0 x1 x2 x3 x1 x2 x1 x3 x2 x3 x1x2x3 y
1 +1 –1 –1 –1 +1 +1 +1 –1 y1
2 +1 +1 –1 –1 –1 –1 +1 +1 y2
3 +1 –1 +1 –1 –1 +1 –1 +1 y3
4 +1 +1 +1 –1 +1 –1 –1 –1 y4
5 +1 –1 –1 +1 +1 –1 –1 +1 y5
6 +1 +1 –1 +1 –1 +1 –1 –1 y6
7 +1 –1 +1 +1 –1 –1 +1 –1 y7
8 +1 +1 +1 +1 +1 +1 +1 +1 y8

Как и при ПФЭ 22, коэффициенты уравнения регрессии (11.1) оп-
ределяются скалярным произведением столбца y на соответствующий
столбец факторов или их взаимодействий в безразмерном масштабе,
деленным на число опытов в матрице планирования (см. уравнения
(10.14) и (10.18)).
Так, например, коэффициент b123 рассчитывается по следующему
выражению:
1
b123 = [? y1 + y 2 + y3 ? y 4 + y5 ? y 6 ? y 7 + y8 ]. (11.2)
8


46
11.2. Проверка значимости коэффициентов и адекватности
уравнения регрессии, полученных при обработке результатов
ПФЭ 22 и 23
Для оценки значимости коэффициентов уравнения регрессии и
проверки адекватности уравнения эксперименту достаточно провести
серию параллельных опытов, выполненных при каком-то одном соче-
тании факторов.
oo ooo
Пусть в центре плана (в точках ( z1 , z 2 ) и ( z1 , z2 , z3 ) для ПФЭ 22 и
23 соответственно) проведена серия из m опытов. Тогда выборочная
дисперсия воспроизводимости, характеризующая влияние случайных
факторов, равна
m

?( )
o2
o
?y
yu
u =1
2
sвоспр = , (11.3)
m ?1
где yu — результат u-го опыта (u = 1, 2, …, m), y o — среднее значе-
o

ние серии опытов. В математической статистике доказывается, что
для спланированных экспериментов все коэффициенты уравнений
регрессии определяются с одинаковой точностью, равной
sвоспр
s (b j ) = . (11.4)
N
Значимость коэффициентов проверяется по критерию Стъюдента.
В условиях нулевой гипотезы Н0: ?j = 0; отношение абсолютной вели-
чины коэффициента к его ошибке имеет распределение Стъюдента.
Для каждого коэффициента определяется t-отношение:
bj bj
tj = = N, (11.5)
s (b j ) sвоспр
которое сравнивается с табличным значением критерия Стъюдента
tp(f ) для выбранного уровня значимости р (обычно 0,05) и числа сте-
пеней свободы f = m – 1. Если для рассматриваемого коэффициента
tj > tp(f ), то он значимо отличается от нуля. Выборочные коэффициен-
ты, для которых tj ? tp(f ), незначимы, и их следует исключить из урав-
нения регрессии.
Допустим, при проверке значимости коэффициентов уравнения
(11.1) оказалось, что все коэффициенты, характеризующие эффекты
взаимодействия факторов, незначимы. После их исключения получа-
ем линейное уравнение регрессии

47
?
y = b0 + b1 x1 + b2 x2 + b3 x3 , (11.6)
при этом значения b0, b1, b2 и b3 не требуется вычислять заново из-за
того, что коэффициенты уравнения некоррелированы между собой.
В отличие от классического регрессионного анализа, исключение не-
значимого коэффициента не сказывается на величинах остальных ко-
эффициентов уравнения регрессии, а сами выборочные коэффициен-
ты, полученные при реализации ПФЭ, являются несмешанными оцен-
ками теоретических коэффициентов.
Адекватность уравнения проверяется по критерию Фишера
( )
2 2
F = sад sвоспр , (11.7)
Дисперсия адекватности (остаточная дисперсия) равна
N ?
?
1
2 2
( yi ? y i ) 2 ,
= =
sад sост (11.8)
N ?l i =1

где l — число значимых коэффициентов (для рассматриваемого слу-
чая l = 4). Уравнение адекватно описывает эксперимент, если
F ? F1? p ( f1 , f 2 ) , (11.9)
где F1-p (f1, f2) — табличное значение критерия Фишера для р = 0,05 и
чисел степеней свободы f1 = fад = N – l и f2 = fвоспр = m – 1.
Рассмотрим также схему проведения регрессионного анализа для
спланированного эксперимента в случае, когда каждый опыт в матри-
це планирования повторялся m раз. В качестве примера используем
ПФЭ 23; при получении уравнения регрессии ограничимся линейным
приближением (уравнение (11.6)). Матрица планирования такого экс-
перимента представлена в табл. 13.
Для каждого сочетания уровней факторов определяется среднее
значение измеряемой величины и выборочная дисперсия:
m

?
1
yi = yiu , (11.10)
m u =1
m

?
1
( yiu ? y i )2 .
si2 = (11.11)
m ? 1 u =1




48
Таблица 13

Матрица планирования ПФЭ 23 в условиях линейной модели
с одинаковым числом параллельных опытов
при каждом сочетании уровней факторов
№ x0 x1 x2 x3 y yi si2
y11, y12, …, y1m y1 s12
1 +1 –1 –1 –1
y21 y22, …, y2m y2 2
s2
2 +1 +1 –1 –1
y31, y32, …, y3m y3 2
s3
3 +1 –1 +1 –1
y41, y42, …, y4m y4 2
s4
4 +1 +1 +1 –1
y51, y52, …, y5m y5 2
s5
5 +1 –1 –1 +1
y61, y62, …, y6m y6 2
s6
6 +1 +1 –1 +1
y71, y72, …, y7m y7 2
s7
7 +1 –1 +1 +1
y81, y82, …, y8m y8 2
s8
8 +1 +1 +1 +1

Однородность дисперсий проверяется по критерию Кохрена. От-
ношение максимальной дисперсии к сумме всех дисперсий
2
smax
G= N (11.12)
? si2
i =1
сравнивается с табличным значением G1-p ( f1, f2) для р = 0,05 и чисел
степеней свободы f1 = m – 1 и f2 = N. Если G ? G1-p ( f1, f2), то выбороч-
ные дисперсии однородны. Тогда наилучшей оценкой дисперсии вос-
производимости будет средневзвешенная дисперсия
N

?
1
2
si2
=
sвоспр (11.13)
N i =1

с числом степеней свободы fвоспр = N (m – 1).
Коэффициенты уравнения регрессии определяются по формуле
N

?x
1
bj = yi . (11.14)
ji
N i =1
Поскольку дисперсия среднего в m раз меньше дисперсии единичного
измерения, т. е.
s 2 ( y ) = sвоспр m ,
2
(11.15)
то выборочные среднеквадратичные отклонения коэффициентов рас-
считываются следующим образом:

49
N
sвоспр
?s
1 2
s (b j ) = = . (11.16)
i
Nm Nm i =1

Значимость коэффициентов проверяется по критерию Стъюдента:
если
bj
tj = > tp( f ), (11.17)
s (b j )
где tp(f ) — табличное значение критерия Стъюдента для р = 0,05 и
числа степеней свободы f = N (m – 1), то коэффициент значимо отли-
чается от нуля.
Адекватность уравнения регрессии эксперименту проверяется по
критерию Фишера. Дисперсия адекватности равна
N ?
? ( yi ? yi ) 2
m
i =1
2
sад = , (11.18)
N ?l
где l — число значимых коэффициентов в уравнении регрессии.
Уравнение адекватно эксперименту, если
2
sад
F= ? F1? p ( f ад , f воспр ) , (11.19)
2
sвоспр
где F1-p (fад, fвоспр) — табличное значение критерия Фишера для р = 0,05
и чисел степеней свободы fад = N – l и fвоспр = N (m – 1). В противном
случае для описания результатов эксперимента необходимо увеличить
порядок аппроксимирующего полинома.

11.3. Дробный факторный эксперимент. Планы типа 2k-1

Число необходимых опытов в условиях линейной модели сущест-
венно сокращается при проведении дробных факторных эксперимен-
тов (дробных реплик от ПФЭ). В качестве реплики обычно использует-
ся полный факторный эксперимент для меньшего числа факторов.
При этом вычисление коэффициентов уравнения и оценка их значимо-
сти проводится так же, как и в рассмотренных выше примерах ПФЭ 22
и 23. Число опытов в дробной реплике должно быть больше или равно
числу неизвестных коэффициентов в уравнении регрессии.




50
Спланируем дробный факторный эксперимент для получения ли-
нейного уравнения регрессии небольшого участка поверхности откли-
ка при трех независимых факторах:
?
y = b0 + b1 x1 + b2 x2 + b3 x3 . (11.20)
Постановка ПФЭ 23 требует проведения 8 опытов. Для решения же
поставленной задачи можно ограничиться 4 опытами, если в матрице
планирования ПФЭ 22 (табл. 10, лекция 10) использовать столбец х1х2
в качестве плана для х3. Матрица планирования такого сокращенного
эксперимента — ДФЭ типа 23-1, или полуреплики от ПФЭ 23, — пред-
ставлена в табл. 14.
Таблица 14


Матрица планирования ДФЭ типа 23-1
№ опыта х0 х1 х2 х3 y
1 +1 –1 –1 +1 y1
2 +1 –1 +1 –1 y2
3 +1 +1 –1 –1 y3
4 +1 +1 +1 +1 y4

Проведение ДФЭ по предложенной схеме позволяет оценить сво-
бодный член и три коэффициента при линейных членах уравнения
(11.20), однако при этом они будут являться несмешанными оценками
теоретических коэффициентов только в том случае, если генеральные
коэффициенты регрессии при парных взаимодействиях равны нулю. В
противном случае найденные выборочные коэффициенты будут сме-
шанными оценками теоретических:
b1 > ?1 + ? 23 , b2 > ? 2 + ?13 , b3 > ?3 + ?12 . (11.21)
Генеральные коэффициенты не могут быть оценены по отдельно-
сти на основании только 4 опытов, поскольку при этом столбцы для
линейных членов и парных произведений одинаковы (например, эле-
менты вычисленного столбца для произведения х2х3 в точности совпа-
дут с элементами столбца х1). Чтобы определить, оценкой суммы ка-
ких именно генеральных коэффициентов явяются выборочные коэф-
фициенты, удобно пользоваться генерирующим соотношением
x3 = x1 x2 , (11.22)
в общем случае означающим, какой именно столбец ПФЭ 2k был ис-
пользован в качестве плана для введения (k + 1)-го фактора в ДФЭ.
При умножении обоих частей (11.22) на x3, получаем

51
2
x3 = x1 x2 x3 . (11.23)
Единичный столбец
I = x1 x2 x3 (11.24)
называется определяющим контрастом и позволяет определить, эле-
менты каких столбцов в расширенной матрице планирования одина-
ковы. Умножая I по очереди на x1, x2 и x3, получаем
2 2
x1 = x1 x2 x3 = x2 x3 , x2 = x1 x2 x3 = x1 x3 ,
2
x3 = x1x2 x3 = x1 x2 , (11.25)
в точности соответствующих системе смешанных оценок (11.21).
При постановке ДФЭ с числом факторов k ? 4 в зависимости от
генерирующего соотношения выборочные коэффициенты регрессии
оказываются смешанными оценками того или иного сочетания гене-
ральных коэффициентов. Поэтому важно заранее определиться с тем,
какая информация является наиболее важной в данном исследовании,
и в зависимости от поставленной задачи подобрать нужную дробную
реплику.
Рассмотрим, например, планирование ДФЭ типа 24-1, представ-
ляющего собой полуреплику от ПФЭ 24. В качестве реплики исполь-
зуем ПФЭ 23 (табл. 12). Используем два генерирующих соотношения:
x4 = x1 x2 x3 , (11.26)
x4 = x1 x3 . (11.27)
Для соотношения (11.26) определяющим контрастом будет
I = x1 x2 x3 x4 . (11.28)
Тогда
x1 = x2 x3 x4 , b1 > ?1 + ? 234 ; x2 = x1 x3 x4 , b2 > ? 2 + ?134 ;
x3 = x1x2 x4 , b3 > ?3 + ?124 ; x4 = x1 x2 x3 , b4 > ?4 + ?123 ;

<<

стр. 2
(всего 3)

СОДЕРЖАНИЕ

>>