стр. 1
(всего 2)

СОДЕРЖАНИЕ

>>

«И Случай, бог изобретатель…»
Александр Сергеевич Пушкин
«Случай ненадежен, но щедр»
Натан Яковлевич Эйдельман
«Случай правит миром»
Демосфен
«Всем правит случай. Знать бы еще, кто правит случаем...»
Станислав Ежи Лец, Непричесанные мысли


РАЗДЕЛ 4. БАЗИСНЫЙ ИНСТРУМЕНТАРИЙ КОНЦЕПЦИИ:
механизмы поисковой оптимизации (от примитивного метода «проб
и ошибок»до иерархического адаптивного случайного поиска)
4.1. Введение. Постановка проблемы
В последние десятилетия в научной и научно-популярной литературе, да и в обыденном использо-
вании, все чаще встречается словосочетание метод «проб и ошибок» (для краткости буду далее всюду,
даже в соответствующих цитатах, обозначать его МПиО – С.Г.). На первый взгляд, его смысл и основная
идея довольно очевидны: использование случайности при поиске некоего полезного результата. Среди
многочисленных попыток реализации МПиО как при объяснении (фактически, моделировании) некото-
рых процессов в природе и обществе, так и при решении практических задач в технике, имеется ряд
весьма успешных (правда, на фоне также достаточно представительного ряда неудачных). По-видимому,
растущая тенденция его применения и объясняется преобладанием положительных оценок этого метода
над отрицательными [Гринченко,2003а].
Это находит свое отражение в практически превалирующей в настоящее время (не только среди
биологов-эволюционистов, но и среди более широкого круга специалистов – философов, прикладных
математиков и др. – и даже неспециалистов) точке зрения на эволюцию живой природы именно как на
процесс «проб и ошибок». Под ним здесь обычно подразумевают генетическую «изменчивость», приво-
дящую через «наследственность» к «естественному отбору»=«выживанию наиболее приспособленных».
В наиболее яркой форме эту точку зрения выразил в своей монографии «Феномен науки. Киберне-
тический подход к эволюции» В.Ф.Турчин: «В процессе эволюции жизни, насколько нам известно, все-
гда происходило и происходит сейчас увеличение общей массы живого вещества и усложнение его ор-
ганизации. Усложняя организацию биологических образований, природа действует по методу проб и
ошибок. Существующие образования воспроизводятся во многих экземплярах, которые, однако, не
вполне тождественны оригиналу, а отличаются от него наличием небольших случайных вариаций. Эти
экземпляры служат затем материалом для естественного отбора. Они могут выступать и как отдельные
живые существа – тогда отбор приводит к закреплению полезных вариаций, и как элементы более слож-
ного образования – тогда отбор направлен также и на структуру нового образования (например, при воз-
никновении многоклеточных организмов). И в том, и в другом случае отбор является результатом борь-
бы за существование, в которой более жизнеспособные образования вытесняют менее жизнеспособные.
Этот механизм развития жизни, открытый Чарльзом Дарвином, можно назвать основным законом эво-
люции. В наши цели не входит обоснование или обсуждение этого закона с точки зрения тех законов
природы, которые можно было бы провозгласить более фундаментальными. Будем принимать основной
закон эволюции как нечто данное» ([Турчин,2000(1977)], стр. 21). Можно констатировать, что позиция
ряда авторов, наиболее развернуто представленная В.Ф.Турчиным, состоит в том, что «эволюция живой
природы адекватно описывается именно в терминах МПиО».
Но действительно ли это так? Достаточен ли МПиО для воспроизведения хотя бы основных
свойств биологической эволюции – притом, что необходимость его для этого очевидна? Не определя-
ются ли существующие трудности в развитии её теории (в частности, связанные с необходимостью от-
ражения имеющихся фактов «направленности» и «канализируемости» эволюции) именно с ограничен-
ностью привлекаемого для её объяснения механизма МПиО как такового? Моя позиция при ответе на

– 111 –
эти вопросы следующая: эволюция живой природы адекватно описывается в терминах другого (хотя и
близкого к упомянутому) метода поисковой оптимизации, а именно предложенного Л.А.Растригиным
(см., напр., [Растригин,1959аб,1960,1965,1968,1979]) метода «случайного поиска», точнее, его важней-
шей разновидности – метода «адаптивного случайного поиска», ещё точнее – иерархии механизмов
«адаптивного случайного поиска», представляющей собой «каркас» модели системы живой природы
(см. [Гринченко,1979-2003]). Метод же «проб и ошибок», с моей точки зрения, следует трактовать как
слепой поиск – предельно упрощенный, даже вырожденный, вариант алгоритма из класса методов «слу-
чайного поиска» (кстати говоря, в основу последнего – при его создании – МПиО и был положен!). А
собственно МПиО должен во всех случаях рассматриваться лишь как нулевое приближение к этим сво-
им более сложным аналогам, также базирующимся на использовании случайности как на фундамен-
тальном свойстве оптимизационных алгоритмов этого класса. Необходимость в подобном уточнении
терминологии вполне назрела, что будет продемонстрировано ниже на конкретных примерах.
Таким образом, задача настоящего раздела монографии – подробный анализ существующей в на-
стоящее время практики употребления в научной литературе понятия (и термина) МПиО, его сходств и
различий по сравнению с перечисленными вариантами метода случайного поиска (включая и его пре-
дельно вырожденный вариант – слепой поиск) – см. подраздел 4.2. На базе данного анализа будет сфор-
мирована объединенная классификация всех перечисленных методов оптимизации, и выработаны такие
определения всех этих методов, которые позволили бы избежать в будущем множества недоразумений
при их применении на практике (подраздел 4.3). В подразделах же 4.4-4.6 будут кратко рассмотрены
примеры использования как собственно МПиО, так и методов поисковой оптимизации в целом для ин-
терпретации таких центральных понятий ряда теорий биологической эволюции, как «изменчивость» и
«естественный отбор». А также их взаимосвязи в контексте модельных представлений об эволюцион-
ных процессах с позиций предлагаемой концепции.
4.2. Метод "проб и ошибок" (МПиО)
– англ. [“trial-and-error”], русск. сленг: «метод тыка», вариант: «метод научного тыка».
У.Р.Эшби, один из отцов-основателей кибернетики, отмечает: «Стоит сказать, что обычный термин
“trial and error” является в высшей степени неточным. Слово “trial” (проба) стоит в единственном числе,
хотя суть метода в том, что попытки повторяются все вновь и вновь. Слово “error” (ошибка) также плохо
выбрано, ибо существенным элементом является достижение успеха в конце. Слова “поиск и остановка”
(hunt and stick), по-видимому, описывают этот процесс и более образно, и более точно. Я буду преиму-
щественно употреблять это название» ([Ashby,1956(1959)], стр. 326-327). К сожалению, его не поддер-
жали… С моей же точки зрения этот метод может быть определен, как «абсолютно случайный» перебор
некоторых «пробных» действий, с проверкой эффективности каждого, вырабатывающей соответст-
вующую реакцию на него («удача» либо «ошибка»).
4.2.1. Об оценках МПиО
Л.А.Растригин так характеризовал его в ряде своих работ: метод «проб и ошибок» – метод, в кото-
ром решение ищется случайно, и при удаче принимается, а при неудаче отвергается с тем, чтобы вновь
обратиться к случайности как источнику потенциально неограниченных возможностей. И далее: МПиО
«строго говоря, нельзя назвать даже методом, так как трудно определить, в чем же, собственно, он со-
стоит. В действительности его правильней было бы назвать методом случайных проб и исправления
ошибок… этот метод опирается на два существенных предположения: нероковой характер ошибок (по-
следствия неудачных результатов легко устранимы, стоимость исправления допущенной ошибки не ве-
лика) и отсутствие априорных (предварительных) соображений о том, как и в каком направлении делать
пробы. Эти соображения почти неизбежно приводят к случаю. Действительно, случайность в такой си-
туации является единственно разумной мерой: случайность почти ничего не стоит и всегда содержит в
себе искомое решение. Это значит, что достаточно длительный поиск всегда приведет к решению зада-
чи» (см. [Растригин,1979], стр. 6).
Очень многими принято считать МПиО чуть ли не эталоном неэффективного процесса оптимиза-
ции, к которому поэтому можно относиться с иронией. Но это с одной стороны. С другой же стороны,
оказывается, что существенная часть касающихся его публикаций содержит весьма положительные
оценки его эффективности при решении самых различных задач.
Как же это может иметь место одновременно? Какие его свойства определяют столь противополож-
ные оценки, как теоретиков, так и практиков? Всегда ли при этом имеется в виду одно и то же содержа-
ние метода? Прежде, чем отвечать на эти вопросы, приведу в подтверждение разноречивости оценок
эффективности МПиО несколько цитат, содержащих такие (иногда эмоциональные) оценки. Большин-
ство источников указанных цитат найдены в Интернете с помощью поисковых машин Google
(www.google.com.ru), Яндекс (www.ya.ru), Рамблер (www.rambler.ru) и Апорт (www.aport.ru).


– 112 –
4.2.1.1. МПиО: оценки негативного характера
Для иллюстрации отрицательного отношения к МПиО приведу несколько цитат различных авторов.
Из области теории изобретательского творчества: «Главный недостаток МПиО – это, во-первых,
медленное генерирование новых идей, а во-вторых, отсутствие защиты от психологической инерции (т.е.
выдвижение идей тривиальных, обыденных, неоригинальных)... Причина неэффективности подобных
методов в том, что они не меняют сути старой технологии перебора вариантов, сам этот перебор. Нужен
принципиально новый инструмент творчества, а не “косметический” ремонт старого» [Альтшуллер,1988].
Из той же области: «Стандартный метод решения изобретательских задач – это МПиО. Конечно,
изобретатель не перебирает подряд все бесчисленное множество возможных вариантов. Нет, сначала
идут пробы привычные, логичные, оправданные. Но когда они не срабатывают, когда труд ушедших ме-
сяцев, лет оказывается безрезультатным, в ход идет перебор любых, ненормальных, "диких", случайных
проб. И вот тогда "однажды" (...) МПиО парадоксально неэффективен. Он – главный виновник задержки
изобретений. Самый страшный враг человечества – это тот нерациональный метод мышления, который
именуется "героикой творческого труда", которому поют дифирамбы и который считается столь же не-
отъемлемым свойством изобретателя, как борода у попа, как облака на небе, как звезды в космосе, как
пятна на солнце, как вода в океане и как ещё сто тысяч таких же незыблемых и привычных "как". МПиО
считается нормой! Это порочный взгляд, потому что он предписывает обязательным применение пороч-
ного метода. Из-за самого существования которого человечество тысячелетиями систематически недос-
читывается миллионов жизней. МПиО – своеобразный идол творческого труда (...) Я не очень-то разби-
раюсь в вероисповеданиях и не знаю, бывают ли идолы добрыми. Одно я знаю совершенно точно: изо
всех самых злых идолов, когда-либо придуманных людьми, МПиО самый кровожадный. Мы привыкли
приносить жертвы на алтарь нашей веры. Но ни одному божеству за все долгие тысячелетия преданно-
сти люди не платили такой дани, которую ежечасно вручают идолу творчества. МПиО – злейший и ужас-
нейший враг человечества. И вместе с тем, этот метод загадочен, таинствен и завораживающе привле-
кателен, как в те далекие времена, когда слова "интуиция" и "озарение" не писались и даже не произно-
сились из-за отсутствия языка и письменности... МПиО романтичен для поэтов. Для изобретателей-
практиков он – тяжелейшая драма, обесценивающая годы неудачных поисков» [Верткин,1987].
Обсуждая процесс поиска новых форм организации и управления в СССР в конце 80-х гг. ХХ века,
С.П.Никаноров писал: «В настоящее время идут два параллельных, влияющих друг на друга, но не свя-
занных функционально процессов. Первый представляет собой процесс ликвидации не оправдавших
себя организационных форм, второй – тщательный поиск и освоение новых. Общая тенденция при этом
состоит в том, чтобы усилить самостоятельность низовых звеньев народного хозяйства, что, как предпо-
лагается, будет стимулировать процессы их рациональной самоорганизации и приведет к образованию
новых, эффективных организационно-экономических форм. Нельзя не видеть, что способ проб и ошибок
прямо противоположен другому, который основан на расчете или, шире, – проектировании необходимых
форм. МПиО чрезвычайно расточителен, он является медленно, негарантированно и неконтролируемо
действующим, допускающим лишь в небольшой степени свое совершенствование. И, что, возможно, ху-
же всего, он ведет к деинтеллектуализации специалистов и руководителей. Специалисты, указывающие
на якобы существующее преимущество рыночных систем во многих странах как на воплощение самоор-
ганизации, упускают из виду не только мощное регулирующее влияние государства, в частности, исполь-
зование системы типа PPBS, PATTERN и др., но и не придают значения вековому становлению рыноч-
ных отношений как конкретно-исторической форме, охватывающей все стороны общества» [Никаноров].
Из области банковской деятельности: «Используя печально известный МПиО, банки бредут терни-
стым путем комплексной или не очень комплексной автоматизации, теряя по дороге людей, деньги, вре-
мя» [Аглицкий]. И т.д.
Таким образом, во всех перечисленных цитатах их авторы, не анализируя ни внутреннюю структу-
ру, ни параметры МПиО, прямо или косвенно дают этому методу отрицательную оценку как таковому.
4.2.1.2. МПиО: оценки нейтрально-критического и нейтрального характера
Часто авторы характеризуют МПиО достаточно нейтрально или неоднозначно, но отмечают при
этом его недостаточность при конкретных применениях и необходимость дальнейшего развития. Это
демонстрируют следующие цитаты.
Из области педагогики: «Иллюзия же успешности педагогической науки и практики зиждется на не-
способности большинства ученых видеть глубинные, сущностные пласты педагогического предмета. Де-
ло в том, что в педагогике, в самой практике в начальных и широких границах можно обходиться так на-
зываемым "здравым смыслом", "жизненным опытом", "методом проб и ошибок" без помощи науки в соб-
ственном смысле слова. И представители педагогической науки довольствуются данным поверхностным
описанием педагогических явлений» [Терегулов].
Из области исследования социального поведения: «Весьма важно уяснить социально-правовые ас-
пекты проблемы терроризма, без чего противодействие этому явлению приобретает неакцентированный
характер поиска решения по принципу проб и ошибок» [Гушер].
Из области теории компьютерного программирования: «В мире, где строительство и разрушение
бесплатны, выбирается метод проб и ошибок, а фундаментальные исследования остаются для проста-
– 113 –
ков. Программное обеспечение разрабатывается именно в таком мире. Программист создает чертеж в
виде программы на языке высокого уровня. Затем он позволяет компилятору и компоновщику в мгнове-
ние ока и почти без затрат построить программный продукт. Создание чертежа требует значительных
усилий, но строительство с помощью компилятора и компоновщика практически бесплатно. Программи-
сту вообще не надо беспокоиться о сносе и уборке обломков – по крайней мере, до тех пор, пока ему
достаточно дискового пространства. Неудивительно, что идеология проб и ошибок так глубоко укорени-
лась в процессе разработки программного обеспечения, а сообщество программистов не удосужилось
исследовать основные принципы разработки программного обеспечения. МПиО завел нас достаточно
далеко. Но рост сложности современных программных систем подводит нас к жесткому пределу. За пре-
делами определенного уровня сложности создание качественных архитектур методом проб и ошибок
становится невозможным» [Бюрер,2001].
Из области синергетики, о проблеме коэволюции: «Движение от одного состояния к другому должно
происходить по определенной траектории – это задача оптимизации. Однако, это движение (развитие)
всегда целенаправленно. Так вот, модели призваны заменить технологии проб и ошибок (что иногда
длится недопустимо долго) – технологиями научно обоснованными, и это наиважнейшая задача научной
интеллигенции в XXI веке» [Курдюмов,2001].
Из области методологии науки: «Большинство людей убеждено в существовании "научного метода".
В то же время многие считают, что "научный метод" – это миф. Одна из причин такого мнения – понима-
ние метода как совокупности правил, которые гарантированно, или без ошибок, должны давать резуль-
таты. Но метод, вообще говоря, – это только метод попыток или проб, или "проб и ошибок". Требование
безошибочности часто заменяется требованием, чтобы ошибок было мало или чтобы вероятность ошиб-
ки была мала» [Серебряный,1997]. И т.д.
Таким образом, перечисленные цитаты демонстрируют, что их авторы, опять-таки не анализируя
МПиО и не формулируя для него каких-либо определений, дают этому методу неоднозначную либо
нейтрально-критическую, а иногда и просто нейтральную оценку.
4.2.1.3. МПиО: оценки позитивного характера
Для иллюстрации положительного отношения к МПиО также приведу несколько цитат ряда авто-
ров из самых различных областей деятельности.
Из области исследования социального поведения: «Неплохим примером того, как человек именно
методом проб и ошибок добирается до своего истинного призвания, может послужить Жан Жак Руссо»
[Эфроимсон,1997-1998].
Из области педагогики: «Трактуя учение как субъектную деятельность ученика, Н.А.Менчинская от-
стаивала необходимость “проб и ошибок” при усвоении знаний. Ученик (конечно, под руководством
взрослого) сам должен “строить” понятие (знание); отчленять признаки существенные от несуществен-
ных (а не получать их в готовом виде), опираться на свой личный опыт познания, соотносить его с тем,
что предлагает взрослый, т.е. осуществлять развернутую поисковую деятельность, а не пользоваться
готовыми “ориентирами”. Настоящая поисковая деятельность без проб и ошибок невозможна» [Якиман-
ская,1995].
Из областей педагогики и программирования: «Итак, каков же наиболее эффективный метод изуче-
ния программного обеспечения? Экспериментирование. Да, простой МПиО получил самую высокую
оценку среди 30 способов обучения (см. таблицу с оценками)» [Харп,1996].
Из области программирования: «Использовать картинки в форматах GIF и JPEG нужно с умом. По-
пробуйте создавать файлы GIF с меньшим числом битов на элемент изображения (пиксель). Например,
зачем сохранять изображение с одним байтом данных на каждый пиксель, если можно ограничиться все-
го одним битом (при условии, что в изображении не использованы 256 цветов). Такая сокращенная вер-
сия файла будет в 8 раз меньше, а передаваться в 8 раз быстрее. Методом проб и ошибок можно уточ-
нить, сколько именно бит данных достаточно для получения удовлетворительного качества изображе-
ния» [Как улучшить…]; а также: «Эволюция Windows – МПиО, который должен привести, наконец-то, к
чему-то стоящему, стабильному, устойчивому» [Windows Longhorn] и «Разработка по методу Linux – это
МПиО, построенный на интенсивном тестировании» [Богатырев,2001].
Из области компьютерного синтеза музыки: «Преимущества пошаговой записи, благодаря которым
множество электронщиков использует её, заключаются не только в возможности записи сложнейших
тем, коррекции в них ошибок и добавлении требуемых нюансов. Созданные таким образом фрагменты
можно потом с легкостью реаранжировать, пустить наоборот, а также полностью изменить с помощью
проб и ошибок» [Худяков].
Из области медицины и фармакологии: «Специалисты знают, что люди по-разному реагируют на ги-
потензивные препараты. Если лекарство позволяет нормализовать давление одного пациента, это не
означает, что оно поможет и другому. Поэтому оптимальный метод поиска лекарства для гипертоника –
это МПиО» [«Провизор»,1999]; «Методом проб и ошибок в той или иной степени пользовались и про-
должают пользоваться все естественные науки, однако для таких наук о биологически активных соеди-


– 114 –
нениях, как фармакология или токсикология, этот метод является прямо-таки доминирующим» [Галак-
тионов,1988].
Из области сравнительного исследования биологической и технической эволюции: «Весь ход тех-
нического и научного прогресса, а также изучение природы живых существ и законов их эволюции пока-
зывает, что пути развития природы и техники различны. Для своего развития природа использует МПиО
путем случайного перебора вариантов и закрепления удачных вариантов в генетическом коде, переда-
ваемом последовательно по наследству. Человек использует МПиО путем целенаправленного (?! –
С.Г.) перебора вариантов в информационной среде, способствующей накоплению и быстрому распро-
странению этой информации в обществе. Это позволяет человеку в миллионы раз сократить время и
затраты на поиск оптимального варианта, что обеспечивает колоссальный прогресс науки и техники да-
же в пределах жизни одного поколения» [Азарьев]. И т.д.
Таким образом, во всех перечисленных цитатах (кроме последней) их авторы, не анализируя ни
внутреннюю структуру, ни параметры МПиО, дают этому методу положительную оценку как таковому.
•••••
Цитирование можно было бы продолжить, но и уже представленных в пункте 4.2.1 материалов дос-
таточно для того, чтобы сделать некоторые предварительные выводы.
Первое, что бросается в глаза: большинство как негативных, так и позитивных оценок МПиО ис-
пользуют этот термин как данность и не содержат попыток уточнения его смысла. Но иногда в литера-
туре встречаются высказывания, подобные приведенному в последней цитате из статьи И.А.Азарьева
(относительно того, что МПиО «используется путем целенаправленного (?! – С.Г.) перебора вариан-
тов»), которые явно расширяют диапазон его свойств, интуитивно предполагаемых большинством авто-
ров и читателей. Действительно, что подразумевать под «целенаправленным перебором вариантов»?
Имеется ли в виду, что такие варианты неравноправны с позиций некоторого целевого алгоритма, и, со-
ответственно, могут выбираться не «абсолютно» случайно, а на основе некоторого имеющегося опыта о
ходе предыдущей реализации данного поискового процесса? Похоже на то, что цитированный автор
имел в виду именно это. Остается вопрос: может ли подобный гипотетический – модифицированный! –
метод продолжать называться методом «проб и ошибок»? И не лучше ли присвоить такому методу соб-
ственное оригинальное наименование, более точно отражающее подобное расширение его свойств по
отношению к сравнительно общепринятому понятию МПиО?
Существование этой и подобных ей расширительных интерпретаций МПиО заставляют более под-
робно рассмотреть определения этого термина, даваемые ему различными авторами.
4.2.2. МПиО: вербальные определения в изданиях энциклопедического характе-
ра
4.2.2.1. Определения МПиО, явно характеризующие поиск как «слепой»
Как ни удивительно, но, несмотря на чрезвычайно частое употребление в самых различных облас-
тях науки и практики (а зачастую – и в обыденной жизни) термина «метод / принцип / алгоритм / спо-
соб/процедура "проб и ошибок"», в большинстве ведущих энциклопедий (в частности, БСЭ, Encyclopedia
Britannica, Брокгауз и Эфрон, ММЭ и др. – за несколькими исключениями, о которых будет упомянуто
ниже) нет специальных статей, посвященных его определению и трактовке. Так, БСЭ дает ему опреде-
ление в статье «Бихевиоризм»: «Для объяснения того, каким образом выбирается данная реакция (чело-
века – С.Г.) в ответ на данное воздействие, Торндайк выдвинул принцип “проб и ошибок”, согласно кото-
рому выработка всякой новой реакции начинается со слепых проб, продолжающихся до тех пор, пока
одна из них не приведет к положительному эффекту» [БСЭ,т.3,1970,С.402-403]. То есть в данном край-
не лаконичном описании метода всё же делается акцент на тот факт, что пробы являются «слепыми»,
или, в эквивалентной трактовке, «равновероятно» случайными.
Словарь «Психология» также утверждает: «Главным течением американской психологии становится
бихевиоризм, согласно которому психология не должна выходить за пределы внешне наблюдаемых те-
лесных реакций на внешние стимулы. Динамика этих реакций мыслилась как слепой поиск, случайно
ведущий к успешному действию, закрепляемому повторением {метод проб и ошибок}. Программные
установки этого направления выразил Дж.Б.Уотсон (1913)» [Психология,1990,«История психологии»].
Encyclopedia Britannica упоминает об алгоритме "проб и ошибок" (“trial and error”) в статье «Кибер-
нетические системы. Самообучающиеся механизмы» при описании процесса движения мыши в лаби-
ринте: «Вначале мышь использует простой (simple) алгоритм "проб и ошибок", наталкиваясь на стенки
до тех пор, пока не найдет выхода. В течение процесса этого типа поиска, она "учится" и запоминает
план лабиринта. После однажды достигнутой (случайно) цели, мышь будет использовать полностью от-
личный, намного больше экономичный и, по-видимому, "интеллектуальный" алгоритм для достижения
цели в последующем эксперименте, основанный на "знании" расположения лабиринта» [Cybernetic
systems,2000]. То есть «первичный» алгоритм, или собственно МПиО, рассматривается как «простой»
(надо полагать, что в данном контексте определение «простой» использовано как синоним определения
– 115 –
«слепой» – blind). Но здесь автора энциклопедической статьи явно больше интересует механизм само-
обучения – совсем другой, "интеллектуальный" поисковый алгоритм, который в ходе повторов пробега
мыши по лабиринту приходит на смену "простому". Можно ли будет этот последний алгоритм рассмат-
ривать как эволюционное развитие первого, из цитируемого текста неясно.
В другой статье «Поведение животных. Пробы и ошибки» (которую можно рассматривать как спе-
циальную, т.е. непосредственно определяющую термин, несмотря на то, что в ней речь идет скорее об
обучении животного по МПиО, а не о самом методе) Encyclopedia Britannica формулирует: «В обучении
по МПиО животное учится, чтобы вести себя специфическим способом путем ассоциирования
(associating) всего, что ведет к желаемому эффекту. Если нога собаки поднята экспериментатором и за-
тем дана пища, в дальнейшем собака, после нескольких таких проб, будет спонтанно поднимать свою
ногу в предвкушении пищи. Как классическое психологическое кондиционирование (conditioning), так и
обучение по МПиО называют ассоциативным обучением, потому что в обоих случаях необусловленный
ответ ассоциирован с обусловленным стимулом. В природных ситуациях животное, вероятно, обучается
ассоциировать некоторую свою спонтанную деятельность с некоторыми желательными результатами,
фиксируя, таким образом, обусловленные стимулы и отклик. Обучение этого типа часто происходит в
тех случаях, когда животные модифицируют свое поведение в течение возбуждающих желание после-
довательностей типа питания и спаривания» [Animal behaviour,2000]. То есть в данном определении во-
обще отсутствуют какие-либо указания на свойства МПиО как такового, он только именуется – в кон-
тексте описания обучения животного – без раскрытия деталей его поведения.
В статье «Мышление. Пробы и ошибки» (которую также будем рассматривать как специальную,
хотя и она посвящена обсуждению подходов к «решению проблем», а не анализу МПиО как такового)
Encyclopedia Britannica предлагает более обобщенную трактовку данного метода: «Деятельность в об-
ласти решения проблем (problem-solving) распадается на две категории: первая подчеркивает простые
(simple) пробы и ошибки; вторая требует некоторой степени понимания. Путем проб и ошибок индивиду-
ум действует главным образом с помощью исследования и управления элементами проблемной ситуа-
ции в усилиях разобраться в своих возможностях и нащупать шаги, которые могли бы привести его бли-
же к цели. Это поведение наиболее подходит в случае, когда «решатель проблем» испытывает недоста-
ток предварительного знания относительно характера решения, или когда нет единственного правила,
лежащего в основе решения. Деятельность путем проб и ошибок не обязательно очевидна (как при по-
пытке приспособить вместе части механической головоломки); она может быть неявной или опосредо-
ванной так же, как индивидуальное отражение задачи и символическое тестирование возможностей при
их обдумывании» [Thought,2000]. То есть в данном определении подчеркивается тот факт, что МПиО
следует использовать именно при недостатке априорной информации о решаемой с его помощью про-
блеме, а его собственные свойства опять-таки не рассматриваются.
В свою очередь, база знаний de facto констатирует: «МПиО – способ выработки новых форм пове-
дения в проблемных ситуациях. МПиО, широко используемый бихевиоризмом для объяснения научения
как вероятностного процесса, получил распространение в психологии после работ Э.Л.Торндайка, со-
гласно которым слепые пробы, ошибки и случайный успех, закрепляющий удачные пробы, определяют
путь приобретения индивидуального опыта у животных и человека. Тем самым была выделена согласо-
ванность поведения со средой на вероятностной основе, что позволило при интерпретации категории
действия выйти за пределы жесткой альтернативы: либо механистической, либо телеологической его
трактовки. Последующая разработка проблемы научения обнаружила слабость и ограниченность объяс-
нительных возможностей МПиО, поскольку он не учитывает характерную для поведения направленность
(! – С.Г.) каждой пробы, её включенность в определенную психическую структуру. Гештальтпсихология
подвергла МПиО критике, противопоставив ему решение проблемы путем инсайта. Непродуктивность и
теоретическая слабость такого противопоставления была показана И.П.Павловым. Свое значение МПиО
сохранил лишь в узкой сфере искусственно создаваемых ситуаций; в частности, он вошел в состав кон-
структивных принципов кибернетических устройств» [База знаний de…]. То есть, акцентируется внима-
ние на несоответствии «слепого» МПиО современному пониманию поведения как направленного. И т.д.
•••••
Обобщая точки зрения, представленные в подпункте 4.2.2.1, можно констатировать, что все они:
а) достаточно близки,
б) рассматривают МПиО как «слепой»/«простой» алгоритм, который настолько элементарен, что
не нуждается в пояснениях его структуры и параметров,
в) обычно рекомендуют использовать МПиО при недостатке или полном отсутствии априорной
информации об объекте его приложения.
4.2.2.2. Определения МПиО, не разделяющие понятия «слепого» и «направленного» поиска
В отличие от изложенной позиции, психологический словарь (также в специальной статье) дает оп-
ределение, что «МПиО – форма научения, описанная Э.Торндайком в 1898 г., основанная на закрепле-
нии случайно совершенных двигательных и мыслительных актов, за счет которых была решена значи-
мая для животного задача. В следующих пробах время, которое затрачивается животным на решение
– 116 –
аналогичных задач в аналогичных условиях, постепенно, хотя и не линейно, уменьшается, до тех пор,
пока не приобретает форму мгновенного решения. В дальнейшем более точный анализ поведения ме-
тодом проб и ошибок показал, что оно не является полностью хаотическим и нецелесообразным, как
считал Торндайк, но интегрирует в себе прошлый опыт (курсив мой – С.Г.) и новые условия для ре-
шения задачи» [Психологический словарь]. То есть в данном случае автор статьи делает акцент, во-
первых, на изменении вероятностных свойств метода в процессе его функционирования, и, во-вторых,
на определенную целесообразность такого изменения. Практически это последнее определение карди-
нально отличается от вышеприведенной трактовки БСЭ и Encyclopedia Britannica. Недостатком данного
определения является его неоднозначность: не вполне понятно, с какого момента времени указанная
форма научения не должна больше рассматриваться как полностью хаотическая и нецелесообразная, и,
главное, все ли специалисты, использующие данный термин в той или иной конкретной ситуации, со-
гласны с тем, что он интегрирует в себе прошлый опыт?
Известный энциклопедический Интернет-сайт www.dictionary.com (со ссылкой на The American
Heritage® Dictionary of the English Language, Fourth Edition) дает МПиО следующее определение: «Ме-
тод достижения корректного решения или удовлетворительного результата с помощью попыток исполь-
зования различных средств или теорий до тех пор, пока ошибка уменьшится в достаточной степени или
будет ликвидирована» [Trial-and-error]. Как видим, здесь алгоритм генерации «попыток» вообще не
рассматривается.
Иногда в качестве синонима МПиО используют термин «эвристический метод». Так, в Толковом
словаре английского языка Random House «под эвристикой понимается метод дискуссии, а также изуче-
ние эвристической процедуры (методики). Термин "эвристический" (heuristically) толкуется там же более
вариативно: 1. Служащий для того, чтобы указывать; стимулирующий интерес как средство дальнейшего
исследования. 2. Вдохновляющий человека, чтобы изучать, обнаруживать, понимать, или решать про-
блемы по-своему, как экспериментируя, оценивая возможные ответы или решения, так и методом проб и
ошибок: эвристический обучающий метод. 3. Имеющий отношение, или основанный на экспериментиро-
вании, оценке, или методах проб и ошибок. 4. Компьютеры, Математика. Имеющий отношение к реше-
нию проблемы методом проб и ошибок в том случае, когда алгоритмический подход непрактичен» [Ху-
торской,1998]. И здесь алгоритм генерации «проб» не рассматривается.
Большое внимание данному вопросу уделяется на энциклопедическом Интернет-сайте, представ-
ляющем проект Principia Cybernetica. В специальной статье The trial-and-error method Ф.Хейлиген и
В.Ф.Турчин вначале определяют его как метод, в котором «генерируются различные возможные конфи-
гурации, после испытания их "приспособленности" хорошие сохраняются, а плохие или "ошибки" устра-
няются (элиминируются)» [Heylighen,Turchin,1996]. Таким образом, в данном определении авторы во-
обще не упоминают о способе генерации новых конфигураций и тем более о центральной проблеме –
используется ли при этом прошлый опыт или нет?
Но далее в этой же статье они разъясняют это довольно общее определение следующим образом:
«Согласно неодарвинистской точке зрения, эволюция происходит путем создания случайных комбина-
ций (живой) материи, с последующей борьбой за существование, в результате которой некоторые ком-
бинации выживают и размножаются, в то время как другие погибают. Поппер (Popper) описывает это как
работу общего метода проб и устранения ошибок. Кэмпбелл (Campbell) использует термин “слепое из-
менение и выборочное сохранение” (blind variation and selective retention) [Кэмпбелл,1964]. Ньюэлл
(Newell) и Саймон (Simon) в их теории “решения проблем” (problem solving) назвали этот механизм "гене-
рируй и тестируй" ("generate and test"). Здесь мы будем говорить просто о методе “проб и ошибок”. Мы не
должны использовать термин "слепой", потому что в культурной эволюции или при “решении проблем”
мы часто имеем дело с осознанным и направленным выбором (курсив мой – С.Г.). Но даже по отноше-
нию к биологической эволюции мы не можем увериться, а тем более подтвердить фактами, что вариа-
ции слепы. Верно, что мы создаем нашу теорию и проверяем её фактами в предположении, что вариа-
ции слепы. Но реально мы не используем факт, что вариация, в действительности, слепа или случайна
(«случайна» и «слепа» используются как синонимы! – С.Г.), то есть все физически и логически возмож-
ные выборы равновероятны. Успех теории (? – если имеется в виду успех теории биоэволюции, то это
слишком сильное и, как минимум, спорное утверждение: подробности см. ниже – С.Г.) доказывает, что
слепота, в нынешнем состоянии теории, является достаточной, но не доказывает, что она необходима.
Основное требование – то, что большое количество возможных состояний или решений исследуется
через процесс вариации. Принцип настолько мощен, что любой тип вариации или пробы, управляемый
предвидением или нет (курсив мой – С.Г.), сопровождаемый устранением "плохих" или "непригодных"
проб, и сохранением или размножением "пригодных" проб, приведет к эволюции. Факт, что успешные
шаги сохранены, ведет к необратимому накоплению, "эффекту храповика", который и позволяет движе-
ние только в специфическом общем направлении, без движения назад (см. принцип асимметричных
переходов)» [Heylighen,Turchin,1996].
Этот комментарий весьма разноречив. С одной стороны, Ф.Хейлиген и В.Ф.Турчин ссылаются – как
на одно из сходных понятий – на введенный Кэмпбеллом термин «слепое изменение и выборочное со-
– 117 –
хранение» (причем в статье Ф.Хейлигена с этим названием, помещенной на том же сайте, «слепота из-
менений» не подвергается сомнению [Heylighen,1993]). С другой стороны, упоминание Ф.Хейлигена и
В.Ф.Турчина, что «реально мы не используем факт, что вариация, в действительности, слепа или слу-
чайна», и прямое формулирование того, что «основное требование – то, что большое количество воз-
можных состояний или решений исследуется через процесс вариации», указывают на то, что авторы во-
обще не различают в МПиО «тип вариации или пробы: управляемый предвидением или нет».
С этой позицией можно было бы согласиться, если бы не одно «но»: она не вполне согласуется с ис-
торически сложившейся традицией употребления термина МПиО преимущественно в смысле использо-
вания именно слепых вариаций – хотя, как было показано выше, имеют место и отдельные трактовки их
как направленных (целенаправленных). В любом случае практика одновременного использования двух
достаточно противоречивых определений одного и того же термина не может быть признана вполне
приемлемой.
•••••
Обобщая точки зрения, представленные в подпункте 4.2.2.2, можно констатировать, что все они:
а) неоднозначны,
б) в части из них МПиО рассматривается как достаточно сложный алгоритм, который обладает
возможностью варьировать размер своей памяти от нуля до некоторой заметной величины, что обес-
печивает «направленность» поиска, и
в) опять-таки рекомендуют использовать МПиО при недостатке или полном отсутствии априор-
ной информации об объекте его приложения.
Подытоживая же данные, приведенные в пункте 4.2.2 в целом, приходится признать, что информа-
ционный поиск в изданиях энциклопедического характера не дал результата – однозначного определения
сущности МПиО. Следовательно, с этой целью следует обратиться к научным публикациям, в которых
он используется.
4.2.3. МПиО: интерпретации в научных изданиях различных отраслей знания
4.2.3.1. Общефилософский аспект
Наиболее общую интерпретацию МПиО дает К.Поппер: «Если мы хотим разъяснить, почему чело-
веческое мышление стремится испробовать все мыслимые решения всех проблем, с какими бы оно ни
сталкивалось, то можем сослаться на одну в высшей степени общую закономерность. Метод, с помощью
которого пытаются решить все проблемы, обычно один и тот же – это МПиО. Этот же метод, по сути де-
ла, используется и организмами в процессе адаптации. Ясно, что его успешность в огромной степени
зависит от количества и разнообразия (курсив мой – С.Г.) проб: чем больше мы делаем попыток, тем
более вероятно, что одна из них окажется удачной (…) Если МПиО развивается все более и более соз-
нательно, то он начинает приобретать характерные черты “научного метода”. Этот “метод” вкратце мож-
но описать следующим образом. Столкнувшись с определенной проблемой, ученый предлагает, в по-
рядке гипотезы, некоторое решение – теорию. Если эта теория и признается наукой, то лишь условно; и
самая характерная черта научного метода состоит как раз в том, что ученые не пожалеют сил для крити-
ки и проверки обсуждаемой теории. Критика и проверка идут рука об руку: теория подвергается критике с
самых разных сторон, и критика позволяет выявить те моменты теории, которые могут оказаться уязви-
мыми. Проверка же теории достигается посредством как можно более строгого испытания этих уязвимых
мест. Конечно, это опять-таки вариант МПиО. Теории выдвигаются в качестве гипотез и тщательно про-
веряются. Если результат проверки свидетельствует об ошибочности теории, то теория элиминируется;
МПиО, в сущности, метод элиминации. Его успех зависит главным образом от выполнения трех условий,
а именно: предлагаемые теории должны быть достаточно многочисленны (и оригинальны); они должны
быть достаточно разнообразны; осуществляемые проверки должны быть достаточно строги. Таким об-
разом, мы сможем, если нам повезет, гарантировать выживание самой подходящей теории посредством
элиминации менее подходящих. Если это описание развития человеческого мышления вообще и науч-
ного мышления в частности признать более или менее корректным, то оно поможет нам понять, что
имеется в виду, когда говорят, что развитие мышления происходит “диалектически”» [Поппер,1995].
Обсуждая эту точку зрения К.Поппера, В.Н.Садовский пишет: «Существенным моментом поппе-
ровской интерпретации диалектики является его утверждение о том, что "диалектическое развитие мож-
но “объяснить”, показав, что оно происходит в соответствии с МПиО", более того – что МПиО является
более широким, чем метод диалектики, который, таким образом, оказывается частным случаем МПиО. У
правоверного приверженца марксистско-гегелевской диалектики это утверждение может вызвать шок, но
оно, тем не менее, представляется хорошо оправданным. Действительно, теория научного метода, ос-
нованная на концепции проб и ошибок, носит более общий характер, чем диалектическая триада, не ус-
танавливает каких-либо ограничений на единственность исходного тезиса, на необходимость “снятия”
синтезом тезиса и т.п., и поэтому диалектика действительно выступает частным случаем МПиО. Думаю,
что у нас есть все основания сказать, что попперовское установление связи диалектики и метода проб


– 118 –
и ошибок является важным моментом рационального истолкования реального смысла диалектики
(курсив автора – С.Г.)» [Садовский,1995].
Правда, есть и критики попперовского мнения о том, что МПиО является более универсальным, чем
метод диалектики: «МПиО Поппера хорош в кустарной мастерской, им оперируют в философии совре-
менные ремесленники, но он бессилен в познании Мира. В природе этим методом детеныши животных
постигают окружающую среду обитания, и там его роль велика, но на уровне человеческого разума он
носит прикладной характер и нередко служит прикрытием махизма в наиболее одиозной форме» [Крей-
дик,2002] – но и данный автор не отрицает применимости его в соответствующих областях науки.
Общим для подобных общефилософских публикаций является тот факт, что МПиО рассматривает-
ся здесь как данность, не требующая дальнейшего анализа её внутренней структуры, и интерпретирует-
ся, по существу, именно в наиболее очевидной форме – как слепой поиск (хотя термин «слепой» и не
употребляется в явном виде).
4.2.3.2. Биолого- и психолого-поведенческий аспект
В данной области науки МПиО был изначально сформулирован, и в ней он к настоящему времени
занимает свое достойное место при объяснении разнообразных поведенческих феноменов. Но и здесь
его интерпретации можно подразделить на две основные группы.
4.2.3.2.1. Трактовки МПиО, явно или неявно характеризующие поиск как «слепой»
К этой группе можно отнести мнения следующих авторов.
Пример: «Как отмечают экспериментаторы, все высшие животные действуют, руководствуясь своим
прежним опытом, а новый опыт приобретают путем слепых проб и ошибок, случайно. И лишь обезьяны
решают задачи также и первично. То есть, предварительно оценивая возможные результаты своих дей-
ствий. Конечно, это не значит, что такая оценка не основана вообще на прежнем опыте. Это означает
лишь то, что из конкретного опыта обезьяны способны извлекать куда больше полезной информации,
чем другие животные, способны даже как-то абстрагировать и данные абстракции использовать в иных
случаях, которые кажутся экспериментаторам совершенно новыми, неизвестными подопытным особям.
Как конкретные ситуации, они, конечно, новы, но в каких-то общих чертах, безусловно, должны быть
сходны с прошлым опытом. Иначе шимпанзе (у рассуждающих о "первичности" экспериментаторов) ока-
зываются способнее людей и даже вообще действующими по какому-то мистическому наитию. Вероят-
но, здесь задействованы механизмы типа тех, что определяют существование в животном мире фено-
мена "инсайта", то есть внезапного озарения, осуществления адаптивной реакции без предварительных
проб и ошибок. Разумеется, эта реакция берется не с потолка, а есть просто результат неожиданного
сопоставления различного опыта, зафиксированного в мозге. Вопрос именно в способности к таким не-
стандартным сопоставлениям. Этот феномен чаще встречается у молодых особей, у которых традици-
онное поведение и возрастная консервация психики ещё не подавляют способность к творчеству. Воз-
можно, физиологическое доверие к прежнему опыту (ибо любой феномен психики имеет нейрофизиоло-
гическую природу) у обезьян сравнительно расшатано в силу отмечавшегося выше естественного мно-
гообразия их отношений к миру. Устройство мозга высших приматов больше, чем у других животных,
рассчитано на нестандартные ситуации. Приматы более свободны в своем поведении, в выборе дейст-
вий, то есть, как говорилось, менее специализированы» [Хоцей].
Другой пример: «Выбор действий животных во вновь возникающих ситуациях обеспечивают УРИ -
условные рефлексы исследовательские, разведочные. В основном это действия методом проб и оши-
бок, просто случайные - в момент опасности действовать наобум лучше, чем вообще не действовать. В
случае удачи УРИ закрепятся в "основном составе" условных рефлексов и будут передаваться через
обучение новым поколениям» [Лебедев,1993].
Третий пример: «Поражающая адекватность экологического поведения – как отдельных особей, так
и целых сообществ – результат миллионолетия проб и ошибок. Те, кто ошибался так, что уже не мог вы-
править равновесие между своей жизнью и жизнью среды, оставались лишь в палеонтологических лето-
писях» [Левин]. И т.д.
Этот ряд можно продолжать, но уже понятно, что подобные примеры демонстрируют в целом пози-
тивную оценку их авторами роли МПиО (причем, явно или неявно, в его «слепой» интерпретации) в ор-
ганизации поведения биологических объектов.
4.2.3.2.2. Трактовки МПиО, либо смешивающие понятия «слепого» и «направленного» поиска,
либо вообще их не разделяющие
К этой группе можно отнести мнения следующих авторов.
Пример из этологии: «Выживаемость на конкретном историческом отрезке (все текучие проблемы
сохранения видов) прежде всего зависит от этологической пластичности вида, т.е. способности активно
адаптироваться к стрессовым воздействиям (локальная агрессия другого вида, трансформация среды
обитания) через способность их социумов к активному перемещению в ландшафтно-географическом
пространстве (задействование новых мест гнездования, иных путей пролета - "динамический" адекват-
ный ответ) или активному задействованию, методом проб и ошибок, пустующих средовых прослоек
(временных, или гриннеловских ниш - трофических, гнездовых, защитных) в том же регионе ("статиче-
– 119 –
ский" адекватный ответ). Последнее всегда связано с той или иной нетипичностью в поведении особей и
социума и может вести к обособлению новой экоморфы (синантропной или "дикой"). Способность адек-
ватного ответа зависит от базовых (врожденных) характеристик психики (определяют общей уровень
этологической пластичности таксона, принципиальную способность "отреагировать") и особой перцеп-
тивной истории конкретного социума (определяет конкретные варианты реагирования)» [Михайлов, Со-
цио-…]. С моей точки зрения, указание здесь на «врожденные характеристики психики» – это специфи-
ческая формулировка наличия памяти в его трактовке алгоритма МПиО.
Примеры из области поведения бактерий: «Некоторые бактерии также используют примитивную
форму управления поведением по МПиО. Бактерии этого вида имеют тенденцию плавать по прямым
линиям, и имеют ровно столько "памяти", чтобы знать, улучшаются ли окружающие условия или ухуд-
шаются по направлению их движения. Если они ощущают, что условия улучшаются, они продолжают
двигаться вперёд. Если они чувствуют, что условия становятся хуже, они останавливаются, переворачи-
ваются и направляются в случайном, обычно ином, направлении. Они исследуют направления, и отдают
предпочтение хорошим, отвергая плохие. И поскольку это заставляет их мигрировать в направлении
больших концентраций молекул пищи, они выжили» [Дрекслер]. Хочу сразу же подчеркнуть, что данный
автор совершенно определенно говорит о МПиО как о методе с «памятью», который, естественно, де-
монстрирует свою высокую эффективность. Интересно сравнить эту оценку с совершенно противопо-
ложной, хотя и относящейся к тому же объекту моделирования: «То, что принцип пробных движений и
"проб и ошибок" совершенно недостаточен уже для понимания поведения низших организмов, недавно
прекрасно показал F.Alverdes в своем сочинении "Neue Bahnen in der Lehre vom Verhalten der niederen
Organismen" (Berlin), 1923, О проблеме происхождения языка» – пишет М.Шелер [Шелер]. Не состоит ли
причина столь негативной оценки данным автором существа МПиО именно в иной его интерпретации –
т.е. как «слепого» метода, памятью не обладающего? Мое мнение – это именно так!
Ещё пример. П.В.Симонов пишет: «Нейрофизиологические механизмы стадии генерализации ус-
ловного рефлекса практически совпадают с феноменом доминанты, обнаруженным академиком
А.А.Ухтомским (1875-1942): доминанта есть временно господствующая рефлекторная система с первич-
ным очагом в одном из отделов мозга, направляющая работу нервных центров в данный момент и опре-
деляющая вектор поведения. Сформировавшись, она обладает четырьмя типичными свойствами: стой-
ким возбуждением, повышенной возбудимостью, благодаря чему возникает способность к суммирова-
нию самых разнообразных раздражений, и, наконец, выраженной инерционностью. В сущности, с такими
характеристиками мы и встречаемся тогда, когда наблюдаем стадию генерализации условного рефлек-
са. Способность доминанты откликаться на самый широкий круг внешних стимулов, по-видимому, реа-
лизуется с участием гиппокампа. К доминанте, по мнению А.А.Ухтомского, "пристает все нужное и не-
нужное, из чего потом делается подбор того, чем обогащается опыт". Но возникающие при этом реакции
не носят случайного характера. Их ограничивает видовой и ранее накопленный индивидуальный опыт
(! – С.Г.). Скажем, собака, стремящаяся избавить себя от болевого раздражения, не переходит к хаоти-
ческим пробам и ошибкам, а перебирает действия, в прошлом приводившие к решению аналогичной за-
дачи. Или обезьяна. Убедившись, что палка для доставания приманки из глубокой щели оказалась
слишком тонкой и короткой, она из кучи берет палку толще и длиннее. Но не наоборот» [Симонов]. Ин-
тересно, что в данной цитате МПиО упоминается (неявно) в форме «перехода к хаотическим пробам и
ошибкам». Наличие же «индивидуального опыта» прямо характеризует его как метод с «памятью».
С другой стороны, В.Ф.Турчин указывает «Простая рефлекторная связь между возбудимой и мы-
шечной клеткой естественно возникает в процессе эволюции по МПиО: если оказывается, что корреля-
ция между возбуждением одной клетки и сокращением другой полезна для животного, то эта корреляция
устанавливается и закрепляется» ([Турчин,2000(1977)], стр. 37). Здесь проблема памяти собственно
МПиО не обсуждается.
Рассматривая вопрос об источниках информации для выработки сохраняющих реакций,
А.А.Ляпунов пишет: «... весьма важно прижизненное обучение (курсив цитируемого автора – С.Г.), т.е.
способность к прижизненному накоплению информации для сохраняющих реакций. Эта информация
может формироваться путем проб и ошибок» (см. [Ляпунов,1980], стр. 227). И здесь проблема памяти
собственно МПиО не затрагивается.
Наконец, В.Ф.Турчин обобщает: «…любая сложная система, возникшая в процессе эволюции по
МПиО, должна иметь иерархическую организацию» ([Турчин,2000(1977)], стр. 51) – переходя уже к
иным аспектам соотнесения модельного механизма МПиО как такового со структурой системы, в кото-
рую он встроен (по моему мнению, «иерархообразующим» является всё же не столько МПиО, сколько
его обобщение – метод адаптивного случайного поиска: см. ниже, подраздел 4.3).
Но высказываются и несколько иные мнения относительно необходимости МПиО: «Какой бы хо-
рошей ни была модель, она не может точно предсказать, что случится в действительности, однако хо-
рошая модель во сто крат предпочтительней проб и ошибок вслепую. Моделирование можно назвать
некой заменой метода проб и ошибок - термин, к сожалению, давно уже присвоенный “крысиными” пси-
хологами» ([Dawkins,1976(1993)], стр. 63). Со мнением, что «хорошая модель во сто крат предпочти-

– 120 –
тельней проб и ошибок вслепую» трудно спорить – но необходимо предварительно понять, где биологи-
ческие объекты могут взять информацию, достаточную для построения «хорошей» модели своего пове-
дения в перманентно изменяющейся внешней среде, и какими методами и средствами могут её реали-
зовать как в онтогенезе, так и, особенно, в филогенезе.
Отмечу и позицию, лишний раз демонстрирующую опасность использования неоднозначно опреде-
ленного термина: «Недавно было доказано, что сфекс-аммофила иногда убивает гусеницу вместо того,
чтобы парализовать её, а подчас парализует её наполовину. Но из того, что инстинкт, как и интеллект,
может ошибаться, что ему свойственны также и индивидуальные отклонения, совсем не следует, что
инстинкт сфекса приобретен, как утверждалось, путем разумных (! – С.Г.) проб и ошибок» [Бергсон].
Как хотелось бы узнать, что именно подразумевается под «разумными» пробами и ошибками…
А также позицию, демонстрирующую опасность неверного использования термина: «Новое поведе-
ние находится путём случайного поиска (? – С.Г.) в окрестности уже освоенного поведения. Случайный
поиск исключительно неэффективен (??? – С.Г.). Максимум, что можно ещё пытаться угадать – это ин-
формация из нескольких бит. Уже 10 бит, то есть тысяча равноправных вариантов – много даже для че-
ловека. Поэтому поиск нового должен происходить на фоне уже освоенного и известного. Причём это
новое должно быть минимально информационно насыщенно (минимально содержательно). После ус-
пешного нахождения "новых бит" и согласования их с имеющимися знаниями, они включаются в "осво-
енные" знания. И далее поиск нового продолжается такими же мельчайшими шажками» [Корниен-
ко,1999]. Ниже будет показано, что термин «случайный поиск» достаточно хорошо, в том числе фор-
мально, определен, и использование его в данном контексте совершенно неоправданно.
И т.д. Этот ряд также можно продолжать, но уже понятно, что подобные примеры демонстрируют
самые различные оценки их авторами роли МПиО в организации поведения биологических объектов в
зависимости от его интерпретации: как «слепого» либо «направленного» (т.е. с памятью).
4.2.3.3. Биолого-эволюционный аспект
Помимо процитированной выше позиции В.Ф.Турчина, существует ещё довольно большое число
работ, авторы которых уверенно ставят знак равенства между МПиО и механизмом биологической эво-
люции, причем даже полагают это «общепризнанным». Как следствие такого подхода, опираясь на на-
глядные, очевидно весьма высокие, окружающие (и включающие!) нас результаты биологической эво-
люции, они положительно оценивают и МПиО как её теоретический (я бы всё же сказал – гипотетиче-
ский) механизм.
Так, обсуждая проблему синтеза научного метода как такового, А.Г.Фонотов отмечает: «Ф.Бэкон
первым дал метод исследования, синтезирующий природное (подчинение природе, подражание ей) и
сознательное человеческое (через целенаправленный поиск) начала. Суть этого метода, его краеуголь-
ный камень состоит в использовании МПиО и практической проверке полученного в результате этого
знания. В настоящее время общепризнанно, что аналогичным образом действует эволюция (при всей
условности понятия "действует" применительно к эволюции). В этом смысле научный метод был не изо-
бретен, а открыт. Но открыт он был (благодаря практической ориентации философии Бэкона) как мате-
риальное воплощение взаимодействующих науки и практики. Это значит, что производственная дея-
тельность, и в первую очередь материальное производство, в своей эволюции сначала неосознанно и
спонтанно, а потом сознательно и целенаправленно начинает опираться на научный метод» [Фонотов].
Иногда в подобных публикациях МПиО рассматривается как «слепой», что не приводит к его кри-
тике автором: «Средством приспособления, более того, способом существования жизни (биологической
формы движения материи) является слепой поиск оптимума, т. е. такого состояния, которое может быть
охарактеризовано как качество соответствия организма (вида и всего живого) среде. Поиск осуществля-
ется посредством случайных проб. Пробным материалом служат особи. Их должно быть много и они
должны быть разные» [Искрин,2001].
По существу тот же смысл в данное понятие вкладывает и Р.Докинз: «Характерной чертой эволю-
ционного процесса стала его внутренняя спонтанность, случайность, которая, тем не менее, ведет к за-
кономерностям развития и прогресса. Недаром метафорой эволюции стал слепой часовщик»
([Dawkins,1988], цитируется по [Капица,1999]).
В известной книге «Сумма технологии» С.Лем констатирует: «Один из фундаментальных законов
биоэволюции состоит в непосредственности её действий. Ибо в эволюции каждое изменение служит
только сегодняшним задачам приспособления. Эволюция не может производить таких изменений, кото-
рые служили бы лишь подготовкой для других, предстоящих через миллионы лет; о том, что будет через
миллионы лет, биоэволюция "ничего не знает", поскольку она является "слепым" конструктором, дейст-
вующим методом "проб и ошибок". Она не может в отличие от инженера "остановить" неисправную ма-
шину жизни, чтобы, "продумав" её основную конструктивную схему, в один прием радикально её пере-
строить» ([Лем,2002], стр. 54). Е.А.Седов начинает предисловие к своей монографии «Эволюция и ин-
формация» словами: «Аргументом в пользу правомерности обобщающего информационного подхода к
анализу эволюционных процессов может служить уже то, что все эволюционные процессы осуществля-

– 121 –
ются путем “проб и ошибок”, сочетающим спонтанные стохастические изменения информации и её де-
терминированный отбор» ([Седов,1976], стр. 3).
Рассматривая проблему филогенетического разнообразия, Г.А.Заварзин пишет: «Филогенетическая
классификация предполагает существование генетически консервативной системы, на которую накла-
дывается функционально значимая фенотипическая оболочка, определяемая внешними условиями –
экологической нишей, представляющей своеобразное техзадание, соответствующее системе, опреде-
ляемой сообществом, то есть вводящим внешнее понятие цели. Отсюда появляется целесообразность
как соответствие системе, достигаемая естественным отбором, методом проб и ошибок» ([Завар-
зин,2001а], стр. 169). И т.д.
Чаще всего именно в подобных публикациях МПиО явно рассматривается как направленный (обла-
дающий возможностью обучения, т.е. памятью). Так, например, Г.Фоллмер пишет: «Мир, в котором мы
живём, доныне не был настолько хаотичным, каким бы он мог быть, а является относительно констант-
ным и упорядоченным. Ожидание закономерности, способность обучаться посредством проб и ошибок,
склонность на основании прошлого "заключать" о будущем, сохранили поэтому доныне диспозицию к
индуктивным заключениям. Живые существа, которые бы этим не обладали, например, параиндуктиви-
сты или существа без условных рефлексов были бы подавлены в естественном отборе и вымерли»
[Фоллмер].
Или, рассматривая его как самый примитивный или «слепой», делают вывод о необходимости пере-
смотра такого определения: «Эволюция от первой живой клетки до микроорганизма, плавающего в океа-
не, заняла больше миллиарда лет – это на первом этапе, когда природа пользовалась самым примитив-
ным методом проб и ошибок. Ещё миллиард лет заняла эволюция от микроорганизмов до ящеров. Эво-
люция от ящеров до обезьян заняла сотни миллионов лет. От теплокровных животных до первобытного
человека – десятки миллионов. А путь от первобытного человека до нас с вами занял уже "всего" десят-
ки тысячелетий. Эволюция все время ускоряла свой бег. А между тем, если бы природа действовала
методом проб и ошибок, скорость эволюции должна была, по крайней мере, быть постоянной или даже
замедляться!» [Амнуэль].
Ещё один пример похожего подхода с подобным же выводом: «Пока нет никаких доказательств
участия метилирования ДНК в адаптивной изменчивости эукариот, но участие его в эпигенетическом на-
следовании некоторых признаков уже не вызывает особых сомнений. Метилирование вполне может ле-
жать в основе некоторых проявлений адаптивной эволюции эукариот. Вопрос только в том, насколько
подобная адаптация управляема, т.е. способен ли геном модифицировать сам себя, причём не методом
проб и ошибок, а вполне целенаправленно» [Ядерное мышление,2001].
Таким образом, трактовка МПиО как механизма естественного отбора часто подвергается справед-
ливой критике, хотя аргументация иных авторов также не свободна от неточностей.
Например: «Теория передачи информации, возникшая на базе теории вероятности, без особого
труда вынесла смертный приговор концепции естественного отбора (это зависит от того, что именно
поднимать под данной концепцией! – С.Г.). Оказалось, что МПиО имел бы в биоэволюции такие же или
даже более ничтожные шансы на успех, чем создание “Войны и мира” обезьяной, тыкающей наугад в
клавиши пишущей машинки. Здесь требовался какой-то новый принцип развития, охватывающий к тому
же не только живую, но и неживую материю (…) Вспомним, что мнимая мудрость эволюции, которая на
самом деле слепа, объясняется по Дарвину, естественным отбором путем проб и ошибок единственно
удачного варианта из огромного числа “пустышек”. Ничего подобного не наблюдается при становлении
живого организма из родительской клетки, которое с самого начала происходит вполне однозначно, в
строго определенном порядке, заданном направлении и в заранее установленный срок. Другими слова-
ми, процесс явно идет от начала до конца строго по плану, неуклонно и целесообразно» [Силин,1997].
Что касается «становления живого организма из родительской клетки», то этот процесс (онтогенез), ко-
нечно же, имеет совершенно иной характер, нежели процесс собственно эволюции такого организма
(филогенез), но из этого факта совсем не следует, что первый процесс как-то опровергает второй. А рас-
суждения об обезьяне и пишущей машинке довольно часто встречаются в публикациях, рассматриваю-
щих их как «доказательство» ошибочности дарвинизма как такового. К сожалению, эти авторы, помимо
прочих неточностей (в частности, неучета иерархичности системы живого) строят свои умозаключения
на неверном, с моей точки зрения, аргументе трактовки механизма эволюции именно как МПиО = сино-
нима «слепого» поиска.
Понятие слепого поиска активно используется и в теории генетических алгоритмов, которые конст-
руируются исходя из бионического принципа, т.е. воплощения в технических устройствах (в данном
случае – в компьютерных программах) свойств того или иного биологического объекта (конечно, в том
виде, в каком последний видится их конструкторам): «Общепринято, что в генетических алгоритмах му-
тациям соответствуют одиночные замены генов, обеспечивающие стохастическое движение в ближай-
шей окрестности. В такой схеме слепого поиска мутации рассматриваются как минорный элемент гене-
тического алгоритма, так что на практике рекомендуют строго ограничивать их вклад с целью подавле-
ния вносимого ими шума» [Воробьев].

– 122 –
Итак, когда МПиО рассматривают как «слепой», делают вывод о его недостаточной эффективности:
зачастую некоторые критики, как они говорят, «случайного поиска» [Waddington,1968(1970)], подразу-
мевают в своем рассмотрении именно слепой поиск, недостатки которого очевидны. Так,
К.Х.Уоддингтон пишет: «Форма гравия на дне реки определяется случайными процессами, т.е. (? –
С.Г.) возникает в результате случайного поиска (??? – С.Г.)» [там же], и демонстрирует такой процесс
на соответствующей иллюстрации фиг. 2 этой статьи.
В действительности
указанные процессы вообще
непоисковые и даже
неоптимизационные. Здесь
мы видим рисунок,
неотличимый на вид от
приводящихся в учебниках
иллюстраций броуновского
движения какой-либо
микрочастицы в жидкости.
Кроме того, применение
термина «случайный поиск»
в данном контексте вообще
неоправданно (более под-
робно это будет
продемонстрировано ниже, в
пункте 4.3.2). В результате
эффектная концовка
цитируемой статьи: «Мы, разумеется, не должны считать, что глаз позвоночного животного, нога лошади
или шея жирафа представляют собой в сколько-нибудь серьезном смысле результат случайного поиска»
([там же], стр. 115) повисает, таким образом, в воздухе...
Но, по моему мнению, именно подобные терминологические недоразумения послужили основным
препятствием к использованию идеологии случайной поисковой оптимизации для объяснения смысла и
особенностей эволюционных процессов в Биосфере Земли. В частности, отрицательное мнение столь
авторитетного специалиста, как К.Х.Уоддингтон, о процессах якобы «случайного поиска» в эволюции
(но, к сожалению, относящееся совсем к другим, непоисковым процессам), прозвучало на известном
симпозиуме по теоретической биологии ещё в 1968 году. Поддержанное рядом его коллег, оно вполне
могло оказаться непреодолимым барьером на пути привлечения в эволюционные представления опти-
мизационных поисковых понятий. Даже публикация книги В.Ф.Турчина (1977, 2000) не смогла разру-
шить этот барьер…
4.2.3.4. Социально-экономико-эволюционный аспект
Авторы целого ряда публикаций в данной отрасли знания полагают, что эволюционирование при-
роды и общества в соответствии с моделью МПиО также является общепризнанным и вполне адекватно.
Например: «Общепризнано, что эволюция в природе и обществе происходит постепенно и медленно,
путем постоянных проб и ошибок. Её результатом является отбор качеств, свойств, умений, навыков и
других признаков, которые способствуют лучшей адаптации систем к изменяющимся условиям природ-
ной и социальной среды» [Рузавин].
Другой пример. Э.М.Галимов пишет: «Паскаль сказал: “Предвидеть – значит управлять”. Именно
в человеческом обществе “управлять – значит предвидеть”. В стае вожак – наиболее опытная особь. В
человеческом обществе лидер – личность, наделенная максимальной способностью к предвидению. В
человеческом обществе управление методом “проб и ошибок” – наиболее примитивная форма управле-
ния, находящаяся, по сути дела, на уровне биологической организации управления» (см. [Гали-
мов,2001], стр. 12).
Подобным же образом можно интерпретировать и высказывания Ф.А. фон Хайека: «В условиях
спонтанного порядка незачем знать ни обо всех преследуемых целях, ни обо всех используемых средст-
вах, чтобы учитывать их в своем поведении. В этом нет нужды, поскольку такой порядок формируется
сам по себе. И если правила, создающие порядок, становятся все более совершенными, так это не по-
тому, что люди начинают лучше понимать свою задачу, а потому, что процветания достигают те группы,
которым удается изменять правила поведения так, чтобы способность к адаптации у них возрастала.
Характер этой эволюции не прямолинеен, он складывался в процессе постоянных проб и ошибок, не-
прерывного "экспериментирования" в сферах, где происходило "соперничество" между порядками разно-
го типа. Разумеется, никакого специального намерения ставить эксперименты здесь не было – и всё же


– 123 –
изменения правил поведения, вносимые исторической случайностью, действующей аналогично генети-
ческим мутациям, оказывались неким подобием экспериментирования» [фон Хайек,1992].
Позиция Ф.А. фон Хайека поясняется его комментатором следующим образом: «Если Ф.Хайек от-
рицает конструктивизм как способ изменения общества, то он обязан следовать эволюционистской тра-
диции. В соответствии с нею источник изменений – спонтанные изменения, мутации ("МПиО"), а естест-
венный отбор ("на выживание") закрепляет новации, оказавшиеся полезными или, по крайней мере, без-
вредными. По Ф.Хайеку, этот метод хорошо работает в очень широком диапазоне: "идея эволюции ни в
коей мере не ограничивается живыми организмами; скорее эволюция начинается в каком-то смысле уже
на уровне атомов, образующихся из элементарных частиц. Таким образом, через многообразные про-
цессы эволюции мы можем объяснять как молекулы – самые примитивные из сложных организмов, так и
сложный современный мир". Конечно, подобное утверждение можно сделать и обосновать, опираясь на
достижения самых различных наук (начиная с физики), только в наше время. В то время, когда К.Маркс
начинал, не было даже открытия Ч.Дарвина, ключевого для теории эволюции. Тем не менее, дух этой
теории, если так можно выразиться, в то время уже существовал. Ф.Хайек отмечает, что Ч.Дарвин читал
А.Смита как раз в то время (в 1838 г.), когда формулировал собственную теорию. А первые слова о гене-
тическом развитии, по его мнению, были сказаны немецким философом и историком культуры
И.Гердером. "Таким образом, современная биология заимствовала понятие эволюции из исследований
культуры, имеющих более древнюю родословную"» [Гребнев,1993].
Цитированные источники являются примерами исследований, в которых существо МПиО, его
внутренняя структура не подвергаются анализу: «слепой» он или нет. Но в ряде других работ данной
области исследований содержится обоснование необходимости введения в МПиО памяти, например:
«Признано, что природа и общество эволюционируют согласно принципу “проб и ошибок”. Результатом
эволюции природных систем является отбор качеств, свойств, способов и методов, которые способст-
вуют процессу их адаптации к изменяющейся внешней среде. Однако приобретенные качества, умения
и навыки отдельных природных систем могут быть использованы в будущем лишь при условии их гене-
тического фиксирования, что практически невозможно. Социальные же системы обладают возможно-
стями для сбора, хранения и использования информации (не только о своем развитии, но и о жизнедея-
тельности других систем) при помощи “коллективной памяти”. Этой особенностью социальных систем
определяется их отношение к рефлексии. Так, известно, что эти системы благодаря указанной способ-
ности носят название “рефлектирующие системы”» [Лизунова,Яровикова].
Другой пример: «Обычаи складываются на основе удовлетворения индивидами своих потребно-
стей: определенные способы поведения, удовлетворяющие ту или иную потребность и в силу этого вы-
годные для индивида, закрепляются, становятся привычными. Первоначальным механизмом возникно-
вения обычаев является МПиО (метод “грубого эксперимента и отбора”): одни способы поведения ока-
зываются менее болезненными по сравнению с другими, более эффективно обеспечивают удовольст-
вие и оберегают человека от страдания, а потому имеют больше шансов на сохранение. Групповая
жизнь людей и их борьба за существование способствовали распространению функционально полезных
способов поведения в социальной группе и превращению их в обычаи. Обычаи являются основной со-
циетальной силой. Они опосредствуют в обществе удовлетворение всех человеческих потребностей и
накладывают социальные ограничения на биологически детерминированное поведение каждого члена
общества. Поскольку возникновение обычаев не осознается людьми, то их происхождение всегда “оку-
тано тайной”, а сами обычаи наделяются для людей “силой фактов”. Основными свойствами народных
обычаев У.Г.Самнер считал их инертность, изменчивость, тенденцию к совершенствованию и согласо-
ванности» [Самнер]. Здесь следует указать, что именно обычаи могут выступать, с одной стороны, в ро-
ли ограничений поиска, а с другой – отражать соответствующую память системы.
Фиксируя же в таких исследованиях понимание свойств МПиО именно как «слепого» поиска, вы-
сказывают резко критическую к нему оценку: «природа оказалась беззащитной перед вооруженным че-
ловеком. В свою очередь человек выявил себя совершенно неспособным к "разумному", осмотритель-
ному использованию так трагически "свалившегося на его голову" рассудка. Он по-прежнему шел околь-
ным, недомысленным путем проб и ошибок, в основном страшных и дорого обходящихся и ему и приро-
де. Самым же зловещим симптомом недоумия человечества является полное игнорирование им горьких
и страшных уроков собственной истории, главный из которых, как известно, состоит в том, что уроки эти
никого и ничему не научили» [Диденко,1999].
Хотя есть и противоположные мнения, например: «Психика, освоив определенные состояния, стре-
мится перерасти себя. Этот же механизм отличает и динамику искусства. Искусство далеко не всегда
отклоняется только в сторону, предначертанную логикой предыдущих процессов. И там, и здесь зачас-
тую идет слепой поиск» [Кривцун,1998].
Среди множества публикаций на данную тему в последние годы начали появляться и такие, в кото-
рых намечаются конкретные пути преодоления недостатков МПиО применительно к интерпретации
эволюционных процессов. Вот что пишут С.П.Курдюмов и Е.Н.Князева: «Синергетика открывает прин-
ципы управления, экономии и ускорения эволюции. Один из важнейших выводов синергетики состоит в
том, что механизмы слепого жесткого отбора, механизмы чисто рыночного типа не являются единствен-
но возможными в эволюции сложных систем. Мы не должны забывать о том, что живая природа научи-
– 124 –
лась многократно сокращать время выхода на нужные структуры посредством матричного дублирования
– ДНК. Подобный механизм для открытых нелинейных систем называется резонансным возбуждением.
В принципе есть возможность строить формы социальной организации не методом слепого отбора, мно-
гократных проб и ошибок. Не обязательно следовать постепенному и долгосрочному пути становления и
развития общества рыночного типа. Иначе мы сейчас, в конце XX века, начнем повторять всю эволюцию
капиталистического общества, которая протекала 400-500 лет. У нас нет этих 500 лет. Необходимо ясно
осознать, что существует путь многократного сокращения временных затрат и материальных усилий,
путь резонансного возбуждения желаемых и – что не менее важно – реализуемых на данной социальной
среде структур. Возможен также путь направленного морфогенеза – спонтанного нарастания сложности
в открытых нелинейных социальных средах. Последний представляет собой некий аналог биологических
процессов морфогенеза и "штамповки" типа редупликации ДНК» [Курдюмов,Князева].
•••••
Подытоживая данные, приведенные в пункте 4.2.3, приходим к мнению, что научные издания раз-
личных отраслей знания также не дают однозначного определения для МПиО. Как видим, лишь часть
авторов ставят перед собой задачу более подробного рассмотрения особенностей МПиО, но и они не
предлагают формальных его определений. Что касается трактовок МПиО, то в приведенных цитатах на-
лицо весь их спектр: от «простейшего» = «слепого» до использующего накопленный индивидуальный
опыт неопределенной глубины. Соответственно столь же широк и диапазон оценок МПиО: от крайне
негативных до весьма позитивных.
4.2.4. МПиО: формальные определения
Возможно, впервые подход, который может быть интерпретирован как «мостик» к формальному
определению МПиО, высказал в 1960 году У.Р.Эшби: «В психологических работах адаптацию методом
проб и ошибок иногда рассматривают как лишь один из способов адаптации, и к тому же не самый луч-
ший. Приведенные выше соображения показывают, что МПиО занимает гораздо более фундаменталь-
ное положение среди методов адаптации. Они, в сущности, показывают, что тогда, когда организм дол-
жен приспосабливаться (удерживать свои существенные переменные в физиологических пределах),
действуя через среду типа “черного ящика”, процесс проб и ошибок необходим (здесь и ниже курсив
У.Р.Эшби), ибо только такой процесс позволяет извлечь нужную информацию. Таким образом, процесс
проб и ошибок можно рассматривать с двух совершенно разных точек зрения. С одной стороны, в нем
можно видеть просто попытку достижения цели; когда цель не достигается, эффективность его мы оце-
ниваем цифрой 0. С такой точки зрения это лишь «второсортный» способ достижения цели. Существует,
однако, другая точка зрения, которая ставит этот метод неизмеримо выше, так как он может играть не-
оценимую роль в получении информации, абсолютно необходимой для успешной адаптации. Именно
поэтому процесс проб и ошибок должен быть использован (организмом) при адаптации» ([Ashby,1960
(1964)], стр. 137).
Позднее Л.А.Растригин специально подчеркивал, что «огромной заслугой Эшби является то, что он
предложил искать управление X (в гомеостате Эшби – С.Г.) не целенаправленно, а случайно – путем
проб и ошибок. Ему же принадлежит заслуга обоснования такого на первый взгляд “неразумного” спосо-
ба поведения» ([Растригин,1965], стр. 30; [Растригин,1968], стр. 54). Тем самым он обосновал мнение,
что теория МПиО может рассматриваться как элемент именно теории управления, конкретнее – её по-
следовательно вложенных друг в друга составляющих «техническая кибернетика»-«теория оптимиза-
ции»- «теория поисковой оптимизации»-«теория случайного поиска».
Далее Л.А.Растригин пишет: «МПиО, используемый гомеостатом для отыскания решения, сводится,
по сути дела, к случайному перебору элементов некоторого допустимого множества управлений (слу-
чайному поиску), проверке эффективности и соответствующей реакции на каждое управление. Четко
?
разграничиваются два вида реакций на случайное управление. Отрицательная реакция R возникает в
ответ на управление, которое не приводит к выполнению поставленных целей. Эта реакция в соответст-
вии с алгоритмом гомеостата вызывает очередную случайную пробу управления. Положительная реак-
+
ция R следует при выполнении в объекте целей управления. Она сохраняет в объекте то управление,
которое привело к выполнению поставленных требований. Алгоритм такого поведения удобно записать
в виде
? ?, если R ? ,
X i +1 = ?
если R + ,
?Xi,
где X i - управление на i -м шаге поиска, а ? - случайное управление из класса допустимых управлений.
Как легко заметить, такой алгоритм имеет целесообразное поведение, направленное на поиск и сохра-
+
нение в системе стабильного состояния, которое обеспечивает положительная реакция R . Этот алго-
ритм естественно назвать алгоритмом с “наказанием случайностью”, так как случайное управление вво-
дится как реакция на неудачу (…) Применение описанной схемы слепого (курсив мой – С.Г.) поиска
прямо к оптимизации многопараметрических систем не приводит к успеху, (…) поскольку алгоритм го-
– 125 –
меостата (т.е. в данном контексте МПиО – С.Г.) решает вопрос об отыскании решения в принципе; он
гарантирует конечность времени отыскания условий, удовлетворяющих целям управления. Вопросы бы-
стродействия не решаются этим алгоритмом, так как он предназначен для управления объектами самого
широкого класса с единственным ограничением – конечность вероятности отыскания решения»
([Растригин,1968], стр. 65-69).
По-видимому, данное математическое выражение с его комментариями и можно рассматривать как
единственное существующее в литературе формальное определение МПиО (по крайней мере, других
подобных определений мне не удалось найти ни непосредственно в специальной литературе, ни с по-
мощью Интернет-поиска). Отмечу, что характеристики случайности поискового управляющего воздей-
ствия ? детализируются в дальнейшем комментарии как «слепой» поиск, причем в силу этого – весьма
малоэффективный. Таким образом, единственное имеющееся формальное определение МПиО рассмат-
ривает его именно как «слепой».
4.2.5. МПиО: предварительные выводы
В результате анализа вышеприведенных определений и разнообразных точек зрения на МПиО, как
представляется, можно сделать следующие предварительные выводы:
а) в литературе удалось найти лишь единственное формальное определение МПиО
(Л.А.Растригиным), определяющее его как «слепой» поиск;
б) достаточно многочисленные вербальные определения и трактовки МПиО неоднозначны – в них,
как правило, не рассматривается его внутренняя структура, в частности, не конкретизируется и не учи-
тывается фактор фундаментального значения: наличие либо отсутствие памяти в процедуре генерации
пробы; таким образом, в значительном числе интерпретаций не делается различия между вариантами
МПиО без памяти («слепого» поиска) и с памятью («направленного» поиска), тогда как во многих дру-
гих случаях МПиО рассматривается конкретно как «слепой» (т.е. МПиО в узком смысле / в узкой трак-
товке) либо как «направленный» (т.е. МПиО в расширенном смысле / в расширенной трактовке);
в) указанная многозначность трактовок термина МПиО приводит к многочисленным недоразуме-
ниям при его использовании в различных отраслях знания, в частности – к суждениям о его эффектив-
ности в диапазоне от резко отрицательных до весьма положительных (что можно объяснить именно раз-
личной интерпретацией МПиО, подразумеваемой тем или иным автором);
г) поскольку в работах У.Р.Эшби, Л.А.Растригина и других показано, что МПиО является элемен-
том более широкой отрасли знания: теории управления и, конкретнее, её важных составляющих – тех-
нической кибернетики, теории оптимизации, теории поисковой оптимизации и теории случайного по-
иска, – следует сравнить его с относительно соответствующими методами, предложенными в их рамках.
Для этого рассмотрим последние несколько подробнее, имея в виду, что, развитые в области техни-
ческой кибернетики, эти методы оказались сравнительно мало известными и почти не использующими-
ся в биологических областях естественных наук.
4.3. Оптимизация, поисковая оптимизация и случайный поиск
4.3.1. Оптимизация
Оптимизация (от лат. optimum – наилучшее) – «процесс нахождения экстремума (глобального
максимума или минимума) определенной функции или выбора наилучшего (оптимального) варианта из
множества возможных» [Солнышков,БСЭ,1974]. Оптимизация – «минимизация или максимизация оп-
ределенным образом заданного критерия, который характеризует качество или эффективность прини-
маемого решения» [Растригин,1979]. Оптимизация – «итеративный процесс улучшения решения за-
дачи, сформулированный в постановке поиска экстремума целевой функции» [Оптимизация].
Данные определения отражают наиболее широко распространенные представления об этом поня-
тии. Иногда после слов «функции» добавляют «или функционала» (переменной величины, заданной на
множестве функций), что несколько расширяет определение, не меняя по существу его смысла.
Анализ приведенных выше и иных определений термина «оптимизация» позволяет выделить в этом
термине две основные составляющие [Гринченко, 2002а]:
1) указание на наличие моделирующего некоторую реальность целевого критерия (целе-
вой функции / целевого функционала, критерия оптимизации, экстремальной характеристики, показате-
ля экстремума, критерия качества и др.), экстремальное (максимальное или минимальное) значение ко-
торого необходимо либо однократно определить (если его положение не зависит от времени), либо пер-
манентно отслеживать (в противном случае);
2) указание на наличие соответствующих средств определения экстремума данного целевого крите-
рия: при наличии достаточной информации о виде оптимизируемой функции – вполне формальных, при
её отсутствии – поисковых.
Подобная структура термина «оптимизация» задает целый спектр возможных комбинаций-«двоек»:
«конкретные свойства целевого критерия» – «конкретные свойства алгоритма определения экстремума».
– 126 –
Так, целевая функция оптимизируемого объекта либо может быть выражена математически, либо может
и не иметь математического представления (в этом случае она лишь должна быть измерима). Целевая
функция может зависеть от одной либо от многих переменных. При этом переменные могут относиться
как к множеству целых чисел, так и к множеству действительных чисел. Целевая функция может иметь
либо единственный локальный экстремум на заданном множестве переменных (который в этом случае
совпадает с глобальным экстремумом), либо множество локальных экстремумов (в этом случае она на-
зывается многоэкстремальной, и возникает дополнительная задача нахождения среди последних гло-
бального экстремума). Целевая функция может быть не только экстремального типа: возможно наличие
функциональных ограничений а) типа равенств и б) типа неравенств. Необходимо также отметить, что и
допустимое множество значений переменных в общем случае также ограничено. Кроме того, целевая
функция и ограничения типа равенств и типа неравенств могут быть как статическими, так и динамиче-
скими (зависящими от времени). Наконец, существуют задачи оптимизации, в которых задаются сразу
несколько критериев экстремального типа – это многокритериальные задачи, требующие для своего ре-
шения использования специальных методов.
В простейшем случае формальная постановка задачи оптимизации записывается следующим обра-
зом. Критерий оптимизации обычно означают буквой Q , а его зависимость от принимаемого решения –
в виде скалярной функции Q ( x ) , где x = ( x1 ,..., xi ,..., xn ) – вектор оптимизационных переменных, ха-
рактеризующий принимаемое решение. Это решение всегда как-то ограничено различными внешними
обстоятельствами (например, ресурсами), в результате чего возникает понятие множества допустимых
решений S , каждый элемент xi которого приемлем для решения задачи оптимизации, т.е. x ? S . Тогда
задачу оптимизации (конкретно – минимизации) можно записать в виде: Q( x ) ? min , т.е. функцию
x?S

Q( x ) следует (знак « ? » в формуле) минимизировать (для максимизации используется знак «max»),
варьируя вектор x в пределах множества S ( x ? S ). Решение этой задачи называют оптимальным и
обозначают x * . Это решение обладает следующим очевидным свойством: Q ( x ? ) = min Q ( x ) .
x?S
Исходя из характера и особенностей представления целевого критерия, и выбирается соответст-
вующий алгоритм решения задачи оптимизации. Для случаев, когда существует математическое выра-
жение целевой функции и ограничения отсутствуют, – это методы спуска (последовательные итераци-
онные шаги в направлении градиента/антиградиента оптимизируемой функции): градиентный метод,
обобщенный метод Ньютона, методы сопряженных направлений и т.п. Если ограничения имеются, воз-
никает задача нахождения условного экстремума, которая решается как методами, непосредственно
обобщающими методы нахождения безусловного экстремума, так и специальными методами. Эти по-
следние развиты в группе смежных научных дисциплин, которую исторически принято называть мате-
матическим программированием (данное название связано с тем, что целью решения задач является вы-
бор программы действий: не путать с технологией написания компьютерных программ). В состав этой
группы входят выпуклое, линейное, кусочно-линейное, квадратичное, дискретное или целочисленное,
динамическое, стохастическое, нелинейное и т.п. программирование [Карманов,1974]. Если же необхо-
димо найти глобальный экстремум многоэкстремальной целевой функции, чаще всего используют соче-
тание стохастического метода Монте-Карло и какого-либо метода спуска.
Случаи, когда математическое выражение целевой функции либо отсутствует вообще (и можно её
только каким-то образом измерять), либо целевая функция вычисляется математически (точнее, на ком-
пьютере) как последовательность сложных нелинейных математических преобразований, требуют ис-
пользования поисковых оптимизационных методов (см. ниже, пункт 4.3.2).
В последние годы усилился интерес к построению оптимизационных моделей различных сложных
процессов и явлений реального мира, как природных, так и антропогенных, имманентными элементами
которых являются механизмы, реализующие процессы оптимизации тех или иных целевых критериев
[Оптимизационная модель,1989; Разумовский,1998, Гринченко,1999б]. Включение этих элементов в со-
став указанных моделей отражает наиболее глубинные закономерности адаптивного поведения сложных
систем в природе и обществе.
4.3.2. Поисковая оптимизация
Поисковая оптимизация – последовательность действий, реализующих неизвестную a priori траек-
торию движения к экстремуму оптимизируемой функции: класс итеративных процессов оптимизации,
использующийся в тех случаях, когда аналитическая зависимость целевой функции от оптимизацион-
ных переменных либо неизвестна, либо её вычисление представляет собой сложную задачу
[Уайльд,1967; Первозванский,1970]. В обоих случаях от целевой функции Q ( x ) требуется только воз-

– 127 –
можность измерения (вычисления) в области определения её переменных x . Поисковый метод описы-
вается итеративным процессом (рекуррентным выражением), определяющим переход от (N-1)-го шага к
N-му: xN = xN ?1 + ?xN , причем шаг ?xN зависит от ситуации в точке xN ?1 ; в простейшем случае
?xN = ? ( xN ?1 ) , где ? - алгоритм поискового процесса оптимизации. В более сложном случае адаптив-
ной поисковой оптимизации сам вид и параметры функции ? зависят от более глубокой предыстории
поиска [Растригин,1980,1981]. Таким образом, когда количество начальной информации об объекте не-
достаточно для достижения цели управления, естественный путь восполнения – определение её в про-
цессе поиска [Гринченко, 2002б].
Поисковая оптимизация применяется для решения как статических задач (целевая функция в кото-
рых не зависит от времени), где её целесообразно называть собственно поисковой оптимизацией, так и
динамических (в последнем случае её традиционно называют экстремальным управлением объектом,
характеристики которого от времени зависят). Теория поисковой оптимизации была в основном разра-
ботана в 1960-1980-х гг. рядом отечественных и зарубежных ученых, среди которых можно выделить
Д.И.Батищева, Р.Буша, Ч.С.Дрейпера, Ю.М.Ермольева, А.Г.Ивахненко, В.В.Казакевича,
А.А.Красовского, В.М.Кунцевича, И.Т.Ли, Ф.Мостеллера, Ю.И.Неймарка, А.А.Первозванского,
Л.А.Растригина, Р.Г.Стронгина, А.А.Фельдбаума, Я.З.Цыпкина, У.Р.Эшби, Д.Б.Юдина и др. (см. напри-
мер, [Казакевич,1944; Ashby1956,1959; Фельдбаум,1959; Дрейпер,Ли,1960; Кунцевич,1961,1966; Буш,
Мостеллер,1962; Красовский, 1963; Моросанов,1964; Цыпкин,1968; Ивахненко,1969; Арефьев,1969;
Первозванский,1970; Мандровский-Соколов,Туник,1970; Юдин,1974; Казакевич,1975; Ермольев,1976;
Казакевич,Родов,1977; Коровин,1978]).
Важнейшим направлением теории поисковой оптимизации является теория случайного поиска.
Впервые изобретенный в 1959 году выдающимся русским ученым Л.А.Растригиным [1959а,б], в после-
дующие годы случайный поиск самым широким образом используется в различных областях науки и
техники – от оптимального проектирования конкретных технических систем до проблем создания об-
щей теории поиска (см., например, [Растригин,1960,1965,1966,1968,1979,1981,1987]). Очень скоро ме-
тод случайного поиск стал мощным вычислительным методом поиска новой информации и принятия
решения при оптимизации сложных объектов. Происходящий в то время бурный рост публикаций по
проблемам случайного поиска (760 источников в библиографии [Случайный поиск (теория и примене-
ние),1973], 661 источник в библиографии [Гринченко,1977], и 1128 источников – в библиографии [Грин-
ченко,1983в]) косвенно указывает на высокую эффективность метода.
Начиная с 70-х гг. получило довольно широкое распространение одно из направлений теории поис-
ковой оптимизации, связанное с методологией синтеза новых алгоритмов на базе бионических пред-
ставлений. В частности, использования для этого моделей эволюции живой природы: эволюционного
подхода (Г.Бремерманн [Bremermann,1968]), «эволюционного моделирования» (Л.Фогель, А.Оуэнс,
М.Уолш [Fogel et al.,1966(1969)], И.Л.Букатова [Букатова,1979,1987; Букатова и др.,1991]), эволюци-
онного формообразования (А.И.Половинкин [Половинкин,1970]), эволюционной глобальной оптимиза-
ции (Э.М.Куссуль, А.Лук [Kussul,Luk,1972, Куссуль,1978]; Р.Джарвис [Jarvis,1975]), эволюционной
адаптации коллективом вероятностных автоматов (Ю.И.Неймарк с соавт. [Григоренко,1971; Мухин и
др.,1973; Рапопорт,1999,2001]), «эволюционной стратегии» (И.Рехенберг [Rechenberg,1973], Г.-
П.Швефель [Schwefel,1975], К.Беллман, Дж.Борн [Bellman,Born,1979]), «генетической адаптации»
(У.Петерзон, К.Восс, К.Вебер [Weber,1972; Petersohn et al, 1974]), «генетических алгоритмов»
(Дж.Холланд, Д.Голдберг, Д.И.Батищев, В.М.Курейчик, С.А.Исаев и др. [Holland,1975; Goldberg,1989;
Батищев,1995; Курейчик,1998; Исаев,2000]) и тому подобных. Использование именно эволюционной и
генетической терминологии оказалось удобным языком при синтезе широкого спектра новых разновид-
ностей алгоритмов поисковой оптимизации. Среди авторов бионических работ в области поисковой оп-
тимизации, опирающихся на аналогии с иными биологическими объектами, следует упомянуть
В.Ф.Коропа, Л.Н.Фицнера, Л.А.Растригина, Н.П.Дидиченко и др. (см., например, [Гринченко,1975; Ко-
роп В.,1974,1976; Короп А.,1976; Фицнер,1977; Гринченко,Растригин,1976,1977,1981; Растригин, Грин-
ченко,1978; Дидиченко,1984]). Близки к ним и «муравьиные алгоритмы» (М.Дориго [Штовба,2003]).
4.3.2.1. Методы поисковой оптимизации
Методы собственно поисковой оптимизации подразделяют на две основные группы:
1) методы, использующие как пробные, так и рабочие шаги поиска;
2) методы, в которых пробные и рабочие шаги совмещены.
При экстремальном управлении пробные и рабочие шаги совмещены всегда.
Кроме того, методы поисковой оптимизации различаются по способу определения направления
движения к экстремуму. Здесь можно выделить два основных подкласса: методы регулярного поиска
(Гаусса-Зейделя, градиентный, наискорейшего спуска и т.п.) и методы случайного поиска. Эффектив-
– 128 –
ность каждого из них зависит от конкретных условий: формы поверхности целевой функции (наличия
гребней, оврагов и т.д.), погрешности её вычисления/измерения и др.
Процесс оптимизации по методу градиента разбивается на два этапа. На первом этапе с помощью
пробных шагов производится определение составляющих градиента, т.е. частных производных критерия
качества по оптимизируемым переменным. Во время второго этапа совершается рабочий шаг, т.е. про-
изводится смещение в направлении обратном градиенту. Новое значение функции качества на каждом
шаге поисковой оптимизации находится после определения всех очередных новых значений варьируе-
мых переменных, и после проверки выполнения ограничений по каждой переменной.
Метод случайного поиска использует для выявления предпочтительных состояний пробные смеще-
ния от текущей точки в случайных направлениях. Простейший алгоритм случайного поиска «с линейной
тактикой» использует только два оператора: случайного шага (? ) и повторения предыдущего шага.
Действие каждого из этих операторов может привести к одному из двух результатов: минимизируемая
функция на N-м шаге поиска QN либо уменьшится, либо не уменьшится. В зависимости от результата
включается тот или другой оператор (в первом случае – «повторить шаг», во втором – ? ). В более
сложных случаях алгоритмы случайного поиска обладают свойством адаптивности, реализуемом с по-
мощью запоминания как траектории поискового процесса (значений поисковых переменных и целевых
функций, а также соответствующих ограничений), так и параметров самого алгоритма (величины и на-
правления поискового шага, глубины памяти и т.п.) [Растригин,1968].
При собственно поисковой оптимизации существует задача определения момента, когда поиск сле-
дует завершить. Поскольку значение экстремума целевой функции a priori неизвестно, определять этот
момент с помощью задания величины допустимого отклонения от цели невозможно. Но это можно де-
лать по достижению числом последовательных неудачных поисковых шагов (или проб) некоторого за-
ранее определенного предела. Последнее можно интерпретировать как признак того, что поиск произво-
дится вблизи экстремального значения целевого критерия. Указанная задача отсутствует в системах
экстремального управления, отслеживающих экстремум оптимизируемого критерия перманентно.
4.3.2.2. Экстремальное управление
«Экстремальное регулирование (Э.р.), способ автоматического регулирования, состоящий в уста-
новлении и поддержании такого режима работы управляемого объекта, при котором достигается экс-
тремальное (минимальное или максимальное) значение некоторого критерия, характеризующего качест-
во функционирования объекта. Критерием качества, который обычно называется целевой функцией,
показателем экстремума или экстремальной характеристикой, может быть либо непосредственно изме-
ряемая физическая величина (например, температура, ток, напряжение, давление), либо к.п.д.,
производительность и др. Э.р. осуществляется в условиях неопределённости в отношении поведения
объекта управления. Поэтому при Э.р. сначала получают необходимую исходную информацию об
объекте (для этого на управляемый объект подаются пробные воздействия, изучается реакция объекта
на эти воздействия и выбираются те из них, которые изменяют целевую функцию в нужном направле-
нии), а затем на основе полученной информации вырабатывают рабочие воздействия, обеспечивающие
достижение экстремума критерия качества (см. Поисковая система управления). Таким образом, при
Э.р. решаются две задачи: нахождение градиента целевой функции, определяющего направление
движения к экстремуму в пространстве регулируемых координат при наличии помех, возмущений и
инерционности объекта оптимизации; организация устойчивого движения системы в направлении точки
экстремума за минимально возможное время либо при минимизации каких-либо других показателей.
Автоматическое устройство, вырабатывающее управляющие воздействия на объект, называется
экстремальным регулятором» [Коровин,БСЭ,1978].
«Поисковая система (П.с.) управления, система автоматического управления, в которой управ-
ляющие воздействия методом поиска автоматически изменяются таким образом, чтобы осуществлялось
наилучшее (в каком-то смысле) управление объектом; при этом характеристики объекта или внешние
возмущения могут изменяться неизвестным заранее образом. Принцип автоматического поиска лежит в
основе действия самоприспосабливающихся систем… Структурная схема П.с. показана на рисунке.
Состояние объекта управления определяется управляющими воздействиями
x ( t ) = ? x1 ( t ) ,..., xm ( t ) ? , внешними возмущениями f ( t ) = ? f1 ( t ) ,..., f k ( t ) ? и выходными параметрами
? ? ? ?
y ( t ) = ? y1 ( t ) ,..., yn ( t ) ? . В П.с. входят: устройство формирования цели управления (УЦ), устройство
? ?
организации поиска (УП) и органы управления (ОУ). УЦ состоит из измерительного и вычислительного
R ? x ( t )? .
устройств и по показателям состояния объекта вырабатывает показатель цели управления ? ?
R ? x ( t ) ? может изменяться и перенастраиваться в зависимости от переменных
Функционал ? ?
v ( t ) = ?v1 ( t ) ,..., vi ( t ) ? . УП включает устройства логического действия и зависимости от изменения
? ?
– 129 –
R ? x ( t ) ? ; оно вырабатывает командные сигналы q ( t ) , необходимые для приближения системы к за-
? ?
данному значению показателя цели управления.
Поиск осуществляется
следующим образом: на вход
объекта подаются пробные
воздействия, и оценивается
реакция на них объекта,
проявляющаяся в виде изменения
значения целевой функции R ( t ) ;
далее в УП определяются те
воздействия, которые изменят пока-
затель цели в нужную сторону;
вслед за этим вырабатываются и
подаются на вход объекта
соответствующие сигналы, т. е. прикладываются рабочие воздействия. Затем на объект управления
снова подаются поисковые воздействия, и цикл повторяется. Наиболее распространённые методы поис-
ка: метод Гаусса-Зейделя, при котором последовательно отыскивается экстремум выхода по 1-й, 2-
й,..., m -й координате входного воздействия; метод градиента, состоящий в том, что новое входное воз-
действие получается из предыдущего в результате движения системы по градиенту выходного функцио-
нала; метод случайного поиска, при котором используются пробные смещения в случайных направлени-
ях; метод стохастической аппроксимации, состоящий в последовательном приближении к экстремуму с
учётом результатов предыдущих поисковых шагов, с постепенным уменьшением размера шага» [Каза-
кевич,БСЭ,1975].
При экстремальном управлении возникает новая проблема выбора наилучшего соотношения между
двумя противоречивыми требованиями: минимизации времени переходного процесса в область экстре-
мума из произвольной точки (так называемых «потерь на поиск») и минимизации отклонения оптимизи-
руемой величины от экстремального значения в установившемся режиме (так называемых «потерь на
рыскание»). Потери на поиск уменьшаются с ростом величины поискового шага. Однако потери на по-
иск характеризуют работу алгоритма лишь на подходе к экстремуму. Алгоритм, имеющий наименьшие
потери на поиск, быстро выведет систему в район экстремума. Но на этом не заканчивается экстремаль-
ное управление: от алгоритмов поиска требуется надежная работа в районе экстремума, позволяющая
отслеживать его «блуждание» или «уплывание». Потери на рыскание существенно зависят от величины
поисковых шагов, поэтому для снижения этих потерь размеры поисковых шагов следует уменьшать. Это
находится в противоречии с требованием быстродействия (для повышения которого величину рабочего
шага нужно, наоборот, увеличивать). Отсюда следует, что выбор компромиссных значений величин ша-
гов на всей траектории поиска следует проводить адаптивно, с учетом особенностей поведения оптими-
зируемого объекта в процессе поиска [Растригин,1974].
Таким образом, экстремальное управление осуществляют в условиях неопределенности в отноше-
нии поведения объекта управления, решая в общем случае как задачу «поиска» – реализации перемеще-
ния к области экстремума в пространстве регулируемых координат (при наличии помех, возмущений и
инерционности объекта оптимизации), так и задачу организации устойчивого движения («рысканий»)
системы вблизи точки экстремума.
Здесь считаю необходимым лишний раз подчеркнуть, что понятие «экстремальное управление» ни-
коим образом не совпадает с понятиями «экстремальные состояния», «экстремальные ситуации» и «экс-
тремальные периоды развития». Эти последние относят к состояниям, ситуациям и периодам, достаточ-
но резко, часто катастрофически, отличающимся от их «нормальных» аналогов в природных и общест-
венных системах (см., напр., [Буровский,2000]). Кстати говоря, в этой связи иногда даже используют
сленговую форму «периоды экстремумов» [там же], что никак нельзя считать удачным словоупотреб-
лением. То есть прилагательное «экстремальный» может употребляться в разных смыслах, и его исполь-
зование в составе термина «экстремальное управление» отражает только тенденцию стремления к экс-
тремуму (т.е. максимуму либо минимуму) некоторой целевой функции – но никак не оттенок «катаст-
рофичности» либо «исключительности» этого процесса. Но всё же указанная многозначность может по-
служить причиной различных недоразумений. По этой причине из двух весьма схожих, практически си-
нонимичных терминов «экстремальное управление» и «поисковая оптимизация» именно последний вы-
бран в настоящей работе в качестве основного.
При теоретических исследованиях и практических разработках систем экстремального управления –
преимущественно в области технической кибернетики и её приложений – выявлен ряд результатов, от-
носящихся к особенностям структуры и соотношений параметров в таких системах. Эти результаты по-
зволяют свое перенесение и на иные отрасли знания, модели процессов в которых могут быть интерпре-
– 130 –
тированы как поисковые оптимизационные и адаптивные [Гринченко,1979аб,1989,2000б] – см. раздел 5
настоящей монографии.
4.3.3. Адаптивный случайный поиск
Простейший пример метода случайного поиска рассмотрен выше. В более сложных вариантах этот
алгоритм обладает свойством адаптивности, реализуемым с помощью запоминания как траектории по-
искового процесса (значений поисковых переменных и целевых функций, а также соответствующих ог-
раничений), так и параметров самого алгоритма (величины и направления поискового шага, глубины
памяти и т.п.). Именно это свойство делает его весьма эффективным средством решения сложных экс-
тремальных задач самого различного типа. Более того, именно механизм адаптивного случайного поис-
ка является средством – причем, по моему мнению, единственно адекватным – моделирования поведе-
ния системы природы. Действительно, довольно трудно представить себе некоторый живой объект, па-
раметры адаптивного поведения которого (например, значение градиента целевой функции) рассчиты-
вались бы в каком-то гипотетическом вычислительном блоке (что необходимо для любого регулярного
метода оптимизации). Применительно же к адаптивному случайному поиску – это вполне реально, по-
скольку он не требует никаких подобных вычислений, а оценивает искомый градиент на базе несколь-
ких имеющихся конкретных реализаций целевой функции (экстремального вида). Добавлю для читате-
ля, знакомого с теорией автоматов, что алгоритм случайного поиска легко формулируется на языке ве-
роятностных автоматов – это просто два разных языка описания одной и той же сущности.
Адаптивный случайный поиск по определению всегда содержит, помимо вероятностной, сущест-
венную регулярную составляющую. Это может, в частности, выражаться в различии вероятностей выбо-
ра величин приращений по каждой из координат поискового пространства ? (т.е. поиск осуществляется
не в гипершаре, а в гиперконусе), в ненулевой глубине памяти алгоритма адаптации и т.п.
4.3.4. Память алгоритма как основа классификации методов поисковой
оптимизации
Любая схема поисковой оптимизации представляет собой контур, содержащий, как минимум, два
элемента: «блок вычисления целевой функции» оптимизации и «блок генерирования поисковой перемен-
ной» (т.е. собственно «оптимизатор», в свою очередь, включающий два основных субблока: «селектор»
и «генератор»), и связи между ними. Оптимизатор, в соответствии с алгоритмом A (ориентированным
на поиск экстремума – например, минимума – целевой функции Q ), вырабатывает (в соответствии с
оценкой селектором ? ( Q ) тенденции изменения Q ) на выходе генератора величину (в общем случае
векторную) поисковой переменной X . Выходом блока вычисления целевой функции является её (ска-
лярная) величина Q ( X ) . В зависимости от тенденции изменения последней селектор ? ( Q ) получаемо-
го результата принимает одно из двух значений: «удача» либо «ошибка» – см. рис. 4.1а.
В контуре поисковой оптимизации эти процессы многократно («по кругу») повторяются, перма-
нентно отслеживая тем самым минимум целевой функции Q ( X ) . Для удобства поисковые «шаги»
обычно нумеруют, интерпретируя их как дискретное время хода процесса оптимизации. При модельных
расчетах в технических приложениях этот процесс останавливают извне, когда считают, что достигнут
достаточно успешный результат. При экстремальном управлении натурными техническими объектами
этот процесс происходит перманентно.
A
Q ( X ) > min ? X*
Таким образом, в соответствии с [Растригин,1981], можно записать:
X??

? H ( X ) ? 0;
где ? : ? – область допустимых значений поисковой переменной X , определяемая системой
?
? G ( X ) = 0.
?
целевых требований H ( X ) и G ( X ) , A – поисковый алгоритм, X* – значение переменной X , соответ-
ствующее экстремуму целевой функции Q ( X ) .
Очевидно, что проблема построения зависимостей Q ( X ) для конкретных приложений выходит за
рамки теории поисковой оптимизации, и решается всегда средствами соответствующих прикладных на-
ук. Другое дело – проблема синтеза собственно алгоритма поиска A , «встроенного» в оптимизатор. Как
представляется, к основным особенностям такого алгоритма можно отнести следующие:
1) в простейшем случае он фиксирован, т.е. имеет постоянную структуру и параметры;
2) в более сложных случаях он может изменяться в ходе поиска в зависимости от получаемых ре-
зультатов и накапливаемого опыта (последнее называют адаптацией поиска);


– 131 –
"Внешнее
Блок вычисления
дополнение"
целевой функции ?
Q(X) (задание показателя
селекции извне, со
стороны внешней
Оптимизатор "Полуоптимизатор"
среды)
X X
? ?
Генератор Селектор Генератор "пробы"



а) классический контур оптимизации б) контур "полуоптимизации"


? (?) - показатель
Примечания: Х - вектор поисковых переменных; Q(X) - целевая функция;
селекции: "удача"/"ошибка"

Рис. 4.1. Схемы поисковой оптимизации: а) типовая и б) «полуоптимизации» с «внешним дополнением».
3) он может содержать случайную компоненту, в потенции обеспечивающую возможность нахож-
дения всех решений задачи оптимизации, т.е. реализацию глобального поиска;
4) он также может содержать дополнительную регулярную компоненту, формирующуюся на базе
ранее полученного опыта поисковой оптимизации и обеспечивающую повышение эффективности ло-
кального (а затем – и глобального) поиска экстремума соответствующей целевой функции;
5) сочетания регулярной и случайной компонент в таком алгоритме могут быть самыми разнооб-
разными.
Из вышеперечисленных пунктов 2) и 4) следует, что опыт, накапливаемый в процессе поиска экс-
тремума оптимизируемой целевой функции, является основой для введения механизма адаптации алго-
ритма A , обуславливающего возможность кардинального улучшения эффективности поисковых харак-
теристик последнего. Таким образом, предположение, что важнейшим параметром алгоритма A явля-
ется именно глубина его памяти ?, не выглядит необоснованным.
Введение параметра ? позволяет получить простой и ясный показатель выявления типовых вариан-
тов реализации поискового алгоритма A , т.е. фактически сформировать классификатор поисковых ме-
тодов оптимизации: для этого достаточно выделить его типовые значения 0 и 1 (?=0, ?=1) , а также типо-
вой интервал значений, больших единицы (?>1) – см. табл. 4.1.
Таблица 4.1. Классификатор поисковых методов оптимизации
Глубина
?=0 ?=1 ?>1
памяти
Поисковый A (t, t ) = A (t ) A ( t , t ? 1) A ( t , t ? 1, t ? 2, t ? 3,..., t ? ? ,...)
А (t )
алгоритм
X (t, t ) = X (t ) X ( t , t ? 1) X ( t , t ? 1, t ? 2, t ? 3,..., t ? ? ,...)
Генератор
? ( ? ) – глобальная ? ( Q ) – локальная
? – «полу-
Селектор
оптимизация» оптимизация оптимизация
Слепые блужда- Слепой поиск
Про-
ния (с селекцией (с селекцией посред- Адаптивный
Типовая стейший
посредством ством целевых огра- случайный
схема случайный
внешнего дополне- ничений): МПиО в поиск
поиск
ния) узком смысле
4.3.4.1. Простейший случайный поиск (глубина памяти ?=1)
Действительно, структура алгоритмов «простейшего» случайного поиска (например, описанный
выше алгоритм с линейной тактикой либо его вариант с нелинейной) зависит от знака приращения целе-
вой функции оптимизации ?Q ( t , t ? 1) = Q ( X ( t ) ) ? Q ( X ( t ? 1) ) , т.е. от последовательных во времени
Q ( X ) ):
X
двух пар значений (поисковой переменной и целевой функции

( )
A ( t , t ? 1) = A X ( t ) , Q ( X ( t ) ) , X ( t ? 1) , Q ( X ( t ? 1) ) . Именно двух этих пар значений достаточно для

– 132 –
построения алгоритмом A ( t , t ? 1) (в соответствующем пространстве) простейших линейных прогнозов
тенденции изменения целевой функции, и действий при поиске её экстремума в соответствии с этим
прогнозом. Например, в зависимости от знака ?Q ( t , t ? 1) происходит выбор нужной ветви из двух воз-
можных в алгоритме «простейшего» случайного поиска с «линейной» тактикой:
при ?Q ( t , t ? 1) ? 0;
? a?
?
?X ( t ) = ? где: a – величина шага поиска (т.е. ?X = a ), а ? – единич-
?X ( t ? 1) при ?Q ( t , t ? 1) < 0;
?
?
ный (т.е. ? = 1 ) случайный вектор, равномерно распределенный по всем направлениям пространства
оптимизируемых переменных X . Забегая несколько вперед, отмечу, что такая «линейная» тактика
поведения – прямое повторение удачного шага – довольно характерна для поведения живых систем
(хотя и не исчерпывает всего разнообразия используемых ими тактик).
Алгоритм «простейшего» случайного поиска, реализующий преемственность последовательных
значений поисковой переменной X , относится к классу методов локальной оптимизации.
4.3.4.2. Адаптивный случайный поиск (глубина памяти ?>1)
В свою очередь, вариант ?>1, т.е. возможность запоминания сразу нескольких пар значений (поис-
ковой переменной X и целевой функции Q ), т.е. удлинение памяти о предыстории поиска – делает ал-
горитм более гибким и, следовательно, более эффективным. В частности, большой объем запоминаемой
информации позволяет строить более сложные нелинейные прогнозы тенденции изменения целевой
функции Q ( X ) . Поскольку нет никаких логических причин для ограничения теоретически возможной
глубины памяти ? поиска, эта величина, по-видимому, может возрастать до весьма больших значений.
Как следствие, предел совершенствования адаптивных алгоритмов поисковой оптимизации не просмат-
ривается ни в технических приложениях, ни в природе.
Алгоритм «адаптивного» случайного поиска, опирающийся как на преемственность последователь-
ных значений поисковой переменной X (что обеспечивает локальность поиска), так и на возможность
прогнозирования рельефа целевой функции Q (что позволяет назвать его глобальную составляющую
«регулярной», а реализуемое ею свойство поиска – «регулярной» глобальностью), следует отнести к
классу методов локально-глобальной оптимизации.
4.3.4.3. Слепой поиск / слепые блуждания (глубина памяти ?=0)
Наиболее интересным с точки зрения основной проблемы настоящего раздела работы является про-
тивоположный вариант алгоритма A , с нулевой глубиной памяти ?=0, т.е. зависимости его только от
( )
текущего момента времени t : A ( t ) = A X ( t ) , Q ( X ( t ) ) . Как можно интерпретировать реализуемый на
его основе оптимизационный процесс? Зависимость алгоритма A ( t ) строго лишь от текущего момента
времени t (а не от его предыстории, хотя бы и «вчерашней», «сиюминутной» и т.д.) эквивалентна воз-
можности оперирования только с одной точкой в соответствующем пространстве (т.е. только с одной
парой значений – поисковой переменной X и целевой функции Q ( X ) ). Поскольку из геометрии из-
вестно, что через одну точку можно провести любое число кривых любого вида (в том числе и их частно-

стр. 1
(всего 2)

СОДЕРЖАНИЕ

>>