Любой интеллект функционирует дискретно. Если говорить точнее, то это сочетание непрерывных и дискретных процессов. Впрочем, существуют ли вообще чисто непрерывные процессы. Во всяком случае, в сложных системах любое непрерывное есть только статистика большого числа отдельных событий. В мозге, например, вся деятельность нейронов выражается отдельными импульсами.
Дискретность внешней деятельности интеллекта я выражаю термином «функциональный акт» (ФА), понимая под ним подготовку и выполнение последовательности движений, направленных на достижение цели. Целью является новое состояние объекта управления, выраженное его моделью, которая создается в процессе самого ФА или задается извне.
Простейший ФА состоит из трех этапов: восприятие — оценка — действие. В действительности даже у животных эта цепочка длиннее и представлена, по крайней мере, пятью элементами (рис. 28), причем каждый элемент расчленяется в свою очередь на несколько простейших действий.
Рис. 28. Этапы функционального акта.
В самом общем виде ФА можно описать так.
Первый этап — восприятие. Рецептор, настроенный на некоторый фрагмент среды, дает его первичную модель — картину.
Второй этап — анализ. Он состоит из трех моментов:
а) распознавание — сравнение первичной моделикартины с моделями-эталонами разной степени обобщенности, взятыми из постоянной памяти. В результате сравнения получается «вторичная модель» — переписанная своими моделями-«словами» картина среды, в которой отражена субъективность и ограниченность интеллекта;
б) прогнозирование будущих изменений среды — новая «фраза», дописанная по «словам» вторичной модели;
в) оценка — активирование чувств распознанными моделями объектов. Чувства зависят от состояния удовлетворения соответствующих потребностей к моменту начала ФА. В результате формируется суммарный стимул и выбирается «первичное действие» — модель действия в самой обобщенной форме.
Третий этап — планирование. «Первичное действие» развертывается в три «фразы» моделей, представляющих собой план:
а) «фраза» последовательности действий;
б) «фраза» эффекта — модель изменения среды в ответ на действия вплоть до достижения цели;
в) «фраза» необходимых усилий или «фраза» чувств.
Четвертый этап — решение, представляющее собой включение плана в действие. Решение возможно только в том случае, если суммарный стимул больше суммы «тормозов», предполагаемых в процессе выполнения действий и учтенных при планировании. «Тормоз» определяется сопротивлением среды.
Пятый этап — действия по реализации плана, то есть «считывание» модели последовательности действий под контролем обратных связей, воспринимаемых изменений объекта и затрачиваемых усилий. При рассогласовании и недостатке стимулов действия прекращаются, и производится новое планирование.
Алгоритм упрощенного функционального акта
Реальные ФА очень сложны. Сложны модели среды, многочисленны критерии, разнообразны варианты действий. Чтобы представить алгоритм ФА, нужно упростить его до предела. На рис. 29 показана схема такого упрощенного ФА.
Рассмотрение его начнем с критериев (потребностей, чувств). Как минимум для понимания ФА необходимы четыре критерия. Первый (главный) — специфический, например голод как потребность «тела», второй — любознательность, третий — «рефлекс цели», четвертый — универсальный «тормоз» — утомление. Три последних критерия рабочие. Для каждого критерия необходимы характеристики и точки исходного состояния на них. Для голода, например, это будет зависимость чувства от количества пищи. Исходное состояние — некоторая низкая степень насыщения, оставшаяся после предыдущего приема пищи. Для критерия любознательности характеристика отражает потребность в информации, то есть зависит от числа и сложности новых моделей среды. Исходное состояние — некоторый «информационный голод». Критерий цели стимулируется от реальности цели, ее близости во времени и в соответствии с «процентом» выполнения плана. Вначале, естественно, он не действует. Критерий утомления включается от любого действия — в зависимости от его утомительности.
«Мысленные» этапы ФА — анализ, планирование — менее утомительны, но они надоедают, наскучивают. «Двигательные» этапы зависят от сопротивления объекта действия — «тормоз» от утомления может быть очень велик. По каждому виду действий — с моделями или с объектами, при восприятии или планировании — утомление отсчитывается от нуля. Значимость каждого критерия различна и задается заранее. Так, голод намного важнее, чем любознательность и удовольствие от достижения цели, но утомление в своем крайнем проявлении сравнимо с голодом.
Рис. 29. Алгоритм функционального акта.
Восприятие. Восприятие среды осуществляется рецептором, для настройки которого необходимо действие. Его мы обозначим Д1. Исходный стимул для него черпается из рабочего критерия любознательности, обеспечивающего некоторый минимальный уровень усилий. Для простоты будем считать стимул достаточным для такой настройки рецептора, чтобы получить модель среды.
В результате восприятия, как программы действия, в кратковременную память вводится модель внешней среды M1, например одного предмета или пространственной ситуации из нескольких объектов. Каждый из них представлен «фразой», состоящей из нескольких «слов» в кадрах памяти (см. рис. 17). Одно «слово» — обобщенная модель, другое — простейшая структура. В модель вводятся «буквы» настройки рецептора и координаты объекта.
Д2 — приведение объекта к стандартным размерам — осуществляется автоматически, за счет того же любопытства и не требует большого напряжения. Получается новая модель М2. Стимул при этом несколько уменьшается.
Анализ. Д3 начинает этап анализа и представляет собой программу распознавания приведенных моделей М2 путем вызова из внешней памяти моделей-эталонов МЭ, похожих на воспринятые. Для этого используются первые «буквы» каждого «слова», как в алфавитном словаре.
Д4 — выбор наиболее похожих из вызванных моделей. Они выписываются в кратковременной памяти рядом с М2 с последующим автоматическим сравнением и определением степени сходства. В результате получается новая «фраза» — модель распознанного объекта, переписанная собственными «словами» с указанием степени сходства,— М3. Любознательность (источник энергии) во время этих действий значительно уменьшается и одновременно нарастает «тормоз» — «надоело». Распознавание может быть продолжено, но для упрощения задачи ограничимся этим.
Д5 — оценка распознанного объекта как возможная «плата» для удовлетворения специальной потребности, в нашем случае — голода. Специальная «фраза» М'3, с которой связана модель распознанного объекта, вызывается из постоянной памяти и указывает степень удовлетворения потребности. Если ее подставить в характеристику главной потребности, отложив от исходной точки (см. рис. 22), можно получить максимальный стимул ЧМАКС. Он определяет основную энергию для всех последующих этапов ФА. Если насытившемуся человеку предложить невкусную пищу, то есть низкую «плату», то стимул Ч будет очень мал. ФА закончится на первых этапах — рассмотрение и анализ, которые отработаны на стимуле «любознательность». Человек не захочет напрягаться изза ерунды (об этом еще будет разговор). Сейчас предположим, что стимул весьма велик.
Планирование. Д6 — определение цели. Принцип утилитарности интеллекта предусматривает автоматическое рассмотрение любой внешней картины с точки зрения ее использования для повышения удовольствия, то есть для удовлетворения потребностей. Важнейший стимул (голод) дает достаточно энергии для первой прикидки использования объекта. Суть действия состоит в создании модели цели. Зрительно это выражается в модели объекта в том виде, каким он должен стать в результате воздействий интеллекта (например, часть структуры объекта должна быть оторвана и перенесена к «телу» или попросту — взять и откусить). Такая цель может быть выражена короткой «фразой» — часть объекта, его перемещение в пространстве к новому месту. Откуда возьмется новая модель — цель. Она есть во внешней памяти в разных вариантах «фраз», связанных с моделью «съедобного» объекта. Для нахождения такой модели нужны входные данные: обобщенная модель объекта и действия с ним. Энергия для извлечения модели из внешней памяти и переноса ее в кратковременную память черпается из стимула, определившегося в предыдущем действии. При этом стимул несколько уменьшится за счет утомления. Таким образом мы получаем новую модель — цель М4.
Д7 — выбор движения для достижения цели. Его модель М5 может быть представлена на разных уровнях обобщения. Самая общая модель — это «взять», «достать» как основное движение с «буквой» обобщения. Такая модель тоже имеется во внешней памяти в виде «фразы», где связаны модель-цель и модельдвижение. Движения задаются моделью рецепторов, заложенных в органах движения.
Д8 — определение сопротивления движению со стороны объекта — представляется как частная модель М6 некоторого качества объекта. Найти ее можно по основной модели объекта или по сочетанию этой модели с моделью действия.
Д6, Д7 и Д8 представляют собой самое упрощенное выражение этапа планирования. По существу, после каждого из этих действий должен производиться перерасчет стимулов, но для простоты эту процедуру мы объединим в одну операцию.
Д9 — новый перерасчет стимулов и «тормозов» для определения их суммы М7, который подготавливает важный этап — принятие решения. Предыдущие три действия были связаны с расходованием энергии стимула, подсчитанного в Д5 на основании величины потребности и «платы», которую может обеспечить объект, воспринятый и распознанный на первых двух этапах. За время планирования этот стимул изменился: во-первых, за счет утомления от самой процедуры расчетов, во-вторых, за счет уточнения «ценности» объекта, которая была связана с уточнением цели, в-третьих, за счет будущих усилий для запланированных движений. Последний пункт особенно важен: мы не начинаем действий, если не уверены в том, что они нам под силу.
Принятие решения. Подсчетом стимулов заканчиваются «мысленные» этапы ФА. Решение занимает промежуточное положение: с одной стороны, действия еще не начаты, а с другой — их начало уже определено, и для этого обеспечены стимулы. Они должны быть значительно сильнее, чем для предыдущих этапов, поскольку призваны обеспечить высокое напряжение моделей движений, способное преодолеть действительное, а не воображаемое сопротивление объекта, например мышечное усилие для поднятия тяжести. Важно понять, что во время восприятия и анализа стимул Ч, как функция неудовлетворенной потребности, может быть достаточно большим, но он не используется, поскольку напряжение нужно лишь для преодоления сопротивления связей, чтобы вызывать модели из внешней памяти.
Однако такое положение бывает не всегда. Стимул для действий, в том числе и для мыслительных, то есть «чистых» действий с моделями, расходуется на преодоление сопротивления связей при введении новых моделей из памяти и их активации. Это сопровождается утомлением. Оно сильно возрастает, если процесс мышления требует большого напряжения, длится непрерывно и не достигает успеха (нет решения задачи). Удовлетворения потребности при этом нет, наоборот, она активируется и стимул все более возрастает. Соответственно возрастанию стимула и противостоящего ему утомления увеличивается напряжение при низком УДК. Такое положение возникает при интенсивной умственной работе или в трудных жизненных ситуациях, вызывающих сильные чувства и не предлагающих легкого решения.
Д10 — решение. Внешне это короткий акт — включение в действие ранее составленных планов, но он весьма значителен. В момент решения необходимо скачкообразно повысить напряжение, чтобы активировать модели плана M8, поскольку нужно преодолеть сопротивление действию со стороны объекта. У человека это связано с сокращением мышц, то есть большим расходом энергии. Решение вызывает особенно сильное напряжение, когда оно бесповоротно, когда уже невозможно остановить начатое действие (пример — прыжок через ров, разрез кожных покровов при операции).
Действия. Д11 — действия в буквальном смысле слова: сокращение мышц у человека либо включение двигательных или манипуляционных устройств у ИИ.
Действия — это считывание модели плана. Она может быть задана в двух вариантах: в виде структурного образа объекта внешней среды как модельцель или в виде последовательности ощущений с рецепторов органов движения. В первом случае обратной связью является орган зрения, воспринимающий объект и сверяющий изменения, которые он претерпел, с моделью цели действий. Во втором случае рецепторы с мышц сами дают обратную связь. Однако как в том, так и в другом варианте само считывание состоит в активации моделей, непосредственно управляющих органами движения. Сами по себе они не представлены в рецепторных зонах, а выражаются только через рецепторы органов движения, но тем не менее это элементы интеллекта, такие же, как и другие. Сложные двигательные акты состоят из последовательности автоматических элементарных движений («слова» и «фразы» из «букв»).
Активность моделей действий должна быть настолько велика, чтобы органы движения, управляемые от них, были способны преодолеть сопротивление объекта воздействий. От модели плана, записанной в кратковременной памяти, поэтапно включаются модели элементарных движений, управляющие эффекторами. Одновременно рецепторами «глаза» и «мышц» воспринимается эффект производимых движений. Как и всякое восприятие, он тоже записывается в кратковременную память в виде модели М9. Таким образом, в кратковременной памяти активно функционирует несколько параллельных моделей: «старые» модели плана, «новые» модели объекта, измененного действием, и модели с рецепторов «мышц», показывающие их сокращения и усилия. Не представлены, но есть модели самих движений — как последовательность активации эффекторов. Эти модели, доведенные до высокой активности многократными повторениями, в дальнейшем могут стать основой автоматических сложных движений. Такими являются любые хорошо заученные двигательные акты, например произнесение слов. Разговаривая, мы просто «включаем» модели слов, а орган слуха воспринимает произносимое и выполняет роль обратной связи (в отличие от имитации чужого произношения, когда мы «считываем» звуковой образ).
Модели выполненных действий, по крайней мере две из них — изменение объекта и мышечных усилий, дают материал для чувственного контроля действий, корректируют планы получения «платы» и утомления.
Д12 — подсчет уровня чувств, стимулов и «тормозов» после выполнения первого этапа движений (предположим, что весь план был разбит на 2—3 этапа). Для этого нужно определить, в какой степени модель измененного действием объекта М10 соответствует модели — цели данного этапа действий. Недовыполнение плана уменьшает реальность всего ФА, снижает активность потребности и уменьшает стимул. С другой стороны, уже определено, каково действительное сопротивление и насколько оно соответствует «силам» эффектора. От этого зависит действительное утомление, то есть величина «тормоза», которая вычитается из стимула для определения их суммы. Если план выполнен, этапный эффект получен, а сопротивление оказалось меньше предполагавшегося, стимул возрастает и следующий этап может быть выполнен быстрее. Если же это невозможно вследствие особенностей объекта, ФА в целом может вызвать в дальнейшем большее удовлетворение. При более сильном сопротивлении «тормоз» может полностью нейтрализовать стимул и возникнет необходимость в прекращении действия, ФА останется незаконченным. Однако в этом случае включается другой «рабочий» стимул — «рефлекс цели». Невыполнение плана, отдаление цели или появление обстоятельств, угрожающих ее осуществлению, являются для него «платой» (довольно странной, но это так), уменьшающей чувство приятного, но побуждающей к деятельности, как и всякая угроза. Он суммируется с положительным стимулом надежды на истинную «плату», позволяет пересилить «тормоз» и продолжать действия, то есть перейти к их следующему этапу, который осуществляется по тем же принципам.
Уровень душевного комфорта в процессе выполнения действий зависит от их эффективности. При затруднениях он оказывается ниже предполагавшегося, если же сопротивление было переоценено,— то выше.
Д13 — завершение ФА. Оно сводится к подведению итогов, определению окончательных чувств и УДК, но в этом и состоит его важность.
Предположим, что план выполнен полностью, «плата» получена, и это прежде всего резко изменяет главное чувство. Точка на характеристике потребности (в нашем примере — голод) перемещается в зону «приятного» и соответственно стимул для действия уменьшается до нуля. С другой стороны, накопившееся утомление представляет неприятный компонент чувственной сферы и понижает сумму чувств, то есть УДК.
Рис. 30. Характеристика «рефлекса цели»: ЧЦ — стимул цели в зависимости от степени выполнения плана.
Третий, снова приятный, компонент дает «рефлекс цели». Он тем значительней, чем больше было преодоленных трудностей. Характеристика этого компонента показана на рис. 30. В ходе выполнения ФА «утомились», или «прискучили», или «насытились» обе рабочие потребности — любознательности и цели, следовательно, их значимость уменьшилась. Так закончился ФА, представленный в самом упрощенном виде.
Воспроизведение простого ФА в алгоритмическом интеллекте, мне кажется, не будет трудным. Потребности и их чувства, то есть критерии, задаются в виде «центров» со своими характеристиками и постоянно находятся в оперативной памяти. То же самое касается центров — моделей настройки рецепторов. Они всегда обладают хотя бы минимальной активностью. Направление рецепторов на цель и их дополнительное активирование включаются как действие, модель которого («куда направить взгляд») всегда имеется в оперативной памяти, поскольку она часто используется. Компоненты этого действия — настройка и активация рецепторов. Действие дает «первичную картину», которая тут же перекодируется цифровым кодом по особой подпрограмме. Так получается цифровая первичная модель. Этап «анализ» сводится к извлечению цифровых моделей из длительной памяти и сравнению их с первичной моделью. В результате создается вторичная модель. Планирование осуществляется по тем же принципам. Пересчет чувств, УДК, определение стимулов и «тормозов» производится после каждого этапа. Построив планы и получив достаточный суммарный стимул, АИ «принимает решение» — включает считывание плана действий. Для этого цифровая модель перекодируется в сигналы, управляющие органами движения — эффекторами. Они изменяют структуру объекта согласно «модели цели», полученной при планировании. Контроль за изменениями структуры объекта осуществляется рецептором зрения, напряжение мышц при работе оценивается специальными рецепторами, полученные картины кодируются и сравниваются с планом. В промежутках между отдельными движениями пересчитываются чувства и стимулы. «Отработанные» модели находятся в оперативной памяти до тех пор, пока активность их снижается, согласно характеристике, до определенного порога, после чего они стираются. Результат ФА в виде основных моделей — «первичной картины», последовательности действий и картины объекта после осуществления ФА — переносится в длительную память. Основная трудность алгоритмизации даже простого ФА состоит в перекодировании пространственной структуры объекта.
«Круги» восприятия
В предыдущем описании ФА был предложен наиболее легкий процесс распознавания моделей — по полному совпадению с эталонами. В действительности это не так. Сложные структуры, воспринятые рецепторами и запечатленные в кратковременной памяти как первичная модель, почти никогда не имеют во внешней памяти точного аналога. Поэтому распознавание всегда носит вероятностный характер. Модель объекта представлена в нескольких кадрах, в которых запечатлены его образы с разной степенью обобщенности и некоторое количество деталей. Сравнение идет по нисходящей — от самых обобщенных моделей до подробностей. При этом требуются усилия — стимулы, поскольку нужно вызывать из памяти все новые модели — эталоны. Усилия утомляют, накапливаются «тормозы», стимулы любознательности ограничены, поэтому сравнение идет только до уравнивания стимулов и «тормозов». При этом не достигается полное распознавание объекта со всеми его качествами, а происходит лишь приблизительное опознание. Как уже говорилось, есть механизм (программа) учета степени вероятности. Этот показатель представляет «вход» для любознательности, так как всякое нераспознанное — в целом или в частностях — является новым и интригующим. Во внешней памяти у развитого интеллекта есть множество вариантов объектов с разным набором деталей, имеющих равное значение для разных целей. Поэтому возможно запоминание нескольких вариантов «своих моделей», соответствующих «первичной модели» с разной степенью вероятности.
Какая точность нужна. И все ли необходимые для ФА детали содержатся в первичной модели.
Точность — это детали и качества. Некоторые из них являются значимыми качествами-критериями. Именно они воздействуют на центр потребности, определяют величину возможной «платы», которую представляет объект. Пример: зеленое или спелое яблоко — качество степени съедобности, в разной мере значимое для сытого и голодного человека. Его нужно точно распознать. Отсюда следует, что предел необходимой точности исследования и распознавания определяет задачу поиска качеств, значимых для данной потребности. Для удовлетворения любознательности достаточны новизна и точность сами по себе (скажем, рябина, а не калина). Для специальных потребностей нужны «избранные» детали. При первом нецеленаправленном осмотре их можно и не заметить.
Итак, первый «круг» восприятия и распознавания действует за счет стимула любознательности и дает нам приблизительную «первичную модель», которая выявляет вероятностное совпадение с не очень подробными моделями-эталонами. Второй пункт анализа как этапа ФА направлен на определение ценности объекта для удовлетворения специальной потребности и выдвигает новые задачи. Степень точности модели может оказаться недостаточной, потому что специальная потребность (чувство) предусматривает некоторые значимые для нее детали. Как только ориентировочно, по неточным моделям, определяется ценность объекта, сразу же начинается второй «круг» — целенаправленное исследование его. Возбуждение специфической потребности («голод») при восприятии объекта вызывает добавочное действие после Д4. Оно состоит в том, что из внешней памяти по связям (адресам) потребности вызываются детали, которыми должен обладать объект, чтобы удовлетворить «голод». Во временную память вводятся «фразы» вариантов объекта, в разной степени ценных как «плата». С ними сравнивается имеющаяся уже первичная модель и обнаруживается, во-первых, ее недостаточно а во-вторых, выявляются нужные детали, которые следует поискать в объекте, чтобы повысить вероятность «платы». Для этого включается новое действие — настройка рецептора с целью специального поиска нужной детали. В результате исследования появляется «усовершенствованная» первичная модель, которая снова подвергается анализу. Распознавание определяет, есть ли в ней искомая деталь, и если таковой нет, это понижает «ценность» объекта как «платы», что сказывается на последующем перерасчете чувств и стимулов. Модель цели на следующем этапе тоже может измениться, поскольку изменилась первичная модель.
Прогнозирование и определение динамики
Эти термины относятся к анализу, мы их опустили для простоты в описании ФА, предположив, что объект и среда совершенно статичны. В действительности же интеллект имеет дело с динамикой. Факт динамичности устанавливается глазом человека при первом восприятии, когда за доли секунды он определяет «первую производную» изменений положения или структуры объекта. Для алгоритмического интеллекта, возможно, понадобятся две первичные модели вместо одной и автоматический механизм их сравнения для определения динамики.
Однако и неподвижные в данный момент объекты необязательно неизменны в продолжение тех отрезков времени, в которых проектируется ФА. Поэтому динамика, прогнозирование изменения объекта, является непременным действием анализа. Ее необходимость выявляется при распознавании: уже тогда, когда первичная модель заменяется, «переписывается» вторичной, в ней заложена возможность и вероятность динамики. Динамичность маркируется особой «буквой».
Прогнозирование состоит в том, что модель объекта представляется «словом» «фразы», в которой записана вероятная последовательность изменения структуры объекта или его пространственного положения в среде. Соответствующие «фразы» хранятся во внешней памяти и вызываются в кратковременную память специальным действием. Я не буду вводить дополнительные обозначения, поскольку они недопустимо усложняют схему. Распознавание будущего по «фразе» динамики носит вероятностный характер и состоит в определении промежуточных и конечного состояний объектов — в виде его новой модели, которую и нужно оценить с позиции значимости как «платы». Это не так просто.
Динамика и прогнозирование сталкивают нас с новым фактором, новой переменной — временем. При описании простейшего ФА мы не учитывали время. На самом же деле, оценивая динамику объекта, интеллект определяет время, в течение которого объект сохраняет значимость в качестве «платы», удовлетворяющей потребность. Пример: зеленая ягода. Поскольку сейчас она в пищу не годится, ФА не состоится. Другой пример: автомашина идет по дороге, которую нужно перейти. Она представляет угрозу, оценка уровня которой прямо определяется динамикой и расстоянием до автомашины. «Плата» обычно ожидается только в будущем, но она уже сейчас определяет действия. Как уже говорилось, любой развитый интеллект всегда работает на будущее. Но ценность объекта в будущем и сейчас не одинакова, и, следовательно, не одинаково его значение как стимула действий.
Для расчета динамических систем введено понятие «реальность будущего». Это очень важное понятие для любого интеллекта. Мы его разлагаем на два компонента: вероятность будущего события и «коэффициент будущего». Уже на этапе анализа реальность вводится в расчет для определения величины «платы», а следовательно, и стимула. В Д5 нужно ввести поправку для динамических систем: умножить стимул на «коэффициент реальности», полученный как произведение вероятности будущего события и значимости будущего — «коэффициента времени», рассчитанного по кривой, показанной на рис. 27. Стимул может оказаться существенно меньше или даже исчезнуть совсем.
В этапе «планирование» время присутствует постоянно. Модель цели учитывает динамику объекта («где и когда его можно взять.», «в каком он будет состоянии.» и обязательно — «сколько для этого потребуется времени.»).
Д7 — модель движений для достижения цели — полностью зависит от времени. Здесь выступает тесная связь времени и сложности действий. Простые движения быстры, сложная последовательность их напротив, продолжительна. Не будем пока говорить о том, как планируются сложные движения, ограничимся констатацией того факта, что они требуют определенного времени для своего выполнения. Следовательно, они отдаляют получение «платы», уменьшают «коэффициент будущего», увеличивают усилия и связанное с ним утомление. Все это сказывается на Д9 — пересчете стимулов после планирования.
Планирование всегда является прогнозированием, следовательно, оно вероятностно. Этот фактор присутствует в планах. Степень вероятности достижения цели в результате действий оценивается по подробности исходной модели объекта и по наличию в памяти соответствующих моделей, полученных из предыдущего опыта. Эти модели-«фразы» извлекаются из постоянной памяти в то время, когда рассчитывается последовательность движений и их результат — как «фразы» плана. Результат характеризуется определенной вероятностью.
При этом может оказаться, что исходная модель объекта снова была недостаточно полной. Одно дело — модель распознавания и модель для оценки и другое дело — модель для воздействия на объект. «Фразы» действий могут потребовать новых деталей, а для этого понадобится новый, третий, «круг» исследования — снова настройка рецептора на искомую деталь, снова ее восприятие, новая первичная модель и анализ — уже с позиций выполнения действий.
Итак, при Д9 — пересчете стимулов — учитывается поправка на реальность достижения цели как функцию вероятности и требуемого времени. Нужно помнить, что само планирование несет с собой утомление, как всякое однообразное действие; это ограничивает его продолжительность и заставляет скорее переходить к решению, не добиваясь стопроцентной вероятности результата при расчете получения «платы».
Иерархия функциональных актов
Юноша пять лет учился в институте — это ФА продолжительностью в пять лет, который он планировал на такое время, исходя из существующих правил обучения. У него была цель — получить высшее образование для работы, призванной в свою очередь удовлетворить набор потребностей, существующих к моменту поступления. Этот длинный ФА будет разделен на пять более коротких — по годам учения, те — на еще более короткие — семестры и т.д., вплоть до уроков и заданий на завтра. Такая совокупность ФА разной продолжительности и разных частных целей при одной общей — окончании института — представляет иерархию ФА. Вся жизнь человека состоит из подобных сложных ФА, направленных на удовлетворение различных потребностей и рассчитанных на неодинаковую продолжительность. Подчиненные ФА выступают при этом в двух образах — как самостоятельные и как компоненты главного.
Так мы подошли к применению принципа обобщенности к ФА. Обобщение модели относилось к моделированию внешнего мира: обобщенная структура из крупных блоков, обобщение повторяющихся объектов во времени или по этапам исследования, «буква обобщенности» как маркировка этого вида действия с моделями, даже если оно происходит автоматически в результате процесса забывания незначащих деталей.
Действия, как сокращения мышц и как операции с моделями в смысле вызова их из постоянной памяти, сравнения, прогнозирования, представлены в интеллекте моделями. Следовательно, они тоже могут обобщаться.
Обобщенные модели можно себе представить как «неясные», или «крупноблочные», без деталей, но имеющие «букву обобщенности». Она указывает, что модель получена путем действия с множеством моделей, а не через восприятие рецепторами с плохой настройкой. «Буква обобщенности» такая же, как «буква настройки рецептора», обе они показывают, как получена соответствующая модель. Обобщенная модель всегда известна, то есть имеет связи с другими моделями. Если нам нужно вообразить «собаку вообще», мы представляем какую-нибудь одну из множества виденных собак, обычно не очень ясно. Обобщенный образ собаки проявляется, когда мы пытаемся ее нарисовать, а не просто вспомнить. Он же проступает скрыто, неявно при распознавании конкретной собаки. Явная обобщенность выступает в интеллекте только через речь. Об этом еще будет разговор.
По такому же принципу возможно обобщение модели действия. Например, действие «взять» состоит из набора нескольких конкретных движений, изменяющихся в зависимости от объекта деятельности, но имеющих нечто общее — фиксацию предмета и перенесение его к субъекту. В конкретном выражении это проявляется двояко: или в работе некоторых мышц, принимающих участие во всех реализациях действия «взять», или в зрительном образе объектов, фиксированных рукой и перенесенных ближе к себе. Обобщенное действие «учиться» представить труднее, потому что оно составлено из очень разнообразных конкретных действий. Их круг расширяется по мере развития ребенка. Обобщение происходит после появления ряда моделей, имеющих общие «буквы».
Обобщенный ФА становится возможным только при развитии памяти и программы обобщения. Его условием является способность запоминать длительные периоды времени с возможностью повторения моделей и последовательного сравнения их с целью обобщения. Так получаются «фразы», охватывающие периоды времени. Как говорилось, структуры «фраз» таковы, что сами по себе они не длинны, а удлинение периодов времени достигается обобщением и созданием иерархии «фраз», расшифровывающих обобщенную модель новой короткой «фразой».
Обобщение изменений среды во времени, тем не менее, не исключает ее оценки как «платы», направленной на удовлетворение потребности. В результате оценки длительного будущего появляется стимул к действию. Обобщенной модели изменений среды в пространстве или во времени соответствует обобщенная модель действия. Эти модели «среда — оценка — действие» хранятся во внешней памяти в вариантах с разной степенью обобщенности.
Как возникает обобщенный ФА. Восприятие конкретного объекта сопровождается анализом его первичной модели, в который входит и прогнозирование. «Фраза» прогноза может охватывать большой отрезок времени в случае, когда объект изменяется медленно. Если изменения не только длительны, но и многообразны, то их обобщенная модель (из двух — четырех слов) развертывается в целый набор коротких «фраз», описывающих каждое обобщенное «слово». Так прогнозируются этапы изменений внешней среды, ее «расписание» во времени, пространстве, качествах. Воздействия или качества прогнозируемого изменяющегося объекта оцениваются с «коэффициентом реальности», формируются конечная цель и обобщенный стимул. В памяти хранятся модели обобщенного действия и их развертывания в частные действия применительно к каждому этапу изменений объекта. Они оцениваются по «трудности», которая выступает как «тормоз» тоже в обобщенном варианте с «коэффициентом реальности». Производится суммирование стимулов и «тормозов», и если сумма оказывается положительной, принимается решение начать обобщенный ФА. Истинное начало выражается во включении первого подчиненного ФА, то есть действий, направленных на достижение первой цели, точнее, промежуточной цели.
Проектирование такого подчиненного ФА осуществляется по общим принципам — или после принятия решения по обобщенному, «главному» ФА, или до этого, когда при предварительном планировании обобщенного ФА подробно расписывается его первый этап.
Выполнение иерархии ФА имеет свои особенности. Они в значительной мере определяются степенями зависимостей между ФА разных уровней. Например, проведение хирургической операции как цепи этапных ФА целиком определяется конечным результатом всей операции. Наоборот, в труде рабочего цели годичного или месячного периодов могут быть малозначащими, а определяющим уровнем является рабочий день или отдельные трудовые циклы с частными целями.
Для того чтобы выполнялось любое действие, необходимы стимулы. Для простейшего ФА мы их уже определили. Основные стимулы — в цели, в удовлетворении специального критерия, а рабочие критерии (чувства, любознательность, цель, утомление) играют вспомогательную роль. О поправке на реальность тоже уже говорилось. Подчиненный ФА при очень большой зависимости от главного функционирует преимущественно за счет его стимулов. Конечно, при этом действуют рабочие стимулы — «рефлекс цели» для достижения промежуточного рубежа, утомление от действий, требующее временного отдыха, и любознательность, поскольку в ходе деятельности производятся исследования. Таким образом, постоянно действующий стимул ФА верхнего уровня периодически сильно уменьшается за счет утомления, и действие может остановиться на некоторое время после очередного этапа, если условия среды это позволяют. В результате отдыха действие главного стимула восстанавливается, и включается следующий этапный ФА.
Рис. 31. Схема двухуровневого функционального акта. Включение очередного низшего ФА происходит после выполнения предыдущего.
После каждого такого этапа производится перерасчет не только стимулов собственно этого ФА, но и главного. Учитывается возросшая вероятность достижения последней цели, увеличивается значение «коэффициента будущего» и «рефлекса цели», поскольку цель приближается во времени.
Схема двухуровневого функционального акта показана на рис. 31.
Условия успешного окончания длительных ФА особенно трудны. Во-первых, их планирование менее достоверно, поскольку ниже вероятность достижения цели из-за трудностей долгосрочного прогнозирования среды как в смысле ее «платежеспособности», так и «сопротивления». Во-вторых, нелегко оценить свои силы на продолжительное время вперед. В модельном представлении это выражается характеристиками потребностей — как «основной», так и «рабочими», например утомляемостью. Вследствие такой неопределенности длительного ФА возможно прекращение деятельности на любом его этапе, когда баланс стимулов и «тормозов» сместится в сторону последних. Правда, часто остановка имеет временный характер, если главным «тормозом» является утомление. После некоторой паузы оно уменьшается, и стимулы вновь побуждают действовать. Но бывают «тормозы» иного характера, к ним мы и перейдем теперь.
Сеть функциональных актов
Развитый интеллект тем и отличается от простого, что он управляет сложными системами по многим или, по крайней мере, нескольким критериям. Это касается только «специальных» потребностей, поскольку «рабочие» одинаковы для всех интеллектов. Например, у животных «специальные» потребности представлены инстинктами: самосохранения, продолжения рода, стадным. Каждый из них объединяет несколько составляющих: инстинкт самосохранения — потребности в безопасности и пище, стадный — потребности в общении, в самовыражении, стремление к лидерству, альтруизм. Так, даже у животных набирается с десяток потребностей, у людей же их гораздо больше. Для удовлетворения каждой потребности не обязательно нужны отдельные ФА (к примеру, общение и самовыражение объединяются), но для большинства других ставятся разные цели. Совсем нередко потребности прямо противоречат друг другу, например, такие, как безопасность и голод. Конкуренция между ФА за время, силы и средства имеет место всегда. Это означает, что ФА, направленный на удовлетворение одной потребности, должен быть тормозом для другого ФА, ведущего к иной цели. При этом компромиссы далеко не всегда возможны, поскольку условия деятельности не позволяют беспрепятственно разделять действия во времени и пространстве. Такое разделение возможно только при суммировании коротких ФА за большие промежутки времени, да и то не всегда.
Множество потребностей создает дополнительные трудности в планировании и выполнении ФА. С одной стороны, сама идея ФА предусматривает доведение его до конца, до завершения, а с другой — деятельность, направленная к одной цели, ведет к недопустимому перенапряжению другой потребности, длительное время не получающей удовлетворения. Следовательно, интеллект должен учитывать все потребности, когда планирует ФА для удовлетворения одной из них. Потребности, не получающие удовлетворения, как правило, являются «специальными» «тормозами» в противоположность «универсальному» «тормозу» — утомлению или скуке. Такое положение требует значительного усложнения расчетов суммы стимулов и «тормозов» на всех этапах ФА.
Уже при первичной оценке внешней среды — на этапе анализа — выступают противоречия потребностей. Среда удовлетворяет их неравномерно, поэтому в каждый момент одни потребности напряжены, другие пассивны, третьи активно насыщены. Оценка производится главным образом по той потребности, которая наиболее остра; другие потребности выступают в качестве «оппонентов», ограничителей. Если внешние раздражители активируют несколько неудовлетворенных потребностей, реализации которых служат разные ФА, то альтернативы возникают уже при выборе самого обобщенного «первичного» действия. Сравнение производится по суммарному приращению интегральных чувств ∆ (Пр — НПр), поскольку трудно сравнивать чувства сами по себе вследствие их специфичности. Часто оценки потребностей оказываются равноценными на этапе анализа, тогда выбор самого выгодного ФА откладывается до планирования. Планы конкурирующих ФА приходится прорабатывать до той степени подробности, пока не определятся преимущества одного над другим за счет выявления значимых качеств либо за счет преимуществ большей реальности цели или меньшей утомительности действий.
Оценка среды и планирование «действий» на данный момент затрудняются не только наличием нескольких неудовлетворенных потребностей, но еще и планами ФА высших иерархических уровней (пример: студенту хочется пойти в кино, и это возможно, если учесть, что завтра преподаватель не будет спрашивать, но «нужно учиться». И он садится за книги). Высший ФА не только дает стимулы для низших, удовлетворяющих данную потребность, но он же — источник «тормозов» для тех ФА, которые направлены на реализацию других потребностей, даже если эти последние — «сиюминутные» и не имеют конкурирующих ФА высшего этажа. Следовательно, планы высших ФА нужно включать в расчет стимулов и «тормозов». Эти планы находятся в памяти и связаны с расписанием внешней среды. Слово «расписание» подчеркивает закономерность независимых от интеллекта изменений среды во времени таким образом, что в одни периоды действуют раздражители, представляющие «плату» для одних потребностей, в другие периоды — другие раздражители, направленные на другие потребности.
Деятельность интеллекта, обладающего многими потребностями, в разнообразной среде представляет собой сеть из ФА. Они подразделяются по направленности на разные потребности и по сложности иерархии. Есть среди них длительные ФА, есть минутные. Они перемежаются таким образом, что между отдельными этапами длительных ФА, которые обусловлены «расписанием» среды и накоплением утомления, включаются короткие ФА, направленные на другие потребности. В результате получается очень сложная динамика действий-поступков, которую и можно назвать поведением.
Но дело не ограничивается лишь переключением действий. Это только видимая сторона деятельности интеллекта. Есть еще и другая.
«Мысли»
Большинство ФА не доводится до действий, а останавливается на этапах анализа и планирования. Эти этапы — «мысли». Таким условным названием можно обозначить последовательное возбуждение новых моделей при введении их в кратковременную память или повторную активацию их при следующем действии. «Мысли» быстры и относительно легки, так как эти модели требуют небольшой энергии стимулов, достаточной для того, чтобы только ввести их в кратковременную память (по сравнению с активностью, необходимой для возбуждения мышц, преодолевающих сопротивление среды).
Какую же модель считать «мыслью». В кратковременной памяти одновременно находится много моделей, даже очень много, с разной степенью активности. Видимо, «мыслью» должна быть одна из них, самая активная. Такой будет каждая новая или вновь активированная модель, и только она одна. Но почему новая активнее уже введенных. Это совсем не легко представить при количественном, модельном подходе к делу. Например, были нужны «сильные» модели для сокращения мышц, которые после выполнения своей задачи отключаются. По законам динамических характеристик активность их снижается постепенно, и эти «отработанные» модели должны бы быть более активными, чем новые модели, поступающие во время отдыха, без всякого напряжения. Все это трудно согласовать без введения дополнительных ограничений. Мысль в каждый момент только одна — это мы знаем, наблюдая себя. Впрочем, это не довод.
Рассмотрим алгоритм формирования кратковременной памяти в связи с ФА. Как уже говорилось, модели в ней образуются от восприятия среды или вводятся из внешней памяти через действия по активации. Действия осуществляются как заданные акты выбора адреса и включения модели и определяются чувствами и активностью других моделей в памяти (рис. 32). Акту действия, например сравнения моделей, предшествует сложный пересчет уровня активности всех моделей в кратковременной памяти. Выбор следующего действия с моделями, то есть поиск адреса новой модели, определяется всей совокупностью активных моделей. Это легко заявить, но трудно воспроизвести. Однако другого выхода просто не существует, если отвергнуть идею сетевого интеллекта СИ, в котором в течение каждого такта нужно пересчитывать активность всех его моделей, поскольку в нем нет разделения памяти на кратковременную и длительную.
Рис. 32. Схема последовательной активации моделей в кратковременной памяти: Д1, Д2, Д3 — действия; М1, М2 — модели. ∑∆Ч — суммарный стимул как приращение чувств, активирующее модели. ДОБ — обобщенное действие, поступающее с ФА высшего уровня, которое играет роль дополнительного стимула.
Для сокращения числа моделей, расчет активности которых нужно осуществлять в течение каждого такта, следует предусмотреть более быстрое их удаление из кратковременной памяти и перевод в длительную, но с сохранением повышенной проходимости связей между моделями, составляющими одну «фразу», что позволяет легко «вспомнить» ее, пока она еще «свежа». Естественно предложить удалять из памяти «отработанные» модели, те, которые уже были использованы для выбора адреса последующих и сообщения им активности. Сюда войдут прежде всего многочисленные модели внешней среды, которые вводятся от рецепторов в большом количестве, автоматически, без отбора. Первоначальная активность этих моделей невелика, в ходе последующего анализа, точнее — действия распознавания, они заменяются «своими» моделями и становятся ненужными. Для них должны предусматриваться «крутые» динамические характеристики. Если внешняя среда еще понадобится при втором «круге», ее можно воспринять заново. То же самое и с моделями вариантов планов: как только выбран один, другие уже не нужны. Значимость моделей в кратковременной памяти должна все время проверяться по их связям с потребностями. Связи надо прерывать, как только этапы ФА уходят вперед. К сожалению, выдвинуть подобные пожелания легче, чем выполнить.
Поиск и «выбраковывание» из памяти ненужных моделей приводит нас к необходимости специального уменьшения их активности, то есть введения торможения. Оно должно дополнить динамические характеристики моделей (см. рис. 18), отражающие постепенность самостоятельного затухания активности возбужденных моделей. Торможение сделает их более крутыми. Оно всегда имеет место в сетевых моделях и в мозге. Другим выходом является создание специального алгоритма изменения характеристик для тех моделей, которые уже использованы. Пока трудно сказать, что выгоднее для АИ.
Второй вопрос — о доминировании «главной» модели над всеми прочими. Уже было сказано, что «новая» модель должна быть «мыслью» и для этого она должна быть активнее всех остальных. То же касается и «старой» модели, если она снова понадобится и активируется повторно, будучи вовлеченной в действия. В разделе об иерархии и сети из ФА было указано на множественность одновременно происходящих или готовящихся действий, призванных удовлетворить различные потребности интеллекта в изменяющейся внешней среде. Как в этом хаосе обеспечить целенаправленные действия, чтобы раз начатый ФА доходил до конца, а не останавливался посредине, будучи прерванным конкурирующим ФА. Конечно, есть «рефлекс цели», но он работает на все ФА и не может стать достаточно сильным механизмом, обеспечивающим приоритет главному ФА. Суть этого приоритета состоит в том, что модели, вовлеченные в главный ФА, должны активно направлять его вперед, то есть вмешиваться в выбор адреса модели для следующего переключения и даже в выбор самого действия. Нужно примирить противоположные требования: обеспечить «консерватизм», то есть доведение до конца начатого, и «гибкость» как способность переключиться на новое, если этого настоятельно требует внешняя среда или изменившиеся потребности. В свое время — в 1963 г.—я предложил для этой цели специальную программу.