1. Сознание и вычисление
1.1. Разум и наука
Насколько широки доступные науке пределы? Подвластны ли ее методам лишь материальные свойства нашей Вселенной, тогда как познанию нашей духовной сущности суждено навеки остаться за рамками ее возможностей? Или, быть может, однажды мы обретем надлежащее научное понимание тайны разума? Лежит ли феномен сознания человека за пределами досягаемости научного поиска, или все же настанет тот день, когда силой научного метода будет разрешена проблема самого существования наших сознательных «я»?
Кое-кто склонен верить, что мы действительно способны приблизиться к научному пониманию сознания, что в этом феномене вообще нет ничего загадочного, а всеми существенными его ингредиентами мы уже располагаем. Они утверждают, что в настоящий момент наше понимание мыслительных процессов человека ограничено лишь крайней сложностью и изощренной организацией человеческого мозга; разумеется, эту сложность и изощренность недооценивать ни в коем случае не следует, однако принципиальных препятствий для выхода за рамки современной научной картины нет. На противоположном конце шкалы расположились те, кто считает, что мы не можем даже надеяться на адекватное применение холодных вычислительных методов бесчувственной науки к тому, что связано с разумом, духом да и самой тайной сознания человека.
В этой книге я попытаюсь обратиться к вопросу сознания с научных позиций. При этом, однако, я твердо убежден (и основано это убеждение на строго научной аргументации) в том, что в современной научной картине мира отсутствует один очень важный ингредиент. Этот недостающий ингредиент совершенно необходим, если мы намерены хоть сколько-нибудь успешно уместить центральные проблемы мыслительных процессов человека в рамки логически последовательного научного мировоззрения. Я утверждаю, что сам по себе этот ингредиент не находится за пределами, доступными науке, хотя в данном случае нам, несомненно, придется в некоторой степени расширить наш научный кругозор. Во второй части книги я попытаюсь указать читателю конкретное направление, следуя которому, он непременно придет как раз к такому расширению современной картины физической вселенной. Это направление связано с серьезным изменением самых основных из наших физических законов, причем я весьма детально опишу необходимую природу этого изменения и возможности его применения к биологии нашего мозга. Даже обладая нынешним ограниченным пониманием природы этого недостающего ингредиента, мы вполне способны указать области, отмеченные его несомненным влиянием, и определить, каким именно образом он вносит чрезвычайно существенный вклад в то, что лежит в основе осознаваемых нами ощущений и действий.
Разумеется, некоторые из приводимых мной аргументов окажутся не совсем просты, однако я постарался сделать свое изложение максимально ясным и везде, где только возможно, использовал лишь элементарные понятия. Кое-где в книге все же встречаются некоторые сугубо математические тонкости, но только тогда, когда они действительно необходимы или каким-то образом способствуют достижению более высокой степени ясности рассуждения. С некоторых пор я уже не жду, что смогу с помощью аргументов, подобных приводимым ниже, убедить в своей правоте всех и каждого, однако хотелось бы отметить, что эти аргументы все же заслуживают внимательного и беспристрастного рассмотрения — хотя бы потому, что они создают прецедент, пренебрегать которым нельзя.
Научное мировоззрение, которое на глубинном уровне не желает иметь ничего общего с проблемой сознательного мышления, не может всерьез претендовать на абсолютную завершенность. Сознание является частью нашей Вселенной, а потому любая физическая теория, которая не отводит ему должного места, заведомо неспособна дать истинное описание мира. Я склонен думать, что пока ни одна физическая, биологическая либо математическая теория не приблизилась к объяснению нашего сознания и его логического следствия — интеллекта, однако этот факт ни в коей мере не должен отпугнуть нас от поисков такой теории. Именно эти соображения легли в основу представленных в книге рассуждений. Возможно, продолжая поиски, мы когда-нибудь получим в полной мере приемлемую совокупность идей. Если это произойдет, то наше философское восприятие мира претерпит, по всей вероятности, глубочайшую перемену. И все же научное знание — это палка о двух концах. Важно еще, что мы намерены делать со своим научным знанием. Попробуем разобраться, куда могут привести нас наши взгляды на науку и разум.
1.2. Спасут ли роботы этот безумный мир?
Открывая газету или включая телевизор, мы всякий раз рискуем столкнуться с очередным проявлением человеческой глупости. Целые страны или отдельные их области пребывают в вечной конфронтации, которая время от времени перерастает в отвратительнейшие войны. Чрезмерный религиозный пыл, национализм, интересы различных этнических групп, просто языковые или культурные различия, а то и корыстные интересы отдельных демагогов могут привести к непрекращающимся беспорядкам и вспышкам насилия, порой беспрецедентным по своей жестокости. В некоторых странах власть до сих пор принадлежит деспотическим авторитарным режимам, которые угнетают народ, держа его под контролем с помощью пыток и бригад смерти. При этом порабощенные — то есть те, кто, на первый взгляд, должны быть объединены общей целью, — зачастую сами конфликтуют друг с другом; создается впечатление, что, получи они свободу, в которой им так долго отказывали, дело может дойти до самого настоящего взаимоистребления. Даже в сравнительно благополучных странах, наслаждающихся преуспеянием, миром и демократическими свободами, природные богатства и людские ресурсы проматываются очевидно бессмысленным образом. Не явный ли это признак общей глупости Человека? Мы уверены, что являем собой апофеоз интеллекта в царстве животных, однако этот интеллект, по всей видимости, оказывается самым жалким образом не способен справиться с множеством проблем, которые продолжает ставить перед нами наше собственное общество.
Впрочем, нельзя забывать и о положительных достижениях нашего интеллекта. Среди них — весьма впечатляющие наука и технология. В самом деле, признавая, что некоторые плоды этой технологии имеют явно спорную долговременную (или сиюминутную) ценность, о чем свидетельствуют многочисленные проблемы, связанные с окружающей средой, и неподдельный ужас перед техногенной глобальной катастрофой, нельзя забывать и о том, что эта же технология является фундаментом нашего современного общества со всеми его удобствами, свободой от страха, болезней и нищеты, с обширными возможностями для интеллектуального и эстетического развития, включая весьма способствующие этому развитию средства глобальной коммуникации. Если технология сумела раскрыть столь огромный потенциал и, в некотором смысле, расширила границы и увеличила возможности наших индивидуальных физических «я», то не следует ли ожидать от нее еще большего в будущем?
Благодаря технологиям — как древним, так и современным — существенно расширились возможности наших органов чувств. Зрение получило поддержку и дополнительную функциональность за счет очков, зеркал, телескопов, всевозможных микроскопов, а также видеокамер, телевизоров и т.п. Не остались в стороне и наши уши: когда-то им помогали слуховые трубки, теперь — крохотные электронные слуховые аппараты; что касается функциональных возможностей нашего слуха, то их расширение связано с появлением телефонов, радиосвязи и спутников. На подмогу естественным средствам передвижения приходят велосипеды, поезда, автомобили, корабли и самолеты. Помощниками нашей памяти выступают печатные книги и фильмы, а также огромные емкости запоминающих устройств электронных компьютеров. Наши способности к решению вычислительных задач — простых и рутинных или же громоздких и изощренных — также весьма увеличиваются благодаря возможностям современных компьютеров. Таким образом, технология не только обеспечивает громадное расширение сферы деятельности наших физических «я», но и усиливает наши умственные возможности, совершенствуя наши способности к выполнению многих повседневных задач. А как насчет тех умственных задач, которые далеки от обыденности и рутины, — задач, требующих участия подлинного интеллекта? Совершенно естественно спросить: поможет ли нам и в их решении технология, основанная на повсеместной компьютеризации?
Я практически не сомневаюсь, что в нашем технологическом (часто сплошь компьютеризованном) обществе в неявном виде присутствует, как минимум, одно направление, содержащее громадный потенциал для совершенствования интеллекта. Я имею в виду образовательные возможности нашего общества, которые могли бы весьма значительно выиграть от применения различных аспектов технологии, — для этого требуются лишь должные чуткость и понимание. Технология обеспечивает необходимый потенциал, т.е. хорошие книги, фильмы, телевизионные программы и всевозможные интерактивные системы, управляемые компьютерами. Эти и прочие разработки предоставляют массу возможностей для расширения нашего кругозора; они же, впрочем, могут и задушить его. Человеческий разум способен на гораздо большее, чем ему обычно дают шанс достичь. К сожалению, эти возможности зачастую попросту разбазариваются, и умы как старых, так и малых не получают тех благоприятных возможностей, которых они несомненно заслуживают.
Многие читатели спросят: а нет ли какой-то иной возможности существенного расширения умственных способностей человека — например, с помощью этакого нечеловеческого электронного «интеллекта», к появлению которого нас как раз вплотную подводят выдающиеся достижения компьютерных технологий? Действительно, уже сейчас мы часто обращаемся за интеллектуальной поддержкой к компьютерам. В очень многих ситуациях человек, используя лишь свой невооруженный разум, оказывается не в состоянии оценить возможные последствия того или иного своего действия, так как они могут находиться далеко за пределами его ограниченных вычислительных способностей. Таким образом, можно ожидать, что в будущем произойдет значительное расширение роли компьютеров именно в этом направлении, т.е. там, где для принятия решения человеческому интеллекту требуются именно однозначные и вычислимые факты.
И все же не могут ли компьютеры достичь в конечном итоге чего-то большего? Многие специалисты заявляют, что компьютеры обладают потенциалом, достаточным — по крайней мере, принципиально — для формирования искусственного интеллекта, который со временем превзойдет наш собственный. По утверждению этих специалистов, как только управляемые посредством вычислительных схем роботы достигнут уровня «эквивалентности человеку», понадобится совсем немного времени, чтобы они значительно поднялись над нашим ничтожным уровнем. Только тогда, не унимаются специалисты, появятся у нас власти, обладающие интеллектом, мудростью и пониманием, достаточными для того, чтобы суметь разрешить глобальные проблемы этого мира, человечеством же и созданные.
Когда же нам следует ожидать наступления сего счастливого момента? По данному вопросу у упомянутых специалистов нет единого мнения. Одни говорят о многих столетиях, другие заявляют, будто эквивалентность компьютера человеку будет достигнута всего через несколько десятилетий. Последние обычно указывают на очень быстрый «экспоненциальный» рост мощности компьютеров и основывают свои оценки на сравнении скорости и точности транзисторов с относительной медлительностью и «небрежностью» нейронов. И правда, скорость работы электронных схем уже более чем в миллион раз превышает скорость возбуждения нейронов в мозге (порядка 109 операций в секунду для транзисторов и лишь 103 для нейронов, при этом электронные схемы демонстрируют высокую точность синхронизации и обработки инструкций, что ни в коей мере не свойственно нейронам. Более того, конструкции «принципиальных схем» мозга присуща высокая степень случайности, что, на первый взгляд, представляется весьма серьезным недостатком по сравнению с продуманной и точной организацией электронных печатных плат.
Кое в чем, однако, нейронная структура мозга все же вполне измеримо превосходит современные компьютеры, хотя это превосходство может оказаться относительно недолговечным. Ученые утверждают, что по общему количеству нейронов (несколько сотен тысяч миллионов) человеческий мозг опережает — в пересчете на транзисторы — современные компьютеры. Более того, в среднем, нейроны мозга соединены гораздо большим количеством связей, нежели транзисторы в компьютере. В частности, клетки Пуркинье в мозжечке могут иметь до 80000 синаптических окончаний (зон контакта между нейронами), тогда как для компьютера соответствующее значение равно максимум трем или четырем. (В дальнейшем я приведу еще несколько комментариев относительно мозжечка; см. , .) Кроме того, большая часть транзисторов в современных компьютерах занимается лишь хранением данных и не имеет отношения непосредственно к вычислениям, тогда как в мозге, по всей видимости, в вычислениях может принимать участие гораздо более значительный процент клеток.
Это временное превосходство мозга может быть без труда преодолено в будущем, особенно когда должное развитие получат вычислительные системы с массивным «параллелизмом». Преимущество компьютеров в том, что отдельные их узлы можно объединять друг с другом, создавая все более крупные блоки, так что общее количество транзисторов, в принципе, можно увеличивать почти бесконечно. Кроме того, ждут своего выхода на сцену и технологические инновации — такие, как замена кабелей и транзисторов современных компьютеров соответствующими оптическими (лазерными) устройствами, благодаря чему, вероятно, будет достигнуто огромное увеличение скорости и мощности с одновременным уменьшением размеров компьютеров. На более фундаментальном уровне можно отметить, что наш мозг, судя по всему, застрял на своем теперешнем уровне, и его количественные характеристики вряд ли в обозримом будущем изменятся; кроме того, имеется и много других ограничений — например, мозг вырастает из одной-единственной клетки, и ничего с этим не поделаешь. Компьютеры же можно конструировать, учитывая заранее возможность их расширения по мере необходимости. Хотя несколько позже я укажу на некоторые важные факторы, которые в данном рассуждении пока не фигурируют (в частности, речь пойдет о весьма бурной деятельности, лежащей в основе функционирования нейронов), одна лишь вычислительная мощь компьютеров вполне способна составить очень и очень внушительный довод в пользу следующего неутешительного предположения: если машина на данный момент и не превосходит человеческий мозг, то она непременно превзойдет его в самом ближайшем будущем.
Таким образом, если поверить самым смелым заявлениям наиболее отъявленных провозвестников искусственного интеллекта и допустить, что компьютеры и управляемые ими роботы в конечном счете — и даже, вероятно, довольно скоро — во всем превзойдут человека, то получается, что компьютеры способны стать чем-то неизмеримо большим, чем просто помощниками нашего интеллекта. Они, в сущности, разовьют свой собственный колоссальный интеллект. А мы сможем обращаться к этому высшему интеллекту за советом и поддержкой во всех своих заботах — и наконец-то появится возможность исправить все то зло, что мы принесли в этот мир!
Однако из этих потенциальных соображений возможно, по-видимому, и другое логическое следствие, причем весьма и весьма тревожное. Не сделают ли такие компьютеры в итоге ненужными самих людей? Если управляемые компьютерами роботы превзойдут нас во всех отношениях, то не обнаружат ли они, что машины в состоянии править миром неизмеримо лучше людей, и не сочтут ли они нас в таком случае вообще ни на что не пригодными? Все человечество окажется в таком случае не более чем пережитком прошлого. Быть может, если повезет, они оставят нас при себе в качестве домашних животных, как однажды предположил Эдвард Фредкин. Возможно также, что у нас достанет сообразительности, и мы сумеем перенести «информационные модели», составляющие нашу «сущность», в машинную форму — о такой возможности писал Ханс Моравек (1988). Опять же, может, и не повезет, а сообразительности не достанет...
1.3. Вычисление и сознательное мышление
В чем же здесь загвоздка? Неужели все дело лишь в вычислительных способностях, в скорости и точности работы, в объеме памяти или, быть может, в конкретном способе «связи» отдельных структурных элементов? С другой стороны, не может ли наш мозг выполнять какие-то действия, которые вообще невозможно описать через вычисление? Каким образом можно поместить в такую вычислительную картину нашу способность к осмысленному осознанию — счастья, боли, любви, какого-либо эстетического переживания, желания, понимания и т.п.? Будут ли компьютеры будущего действительно обладать разумом? Влияет ли обладание сознательным разумом на поведение индивида, и если влияет, то как именно? Имеет ли вообще смысл говорить о таких вещах на языке научных терминов; иными словами, обладает ли наука достаточной компетентностью для того, чтобы рассматривать вопросы, относящиеся к сознанию человека?
Мне кажется, что можно говорить, как минимум, о четырех различных точках зрения — или даже крайностях, — которых разумный индивид может придерживаться в отношении данного вопроса:
A . Всякое мышление есть вычисление; в частности, ощущение осмысленного осознания есть не что иное, как результат выполнения соответствующего вычисления.
B . Осознание представляет собой характерное проявление физической активности мозга; хотя любую физическую активность можно моделировать посредством той или иной совокупности вычислений, численное моделирование как таковое не способно вызвать осознание.
C . Осознание является результатом соответствующей физической активности мозга, однако эту физическую активность невозможно должным образом смоделировать вычислительными средствами.
D . Осознание невозможно объяснить в физических, математических и вообще научных терминах.
Точка зрения D, полностью отрицающая взгляды физикалистов и рассматривающая разум как нечто абсолютно неподвластное языку науки, свойственна мистикам; и, по крайней мере, в какой-то степени, такое мировоззрение, видимо, сродни религиозной доктрине. Лично я считаю, что связанные с разумом вопросы, пусть даже и не объясняемые должным образом в рамках современного научного понимания, не следует рассматривать как нечто, чего науке никогда не постичь. Пусть на данный момент наука и не способна сказать в отношении этих вопросов своего веского слова, со временем ее возможности неминуемо расширятся настолько, что в ней найдется место и для таких вопросов, причем не исключено, что в процессе такого расширения изменятся и сами ее методы. Отбрасывая мистицизм с его отрицанием научных критериев в пользу научного познания, я все же убежден, что и в рамках усовершенствованной науки вообще и математики в частности найдется немало загадок, среди которых не последнее место займет тайна разума. К некоторым из этих идей я еще вернусь в следующих главах книги, сейчас же достаточно будет сказать, что согласиться с точкой зрения D я никак не могу, поскольку твердо намерен двигаться вперед, следуя пути, проложенному наукой. Если мой читатель питает сильное убеждение, что истинным является именно пункт D, в той или иной его форме, я попрошу его потерпеть еще немного и посмотреть, сколько нам удастся пройти вместе по дороге науки, — и попытаться при этом понять, куда, по моему убеждению, эта дорога в конечном счете нас приведет.
Теперь обратимся к противоположной крайности: к точке зрения A. Эту точку зрения разделяют сторонники так называемого сильного, или жесткого, искусственного интеллекта (ИИ); иногда для обозначения такой позиции употребляется также термин функционализм, хотя некоторые распространяют термин «функционализм» еще и на определенные варианты пункта C. Одни считают A единственно возможной точкой зрения, которую допускает сугубо научное отношение. Другие воспринимают A как нелепость, которая вряд ли стоит сколь-нибудь серьезного внимания. Существует, несомненно, множество различных вариантов позиции A. (Длинный список альтернативных версий вычислительной точки зрения приводится в [].) Некоторые из них отличаются лишь различным пониманием того, что следует считать «вычислением» или «выполнением вычисления». Есть и такие приверженцы A, которые вообще не считают себя «сторонниками сильного ИИ», поскольку придерживаются принципиально иного взгляда на интерпретацию термина «вычисление», нежели та, что предлагается в традиционном понятии ИИ (см.[]). Я рассмотрю эти вопросы подробнее в . Пока же достаточно будет понимать под «вычислением» такую операцию, какую способны выполнять обычные универсальные компьютеры. Другие сторонники позиции A могут расходиться в интерпретации значения терминов «осмысление» или «осознание». Некоторые отказываются признавать само существование такого феномена, как «осмысленное осознание», тогда как другие собственно феномен признают, однако рассматривают его лишь как своего рода «эмергентное свойство» (см. также и ), которое проявляется всякий раз, когда выполняемое вычисление имеет достаточную степень сложности (или громоздкости, или самоотносимости, или чего угодно еще). В я приведу свою собственную интерпретацию терминов «осознание» и «осмысление». Пока же любые расхождения в возможной их интерпретации не будут иметь особой важности для наших рассуждений.
Аргументы, приведенные мной в НРК, были направлены, главным образом, против точки зрения A, или позиции сильного ИИ. Один только объем этой книги должен показать, что, хотя лично я не верю в истинность A, я все же рассматриваю эту точку зрения как реальную возможность, на которую стоит обратить серьезное внимание, A есть следствие предельно операционного подхода к науке, предполагающего, что абсолютно все феномены физического мира можно описать одними лишь вычислительными методами. В одной из крайних вариаций такого подхода сама Вселенная рассматривается, по существу, как единый гигантский компьютер, причем «осмысленные осознания», формирующие, в сущности, наш с вами сознательный разум, вызываются посредством соответствующих субвычислений, выполняемых этим компьютером.
Я полагаю, что эта точка зрения (согласно которой физические системы следует считать простыми вычислительными объектами) отчасти основывается на значительной и постоянно растущей роли вычислительных моделей в современной науке и отчасти из убеждения в том, что сами физические объекты — это, в некотором смысле, всего лишь «информационные модели», подчиняющиеся математическим, вычислительным законам. Большая часть материи, из которой состоят наше тело и мозг, постоянно обновляется — неизменными остаются лишь их модели. Более того, и сама материя, судя по всему, ведет преходящее существование, поскольку ее можно преобразовать из одной формы в другую. Даже масса материального тела, которая является точной физической мерой количества материи, содержащегося в теле, может быть при определенных обстоятельствах превращена в чистую энергию (в соответствии со знаменитой формулой Эйнштейна E = mc 2 ). Следовательно, и материальная субстанция, по-видимому, способна превращаться в нечто, обладающее лишь теоретико-математической реальностью. Более того, если верить квантовой теории, материальные частицы — это не что иное, как информационные «волны». (На этих вопросах мы более подробно остановимся во второй части книги.) Таким образом, сама материя есть нечто неопределенное и недолговечное, поэтому вполне разумно предположить, что постоянство человеческого «я», возможно, больше связано с сохранением моделей, нежели реальных частиц материи.
Даже если мы не считаем возможным рассматривать Вселенную всего лишь как компьютер, к точке зрения A нас могут подтолкнуть более практические, операционные соображения. Предположим, что перед нами управляемый компьютером робот, который отвечает на вопросы так же, как это делал бы человек. Мы спрашиваем его, как он себя чувствует, и обнаруживаем, что его ответы полностью соответствуют нашим представлениям об ответах на подобные вопросы разумного существа, действительно обладающего чувствами. Он говорит нам, что способен к осознанию, что ему весело или грустно, что он воспринимает красный цвет и что его волнуют вопросы «разума» и «собственного я». Он может даже выразить озадаченность: следует ли ему допустить, что и других существ (в частности, людей) нужно рассматривать как обладающих сознанием, сходным с тем, на обладание которым претендует он сам. Что помешает нам поверить его утверждениям о том, что он ощущает, любопытствует, радуется, испытывает боль, особенно если учесть, что о других людях мы знаем ничуть не больше и все же считаем их обладающими сознанием? Мне кажется, что операционный аргумент все же обладает значительной силой, хотя его и нельзя считать решающим. Если все внешние проявления сознательного разума, включая ответы на непрекращающиеся вопросы, действительно могут быть полностью воспроизведены системой, управляемой исключительно вычислительными алгоритмами, то мы имеем полное право допустить, что в рамках рассматриваемой ситуации такая модель должна содержать и все внутренние проявления разума (включая собственно сознание).
Принимая или отвергая такой вывод из вышеприведенного рассуждения, которое в основе своей составляет суть так называемого теста Тьюринга, мы тем самым определяем свою принадлежность к тому или иному лагерю — именно здесь проходит граница между позициями A и B. Согласно A, любого управляемого компьютером робота, который после достаточно большого количества заданных ему вопросов ведет себя так, словно он обладает сознанием, следует фактически считать обладающим сознанием. Согласно B, робот вполне может вести себя точно так же, как обладающий сознанием человек, при этом реально не имея и малой доли этого внутреннего качества. И A, и B сходятся в том, что управляемый компьютером робот может вести себя так, как ведет себя обладающий сознанием человек. C же, напротив, не допускает и малейшей возможности того, что когда-либо может быть реализована эффективная модель обладающего сознанием человека в виде управляемого компьютером робота. Таким образом, согласно C, после некоторого достаточно большого количества вопросов реальное отсутствие сознания у робота так или иначе проявится. Вообще говоря, C является в гораздо большей степени операционной точкой зрения, нежели B, и в этом отношении она больше похожа на A, чем на B.
Так что же представляет собой позиция B? Я думаю, что B — это, вероятно, именно та точка зрения, которую многие полагают «научным здравым смыслом». Описываемый ею искусственный интеллект еще называют слабым (или мягким) ИИ. Подобно A, она утверждает, что все физические объекты этого мира должны вести себя в соответствии с некоторыми научными положениями, которые, в принципе, допускают создание вычислительной модели этих объектов. С другой стороны, эта точка зрения уверенно отрицает мнение операционистов, согласно которому любой объект, внешне проявляющий себя как сознательное существо, непременно обладает сознанием. Как отмечает философ Джон Серл, вычислительную модель физического процесса никоим образом не следует отождествлять с самим процессом, происходящим в действительности. (Компьютерная модель, например, урагана — это совсем не то же самое, что и реальный ураган!) Согласно взгляду B, наличие или отсутствие сознания очень сильно зависит от того, какой именно физический объект «осуществляет мышление» и какие физические действия он при этом совершает. И только потом следует рассмотреть конкретные вычисления, которых требуют эти действия. Таким образом, активность биологического мозга может вызвать осознание, а вот его точная электронная модель вполне может оказаться на это неспособной. Это различие, по B, совсем не обязательно должно оказаться различием между биологией и физикой. Однако крайне важным остается реальное материальное строение рассматриваемого объекта (скажем, мозга), а не просто его вычислительная активность.
Позиция C, на мой взгляд, ближе всех к истине. Она подразумевает более операционный подход, нежели (B, так как утверждает, что существуют такие внешние проявления обладающих сознанием объектов (скажем, мозга), которые отличаются от внешних проявлений компьютера: внешние проявления сознания невозможно должным образом воспроизвести вычислительными методами. Свои основания для такой убежденности я приведу несколько позже. Поскольку C, как и B, не отвергает позиции физикалистов, согласно которой разум возникает в результате проявления активности тех или иных физических объектов (например, мозга, хотя это и не обязательно), C подразумевает, что не всякую физическую активность можно должным образом смоделировать вычислительными методами.
Допускает ли современная физика возможность существования процессов, которые принципиально невозможно смоделировать на компьютере? Если мы надеемся получить на этот вопрос математически строгий ответ, то нас ждет разочарование. По крайней мере, лично мне такой ответ неизвестен. Вообще, с математической точностью здесь дело обстоит несколько запутаннее, чем хотелось бы. Однако сам я убежден в том, что подобные невычислимые процессы следует искать за пределами тех областей физики, которые описываются известными на настоящий момент физическими законами. Далее в этой книге я вновь перечислю некоторые весьма серьезные — причем именно физические — доводы в пользу того, что мы действительно нуждаемся в новом взгляде на ту область, которая лежит между уровнем микроскопических величин, где господствуют квантовые законы, и уровнем «обычных» размеров, подвластным классической физике. Хотя, надо сказать, далеко не все современные физики единодушно уверены в необходимости подобной новой физической теории.
Таким образом, существуют, как минимум, две различные точки зрения, которые можно отнести к категории C. Одни сторонники C утверждают, что наше современное физическое понимание абсолютно адекватно, следует лишь обратить в рамках традиционной теории более пристальное внимание на некоторые тонкие типы поведения, которые вполне могут вывести нас за пределы того, что целиком и полностью объяснимо с помощью вычислений (некоторые из таких типов мы рассмотрим ниже — например, хаотическое поведение (), некоторые тонкости непрерывного действия в противоположность дискретному (), квантовая случайность). Другие же, напротив, полагают, что современная физика, в сущности, не располагает должными средствами для реализации невычислимости требуемого типа. Далее я представлю некоторые веские, на мой взгляд, доводы в пользу принятия позиции C именно в этом, более строгом, ее варианте, который предполагает создание фундаментально новой физики.
Кое-кто попытался было объявить, что эти соображения отправляют меня прямиком в лагерь сторонников точки зрения D, поскольку я утверждаю, что для отыскания хоть какого-то объяснения феномену сознания нам придется выйти за пределы известной науки. Однако между упомянутым строгим вариантом C и точкой зрения D есть существенная разница, в частности, на уровне методологии. В соответствии с C, проблема осмысленного осознания носит, в сущности, научный характер, даже если подходящей наукой мы пока что не располагаем. Я всецело поддерживаю эту точку зрения; я полагаю, что ответы на интересующие нас вопросы нам следует искать именно с помощью научных методов — разумеется, должным образом усовершенствованных, пусть даже о конкретной природе необходимых изменений мы, возможно, имеем на данный момент лишь самое смутное представление. В этом и состоит ключевая разница между C и D, насколько бы похожими ни казались нам соответствующие мнения относительно того, на что способна современная наука.
Определенные выше точки зрения A, B, C, D представляют собою крайности, или полярные точки возможных позиций, которых может придерживаться тот или иной индивидуум. Я вполне допускаю, что кому-то может показаться, что их собственные взгляды не подходят ни под одну из перечисленных категорий, а лежат где-то между ними либо противоречат некоторым из них. Безусловно, между такими, например, крайними точками зрения, как A и B, можно разместить множество различных промежуточных точек зрения (см. []). Существует даже мнение (весьма, кстати, широко распространенное), которое лучше всего определяется как комбинация A и D (или, быть может, B и D, — предусматриваемая им возможность еще сыграет немаловажную роль в наших дальнейших размышлениях. Согласно этому мнению, мозг действительно работает как компьютер, однако компьютер настолько невообразимой сложности, что его имитация не под силу человеческому и научному разумению, ибо он, несомненно, является божественным творением Господа — «лучшего в мире системотехника», не иначе!
1.4. Физикализм и ментализм
Я должен сделать здесь краткое отступление касательно использования терминов «физикалист» и «менталист» (обычно противопоставляемых один другому), в нашей конкретной ситуации, т.е. в отношении крайних точек зрения, обозначенных нами через A, B, C и D. Поскольку D являет собой полное отрицание физикализма, сторонников & безусловно следует считать менталистами. Однако мне не совсем ясно, где провести границу между физикализмом и ментализмом в случае с тремя другими позициями A, B и C. Я полагаю, что приверженцев A следует обыкновенно считать физикалистами, и я уверен, что подавляющее их большинство согласилось бы со мной. Однако здесь скрывается некий парадокс. В соответствии с A, материальное строение мыслящего устройства считается несущественным. Все его мыслительные атрибуты определяются лишь вычислениями, которые это устройство выполняет. Сами по себе вычисления суть феномены абстрактной математики, не связанные с конкретными материальными телами. Таким образом, согласно A, сами мыслительные атрибуты не имеют жесткой связи с физическими объектами, а потому термин «физикалист» может показаться несколько неуместным. Точки зрения B и C, напротив, требуют, чтобы при определении наличия в том или ином объекте подлинного разума решающую роль играло реальное физическое строение рассматриваемого объекта. Соответственно, вполне можно было бы утверждать, что именно эти точки зрения, а никак не A, представляют возможные позиции физикалистов. Однако такая терминология, по-видимому, вошла бы в некоторое противоречие с общепринятым употреблением, где более уместным считается называть «менталистами» сторонников её и её, поскольку в этих случаях свойства мышления рассматриваются как нечто «реальное», а не просто как «эпифеномены», которые случайным образом возникают при выполнении определенных типов вычислений. Ввиду такой путаницы, я буду избегать использования терминов «физикалист» и «менталист» в последующих рассуждениях, ссылаясь вместо этого на конкретные точки зрения A, B, C и D, определенные выше.
1.5. Вычисление: нисходящие и восходящие процедуры
До сих пор было не совсем ясно, что именно я понимаю под термином «вычисление» в определениях позиций A, B, C и D, приведенных в . Что же такое вычисление? В двух словах: это все, что делает самый обычный универсальный компьютер. Если же мы хотим быть более точными, то следует воспринимать этот термин в соответственно идеализированном смысле: вычисление — это действие машины Тьюринга.
А что такое машина Тьюринга? По сути, это и есть математически идеализированный компьютер (теоретический предшественник современного универсального компьютера); идеализирован же он в том смысле, что никогда не ошибается, может работать сколько угодно долго и обладает неограниченным объемом памяти. Немного более подробно о точных спецификациях машин Тьюринга я расскажу в и в . (Интересующийся более полным введением в этот вопрос читатель может обратиться к описанию, приведенному в НРК, глава 2, а также к работам Клина [] или Дэвиса [].)
Для описания деятельности машины Тьюринга нередко используют термин «алгоритм». В данном контексте я считаю термин «алгоритм» полностью синонимичным термину «вычисление». Здесь необходимо небольшое разъяснение, так как в отношении термина «алгоритм» некоторые придерживаются более узкой точки зрения, нежели предлагаемая мною здесь, подразумевая под алгоритмом то, что я в дальнейшем буду более конкретно называть «нисходящим алгоритмом». Попытаемся разобраться, что же следует понимать в контексте вычисления под термином «нисходящий» и противоположным ему термином «восходящий».
Мы говорим, что вычислительная процедура имеет нисходящую организацию, если она построена в соответствии с некоторой прозрачной и хорошо структурированной фиксированной вычислительной процедурой (которая может содержать некий заданный заранее объем данных) и предоставляет, в частности, четкое решение для той или иной рассматриваемой проблемы. (Описанный в НРК на с. 31 евклидов алгоритм нахождения наибольшего общего делителя двух натуральных чисел представляет собой простой пример нисходящего алгоритма.) В противоположность такой организации существует организация восходящая, где упомянутые четкие правила выполнения действий и объем данных заранее не определены, однако вместо этого имеется некоторая процедура, определяющая, каким образом система должна «обучаться» и повышать свою эффективность в соответствии с накопленным «опытом». Иными словами, в случае восходящей системы правила выполнения действий подвержены постоянному изменению. Очевидно, что такая система должна пройти множество циклов, выполняя требуемые действия над непрерывно поступающими данными. Во время каждого прогона производится оценка эффективности (возможно, самой системой), после чего, в соответствии с этой оценкой, система так или иначе модифицирует свои действия, стремясь улучшить качество вывода данных. Например, на вход системы подаются несколько оцифрованных с некоторым качеством фотопортретов, и ставится задача — определить, на каких портретах изображен один человек, а на каких — другой. После каждого прогона результат выполнения задачи сравнивается с правильным, после чего правила выполнения действий модифицируются так, чтобы с некоторой вероятностью добиться улучшения функционирования системы при следующем прогоне.
Конкретные способы такого улучшения в какой-либо конкретной восходящей системе нас в данный момент не интересуют. Достаточно сказать, что количество всевозможных готовых схем весьма велико. Среди наиболее известных систем восходящего типа можно упомянуть так называемые искусственные нейронные сети (иногда их называют просто «нейронными сетями», что может ввести в некоторое заблуждение), которые представляют собой компьютерные самообучающиеся программы — или же особым образом сконструированные электронные устройства, — основанные на определенных представлениях о реальной организации системы связей между нейронами в мозге и о том, каким образом эта система улучшается по мере приобретения мозгом опыта. (Вопрос о том, как в действительности модифицирует самоё себя система взаимосвязей между нейронами мозга, приобретет для нас особую значимость несколько позднее; см. и .) Очевидно также, что возможны системы, сочетающие в себе элементы как восходящей, так и нисходящей организации.
Для наших целей важно понимать, что и нисходящие, и восходящие вычислительные процедуры с легкостью выполняются на универсальном компьютере, а потому их можно отнести к категории процессов, названных мною вычислительными и алгоритмическими. Таким образом, в случае восходящих (или комбинированных) систем сам способ модификации системой своих процедур задается какими-то целиком и полностью вычислительными инструкциями, причем задается заблаговременно. Этим и объясняется возможность реализации всей системы на обычном компьютере. Существенная разница между восходящей (или комбинированной) системой и системой нисходящей состоит в том, что в первом случае вычислительная процедура должна подразумевать возможность сохранения «памяти» о предыдущем выполнении задачи (т.е. обладать способностью накапливать «опыт») с тем, чтобы эту память затем можно было использовать в последующих вычислительных действиях. Конкретные подробности сейчас не имеют особого значения, однако к обсуждению этого вопроса мы еще вернемся в .
Задавшись целью создать искусственный интеллект (сокращенно «ИИ»), человек пока лишь пытается сымитировать разумное поведение на каком угодно уровне посредством каких-то вычислительных средств. При этом часто используется как нисходящая, так и восходящая организация. Первоначально наиболее перспективными представлялись нисходящие системы, однако сейчас все большую популярность приобретают восходящие системы типа искусственной нейронной сети. По всей видимости, получения наиболее успешных систем ИИ можно ожидать лишь при том или ином сочетании нисходящих и восходящих организаций. У каждой из них есть свои преимущества. Нисходящая организация наиболее успешна в тех областях, где данные и правила выполнения действий четко определены и имеют хорошо выраженный вычислительный характер, — при решении некоторых конкретных математических задач, создании вычислительных систем для игры в шахматы или, скажем, в медицинской диагностике, где определение того или иного заболевания происходит с помощью заданных наборов правил, основанных на общепринятых медицинских процедурах. Восходящая же организация оказывается полезной, когда критерии для принятия решений не слишком точны или не совсем ясны, — как, например, при распознавании лиц или звуков или, возможно, при поиске месторождений минералов, где основным поведенческим критерием становится повышение эффективности на основе накопленного опыта. Во многих подобных системах действительно присутствуют элементы и нисходящей, и восходящей организаций (например, шахматный компьютер, обучающийся на основе опыта, или созданное на базе какой-либо четкой геологической теории вычислительное устройство, помогающее в поисках месторождений минералов).
Я думаю, справедливым будет сказать, что лишь в некоторых примерах нисходящей (или по большей части нисходящей) организации компьютеры демонстрируют значительное превосходство над человеком. Самым очевидным примером может служить прямой численный расчет, где в наше время компьютеры побеждают человека без каких-либо усилий. То же самое относится и к «вычислительным» играм, типа шахмат и шашек, в которые у лучших компьютеров способны выиграть, возможно, лишь несколько человек (более подробно об этом в и ). В случае же восходящей организации (искусственной нейронной сети) компьютерам лишь в немногих специфических примерах удается достичь приблизительно уровня обычных хорошо обученных людей.
Еще одно отличие между видами компьютерных систем связано с различием между последовательной и параллельной архитектурами. Компьютер последовательного действия — это машина, выполняющая вычисления друг за другом, поэтапно, тогда как параллельный компьютер выполняет множество независимых вычислений одновременно, результаты же этих вычислений сводятся вместе лишь по завершении достаточно большого их количества. Кстати, у истоков разработки некоторых параллельных систем стояли все те же теории, описывающие предполагаемые способы функционирования мозга. Здесь следует отметить, что различие между вычислительными машинами последовательного и параллельного действия ни в коей мере не является принципиальным. Параллельное действие всегда можно смоделировать последовательно, хотя, конечно же, существуют некоторые типы задач (весьма немногочисленные), для решения которых эффективнее (в смысле затрат времени на вычисление и т.п.) будет параллельное действие, нежели последовательное. Поскольку в рамках настоящего труда меня занимают, главным образом, принципиальные вопросы, различия между параллельными и последовательными вычислениями не представляются в этом отношении особенно существенными.
1.6. Противоречит ли точка зрения
C
тезису Черча—Тьюринга?
Вспомним, что точка зрения C предполагает, что обладающий сознанием мозг функционирует таким образом, что его активность не поддается никакому численному моделированию — ни нисходящего, ни восходящего, ни какого-либо другого типа. Те, кто сомневается в истинности C, могут отчасти оправдать свои сомнения тем, что формулировка C якобы противоречит так называемому тезису Черча (или тезису Черча—Тьюринга) — вернее, тому условию, которое сейчас общепринято обозначать упомянутым термином. В чем же суть тезиса Черча? В первоначальной форме, предложенной американским логиком Алонзо Черчем в 1936 году, этот тезис гласил, что любой процесс, который можно корректно назвать «чисто механическим» математическим процессом, — т.е. любой алгоритмический процесс — может быть реализован в рамках конкретной схемы, открытой самим Черчем и названной им лямбда-исчислением (λ-исчислением) (весьма, надо отметить, изящная и концептуально сдержанная схема; краткое ознакомительное изложение см. в НРК, с. 66-70). Вскоре после этого, в 1936-1937 годах, британский математик Алан Тьюринг нашел свой собственный, гораздо более убедительный способ описания алгоритмических процессов, основанный на функционировании теоретических «вычислительных машин», которые мы сейчас называем машинами Тьюринга. Вслед за Тьюрингом в некоторой степени аналогичную схему разработал американский ученый-логик польского происхождения Эмиль Пост (1936). Далее Черч и Тьюринг независимо друг от друга показали, что исчисление Черча эквивалентно концепции машины Тьюринга (а следовательно, и схеме Поста). Более того, именно этим концепциям Тьюринга в значительной степени обязаны своим появлением на свет современные универсальные компьютеры. Как уже упоминалось, машина Тьюринга по принципу функционирования фактически полностью эквивалентна современному компьютеру, — несколько, впрочем, идеализированному, т.е. обладающему возможностью использовать неограниченный объем памяти. Таким образом получается, что тезис Черча в его первоначальной формулировке всего лишь утверждает, что математическими алгоритмами следует считать как раз те процессы, которые способен выполнить идеализированный современный компьютер — а если учесть общепринятое ныне определение термина «алгоритм», то такое утверждение и вовсе становится тавтологией. Так что принятие этой формулировки тезиса Черча не влечет за собой никакого противоречия точке зрения C.
Вполне вероятно, однако, что сам Тьюринг имел в виду нечто большее: вычислительные возможности любого физического устройства должны (в идеале) быть эквивалентны действию машины Тьюринга. Такое утверждение существенно выходит за рамки того, что изначально подразумевал Черч. При разработке концепции «машины Тьюринга» сам Тьюринг основывался на своих представлениях о том, чего, в принципе, мог бы достичь вычислитель-человек (см. []). Судя по всему, он полагал, что физическое действие в общем (а под эту категорию подпадает и активность мозга человека) всегда можно свести к какой-либо разновидности действия машины Тьюринга. Быть может, это утверждение (физическое) следует называть «тезисом Тьюринга» — для того чтобы отличать его от оригинального «тезиса Черча», утверждения чисто математического, которому никоим образом не противоречит C. Именно такой терминологии я намерен придерживаться далее в этой книге. Соответственно, точка зрения C противоречит в этом случае тезису Тьюринга, а вовсе не тезису Черча.
1.7. Хаос
В последние годы ученые проявляют огромный интерес к математическому феномену, известному под названием «хаос», — феномену, в рамках которого физические системы оказываются способными на якобы аномальное и непредсказуемое поведение (рис. ). Образует ли феномен хаоса необходимую невычислимую физическую основу для такой точки зрения, как C?
Рис. 1.1. Аттрактор Лоренца — один из первых примеров хаотической системы. Следуя линиям, мы переходим от левого лепестка аттрактора к правому и обратно произвольным, на первый взгляд, образом; то, в каком именно лепестке мы оказываемся в тот или иной момент времени, существенно зависит от нашей исходной точки. При этом кривая описывается простым математическим (дифференциальным) уравнением.
Хаотические системы — это динамически развивающиеся физические системы, математические модели таких физических систем или же просто математические модели, не описывающие никакой реальной физической системы и интересные сами по себе; характерно то, что будущее поведение такой системы чрезвычайно сильно зависит от ее начального состояния, причем определяющими могут оказаться самые незначительные факторы. Хотя обыкновенные хаотические системы являются полностью детерминированными и вычислительными, на деле может показаться, что в их поведении ничего детерминированного нет и никогда не было. Это происходит потому, что для сколько-нибудь надежного детерминистического предсказания будущего поведения системы необходимо знать ее начальное состояние с такой точностью, которая может оказаться просто недостижимой не только для тех измерительных средств, которыми мы располагаем, но также и для тех, которые мы только можем вообразить.
В этой связи чаще всего вспоминают о подробных долгосрочных прогнозах погоды. Законы, управляющие движением молекул воздуха, а также другими физическими величинами, которые могут оказаться релевантными для определения будущей погоды, хорошо известны. Однако реальные синоптические ситуации, которые могут возникнуть всего через несколько дней после предсказания, настолько тонко зависят от начальных условий, что нет никакой возможности измерить эти условия достаточно точно для того, чтобы дать хоть сколько-нибудь надежный прогноз. Безусловно, количество параметров, которые необходимо ввести в подобное вычисление, огромно; поэтому, быть может, и нет ничего удивительного в том, что в данном случае предсказание может оказаться на практике просто невозможным.
С другой стороны, подобное — так называемое хаотическое — поведение может иметь место и в случае очень простых систем; примером тому служат системы, состоящие из малого количества частиц. Вообразите, что от вас требуется загнать в лузу бильярдный шар Е, расположенный пятым в некоторой извилистой и очень растянутой цепочке шаров А, В, С, D и Е; вам нужно ударить кием по шару А так, чтобы тот ударил шар В, который, в свою очередь, ударил бы шар С, который ударил бы шар D, который ударил бы шар Е, который, наконец, попал бы в лузу. В общем случае необходимая для этого точность значительно превышает способности любого профессионального игрока в бильярд. Если бы цепочка состояла из 20 шаров, то тогда — даже допустив, что эти шары представляют собой идеально упругие точные сферы, — задача загнать в лузу последний шар оказалась бы не под силу и самому точному механизму из всех доступных современной технологии. Поведение последних шаров цепочки было бы, в сущности, случайным, несмотря на то, что управляющие поведением шаров ньютоновы законы математически абсолютно детерминированы и, в принципе, эффективно вычислимы. Никакое вычисление не смогло бы предсказать реальное поведение последних шаров цепочки просто потому, что нет никакой возможности добиться достаточно точного определения реального начального положения и скорости движения кия или положений первых шаров цепочки. Более того, даже самые незначительные внешние воздействия, вроде дыхания человека в соседнем городе, могут нарушить эту точность до такой степени, которая полностью обесценит результаты любого подобного вычисления.
Здесь необходимо пояснить, что, несмотря на столь серьезные трудности, встающие перед детерминистическим предсказанием, все нормальные системы, к которым применим термин «хаотические», следует относить к категории систем, которые я называю «вычислительными». Почему? Как и в других ситуациях, которые мы рассмотрим позднее, для того, чтобы определить, является ли та или иная процедура вычислительной, достаточно задать себе вопрос: выполнима ли она на обычном универсальном компьютере? Очевидно, что в данном случае ответ может быть только утвердительным, по той простой причине, что математически описываемые хаотические системы и в самом деле изучаются, как правило, с помощью компьютера!
Разумеется, если мы попытаемся создать компьютерную модель для подробного предсказания погоды в Европе в течение недели или же для описания последовательных столкновений расположенных вдоль некоторой кривой на достаточно большом расстоянии друг от друга двадцати бильярдных шаров после того, как по первому из них резко ударили кием, то можно почти с полной определенностью утверждать, что результаты, полученные с помощью нашей модели, и близко не будут похожи на то, что произойдет в действительности. Такова природа хаотических систем. На практике бесполезно пытаться с помощью вычислений предсказать реальное конечное состояние системы. Тем не менее, моделирование типичного конечного состояния вполне возможно. Предсказанная погода может и не совпасть с реальной, но она абсолютно правдоподобна как погода вообще! Точно так же и предсказанный результат столкновений бильярдных шаров абсолютно приемлем как возможный исход, даже несмотря на то, что на самом деле шары могут повести себя совершенно не так, как предсказано вычислением, — однако и при этом их поведение остается в равной степени приемлемым. Упомянем еще об одном обстоятельстве, которое подчеркивает идеально вычислительную природу таких операций: если запустить процесс компьютерного моделирования вторично, задав те же входные данные, что и ранее, то результат моделирования будет точно таким же, как и в первый раз! (Здесь предполагается, что сам компьютер не ошибается; впрочем, надо признать, что современные компьютеры и в самом деле крайне редко совершают при вычислениях реальные ошибки.)
Возвращаясь к искусственному интеллекту, отметим, что никто пока и не пытается воспроизвести поведение какого-то конкретного индивидуума; нас бы прекрасно устроила модель индивидуума вообще! В этом контексте моя позиция вовсе не представляется такой уж неразумной: хаотические системы следует безусловно относить к категории систем, которые мы называем «вычислительными». Компьютерная модель такой системы и в самом деле выглядела бы как абсолютно приемлемый «типичный случай», даже и не совпадая при этом ни с каким «реальным случаем». Если внешние проявления человеческого разума суть результаты некоей хаотической динамической эволюции (эволюции вычислительной в том смысле, о котором мы только что говорили), то это вполне согласуется с точками зрения A и B, но никак не C.
Время от времени выдвигаются предположения, что, возможно, именно феномен хаоса — если, конечно, он действительно имеет место в деятельности мозга как физической сущности — позволяет человеческому мозгу симулировать поведение, якобы отличное от вычислительно-детерминированного функционирования машины Тьюринга, хотя, как подчеркивалось выше, формально его активность является целиком и полностью вычислительной. К этому вопросу мне еще придется вернуться несколько позднее (см. ). Пока же достаточно уяснить лишь то, что хаотические системы относятся к категории систем, называемых мною «вычислительными» или «алгоритмическими». Вопрос же о том, можно ли смоделировать какую-нибудь из таких систем на практике, не входит в круг принципиальных вопросов, которые мы здесь рассматриваем.
1.8. Аналоговые вычисления
До сих пор я рассматривал «вычисление» только в том смысле, в котором этот термин применим к современным цифровым компьютерам или, точнее, к их теоретическим предшественникам — машинам Тьюринга. Существуют и другие разновидности вычислительных устройств, особенно широко распространенные в не столь отдаленном прошлом; вычислительные операции здесь осуществляются не посредством переходов между дискретными состояниями «вкл./выкл.», знакомыми нам по цифровым вычислениям, а с помощью непрерывного изменения того или иного физического параметра. Самым известным из таких устройств является логарифмическая линейка, изменяемым физическим параметром которой является линейное расстояние (между фиксированными точками на линейке). Это расстояние служит для представления логарифмов чисел, которые нужно перемножить или разделить. Существует много различных разновидностей аналоговых вычислительных устройств, в которых могут применяться и другие типы физических параметров — такие, например, как время, масса или электрический потенциал.
В случае аналоговых систем необходимо учитывать одно формальное обстоятельство: стандартные понятия вычисления и вычислимости применимы, строго говоря, только к дискретным системам (над которыми, собственно, и выполняются «цифровые» действия), но не к непрерывным, таким, например, как расстояния или электрические потенциалы, с которыми имеет дело традиционная классическая физика. Иными словами, для того чтобы применить обычные вычислительные понятия к системе, описание которой требует не дискретных (или «цифровых»), а непрерывных параметров, мы естественным образом должны прибегнуть к аппроксимации. Действительно, при компьютерном моделировании физических систем вообще стандартной процедурой является аппроксимация всех рассматриваемых непрерывных параметров в дискретной форме. Подобная процедура, однако, неминуемо вносит некоторую погрешность, величина которой определяется заданной степенью точности аппроксимации; при этом вполне возможно, что для той или иной интересующей нас физической системы заданной точности может оказаться недостаточно. В итоге дискретное компьютерное моделирование очень просто может привести нас к ошибочным выводам относительно поведения моделируемой непрерывной физической системы.
В принципе, ничто не мешает повысить точность до уровня, адекватного для моделирования рассматриваемой непрерывной системы. Однако на практике, особенно в случае хаотических систем, требуемые для этого время вычислений и объем памяти могут оказаться непомерно большими. Кроме того, можем ли мы, строго говоря, быть абсолютно уверены в том, что выбранная нами степень точности является действительно достаточной? Необходим какой-то критерий, который позволил бы нам определить, что нужный уровень точности достигнут, дальнейшего ее повышения не требуется и качественному поведению, вычисленному с такой точностью, в самом деле можно доверять. Все это поднимает ряд достаточно щекотливых математических вопросов, рассматривать которые подробно на этих страницах мне представляется не совсем уместным.
Существуют, однако, и другие подходы к проблемам вычислений в случае непрерывных систем; например, такие, в которых непрерывные системы рассматриваются как самостоятельные математические структуры со своим собственным понятием «вычислимости» — понятием, обобщающим идею вычислимости по Тьюрингу с дискретных величин на непрерывные. При таком подходе исчезает необходимость в аппроксимации непрерывной системы дискретными параметрами с целью применить к ней традиционную концепцию вычислимости по Тьюрингу. Такие идеи вызывают определенный интерес с математической точки зрения; к сожалению, им, как нам представляется, не достает пока той неотразимой естественности и уникальности, которые присущи стандартному понятию вычислимости по Тьюрингу для дискретных систем. Более того, вследствие определенной непоследовательности данного подхода, формально «невычислимыми» оказываются и некоторые простые системы, в применении к которым подобная терминология выглядит как-то не совсем уместно (даже такие, например, как известное всем из физики простое «волновое уравнение»; см. [] и НРК, с. 187-188). С другой стороны, следует упомянуть и об одной сравнительно недавней работе ([]), в которой показано, что теоретические аналоговые компьютеры, объединяемые в некоторый достаточно обширный класс, не могут выйти за рамки обычной вычислимости по Тьюрингу. Я надеюсь, что дальнейшие исследования должным образом осветят эти безусловно интересные и важные темы. Пока же у меня нет оснований полагать, что работы в этом направлении в целом уже достигли той стадии завершенности, чтобы их результаты можно было применить к рассматриваемым здесь проблемам.
В этой книге меня в особенности занимает вопрос о вычислительной природе умственной деятельности, где термин «вычислительный» следует рассматривать в стандартном смысле вычислимости по Тьюрингу. В самом деле, компьютеры, которыми мы сегодня повседневно пользуемся, являются цифровыми, и именно это их свойство оказывается существенным для современных разработок в области ИИ. Наверное, логичным будет предположить, что в будущем может появиться «компьютер» какого-то иного типа, решающую роль в функционировании которого будут играть (пусть даже и не выходя при этом за общепринятые теоретические рамки современной физики) непрерывные физические параметры, что позволит такому компьютеру демонстрировать поведение, существенно отличное от поведения цифрового компьютера.
Как бы то ни было, все эти вопросы важны, главным образом, для проведения границы между «сильной» и «слабой» версиями позиции C. Согласно слабой версии C, поведение обладающего сознанием человеческого мозга обусловлено некоторой физической активностью, которую невозможно вычислить в стандартном смысле дискретной вычислимости по Тьюрингу, но которую можно полностью объяснить в рамках современных физических теорий. Если так, то эта активность, по всей видимости, должна зависеть от каких-то непрерывных физических параметров таким образом, чтобы ее невозможно было адекватно воспроизвести с помощью стандартных цифровых процедур. В соответствии же с сильной версией C, невычислимость сознательной деятельности мозга может быть исчерпывающе объяснена в рамках некоторой невычислительной физической теории (пока еще не открытой), следствия из которой, собственно, и обусловливают упомянутую деятельность. Хотя второй вариант может показаться несколько надуманным, альтернатива (для сторонников C) и в самом деле состоит в отыскании для какого-либо непрерывного процесса в рамках известных физических законов такой роли, которую невозможно было бы адекватно воспроизвести посредством каких угодно вычислений. На данный же момент, несомненно, следует ожидать, что для любой достоверной аналоговой системы любого типа из тех, что получили более или менее серьезное рассмотрение, обязательно окажется возможным (по крайней мере, в принципе) создать эффективную цифровую модель.
Даже если не принимать во внимание всевозможные теоретические проблемы общего плана, на сегодняшний день наибольшее превосходство перед аналоговыми вычислительными системами демонстрируют именно цифровые компьютеры. Цифровые вычисления имеют гораздо более высокую точность благодаря, в основном, тому, что при хранении данных в цифровом виде повышение точности обеспечивается простым увеличением разрядности чисел, что легко достижимо с помощью весьма скромного увеличения (логарифмического) мощности компьютера; в аналоговых же машинах (по крайней мере, в полностью аналоговых, в конструкцию которых не заложено никаких цифровых концепций) увеличения точности можно добиться лишь посредством весьма и весьма значительного увеличения (линейного) соответствующих параметров. Возможно, когда-нибудь в будущем возникнут новые идеи, которые пойдут на пользу аналоговым вычислителям, однако в рамках современной технологии большая часть существенных практических преимуществ принадлежит, по всей видимости, цифровому вычислению.
1.9. Невычислительные процессы
Из всех типов вполне определенных процессов, что приходят в голову, большая часть относится, соответственно, к категории феноменов, называемых мною «вычислительными» (имеются в виду, конечно же, «цифровые вычисления»). Возможно, читатель уже начал волноваться, что сторонники позиции C так и останутся у нас не при деле. Причем я еще ни словом не упоминал о строго случайных процессах, которые могут быть обусловлены, скажем, какими-либо исходными данными, получаемыми от квантовой системы. (О квантовой механике мы немного подробнее поговорим во второй части, и .) Впрочем, для самой системы практически безразлично, подается на ее вход подлинно случайная последовательность данных или же всего лишь псевдослучайная, которую можно целиком и полностью сгенерировать вычислительным путем (см. ). Действительно, несмотря на то, что между «случайным» и «псевдослучайным», строго говоря, существуют некоторые формальные отличия, они, на первый взгляд, не имеют непосредственного отношения к проблемам ИИ. Далее, в , и последующих, я приведу некоторые серьезные доводы в пользу того, что «чистая случайность» и в самом деле абсолютно бесполезна для наших целей; если уж возникает такая необходимость, то лучше все же придерживаться псевдослучайности хаотического поведения, а все нормальные типы хаотического поведения, как уже подчеркивалось выше, относятся к категории «вычислительных».
А что нам известно о роли окружения? По мере развития каждого индивидуума у него или у нее формируется уникальное окружение, отличное от окружения любого другого человека. Возможно, именно это уникальное личное окружение и дает каждому из нас ту особенную последовательность входных данных, которая неподвластна вычислению? Хотя лично мне, например, сложно сообразить, на что именно в данном контексте может повлиять «уникальность» нашего окружения. Эти рассуждения напоминают разговор о хаосе, который мы вели выше (см. ). Для обучения управляемого компьютером робота достаточно одной лишь модели некоего правдоподобного окружения (хаотического), при том, разумеется, условии, что в этой модели не будет ничего заведомо невычислимого. Роботу нет нужды учиться тем или иным навыкам в каком-то конкретном реальном окружении; его, разумеется, вполне устроит типичное окружение, моделирующее реальность вычислительными методами.
А может быть, численное моделирование пусть даже всего лишь правдоподобного окружения невозможно в принципе. Быть может, в окружающем физическом мире все же есть нечто такое, что на самом деле неподвластно численному моделированию. Возможно, некоторые сторонники A или B уже вознамерились приписать все не поддающиеся, на первый взгляд, вычислению проявления человеческого поведения невычислимости внешнего окружения. Должен, однако, заметить, что намерение это несколько опрометчиво. Ибо, как только мы признаем, что физическое поведение допускает где-то что-то такое, что невозможно моделировать вычислительными методами, мы тем самым тут же лишаемся главного, по всей видимости, основания сомневаться в правдоподобии, в первую очередь, самой точки зрения C. Если во внешнем окружении (т.е. вне мозга) имеют место процессы, не поддающиеся численному моделированию, то почему не могут оказаться таковыми и процессы, протекающие внутри мозга? В конце концов, внутренняя физическая организация мозга человека, по всей видимости, гораздо более сложна, чем большая часть (и это еще слабо сказано) его окружения, за исключением, быть может, тех его участков, где это окружение само оказывается под сильным влиянием деятельности других мозгов. Признание возможности внешней невычислимой физической активности лишает всякой силы главный аргумент против C. (См. также , .)
Следует сделать еще одно замечание относительно «не поддающихся вычислению» процессов, возможность существования которых предполагает позиция C. Под этим термином я имею в виду отнюдь не те процессы, которые всего-навсего невычислимы практически. Здесь, конечно же, уместно вспомнить и о том, что, хотя моделирование любого правдоподобного окружения, или же любое точное воспроизведение всех физических и химических процессов, протекающих в мозге, может быть, в принципе, вычислимым, на такое вычисление, скорее всего, понадобится столько времени или такой объем памяти, что вряд ли удастся выполнить его на любом реально существующем или даже вообразимом в ближайшем будущем компьютере. Вероятно, нереально даже написание соответствующей компьютерной программы, если учесть, какое огромное количество различных факторов придется принимать в расчет. Однако сколь бы существенными ни были все эти соображения (а мы еще вернемся к ним в , Q8 и ), они не имеют никакого отношения к тому, что называю «невычислимостью» я (и чего требует C). Под «невычислимостью» я подразумеваю принципиальную невозможность вычисления в том смысле, который мы очень скоро обсудим. Вычисления, которые просто выходят за рамки существующих (или вообразимых) компьютеров или имеющихся в нашем распоряжении вычислительных методов, формально все равно остаются «вычислениями».
Читатель имеет полное право спросить: если ничего, что можно счесть «невычислимым», не обнаруживается ни в случайности, ни во влиянии окружения, ни в банальном несоответствии уровня сложности феномена нашим техническим возможностям, то что вообще я имею в виду, говоря «чего требует C»? В общем случае, это некий вид математически точной активности, невычислимость которой можно доказать. Насколько нам на данный момент известно, при описании физического поведения в подобной математической активности необходимости не возникает. Тем не менее, логически она возможна. Более того, она представляет собой нечто большее, нежели просто логическую возможность. Согласно приводимой далее в книге аргументации, возможность активности подобного общего характера прямо подразумевается физическими законами, несмотря на то, что ни с чем подобным в известной физике мы еще не встречались. Некоторые примеры такой математической активности замечательно просты, поэтому представляется вполне уместным проиллюстрировать с их помощью то, о чем я здесь говорю.
Начать мне придется с описания нескольких примеров классов хорошо структурированных математических задач, не имеющих общего численного решения (ниже я поясню, в каком именно смысле). Начав с любого из таких классов задач, можно построить «игрушечную» модель физической вселенной, активность которой (даже будучи полностью детерминированной) фактически не поддается численному моделированию.
Первый пример такого класса задач знаменит более остальных и известен под названием «десятая проблема Гильберта». Эта задача была предложена великим немецким математиком Давидом Гильбертом в 1900 году в составе этакого перечня нерешенных на тот момент математических проблем, которые по большей части определили дальнейшее развитие математики в начале (да и в конце) двадцатого века. Суть десятой проблемы Гильберта заключалась в отыскании вычислительной процедуры, на основании которой можно было бы определить, имеют ли уравнения, составляющие данную систему диофантовых уравнений, хотя бы одно общее решение.
Диофантовыми называются полиномиальные уравнения с каким угодно количеством переменных, все коэффициенты и все решения которых должны быть целыми числами. (Целые числа — это числа, не имеющие дробной части, например: …, -3, -2, -1, 0, 1, 2, 3, 4, …. Первым такие уравнения систематизировал и изучил греческий математик Диофант в третьем веке нашей эры.) Ниже приводится пример системы диофантовых уравнений:
6ω + 2x 2 - y 3 = 0, 5xy - z 2 + 6 = 0, ω 2 - ω + 2x - y + z - 4 = 0
Вот еще один пример:
6ω + 2x 2 - y 3 = 0, 5xy - z 2 + 6 = 0, ω 2 - ω + 2x - y + z - 3 = 0 .
Решением первой системы является, в частности, следующее:
ω = 1, x = l, у = 2, z = 4,
тогда как вторая система вообще не имеет решения (судя по первому уравнению, число у должно быть четным, судя по второму уравнению, число z также должно быть четным, однако это противоречит третьему уравнению, причем при любом ω, поскольку значение разности ω2 - ω — это всегда четное число, а число 3 нечетно). Задача, поставленная Гильбертом, заключалась в отыскании математической процедуры (или алгоритма), позволяющей определить, какие системы диофантовых уравнений имеют решения (наш первый пример), а какие нет (второй пример). Вспомним (см. ). что алгоритм — это всего лишь вычислительная процедура, действие некоторой машины Тьюринга. Таким образом, решением десятой проблемы Гильберта является некая вычислительная процедура, позволяющая определить, когда система диофантовых уравнений имеет решение.
Десятая проблема Гильберта имеет очень важное историческое значение, поскольку, сформулировав ее, Гильберт поднял вопрос, который ранее не поднимался. Каков точный математический смысл словосочетания «алгоритмическое решение для класса задач»? Если точно, то что это вообще такое — «алгоритм»? Именно этот вопрос привел в 1936 году Алана Тьюринга к его собственному определению понятия «алгоритм», основанному на изобретенных им машинах. Примерно в то же время другие математики (Черч, Клин, Гёдель, Пост и др.; см. []) предложили несколько иные процедуры. Как вскоре было показано, все эти процедуры оказались эквивалентными либо определению Тьюринга, либо определению Черча, хотя особый подход Тьюринга приобрел все же наибольшее влияние. (Только Тьюрингу пришла в голову идея специфической и всеобъемлющей алгоритмической машины, — названной универсальной машиной Тьюринга, — которая способна самостоятельно выполнить абсолютно любое алгоритмическое действие. Именно эта идея привела впоследствии к созданию концепции универсального компьютера, который сегодня так хорошо нам знаком.) Тьюрингу удалось показать, что существуют определенные классы задач, которые не имеют алгоритмического решения (в частности, «проблема остановки», о которой я расскажу ниже). Однако самой десятой проблеме Гильберта пришлось ждать своего решения до 1970 года, когда русский математик Юрий Матиясевич (представив доказательства, ставшие логическим завершением некоторых соображений, выдвинутых ранее американскими математиками Джулией Робинсон, Мартином Дэвисом и Хилари Патнэмом) показал невозможность создания компьютерной программы (или алгоритма), способной систематически определять, имеет ли решение та или иная система диофантовых уравнений. (См. [] и [], глава 6, где приводится весьма занимательное изложение этой истории.) Заметим, что в случае утвердительного ответа (т.е. когда система имеет-таки решение), этот факт, в принципе, можно констатировать с помощью особой компьютерной программы, которая самым тривиальным образом проверяет один за другим все возможные наборы целых чисел. Сколько-нибудь систематической обработке не поддается именно случай отсутствия решения. Можно, конечно, создать различные совокупности правил, которые корректно определяли бы, когда система не имеет решения (наподобие приведенного выше рассуждения с использованием четных и нечетных чисел, исключающего возможность решения второй системы), однако, как показывает теорема Матиясевича, список таких совокупностей никогда не будет полным.
Еще одним примером класса вполне структурированных математических задач, не имеющих алгоритмического решения, является задача о замощении. Она формулируется следующим образом: дан набор многоугольников, требуется определить, покрывают ли они плоскость; иными словами, возможно ли покрыть всю евклидову плоскость только этими многоугольниками без зазоров и наложений? В 1966 году американский математик Роберт Бергер показал (причем эффективно), что эта задача вычислительными средствами неразрешима. В основу его доводов легло обобщение одной из работ американского математика китайского происхождения Хао Вана, опубликованной в 1961 году (см. []). Надо сказать, что в моей формулировке задача оказывается несколько более громоздкой, чем хотелось бы, так как многоугольные плитки описываются в общем случае с помощью вещественных чисел (чисел, выражаемых в виде бесконечных десятичных дробей), тогда как обычные алгоритмы способны оперировать только целыми числами. От этого неудобства можно избавиться, если в качестве рассматриваемых многоугольников выбрать плитки, состоящие из нескольких квадратов, примыкающих один к другому сторонами. Такие плитки называются полиомино (см. []; [], глава 13; []). На рис. показаны некоторые плитки полиомино и примеры замощений ими плоскости. (Другие примеры замощений плоскости наборами плиток см. в НРК, с. 133-137, рис. 4.6-4.12.) Любопытно, что вычислительная неразрешимость задачи о замощении связана с существованием наборов полиомино, называемых апериодическими; такие наборы покрывают плоскость исключительно апериодически (т.е. так, что никакой участок законченного узора нигде не повторяется, независимо от площади покрытой плиткой плоскости). На рис. представлен апериодический набор из трех полиомино (полученный из набора, обнаруженного Робертом Амманом в 1977 году; см. [], рис. 10.4.11-10.4.13 на с. 555-556).
Математические доказательства неразрешимости с помощью вычислительных методов десятой проблемы Гильберта и задачи о замощении весьма сложны, и я, разумеется, не стану и пытаться приводить их здесь. Центральное место в каждом из этих доказательств отводится, в сущности, тому, чтобы показать, каким образом можно запрограммировать машину Тьюринга на решение задачи о диофантовых уравнениях или задачи о замощении. В результате все сводится к вопросу, который Тьюринг рассматривал еще в своем первоначальном исследовании: к вычислительной неразрешимости проблемы остановки — проблемы определения ситуаций, в которых работа машины Тьюринга не может завершиться. В мы приведем несколько примеров явных вычислительных процедур, которые принципиально не могут завершиться, а в будет представлено достаточно простое доказательство — основанное, по большей части, на оригинальном доказательстве Тьюринга, — которое, помимо прочего, показывает, что проблема остановки действительно неразрешима вычислительными методами. (Что же касается следствий из того самого «прочего», ради которого, собственно, и затевалось упомянутое доказательство, то на них, в сущности, построены рассуждения всей первой части книги.)
Рис. 1.2. Плитки полиомино и замощения ими бесконечной евклидовой плоскости (допускается использование зеркально отраженных плиток). Если брать полиомино из набора (с) по отдельности, то ни одно из них не покроет всю плоскость.
Рис. 1.З. Набор из трех полиомино, покрывающий плоскость апериодически (получен из набора Роберта Аммана).
Каким же образом можно применить такой класс задач, как задачи о диофантовых уравнениях или задачи о замощении, к созданию «игрушечной» вселенной, которая, будучи детерминированной, является, тем не менее, невычислимой? Допустим, что в нашей модели вселенной течет дискретное время, параметризованное натуральными (т.е. целыми неотрицательными) числами 0, 1, 2, 3, 4, …. Предположим, что в некий момент времени n состояние вселенной точно определяется одной задачей из рассматриваемого класса, скажем, набором полиомино. Необходимо установить два вполне определенных правила относительно того, какой из наборов полиомино будет представлять состояние вселенной в момент времени n + 1 при заданном наборе полиомино для состояния вселенной в момент времени n, причем первое из этих правил применяется в том случае, если полиомино покрывают всю плоскость без зазоров и наложений, а второе — если это не так. То, как именно будут выглядеть подобные правила, не имеет в данном случае особого значения. Можно составить список S0, S1, S2, S3, S4, S5, … всех возможных наборов полиомино таким образом, чтобы наборы, содержащие в общей сложности четное число квадратов, имели бы четные индексы S0, S2, S4, S6, …, а наборы с нечетным количеством квадратов — нечетные индексы S1, S3, S5, S7, …. (Составление такого списка не представляет особой сложности; нужно лишь подобрать соответствующую вычислительную процедуру.) Итак, «динамическая эволюция» нашей игрушечной вселенной задается теперь следующим условием:
Из состояния S n в момент времени t вселенная переходит в момент времени t + 1 в состояние S n +1 , если набор полиомино S n покрывает плоскость, и в состояние S n+2 , если набор S n не покрывает плоскость.
Поведение такой вселенной полностью детерминировано, однако поскольку в нашем распоряжении нет общей вычислительной процедуры, позволяющей установить, какой из наборов полиомино Sn покрывает плоскость (причем это верно и тогда, когда общее число квадратов постоянно, независимо от того, четное оно или нет), то невозможно и численное моделирование ее реального развития. (См. рис. .)
Рис. 1.4. Невычислимая модель «игрушечной» вселенной. Различные состояния этой детерминированной, но невычислимой вселенной даны в виде возможных конечных наборов полиомино, пронумерованных таким образом, что четные индексы S n соответствуют четному общему количеству квадратов в наборе, а нечетные индексы — нечетному количеству квадратов. Временная эволюция происходит в порядке увеличения индекса ( S 0 , S 2 , S 3 , S 4 , …, S 278 , S 280 , …), при этом индекс пропускается, когда предыдущий набор оказывается не в состоянии замостить плоскость.
Безусловно, такую схему нельзя воспринимать хоть сколько-нибудь всерьез — она ни в коем случае не моделирует реальную вселенную, в которой все мы живем. Эта схема приводится здесь (как, собственно, и в НРК, с. 170) для иллюстрации того часто недооцениваемого факта, что между детерминизмом и вычислимостью существует вполне определенная разница. Некоторые полностью детерминированные модели вселенной с четкими законами эволюции невозможно реализовать вычислительными средствами. Вообще говоря, как мы убедимся в , только что рассмотренные мною весьма специфические модели не совсем отвечают реальным требованиям точки зрения C. Что же касается тех феноменов, которые отвечают-таки этим самым реальным требованиям, и некоторых связанных с упомянутыми феноменами поразительных физических возможностях, то о них мы поговорим в .
1.10. Завтрашний день
Так какого же будущего для этой планеты нам следует ожидать согласно точкам зрения A, B, C, D? Если верить A, то настанет время, когда соответствующим образом запрограммированные суперкомпьютеры догонят — а затем и перегонят — человека во всех его интеллектуальных достижениях. Конечно же, сторонники A придерживаются различных взглядов относительно необходимого для этого времени. Некоторые вполне разумно полагают, что пройдет еще много столетий, прежде чем компьютеры достигнут уровня человека, принимая во внимание крайнюю скудость современного понимания реально выполняемых мозгом вычислений (так они говорят), обусловливающих ту тонкость поведения, какую, несомненно, демонстрирует человек, — тонкость, без которой, конечно же, нельзя говорить о каком бы то ни было «пробуждении сознания». Другие утверждают, что времени понадобится значительно меньше. В частности, Ханс Моравек в своей книге «Дети разума» [] приводит вполне аргументированное доказательство (основанное на непрерывно ускоряющемся развитии компьютерных технологий за последние пятьдесят лет и на своей оценке той доли от всего объема функциональной активности мозга, которая на сегодняшний день уже успешно моделируется численными методами) в поддержку своего утверждения, будто уровень «эквивалентности человеку» будет преодолен уже к 2030 году. (Кое-кто утверждает, что это время будет еще короче, а кто-то даже уверен, что предсказанная дата достижения эквивалентности человеку уже осталась в прошлом!) Однако чтобы читатель не очень пугался того, что менее чем через сорок (или около того) лет компьютеры во всем его превзойдут, горькая пилюля подслащена одной радужной надеждой (подаваемой под видом гарантированного обещания): все мы сможем тогда перенести свои «ментальные программы» в сверкающие металлические (или пластиковые) корпуса роботов (конкретную модель, разумеется, каждый выберет себе сам), чем и обеспечим себе что-то вроде бессмертия [, ].
А вот для сторонников точки зрения B подобный оптимизм — непозволительная роскошь. Они вполне согласны с приверженцами A относительно перспектив развития интеллектуальных способностей компьютеров — с той лишь оговоркой, что речь при этом идет исключительно о внешних проявлениях этих самых способностей. Для управления роботом необходимо и достаточно располагать адекватной моделью деятельности человеческого мозга, больше ничего не требуется (рис. ). Согласно B, вопрос о том, способно ли подобное моделирование вызвать осмысленное осознание, не имеет никакого отношения к реальному поведению робота. На достижение необходимого для такого моделирования технологического уровня может уйти как несколько веков, так и менее сорока лет. Однако, как уверяют сторонники B, рано или поздно, а это все-таки произойдет. Тогда же компьютеры достигнут уровня «эквивалентности человеку», а затем, как можно ожидать, и уверенно превзойдут его, оставив без внимания все потуги нашего относительно слабого мозга хоть немного этот уровень приподнять. Причем возможности «подключения» к управляемым роботам у нас в этом случае не будет, и, похоже, придется примириться с тем, что нашей планетой, в конечном итоге, будут править абсолютно бесчувственные машины! Мне представляется, что из всех точек зрения A, B, C и D именно B предлагает самый пессимистичный взгляд на будущее нашей планеты — вопреки, казалось бы, тому факту, что именно она лучше всего соотносится с так называемым «здравым смыслом».
Рис. 1.5. Согласно точке зрения B , компьютерное моделирование деятельности самосознающего человеческого мозга, в принципе, возможно; поэтому, в конечном итоге, управляемые компьютером роботы смогут догнать — а затем и значительно обогнать — человека во всех его интеллектуальных достижениях.
Если же верить C или D, то можно ожидать, что компьютеры навсегда сохранят подчиненное по отношению к человеку положение — какими бы быстрыми, мощными или алгоритмически совершенными они ни стали. При этом точка зрения C не отрицает возможности будущих научных разработок, которые могут привести к созданию неких устройств, принцип действия которых не будет иметь ничего общего с компьютерами в их сегодняшнем понимании, а будет основан на той самой невычислимой физической активности, которая, согласно C, обусловливает наше собственное сознательное мышление, — устройств, которые окажутся способны вместить в себя реальные разум и сознание. Быть может, в конечном итоге именно такие устройства, а вовсе не те машины, которые мы называем «компьютерами», и превзойдут человека в интеллектуальном отношении. Что ж, не исключено; однако подобные умозрительные прогнозы представляются мне в настоящий момент крайне преждевременными, поскольку мы практически не обладаем необходимыми для таких исследований научными познаниями, не говоря уже о каких бы то ни было технологических решениях. К этому вопросу мы еще вернемся во второй части книги ().
1.11. Обладают ли компьютеры правами и несут ли ответственность?
С некоторых пор умы теоретиков от юриспруденции начал занимать один вопрос, имеющий самое непосредственное отношение к теме нашего разговора, но в некотором смысле более практический. Суть его заключается в следующем: не предстоит ли нам в не столь отдаленном будущем задуматься над тем, обладают ли компьютеры законными правами и несут ли они ответственность за свои действия. В самом деле, если со временем компьютеры смогут достичь уровня человека (а то и превзойти его) в самых разных областях деятельности, то подобные вопросы неминуемо должны приобрести определенную значимость. Если придерживаться точки зрения A, то следует, очевидно, признать, что компьютеры (или управляемые компьютером роботы) должны потенциально и обладать правами, и нести ответственность. Ибо, согласно этой точке зрения, между человеком и роботом достаточно высокого уровня сложности нет существенной разницы, за исключением такой «мелочи», как различие в материальном строении. Однако приверженцам точки зрения B ситуация представляется несколько более запутанной. Разумно утверждать, что вопрос о правах или ответственности уместен для созданий, наделенных способностью чувствовать, т.е. испытывать определенные, подлинно душевные «ощущения» — такие, как страдание, гнев, мстительность, злоба, вера (религиозная и общечеловеческая), желание, сомнение, понимание или страсть. Согласно B, управляемый компьютером робот не обладает такой способностью, вследствие чего, на мой взгляд, не может ни обладать правами, ни нести ответственность. С другой стороны, если верить B, не существует эффективного способа определить, что упомянутая способность у робота действительно отсутствует, поэтому если роботы смогут достаточно правдоподобно имитировать поведение человека, то человек может оказаться в весьма затруднительном положении.
Подобного затруднения, по всей видимости, не возникнет у сторонников точки зрения C (а также, возможно, D) поскольку, согласно этим точкам зрения, компьютеры не в состоянии убедительно демонстрировать душевные переживания и, уж конечно же, ничего похожего не чувствуют и чувствовать никогда не будут. Соответственно, компьютеры не могут ни обладать правами, ни нести ответственность. Лично мне такая точка зрения представляется весьма разумной. Вообще в этой книге я выступаю как серьезный противник позиций A и B. Согласившись с моими аргументами, юристы, безусловно, существенно упростят себе жизнь: как таковые компьютеры или управляемые компьютерами роботы ни при каких обстоятельствах не обладают правами и не несут ответственности. Нельзя обвинить компьютеры в каких бы то ни было неприятностях или недоразумениях — виновен всегда человек!
Следует, однако, понимать, что вышеприведенные аргументы могут и не относиться к всевозможным гипотетическим «устройствам», подобным упомянутым выше — тем, что смогут в конечном итоге воплотить в себе принципы новой, невычислительной физики. Но поскольку перспектива появления таких устройств — если их вообще удастся создать — весьма туманна, возникновения связанных с ними юридических проблем в ближайшем будущем ожидать не приходится.
Проблема «ответственности» поднимает глубокие философские вопросы, связанные с основными факторами, обусловливающими наше поведение. Можно вполне обоснованно утверждать, что каждое наше действие так или иначе определяется наследственностью и окружением, а то и всевозможными случайностями, непрерывно влияющими на нашу жизнь. Но ведь ни одно из этих воздействий никак не зависит лично от нас, почему же мы должны нести за них ответственность? Является ли понятие «ответственности» лишь терминологической условностью, или дело в чем-то еще? Возможно, и впрямь существует некая «самость» — нечто, стоящее «выше» уровня подобных влияний и определяющее, в конечном счете, наши действия? В юридическом смысле понятие «ответственности» явно подразумевает, что внутри каждого из нас и в самом деле существует своего рода независимая «самость», наделенная своей собственной ответственностью — и, по определению, правами, — причем ее проявления нельзя объяснить ни наследственностью, ни окружением, ни случайностью. Если же присутствие в нашей речи такой независимой «самости» не просто языковая условность, то в современных физических представлениях недостает чего-то весьма существенного. Открытие этого недостающего ингредиента, несомненно, многое изменит в нашем научном мировоззрении.
Хотя книга, которую вы держите в руках, и не дает исчерпывающего ответа на эти серьезные вопросы, она, как я полагаю, может чуть приоткрыть дверь, отделяющую нас от него, — не больше, но и не меньше. Вы не найдете здесь неопровержимых доказательств непременного существования такой «самости», проявления которой нельзя объяснить никакой внешней причиной, вам лишь предложат несколько шире взглянуть на саму природу возможных «причин». «Причина» может оказаться невычислимой — на практике или в принципе. Я намерен показать, что если упомянутая «причина» так или иначе порождается нашими сознательными действиями, то она должна быть весьма тонкой, безусловно невычислимой и не имеющей ничего общего ни с хаосом, ни с прочими чисто случайными воздействиями. Сможет ли такая концепция «причины» приблизить нас к пониманию истинной сущности свободы воли (или иллюзорности такой свободы) — вопрос будущего.
1.12. «Осознание», «понимание», «сознание», «интеллект»
До сих пор я не ставил перед собой задачи точно определить те неуловимые концепции, что так или иначе связаны с проблемой «разума». Формулируя положения A, B, C и D в , я несколько туманно упоминал об «осознании», других же свойств мышления мы пока не касались. Думаю, что следует хотя бы попытаться прояснить используемую здесь и далее терминологию — особенно в отношении таких понятий, как «понимание», «сознание» и «интеллект», играющих весьма существенную роль в наших рассуждениях.
Хотя я не вижу особой необходимости пытаться дать непременно полные определения, некоторые комментарии относительно моей собственной терминологии представляются все же уместными. Я часто с некоторым замешательством обнаруживаю, что употребление всех этих слов, столь очевидное для меня, не совпадает с тем, что полагают естественным другие. Например, термин «понимание», на мой взгляд, безусловно подразумевает, что истинное обладание этим свойством требует некоторого элемента осознания. Не осознав сути того или иного суждения, мы, разумеется, не можем претендовать на истинное понимание этого самого суждения. По крайней мере, я уверен, что эти слова следует понимать именно так, хотя провозвестники ИИ, похоже, со мною не согласны и используют термины «понимание» и «осознание» в некоторых контекстах так, что первое никоим образом не предполагает непременного наличия второго. Некоторые из них (принадлежащие к категории A или B) полагают, что управляемый компьютером робот «понимает», в чем заключаются его инструкции, однако при этом никто и не заикается о том, что робот свои инструкции действительно «осознает». Мне кажется, что здесь перед нами всего-навсего неверное употребление термина «понимание», пусть даже одно из тех, что обладают подлинной эвристической ценностью для описания функционирования компьютера. Когда мне потребуется указать на то, что термин «понимание» используется не в таком эвристическом смысле — т.е. при описании деятельности, для которой действительно необходимо осознание, — я буду использовать сочетание «подлинное понимание».
Кое-кто, разумеется, может заявить, что между этими двумя случаями употребления слова «понимание» нет четкого различия. Если это так, то сама концепция осознания также не имеет точного определения. С этим, конечно, не поспоришь; однако у меня нет никаких сомнений в том, что осознание действительно представляет собой некоторую сущность, причем эта сущность может как наличествовать, так и отсутствовать, — по крайней мере, до некоторой степени. Если согласиться с тем, что осознание представляет-таки собой некоторую сущность, то вполне естественно будет согласиться и с тем, что эта сущность должна являться неотъемлемой частью всякого подлинного понимания. Это утверждение, кстати, не отрицает возможности того, что «сущность», которой является осознание, окажется в действительности результатом чисто вычислительной деятельности в полном соответствии с точкой зрения A.
Я также полагаю, что термин «интеллект» следует употреблять исключительно в связи с пониманием. Некоторые же теоретики от ИИ берутся утверждать, что их робот вполне может обладать «интеллектом», не испытывая при этом никакой необходимости в действительном «понимании» чего-либо. Термин «искусственный интеллект» предполагает возможность осуществления разумной вычислительной деятельности, и, вместе с тем, многие полагают, что разрабатываемый ими ИИ замечательно обойдется без подлинного понимания — и, как следствие, осознания. На мой взгляд, словосочетание «интеллект без понимания» есть лишь результат неверного употребления терминов. Следует, впрочем, отметить, что иногда что-то вроде частичного моделирования подлинного интеллекта без какого бы то ни было реального понимания оказывается до определенной степени возможным. (В самом деле, не так уж редко встречаются человеческие существа, способные на некоторое время одурачить нас демонстрацией какого-никакого понимания, хотя, как в конце концов выясняется, оно им в принципе не свойственно!) Между подлинным интеллектом (или подлинным пониманием) и любой деятельностью, моделируемой исключительно вычислительными методами, действительно существует четкое различие; это утверждение является одним из важнейших положений моих дальнейших рассуждений. Согласно моей терминологии, обладание подлинным интеллектом непременно предполагает присутствие подлинного понимания. То есть, употребляя термин «интеллект» (особенно в сочетании с прилагательным «подлинный»), я тем самым подразумеваю наличие некоторого действительного осознания.
Лично мне такая терминология кажется совершенно естественной, однако многие поборники ИИ (во всяком случае те из них, кто не поддерживает точку зрения A) станут решительно отрицать всякую свою причастность к попыткам реализации искусственного «осознания», хотя конечной их целью является, судя по названию, не что иное, как искусственный «интеллект». Они, пожалуй, оправдаются тем, что они (в полном согласии с B) всего лишь моделируют интеллект — такая модель не требует действительного понимания или осознания, — а вовсе не пытаются создать то, что я называю подлинным интеллектом. Вероятно, они будут уверять вас, что не видят никакой разницы между подлинным интеллектом и его моделью, что вполне отвечает точке зрения A. В своих дальнейших рассуждениях я, в частности, намерен показать, что некоторые аспекты «подлинного понимания» действительно невозможно воссоздать путем каких бы то ни было вычислений. Следовательно, должно существовать и различие между подлинным интеллектом и любой попыткой его достоверного численного моделирования.
Я, разумеется, не даю определений ни «интеллекту», ни «пониманию», ни, наконец, «осознанию». Я полагаю в высшей степени неблагоразумным пытаться дать в рамках данной книги полное определение хотя бы одному из упомянутых понятий. Нам придется до некоторой степени положиться на свое интуитивное восприятие действительного смысла этих слов. Если интуиция подсказывает нам, что «понимание» есть нечто, необходимое для «интеллекта», то любое доказательство невычислительной природы «понимания» автоматически доказывает и невычислительную природу «интеллекта». Более того, если «пониманию» непременно должно предшествовать «осознание», то невычислительное физическое обоснование феномена осознания вполне в состоянии объяснить и аналогичную невычислительную природу «понимания». Итак, мое употребление этих терминов (в сущности совпадающее, как я полагаю, с общеупотребительным) сводится к двум положениям:
а) «интеллект» требует «понимания»
и
б) «понимание» требует «осознания».
Осознание я воспринимаю как один из аспектов — пассивный — феномена сознания. У сознания имеется и активный аспект, а именно — свободная воля. Полного определения слова «сознание» здесь также не дается (и, уж конечно же, не мне определять, что есть «свободная воля»), хотя мои аргументы имеют целью окончательное объяснение феномена сознания в научных, но невычислительных терминах — как того требует точка зрения C. Не претендую я и на то, что мне удалось преодолеть хоть сколько-нибудь значительное расстояние на пути к этой цели, однако надеюсь, что представленная в этой книге (равно как и в НРК) аргументация расставит вдоль этого пути несколько полезных указателей для идущих следом — а может, станет и чем-то большим. Мне кажется, что, пытаясь на данном этапе дать слишком точное определение термину «сознание», мы рискуем упустить ту самую концепцию, какую хотим изловить. Поэтому вместо поспешного и наверняка неадекватного определения я приведу лишь несколько комментариев описательного характера относительно моего собственного употребления термина «сознание». В остальном же нам придется положиться на интуитивное понимание смысла этого термина.
Все это вовсе не означает, что я полагаю, будто мы действительно «интуитивно знаем», чем на самом деле «является» сознание; я лишь хочу сказать, что такое понятие существует, а мы, по мере сил, пытаемся его постичь — причем за понятием стоит некий реально существующий феномен, который допускает научное описание и играет в физическом мире как пассивную, так и активную роль. Некоторые, судя по всему, полагают, что данная концепция слишком туманна, чтобы заслуживать серьезного изучения. Однако при этом те же люди часто и с удовольствием рассуждают о «разуме», полагая, очевидно, что это понятие определено гораздо точнее. Общепринятое употребление слова «разум» предполагает разделение этого самого разума (возможное или реальное) на так называемые «сознательную» и «бессознательную» составляющие. На мой взгляд, концепция бессознательного разума представляется еще более невразумительной, нежели концепция разума сознательного. Я и сам нередко пользуюсь словом «разум», однако не пытаюсь при этом дать его точное определение. В нашей последующей дискуссии (достаточно строгой, надеюсь) концепция «разума» — за исключением той ее части, что уже нашла свое воплощение в термине «сознание», — не будет играть центральной роли.
Что же я имею в виду, говоря о сознании? Как уже отмечалось ранее, сознание обладает активным и пассивным аспектами, однако различие между ними далеко не всегда четко определено. Восприятие, скажем, красного цвета требует несомненно пассивного сознания, равно как и ощущение боли либо восхищение музыкальным произведением. Активное же сознание участвует в сознательных действиях — таких, например, как подъем с кровати или, напротив, намеренное решение воздержаться от какой-либо энергичной деятельности. При воссоздании в памяти каких-то прошедших событий оказываются задействованы как пассивный, так и активный аспекты сознания. Составление плана будущих действий также обычно требует участия сознания — и активного, и пассивного; и, надо полагать, какое-никакое сознание необходимо для умственной деятельности, которую общепринято описывать словом «понимание». Более того, мы остаемся, в определенном смысле, в сознании (пассивный аспект), даже когда спим, если при этом нам снится сон (в процессе же пробуждения может принимать участие и активный аспект сознания).
У кого-то могут найтись возражения против того, что все эти разнообразные проявления сознания следует загонять в тесные рамки какой-то одной — пусть и всеобъемлющей — концепции. Можно, например, указать на то, что для описания феномена сознания необходимо принимать во внимание множество самых разных концепций, не ограничиваясь простым разделением на «активное» и «пассивное», а также и то, что реально существует огромное количество различных психических признаков, каждый из которых имеет определенное отношение к тому или иному свойству мышления. Соответственно, применение ко всем этим свойствам общего термина «сознание» представляется, в лучшем случае, бесполезным. Мне все же думается, что должна существовать некая единая концепция «сознания», центральная для всех отдельных аспектов мыслительной деятельности. Говоря о разделении сознания на пассивный и активный аспекты (иногда четко отличимые один от другого, причем пассивный аспект связан с ощущениями (или qualia), а активный — с проявлениями «свободной воли»), я считаю их двумя сторонами одной монеты.
В первой части книги меня будет занимать, главным образом, вопрос о том, чего можно достичь, используя свойство мышления, известное как «понимание». Хотя я не даю здесь определения термину «понимание», надеюсь все же прояснить его смысл в достаточной мере для того, чтобы убедить читателя в том, что обозначаемое этим термином свойство — чем бы оно ни оказалось — ив самом деле должно быть неотъемлемой частью мыслительной деятельности, которая необходима, скажем, для признания справедливости рассуждений, составляющих . Я намерен показать, что восприятие этих рассуждений должно быть связано с какими-то принципиально невычислимыми процессами. Мое доказательство не затрагивает столь непосредственно другие свойства мыслительной деятельности («интеллект», «осознание», «сознание» или «разум»), однако оно имеет определенное отношение и к этим концепциям, поскольку, в соответствии с той терминологией «от здравого смысла», о которой я упоминал выше, осознание непременно должно быть существенным компонентом понимания, а понимание — являться неотъемлемой частью любого подлинного интеллекта.
1.13. Доказательство Джона Серла
Прежде чем представить свое собственное рассуждение, хотелось бы упомянуть о совсем иной линии доказательства — знаменитой «китайской комнате» философа Джона Серла — главным образом для того, чтобы подчеркнуть существенное отличие от нее моего доказательства как по общему характеру, так и по базовым концепциям. Доказательство Серла тоже связано с проблемой «понимания» и имеет целью выяснить, можно ли утверждать, что функционирование достаточно сложного компьютера реализует это свойство мышления. Я не буду повторять здесь рассуждение Серла во всех подробностях, а лишь кратко обозначу его суть.
Дана некая компьютерная программа, которая демонстрирует имитацию «понимания», отвечая на вопросы о какой-то рассказанной ей предварительно истории, причем все вопросы и ответы даются на китайском языке. Далее Серл рассматривает не владеющего китайским языком человека, который старательно воспроизводит все до единой вычислительные операции, выполняемые в процессе имитации компьютером. Когда вычисления выполняет компьютер, получаемые на его выходе данные создают некоторую видимость понимания; когда же все необходимые вычисления посредством соответствующих манипуляций воспроизводит человек, какого-либо понимания в действительности не возникает. На этом основании Серл утверждает, что понимание как свойство мышления не может сводиться исключительно к вычислениям — хотя человек (не знающий китайского) и воспроизводит каждую вычислительную операцию, выполняемую компьютером, он все же совершенно не понимает смысла рассказанной истории. Серл допускает, что возможно осуществить моделирование получаемых на выходе результатов понимания (в полном соответствии с точкой зрения B), поскольку он полагает, что это вполне достижимо посредством компьютерного моделирования всей физической активности мозга (чем бы мозг при этом ни занимался) в тот момент, когда его владелец вдруг что-либо понимает. Однако главный вывод из «китайской комнаты» Джона Серла заключается в том, что сама по себе модель в принципе не способна действительно «ощутить» понимание. То есть для любой компьютерной модели подлинное понимание остается, в сущности, недостижимым.
Доказательство Серла направлено против точки зрения A (согласно которой любая «модель» понимания эквивалентна «подлинному» пониманию) и, по замыслу автора, в поддержку точки зрения B (хотя в той же мере оно поддерживает и C или D). Оно имеет дело с пассивным, обращенным внутрь, или субъективным аспектами понимания, однако при этом не отрицает возможности моделирования понимания в его активном, обращенном наружу, или объективном аспектах. Сам Серл однажды заявил: «Несомненно, мозг — это цифровой компьютер. Раз кругом одни цифровые компьютеры, значит, и мозг должен быть одним из них». Отсюда можно заключить, что Серл готов принять возможность полного моделирования работы обладающего сознанием мозга в процессе «понимания», результатом которого оказалась бы полная тождественность внешних проявлений модели и внешних проявлений действительно мыслящего человеческого существа, что соответствует точке зрения B. Мое же исследование призвано показать, что одними лишь внешними проявлениями «понимание» отнюдь не ограничивается, в связи с чем я утверждаю, что невозможно построить достоверную компьютерную модель даже внешних проявлений понимания. Я не привожу здесь аргументацию Серла в подробностях, поскольку точку зрения C она напрямую не поддерживает (а целью всех наших дискуссий здесь является как раз поддержка C и ничто иное). Тем не менее, следует отметить, что концепция «китайской комнаты» предоставляет, на мой взгляд, достаточно убедительный аргумент против A, хоть я и не считаю этот аргумент решающим. Более подробное изложение и различные контраргументы представлены в [], обсуждение — там же и в []; см. также [] и []. Мою оценку можно найти в НРК, с. 17-23.
1.14. Некоторые проблемы вычислительной модели
Прежде чем перейти к вопросам, отражающим специфические отличия точки зрения C от A и B, рассмотрим некоторые другие трудности, с которыми непременно сталкивается любая попытка объяснить феномен сознания в соответствии с точкой зрения A. Согласно A, для возникновения осознания необходимо лишь простое «выполнение» или воспроизведение надлежащих алгоритмов. Что же это означает в действительности? Следует ли под «воспроизведением» понимать, что в соответствии с последовательными шагами алгоритма должны перемещаться с места на место некие физические материальные объекты? Предположим, что эти последовательные шаги записываются строка за строкой в огромную книгу. Являются ли «воспроизведением» действия, посредством которых осуществляется запись или печать этих строк? Достаточно ли для осознания одного лишь статического существования такой книги? А если просто водить пальцем от строчки к строчке — можно ли это считать «воспроизведением»? Или если водить пальцем по символам, набранным шрифтом Брайля? А если проецировать страницы книги одну за другой на экран? Является ли воспроизведением простое представление последовательных шагов алгоритма? С другой стороны, необходимо ли, чтобы кто-нибудь проверял, на самом ли деле каждая последующая линия надлежащим образом следует из предыдущей (в соответствии с правилами рассматриваемого алгоритма)? Последнее предположение способно, по крайней мере, разрешить все наши сомнения, поскольку данный процесс должен, по всей видимости, обходиться без участия (сознательного) каких бы то ни было ассистентов. И все же нет совершенно никакой ясности относительно того, какие именно физические действия следует считать действительными исполнителями алгоритма осознания. Быть может, подобные действия не требуются вовсе, и можно, не противореча точке зрения A, утверждать, что для возникновения «осознания» вполне достаточно одного лишь теоретического математического существования соответствующего алгоритма (см. ).
Как бы то ни было, можно предположить, что, даже согласно A, далеко не всякий сложный алгоритм может обусловить возникновение осознания (ощущения осознания). Наверное, для того, чтобы можно было считать состоявшимся сколько-нибудь заметное осознание, алгоритм, судя по всему, должен обладать некоторыми особенными свойствами — такими, например, как «высокоуровневая организация», «универсальность», «самоотносимость», «алгоритмическая простота/сложность» и тому подобными. Кроме того, донельзя скользким представляется вопрос о том, какие именно свойства алгоритма отвечают в этом случае за различные qualia (ощущения), формирующие осознание. Например, какое конкретно вычисление вызывает ощущение «красного»? Какие вычисления дают ощущения «боли», «сладости», «гармоничности», «едкости» и т.д.? Сторонники A время от времени предпринимают попытки разобраться в подобного рода проблемах (см., например, []), однако пока что эти попытки выглядят весьма и весьма неубедительными.
Более того, любое четко определенное и достаточно простое алгоритмическое предположение (подобное всем тем, что до сих пор выдвигались в соответствующих исследованиях) обладает одним существенным недостатком: этот алгоритм можно без особых усилий реализовать на современном электронном компьютере. А между тем, согласно утверждению автора такого предположения, реализация его алгоритма неизбежно вызывает реальное ощущение того или иного qualium. Мне думается, что даже самому стойкому приверженцу точки зрения A будет сложно всерьез поверить, что такое вычисление — да и вообще любое вычисление, которое можно запустить на современном компьютере, работа которого основывается на современных представлениях об ИИ, — может действительно обусловить мышление хотя бы даже и в самой зачаточной степени. Так что сторонникам подобных предположений остается, по всей видимости, уповать лишь на то, что всеми мыслительными ощущениями мы обязаны не чему иному, как банальной сложности сопровождающих деятельность мозга вычислений (выполняющихся в соответствии с упомянутыми предположениями).
В связи с этим возникает еще несколько проблем, которых, насколько мне известно, всерьез пока не касался никто. Если предположить, что необходимым условием сознательной мыслительной деятельности является, главным образом, огромная сложность «соединений», формирующих в мозге сеть из взаимосвязанных нейронов и синапсов, то придется каким-то образом примириться и с тем, что сознание свойственно не всем отделам головного мозга человека в равной степени. Когда термин «мозг» употребляют без каких-либо уточнений, вполне естественно (по крайней мере, для неспециалиста) представлять себе обширные, покрытые извилинами внешние области, образующие так называемую кору головного мозга, — состоящий из серого вещества наружный слой головного мозга. В коре головного мозга содержится приблизительно сто тысяч миллионов (1011) нейронов, что и в самом деле дает ощутимый простор для формирования структур огромной сложности, однако кора — это еще далеко не весь мозг. В задней нижней части мозга находится еще один весьма важный сгусток спутанных нейронов, известный как мозжечок (см. рис. ). Мозжечок, судя по всему, неким критическим образом связан с процессом выработки двигательных навыков; его действие можно наблюдать, когда человек овладевает тем или иным движением в совершенстве, т.е. когда движение перестает требовать сознательного обдумывания, как не требует обдумывания, скажем, ходьба. Сначала, когда мы еще только учимся какому-то новому навыку, нам необходимо контролировать свои действия сознательно, и этот контроль, по-видимому, требует существенного участия коры головного мозга. Однако впоследствии, по мере того, как необходимые движения становятся «автоматическими», управление ими постепенно переходит к мозжечку и осуществляется, по большей части, бессознательно. Учитывая, что деятельность мозжечка является, по всей видимости, абсолютно бессознательной, весьма примечателен тот факт, что количество нейронов в мозжечке может достигать половины того их количества, что содержится в коре головного мозга. Более того, именно в мозжечке располагаются такие нейроны, как клетки Пуркинье (те самые, что имеют до 80 000 синаптических связей, о чем я уже упоминал в ), так что общее число связей между нейронами в мозжечке может оказаться ничуть не меньше аналогичного числа в головном мозге. Если необходимым условием возникновения сознания считать одну лишь сложность нейронной сети, то неплохо было бы выяснить, почему же сознание никак, на первый взгляд, не проявляется в деятельности мозжечка. (Несколько дополнительных замечаний на эту тему приведены в .)
Рис. 1.6. Количество нейронов и нейронных связей в мозжечке совпадает по порядку величины с количеством нейронов и нейронных связей головного мозга. Если основываться лишь на подсчете нейронов и взаимосвязей между ними, то не совсем ясно, почему же деятельность мозжечка абсолютно бессознательна?
Разумеется, затронутые в этом разделе проблемы, с которыми приходится иметь дело сторонникам точки зрения A, имеют свои аналоги и применительно к точкам зрения B и C. Какой бы научной позиции вы ни придерживались, вам в конечном итоге все равно придется как-то решать вопрос о том, что же лежит в основе феномена сознания и как возникают qualia. В последних параграфах второй части книги я попытаюсь наметить некоторые пути к пониманию сознания с точки зрения C.
1.15. Свидетельствуют ли ограниченные возможности сегодняшнего ИИ в пользу
C
?
Но почему вдруг C? Чем мы реально располагаем, что можно было бы интерпретировать как прямое свидетельство в пользу точки зрения C Представляет ли C действительно сколько-нибудь серьезную альтернативу точкам зрения A, B или даже D? Нам необходимо постараться понять, что именно мы делаем нашим мозгом (или разумом), когда дело доходит до сознательных размышлений; я же попытаюсь убедить читателя в том, что его связанная с сознательным мышлением деятельность весьма отличается (по крайней мере, иногда) от того, что можно реализовать посредством вычислений. Приверженцы точки зрения A, скорее всего, будут утверждать, что мышление осуществляется исключительно посредством «вычислений» в той или иной форме, и никак иначе, — а до тех пор, пока речь идет лишь о внешних проявлениях процесса мышления, с ними согласятся и сторонники B. Что же касается поборников D, то они вполне могли бы согласиться с C в том, что деятельность сознания должна быть феноменом невычислимым, однако при этом они будут напрочь отрицать любую возможность объяснения сознания в научных терминах. Таким образом, для поддержания точки зрения C необходимо найти примеры мыслительной деятельности, не поддающиеся никакому вычислению, и, кроме того, попытаться сообразить, как подобная деятельность может оказаться результатом тех или иных физических процессов. Остаток первой части моей книги будет направлен на достижение первой цели, во второй же части я представлю свои попытки продвинуться по направлению к цели номер два.
Какой же должна быть мыслительная деятельность, чтобы ее невычислимость можно было явственно продемонстрировать? В качестве возможного пути к ответу на этот вопрос можно попытаться рассмотреть современное состояние искусственного интеллекта и постараться понять сильные и слабые стороны систем, управляемых посредством вычислений. Безусловно, сегодняшнее положение дел в области исследований ИИ может и не дать сколько-нибудь четких указаний относительно принципиально возможных достижений будущего. Даже, скажем, через пятьдесят лет ситуация вполне может оказаться совершенно отличной от той, что мы имеем сегодня. Быстрое развитие компьютерных технологий и областей их применения только за последние пятьдесят лет привело к чрезвычайно серьезным переменам. Нам, несомненно, следует быть готовыми к значительным переменам и в дальнейшем — переменам, которые, возможно, произойдут с нами очень и очень скоро. И все же в данной книге меня прежде всего будут интересовать не темпы технического развития, а некоторые фундаментальные и принципиальные ограничения, которым его достижения неминуемо оказываются подвержены. Эти ограничения останутся в силе независимо от того, на сколько веков вперед мы устремим свой взгляд. Таким образом, свою аргументацию нам следует строить исходя из общих принципов, не предаваясь чрезмерным восторгам по поводу тех или иных сегодняшних достижений. Тем не менее, успехи и неудачи современных исследований искусственного интеллекта вполне могут содержать некоторые полезные для нас ключи, несмотря даже на тот факт, что результаты этих исследований демонстрируют на данный момент лишь очень слабое подобие того, что можно было бы назвать действительно убедительным искусственным интеллектом, и это, безусловно, подтвердят даже самые ярые поборники идеи ИИ.
Как ни удивительно, главную неудачу современный искусственный интеллект терпит вовсе не в тех областях, где человеческий разум может вполне самостоятельно продемонстрировать поистине впечатляющую мощь — там, например, где отдельные люди-эксперты способны буквально потрясти всех окружающих какими-то своими специальными познаниями или способностью мгновенно выносить суждения, требующие крайне сложных вычислительных процедур, — а в вещах вполне «обыденных», какие на протяжении большей части своей сознательной жизни проделывают самые заурядные из представителей рода человеческого. Пока что ни один управляемый компьютером робот не может соперничать даже с малым ребенком в таком, например, простейшем деле, как сообразить, что для завершения рисунка необходим цветной карандаш, который валяется на полу в противоположном конце комнаты, после чего подойти к нему, взять и использовать по назначению. Коли уж на то пошло, даже способности муравья, проявляющиеся в выполнении повседневной муравьиной работы, намного превосходят все то, что можно реализовать с помощью самых сложных современных систем компьютерного управления. А с другой стороны, перед нами имеется поразительный пример способности компьютеров к чрезвычайно эффективным действиям — я имею в виду последние работы по созданию шахматных компьютеров. Шахматы, несомненно, представляют собой такой вид деятельности, в котором мощь человеческого интеллекта проявляется особенно ярко, хотя в полной мере эту мощь используют, к сожалению, лишь немногие. И все же современные компьютерные системы играют в шахматы необычайно хорошо и способны выиграть у большинства шахматистов-людей. Даже лучшим из шахматистов приходится сейчас нелегко, и вряд ли им удастся надолго сохранить свое теперешнее превосходство над наиболее продвинутыми компьютерами. Существует еще несколько узких областей, в которых компьютеры могут с успехом (постоянным или переменным) соперничать со специалистами-людьми. Кроме того, необходимо упомянуть и о таких видах интеллектуальной деятельности (например, о прямых численных расчетах), где способности компьютеров значительно превосходят способности людей.
Как бы то ни было, вряд ли можно утверждать, что во всех вышеперечисленных ситуациях компьютер и впрямь понимает, что именно он делает. В случае нисходящей организации причина успешной работы системы состоит не в том, что что-то такое понимает сама система, а в том, что в управляющую действиями системы программу было изначально заложено понимание, присущее программистам (или экспертам, которые наняли программистов). Что же касается восходящей организации, то не совсем ясно, есть ли здесь вообще необходимость в каком бы то ни было специфическом понимании на системном уровне либо со стороны самого устройства, либо со стороны программистов, за исключением того понимания, которое потребовалось при разработке конкретных алгоритмов, используемых устройством для улучшения качества своей работы, и того понимания, что изначально позволило создать саму концепцию возможности улучшения качества работы системы на основе накапливаемого ею опыта посредством внедрения в нее соответствующей системы обратной связи. Разумеется, не всегда возможно однозначно определить, что же на самом деле означает термин «понимание», вследствие чего кто-то может утверждать, что в его (или ее) системе обозначений такие компьютерные системы и в самом деле демонстрируют своего рода «понимание».
Однако разумно ли это? Для иллюстрации отсутствия какого бы то ни было реального понимания у современных компьютеров рассмотрим один занятный пример — шахматную позицию, приведенную на рис. (автор: Уильям Хартстон; цитируется по статье Джейн Сеймур и Дэвида Норвуда []). В этой позиции черные имеют огромное преимущество по фигурам в виде двух ладьей и слона. И все же белые очень легко избегают поражения, просто делая ходы королем на своей стороне доски. Стена из пешек для черных фигур непреодолима, и черные ладьи или слон не представляют для белых никакой опасности. Это вполне очевидно для любого человека, который в достаточной степени знаком с правилами игры в шахматы. Но когда эту позицию (белые начинают) предложили компьютеру «Deep Thought» — самому мощному на то время шахматному компьютеру, имеющему в своем активе несколько побед над гроссмейстерами-людьми, — он тут же совершил грубейшую ошибку, взяв пешкой черную ладью, что разрушило заслон из пешек и поставило белых в безнадежно проигрышное положение!
Рис. 1.7. Белые начинают и заканчивают игру вничью — очевидно для человека, а вот «Deep Thought» взял ладью!
Как мог столь искусный шахматист сделать такой очевидно глупый ход? Ответ заключается в следующем: помимо большого количества «позиций из учебника» программа «Deep Thought» содержала лишь инструкции, которые сводились исключительно к вычислению последовательности будущих ходов (на некоторую значительную глубину), позволяющей достичь максимального преимущества по фигурам. Ни на одном из этапов вычислений компьютер не обладал подлинным пониманием не только того, что может ему дать заслон из пешек, но и вообще любого из своих действий.
Любой, кто в достаточной степени представляет себе общий принцип работы компьютера «Deep Thought» или других компьютерных систем для игры в шахматы, не станет удивляться тому, что эта система терпит крах в позициях вроде той, что показана на рис. . Мы не только способны понять в шахматах что-то такое, чего не понимает «Deep Thought»; мы, кроме того, кое-что понимаем и в процедурах (нисходящих), на которых построена вся работа «Deep Thought», то есть мы способны как реально оценить, почему он сделал столь грубую ошибку, так и понять, почему в большинстве других случаев он может играть в шахматы настолько эффективно. Напрашивается, однако, вопрос: сможет ли «Deep Thought» или иная ИИ-система достичь когда-нибудь хоть какого-то подлинного понимания — подобного тому, каким обладаем мы сами — в шахматах или в чем-то еще? Некоторые сторонники ИИ скажут, что для обретения ИИ-системой «подлинного» понимания (что бы это ни значило) ее программа должна задействовать восходящие процедуры на гораздо более фундаментальном уровне, нежели это принято в программах теперешних шахматных компьютеров. Соответственно, в такой системе «понимание» развивалось бы постепенно по мере накопления «опыта», а не возникало бы в результате введения каких-то конкретных нисходящих алгоритмических правил. Нисходящие правила, достаточно простые и прозрачные, не способны сами по себе обеспечить вычислительную основу для подлинного понимания, поскольку само понимание этих правил позволяет нам осознать их фундаментальные ограничения.
Этот момент мы более подробно рассмотрим в и . А что же в самом деле восходящие вычислительные процедуры? Могут ли они составить основу для понимания? В я приведу рассуждения, доказывающие обратное. Пока же мы можем просто взять на заметку тот факт, что современные компьютерные системы восходящего типа никоим образом не обеспечивают замены подлинному человеческому пониманию ни в одной из важных областей интеллектуальной компетенции, требующих настоящего живого человеческого понимания и интуиции. Такую позицию, я уверен, сегодня разделяют многие. Весьма оптимистичные перспективы, время от времени выдвигаемые сторонниками идеи искусственного интеллекта и производителями экспертных систем, пока что в большинстве своем реализованы не были.
Однако в том, что касается возможных результатов развития искусственного интеллекта, мы все еще находимся в самом начале пути. Сторонники ИИ (в форме A или B) уверяют нас, что проявление существенных элементов понимания в поведении их систем с компьютерным управлением — всего лишь вопрос времени и, быть может, некоторых, пусть и значительных, технических усовершенствований. Несколько позднее я попробую поспорить с этим заявлением в более точных терминах, опираясь на то, что некие фундаментальные ограничения присущи любой чисто вычислительной системе, будь она нисходящей или восходящей. Не исключая возможности того, что, будучи достаточно грамотно сконструированной, такая система сможет в течение некоторого продолжительного периода времени поддерживать иллюзию обладания чем-то, подобным пониманию (как это произошло с компьютером «Deep Thought»), я все же утверждаю, что на деле полная ее неспособность к пониманию в общем смысле этого слова непременно в конце концов обнаружится — по крайней мере, в принципе.
Для приведения точных аргументов мне придется обратиться к математике, причем я намерен показать, что к одним лишь вычислениям невозможно свести даже математическое понимание. Некоторые защитники ИИ могут счесть это весьма удивительным, ибо они утверждают, что те способности, которые сформировались в процессе эволюционного развития человека сравнительно недавно (например, способность выполнять арифметические или алгебраические вычисления), «осваиваются» компьютерами легче всего, и именно в этих областях компьютеры на настоящий момент значительно опережают «человека вычисляющего»; овладение же теми способностями, что развились в начале эволюционного пути — такими, например, как умение ходить или интерпретировать сложные визуальные сцены, — не требует практически никакого труда от человека, тогда как сегодняшние компьютеры даже при всем старании демонстрируют в этом «виде спорта» весьма посредственные результаты. Я рассуждаю несколько иначе. Современный компьютер легко справится с любой сложной деятельностью — будь то математические вычисления, игра в шахматы или выполнение какой-либо работы по дому, — но лишь при условии, что эту деятельность можно описать в виде набора четких вычислительных правил; а вот собственно понимание, лежащее в основе этих самых вычислительных правил, оказывается феноменом, для вычисления недоступным.
1.16. Доказательство на основании теоремы Гёделя
Как можем мы быть уверены в том, что вышеописанное понимание не может, в сущности, быть сведено к набору вычислительных правил? Несколько позже (в и ) я приведу некоторые очень серьезные доводы в пользу того, что проявления понимания (по крайней мере, определенных его видов) невозможно достоверно моделировать посредством каких угодно вычислений — ни нисходящего, ни восходящего типа, ни любой из их комбинаций. Таким образом, за реализацию присущей человеку способности к «пониманию» должна отвечать какая-то невычислительная деятельность мозга или разума. Напомним, что термином «невычислительный» в данном контексте (см. , ) мы характеризуем феномен, который невозможно эффективно моделировать с помощью какого угодно компьютера, основанного на логических принципах, общих для всех современных электронных или механических вычислительных устройств. При этом термин «невычислительная активность» вовсе не предполагает невозможности описать такую активность научными и, в частности, математическими методами. Он предполагает лишь то, что точки зрения A и B оказываются не в состоянии объяснить, каким именно образом мы выполняем все те действия, которые представляют собой результат сознательной мыслительной деятельности.
Существует, по меньшей мере, логическая возможность того, что обладающий сознанием мозг (или сознательный разум) может функционировать в соответствии с такими невычислительными законами (см. ). Однако так ли это? Представленные в следующей главе () рассуждения содержат, как мне кажется, весьма четкое доказательство наличия в нашем сознательном мышлении невычислительной составляющей. Основаны эти рассуждения на знаменитой и мощной теореме математической логики, сформулированной великим логиком, чехом по происхождению, Куртом Гёделем. Для моих целей будет вполне достаточно существенно упрощенного варианта этой теоремы, который не потребует от читателя слишком обширных познаний в математике (что касается математики, то я также позаимствую кое-что из одной важной идеи, высказанной несколько позднее Аланом Тьюрингом). Любой достаточно серьезно настроенный читатель без труда разберется в моих рассуждениях. Доказательства гёделевского типа, да еще и примененные в подобном контексте, подвергаются время от времени решительным нападкам. Вследствие этого у некоторых читателей может сложиться впечатление, что мое основанное на теореме Гёделя доказательство было полностью опровергнуто. Должен заметить, что это далеко не так. За прошедшие годы действительно выдвигалось множество контраргументов. Мишенью для многих из них послужило одно из самых первых таких доказательств (направленное в поддержку ментализма и против физикализма), предложенное оксфордским философом Джоном Лукасом []. Опираясь на результаты теоремы Гёделя. Лукас доказывал, что мыслительные процессы невозможно воспроизвести вычислительными методами. (Подобные соображения выдвигались и ранее; см., например, [].) Мое доказательство, пусть и построенное на том же фундаменте, выдержано все же в несколько ином духе, нежели доказательство Лукаса; кроме того, в число моих задач не входила непременная поддержка ментализма. Я думаю, что моя формулировка способна лучше противостоять различным критическим замечаниям, выдвинутым в свое время против доказательства Лукаса, и во многих отношениях выявить их несостоятельность.
Ниже (в и ) мы подробно рассмотрим все контраргументы, которые когда-либо попадались мне на глаза. Надеюсь, что мои сопутствующие комментарии не только помогут прояснить некоторые, похоже, широко распространившиеся заблуждения относительно смысла доказательства Гёделя, но и дополнят, по-видимому, неудовлетворительно краткое рассмотрение этого вопроса, предпринятое в НРК. Я намерен показать, что большая часть этих контраргументов произрастает, в сущности, из банальных недоразумений, тогда как остальные, основанные на более или менее осмысленных и требующих детального рассмотрения возражениях, представляют собой, в лучшем случае, не более чем возможные «лазейки» в духе взглядов A или B; при этом они не дают — в чем у нас еще будет возможность убедиться — сколько-нибудь правдоподобного объяснения действительным последствиям наличия у нас способности «понимать», да и в любом случае эти лазейки не представляют особой ценности для развития идеи ИИ. Так что тем, кто по-прежнему полагает, что все внешние проявления процессов сознательного мышления можно адекватно воспроизвести вычислительными методами, в рамках положений A или B, я могу лишь порекомендовать повнимательнее следить за предлагаемой ниже аргументацией.
1.17. Платонизм или мистицизм?
Критики, впрочем, могут возразить, что отдельные выводы в рамках этого доказательства Гёделя следует рассматривать не иначе как «мистические», поскольку упомянутое доказательство, судя по всему, вынуждает нас принять либо точку зрения C, либо точку зрения D; подобный взгляд, разумеется, не более приемлем, нежели любая из вышеупомянутых лазеек, полученных из теоремы Гёделя. Что касается D, то здесь я, вообще говоря, полностью с критиками согласен. Мои собственные причины неприятия D — точки зрения, настаивающей на полном бессилии науки перед тайною разума, — проистекают из осознания того факта, что только благодаря применению научных и, в частности, математических методов был достигнут хоть какой-то реальный прогресс в понимании происходящих в окружающем нас мире процессов. Более того, если мы и располагаем какими-то достоверными сведениями о разуме, то только о том разуме, который тесно связан с конкретным физическим объектом — мозгом, — причем различным состояниям разума четко соответствуют различные физические состояния мозга. По всей видимости, с теми или иными специфическими типами физической активности мозга можно ассоциировать и психические состояния сознания. Если бы не таинственные аспекты сознания, связанные с формированием «осознания» и, быть может, с проявлениями «свободы воли», которые пока что не поддаются физическому описанию, нам бы и в голову не пришло, что для объяснения разума, являющегося по всем признакам продуктом протекающих внутри мозга физических процессов, стандартных научных методов может и не хватить.
С другой стороны, следует понимать, что наука (и, в частности, математика) и сама по себе являет нам мир, исполненный тайн. Чем глубже мы проникаем в процессе научного познания в суть вещей, тем более фундаментальные тайны открываются нашему взору. Быть может, стоит в этой связи упомянуть и о том, что физики, более непосредственно знакомые с головоломной и непостижимой манерой, в какой реально проявляет себя материя, склонны видеть мир в менее классически механистическом свете, нежели биологи. В мы поговорим о некоторых наиболее таинственных аспектах квантового поведения, обнаруженных относительно недавно. Возможно, для полного «охвата» тайны разума нам придется несколько расширить границы того, что мы в настоящее время называем наукой, однако я не вижу причин напрочь отказываться от тех методов, которые так замечательно служили нам до сих пор. Таким образом, если гёделевские соображения подталкивают нас к принятию точки зрения C в том или ином ее виде (а я полагаю, что так оно и есть), то нам поневоле придется принять и некоторые другие ее следствия. Иными словами, следуя этим путем, мы приходим, ни много ни мало, к объективному идеализму по Платону. Согласно учению Платона, математические концепции и математические истины существуют в их собственном, вполне реальном мире, в котором отсутствует течение времени и который не имеет физического местонахождения. Мир Платона — это идеальный мир совершенных форм, отличный от физического мира, но являющийся основой для его понимания. Он, кроме того, никак не связан с нашим"и несовершенными мысленными построениями, однако человеческий разум способен получить в некотором смысле непосредственный доступ в это платоново царство благодаря способности «осознавать» математические формы и рассуждать о них. Нашему «платоническому» восприятию, как вскоре выяснится, может иногда поспособствовать вычисление, однако в общем это восприятие вычислением не ограничено. Согласно такому платоническому подходу, именно способность «осознавать» математические концепции дает разуму мощь, далеко превосходящую все, чего можно добиться от устройства, работа которого основывается исключительно на вычислении.
1.18. Почему именно математическое понимание?
Все эти благоглупости, конечно, очень (или не очень) замечательны — так, несомненно, уже ворчат иные читатели. Однако какое отношение имеют все эти замысловатые проблемы математики и философии математики к большинству вопросов, непосредственно касающихся, например, искусственного интеллекта? В самом деле, многие философы и поборники ИИ придерживаются достаточно разумного мнения, суть которого сводится к тому, что теорема Гёделя, безусловно, имеет огромное значение в своем исходном контексте, т.е. в области математической логики, однако в отношении ИИ или философии разума актуальность ее, в лучшем случае, весьма и весьма ограничена. В конце концов, не так уж и часто мыслительная деятельность человека оказывается направлена на решение вопросов, относящихся к первоначальной области применимости рассуждений Гёделя — аксиоматическим основам математики. На это возражение я бы ответил так: но ведь практически всегда мыслительная деятельность человека требует участия сознания и понимания. Рассуждение же Гёделя я использую для того, чтобы показать, что человеческое понимание нельзя свести к алгоритмическим процессам. Если мне удастся показать справедливость этого утверждения в каком-либо конкретном контексте, то этого будет вполне достаточно. Продемонстрировав, что понимание каких-то математических процедур не поддается описанию с помощью вычислительных методов, мы тем самым докажем, что в нашем разуме происходит-таки что-то такое, что невозможно вычислить. А если так, то напрашивается вполне естественный вывод: невычислительная активность должна быть присуща и многим другим аспектам мыслительной деятельности. Вот и все, путь свободен!
Может показаться, что представленное в математическое доказательство, устанавливающее необходимую нам форму теоремы Гёделя, не имеет прямого отношения к большинству аспектов сознания. В самом деле: что общего может быть у демонстрации невычислимости феномена понимания на примере определенных типов математических суждений с восприятием, например, красного цвета? Да и в большинстве других аспектов сознания математические соображения, похоже, не играют явно выраженной роли. К примеру, даже математики, как правило, не думают о математике, когда спят и видят сны! Судя по всему, сны видят и собаки, причем есть основания полагать, что они, до некоторой степени, осознают, что видят сон; и я склонен думать, что они наверняка осознают и происходящее с ними во время бодрствования. Однако собаки математикой не занимаются. Бесспорно, математические размышления — далеко не единственная деятельность живого организма, требующая участия сознания. Скажем больше: эта деятельность в высшей степени специализирована и характерна лишь для человека. (И даже более того, я встречал циников, которые уверяли меня, что упомянутая деятельность характерна лишь для определенной, чрезвычайно редкой разновидности людей.) Феномен же сознания наблюдается повсеместно и присущ мыслительной деятельности как человека, так и большинства нечеловеческих форм жизни; сознанием, безусловно, в равной степени обладают и люди, далекие от математики, и математики-профессионалы, причем даже тогда, когда они математикой не занимаются (т.е. большую часть своей жизни). Математическое мышление составляет очень и очень малую область сознательной деятельности вообще, практикует его очень и очень незначительное меньшинство обладающих сознанием существ, да и то на протяжении очень и очень ограниченной части их сознательной жизни.
Почему же в таком случае я решил рассмотреть вопрос сознания прежде всего в математическом контексте? Причина заключается в том, что только в математических рамках мы можем рассчитывать на возможность хоть сколько-нибудь строгой демонстрации непременной невычислимости, по крайней мере, некоторой части сознательной деятельности. Вопрос вычислимости по самой своей природе является, безусловно, математическим. Нельзя ожидать, что нам удастся дать хоть какое-то «доказательство» невычислимости того или иного процесса, не обратившись при этом к математике. Я хочу убедить читателя в том, что все, что мы делаем нашим мозгом или разумом в процессе понимания математического суждения, существенно отличается от того, чего мы можем добиться от какого угодно компьютера; если мне это удастся, то читателю будет намного легче оценить роль невычислительных процессов в сознательном мышлении вообще.
А разве не очевидно, возразят мне, что восприятие того же красного цвета никак не может быть вызвано просто выполнением какого бы то ни было вычисления. К чему вообще утруждать себя какими-то ненужными математическими демонстрациями, когда и без того совершенно ясно, что qualia — т.е. субъективные ощущения — никак не связаны с вычислениями? Один из ответов заключается в том, что такое доказательство от «очевидного» (как бы благожелательно я ни относился к подобному способу доказательства) применимо только к пассивным аспектам сознания. Как и китайскую комнату Серла, его можно представить в качестве аргумента против точки зрения A, а вот между C и B разницы для него не существует.
Более того, мне представляется крайне уместным побить функционалистов вместе с их вычислительной моделью (т.е. точкой зрения A), так сказать, на их собственном поле; ведь это именно функционалисты настаивают на том, что все qualia на самом деле должны быть так или иначе обусловлены банальным выполнением соответствующих вычислений, невзирая на то, сколь невероятной такая картина может показаться на первый взгляд. Ибо, аргументируют они, что же еще можем мы эффективно делать своим мозгом, как не выполнять те или иные вычисления? Для чего вообще нужен мозг, если не в качестве своеобразной системы управления вычислениями — да, чрезвычайно сложными, но все же вычислениями? Какие бы «ощущения осознания» ни пробуждались в нас в результате той или иной функциональной активности мозга, эти ощущения, согласно функционалистской модели, непременно являются результатом некоторой вычислительной процедуры. Функционалисты любят упрекать тех, кто не признает за вычислительной моделью способности объяснить любые проявления активности мозга, включая и сознание, в склонности к мистицизму. (Надо понимать так, что единственной альтернативой точки зрения A является D.) Во второй части книги я намерен привести несколько частных предположений относительно того, что еще может вполне эффективно делать мозг, допускающий научное описание. Не стану отрицать, некоторые «конструктивные» моменты моего доказательства являются чисто умозрительными. И все же я полагаю, что мои доводы в пользу невычислимости хотя бы некоторых мыслительных процессов весьма убедительны; а для того, чтобы эта убедительность переросла в неотразимость, их следует применить к математическому мышлению.
1.19. Какое отношение имеет теорема Гёделя к «бытовым» действиям?
Допустим однако, что мы все уже согласны с тем, что при формировании осознанных математических суждений и получении осознанных же математических решений в нашем мозге действительно происходит что-то невычислимое. Каким образом это поможет нам понять причины ограниченных способностей роботов, которые, как я упоминал ранее, значительно хуже справляются с элементарными, «бытовыми», действиями, нежели со сложными задачами, для выполнения которых требуются высококвалифицированные специалисты-люди? На первый взгляд, создается впечатление, что мои выводы в корне противоположны тем, к которым придет всякий здравомыслящий человек, исходя из известных ограничений искусственного интеллекта — по крайней мере, сегодняшних ограничений. Ибо многим почему-то кажется, что я утверждаю, будто невычислимое поведение должно быть связано скорее с пониманием крайне сложных областей математики, а никак не с обыденным, бытовым поведением. Это не так. Я утверждаю лишь, что пониманию сопутствуют невычислимые процессы одинаковой природы, вне зависимости от того, идет ли речь о подлинно математическом восприятии, скажем, бесконечного множества натуральных чисел или всего лишь об осознании того факта, что предметом удлиненной формы можно подпереть открытое окно, о понимании того, какие именно манипуляции следует произвести с куском веревки для того, чтобы привязать или, напротив, отвязать уже привязанное животное, о постижении смысла слов «счастье», «битва» или «завтра» и, наконец, о логическом умозаключении относительно вероятного местонахождения правой ноги Авраама Линкольна, если известно, что левая его нога пребывает в настоящий момент в Вашингтоне, — я привел здесь некоторые из примеров, оказавшихся на удивление мучительными для одной реально существующей ИИ-системы! Такого рода невычислимые процессы лежат в основе всякой деятельности, результатом которой является непосредственное осознание чего-либо. Именно это осознание позволяет нам визуализировать геометрию движения деревянного бруска, топологические свойства куска веревки или же «связность» Авраама Линкольна. Оно также позволяет нам получить до некоторой степени прямой доступ к опыту другого человека, с помощью чего мы можем «узнать», что этот другой, скорее всего, подразумевает под такими словами, как «счастье», «битва» и «завтра», несмотря даже на то, что предлагаемые в процессе общения объяснения зачастую оказываются недостаточно адекватными. Передать «смысл» слов от человека к человеку все же возможно, однако не с помощью объяснений различной степени адекватности, а лишь благодаря тому, что собеседник уже, как правило, имеет в сознании некий общий образ возможного смысла этих слов (т.е. «осознает» их), так что даже очень неадекватных объяснений обычно бывает вполне достаточно для того, чтобы человек смог «уловить» верный смысл. Именно наличие такого общего «осознания» делает возможным общение между людьми. И именно этот факт ставит неразумного, управляемого компьютером робота в крайне невыгодное положение. (В самом деле, уже самый смысл понятия «смысл слова» изначально воспринимается нами как нечто само собой разумеющееся, и поэтому совершенно непонятно, каким образом такое понятие можно сколько-нибудь адекватно описать нашему неразумному роботу.) Смысл можно передать лишь от человека к человеку, потому что все люди имеют схожий жизненный опыт или аналогичное внутреннее ощущение «природы вещей». Можно представить «жизненный опыт» в виде своеобразного хранилища, в которое складывается память обо всем, что происходит с человеком в течение жизни, и предположить, что нашего робота не так уж и сложно таким хранилищем оснастить. Однако я утверждаю, что это не так; ключевым моментом здесь является то, что рассматриваемый субъект, будь то человек или робот, должен свой жизненный опыт осознавать.
Что же заставляет меня утверждать, будто упомянутое осознание, что бы оно из себя ни представляло, должно быть невычислимым — иначе говоря, таким, что его не сможет ни достичь, ни хотя бы воспроизвести ни один робот, управляемый компьютером, построенным исключительно на базе стандартных логических концепций машины Тьюринга (или эквивалентной ей) нисходящего либо восходящего типа? Именно здесь и играют решающую роль гёделевские соображения. Вряд ли мы в настоящее время можем многое сказать об «осознании», например, красного цвета; а вот относительно осознания бесконечности множества натуральных чисел кое-что определенное нам таки известно. Это такое «осознание», благодаря которому ребенок «знает», что означают слова «ноль», «один», «два», «три», «четыре» и т.д. и что следует понимать под бесконечностью этой последовательности, хотя объяснения ему были даны до нелепости ограниченные и, на первый взгляд, к делу почти не относящиеся, на примере нескольких бананов и апельсинов. Из таких частных примеров ребенок и в самом деле способен вывести абстрактное понятие числа «три». Более того, он также оказывается в состоянии понять, что это понятие является лишь звеном в бесконечной цепочке похожих понятий («четыре», «пять», «шесть» и т.д.). В некотором платоническом смысле ребенок изначально «знает», что такое натуральные числа.
Возможно, кто-то усмотрит здесь некий налет мистики, однако в действительности мистика здесь не при чем. Для понимания последующих рассуждений крайне важно отличать такое платоническое знание от мистицизма. Понятия, «известные» нам в платоническом смысле, суть вещи для нас «очевидные»: вещи, которые сводятся к воспринятому когда-то «здравому смыслу», — при этом мы не можем охарактеризовать эти понятия во всей их полноте посредством вычислительных правил. Действительно — и это станет ясно из дальнейших рассуждений, связанных с доказательством Гёделя, — не существует способа целиком и полностью охарактеризовать свойства натуральных чисел на основе лишь таких правил. А как же тогда описания числа через яблоки или бананы дают ребенку понять, что означают слова «три дня», и откуда ему знать, что смысл абстрактного понятия числа «три» здесь совершенно тот же, что и в словах «три апельсина»? Разумеется, такое понимание иногда приходит к ребенку далеко не сразу, и на первых порах он, бывает, ошибается, однако суть не в этом. Суть в том, что подобное осознание вообще возможно. Абстрактное понятие числа «три», равно как и представление о том, что существует бесконечная последовательность аналогичных понятий — собственно последовательность натуральных чисел, — ив самом деле вполне доступно человеческому пониманию, однако, повторяю, лишь через осознание.
Я утверждаю, что точно так же мы не пользуемся вычислительными правилами при визуализации движений деревянного бруска, куска веревки или Авраама Линкольна. Вообще говоря, существуют весьма эффективные компьютерные модели движения твердого тела — например, деревянного бруска. С их помощью можно осуществлять моделирование такого движения с точностью и достоверностью, обычно недостижимыми при непосредственной визуализации. Аналогично, вычислительными методами можно моделировать и движение веревки или струны, хотя такое моделирование почему-то оказывается несколько более сложным по сравнению с моделированием движения твердого тела. (Отчасти это связано с тем, что для описания положения «математической струны» необходимо определить бесконечно много параметров, тогда как положение твердого тела описывается всего шестью.) Существуют компьютерные алгоритмы для определения «заузленности» веревки, однако они в корне отличаются от алгоритмов, описывающих движение твердого тела (и не очень эффективны в вычислительном отношении). Любое воспроизведение с помощью компьютера внешнего облика Авраама Линкольна, безусловно, представляет собой еще более сложную задачу. Во всяком случае, дело не в том, что визуализация чего-либо человеком «лучше» или «хуже» компьютерного моделирования, просто это вещи совершенно различные.
Важный момент, как мне кажется, заключается в том, что визуализация содержит некий элемент оценки того, что человек видит, то есть сопровождается пониманием. Чтобы проиллюстрировать, что я имею в виду, давайте рассмотрим одно элементарное арифметическое правило, а именно: для любых двух натуральных чисел (т.е. неотрицательных целых чисел 0, 1, 2, 3, 4, …) а и b справедливо следующее равенство:
a × b = b × a .
Следует пояснить, что это высказывание не является пустым, хотя части уравнения и имеют различный смысл. Запись a × b слева означает совокупность а групп по b объектов в каждой; b × a справа — b групп по a объектов в каждой. В частном случае, например, при a = 3 и b = 5, запись a × b можно представить следующим рядом точек:
(•••••)(•••••)(•••••),
в то время как для b × a имеем
(•••)(•••)(•••)(•••)(•••).
Общее число точек в каждом случае одинаково, следовательно, справедливо равенство 3 × 5 = 5 × 3.
В истинности этого равенства можно удостовериться, представив зрительно матрицу
• • • • •
• • • • •
• • • • •
Читая матрицу по строкам, можно сказать, что в ней три строки, каждая из которых содержит по пять точек, что соответствует числу 3 × 5. Однако если эту же матрицу прочесть по столбцам, то получится пять столбцов по три точки в каждом, что соответствует числу 5 × 3. Равенство этих чисел очевидно, поскольку речь в каждом случае идет об одной и той же прямоугольной матрице, просто мы ее по-разному читаем. (Есть и альтернативный вариант: мы можем мысленно повернуть изображение на прямой угол и убедиться в том, что матрица, соответствующая числу 5 × 3, содержит то же количество элементов, что и матрица, соответствующая числу 3 × 5.)
Важный момент описанной визуализации заключается в том, что она непосредственно дает нам нечто гораздо более общее, чем просто частное численное равенство 3 × 5 = 5 × 3. Иными словами, в конкретных числовых значениях а = 3 и b = 5, участвующих в данной процедуре, нет ничего особенного. Полученное правило будет применимо, даже если, скажем, а = 79 797 000 222, а b = 50 000 123 555, и мы с уверенностью можем утверждать, что 79 797 000 222 × 50 000 123 555 = 50 000123 555 × 79 797 000 222, несмотря на то, что у нас нет ни малейшей возможности сколько-нибудь точно представить себе визуально прямоугольную матрицу такого размера (да и ни один современный компьютер не сможет перечислить все ее элементы). Мы вполне можем заключить, что вышеприведенное равенство должно быть истинным — или что истинным должно быть равенство общего вида a × b = b × a — на основании, в сущности, той же самой визуализации, которую мы применяли для конкретного случая 3 × 5 = 5 × 3. Нужно просто несколько «размыть» мысленно действительное количество строк и столбцов рассматриваемой матрицы, и равенство становится очевидным.
Я вовсе не хочу сказать, что все математические отношения можно с помощью верной визуализации непосредственно постигать как «очевидные», или же что их просто можно в любом случае постичь каким-то иным способом, основанным непосредственно на интуиции. Это далеко не так. Для уверенного понимания некоторых математических отношений необходимо строить весьма длинные цепочки умозаключений. Цель математического доказательства, по сути дела, в этом и заключается: мы строим цепочки умозаключений таким образом, чтобы на каждом этапе получать утверждение, допускающее «очевидное» понимание. Как следствие, конечной точкой умозаключения должно оказаться суждение, которое необходимо принимать как истинное, пусть даже оно само по себе вовсе и не очевидно.
Кое-кто, наверное, уже вообразил, что в таком случае можно раз и навсегда составить список всех «возможных» этапов умозаключений и тогда всякое доказательство можно будет свести к вычислению, т. е. к простым механическим манипуляциям полученными очевидными этапами. Доказательство Гёделя () как раз и демонстрирует невозможность реализации такой процедуры. Нельзя совершенно избавиться от необходимости в новых «очевидно понимаемых» отношениях. Таким образом, математическое понимание никоим образом не сводится к бездумному вычислению.
1.20. Мысленная визуализация и виртуальная реальность
Интуитивные математические процедуры, описанные в , имеют весьма ярко выраженный специфический геометрический характер. В математических доказательствах применяются и многие другие типы интуитивных процедур, причем некоторые из них весьма далеки от «геометричности». Однако, как показывает практика, геометрические интуитивные представления чаще всего дают более глубокое математическое понимание. Полагаю, было бы весьма полезно выяснить, какие же именно физические процессы происходят в нашем мозге, когда мы визуализируем что-либо геометрически. Начнем хотя бы с того, что никакой логической необходимости в том, чтобы непосредственным результатом этих процессов было «геометрическое отражение» визуализируемого объекта, по сути дела, не существует. Как мы увидим далее, здесь может получиться нечто совсем иное.
Здесь уместно провести аналогию с феноменом, именуемым «виртуальной реальностью». Феномен этот, согласно распространенному мнению, имеет самое прямое отношение к теме «визуализации». Методы виртуальной реальности позволяют создать компьютерную модель какой-либо не существующей в природе структуры, — например, здания на стадии архитектурного проекта, — затем модель проецируется в глаз наблюдателя-человека, который, предположительно, воспринимает ее как «реальное» здание. Совершая движения глазами, головой или, может быть, ногами, словно прогуливаясь вокруг демонстрируемого ему здания, наблюдатель может разглядывать его с разных сторон — точно так же, как если бы здание действительно было реальным (см. рис. ). Согласно некоторым предположениям, выполняемые мозгом в процессе сознательной визуализации операции (какой бы ни была их истинная природа) аналогичны вычислениям, производимым при построении такой виртуальной модели. В самом деле, мысленно осматривая какую-то реально существующую неподвижную структуру, человек, по всей видимости, создает в уме некую модель, которая остается неизменной, несмотря на постоянные движения его головы, глаз и тела, приводящие к непрерывной смене образов, возникающих на сетчатке его глаз. Такие поправки на движения тела играют весьма существенную роль при построении виртуальной реальности, и высказывались предположения в том смысле, что нечто подобное должно происходить и при создании «мысленных моделей», представляющих собой результаты актов визуализации. Такие вычисления, разумеется, вовсе не обязаны иметь целью воспроизведение реальной геометрической структуры моделируемой конструкции (или ее «отражение»). Сторонникам точки зрения A в таком случае пришлось бы рассматривать сознательную визуализацию как результат своего рода численного моделирования окружающего мира в голове человека. Я же полагаю, что всякий раз, когда мы сознательно воспринимаем ту или иную визуальную сцену, сопровождающее этот процесс понимание представляет собой нечто, существенно отличное от моделирования мира методами вычислительного характера.
Рис. 1.8. Виртуальная реальность. В результате определенных вычислений в сознании человека возникает трехмерный воображаемый мир, должным образом реагирующий на движения головы и тела наблюдателя.
Можно также предположить, что внутри мозга функционирует нечто вроде «аналогового компьютера», в котором моделирование внешнего мира реализуется не с помощью цифровых вычислений, как в современных электронных компьютерах, а с помощью некоторой внутренней структуры, физическое поведение которой каким-то однозначным образом отражает поведение моделируемой внешней системы. Допустим, например, что нам необходимо аналоговое устройство для моделирования движений некоторого внешнего твердого тела. Для создания такого устройства мы, очевидно, воспользуемся весьма простым и естественным способом. Мы отыщем внутри системы реальное физическое тело той же формы (но меньшего размера), что и моделируемый внешний объект; я, разумеется, ни в коем случае не утверждаю, что данная конкретная модель имеет какое бы то ни было прямое отношение к тому, что происходит внутри мозга. Движения упомянутого «внутреннего» тела можно рассматривать с разных сторон, т.е. в том, что касается внешних проявлений, аналоговая модель оказывается очень похожа на модель, полученную с помощью вычислительных методов. Можно даже создать на основе такой модели систему «виртуальной реальности», в которой вместо целиком вычислительной модели рассматриваемой структуры будет действовать ее реальная физическая модель, отличающаяся от моделируемого «реального» объекта только размерами. В общем случае аналоговое моделирование вовсе не обязано быть столь прямолинейным и примитивным. Вместо физического расстояния можно использовать в качестве параметра, например, электрический потенциал и т.п. Следует только удостовериться в том, что физические законы, управляющие внутренней структурой, в точности совпадают с физическими законами, которым подчиняется внешняя, моделируемая, структура. При этом нет никакой необходимости в том, чтобы внутренняя структура была похожа на внешнюю («отражала» ее) каким-либо очевидным образом.
Способны ли аналоговые устройства достичь результатов, недоступных для чисто вычислительного моделирования? Как уже упоминалось в , современная физика не дает никаких оснований полагать, что с помощью аналогового моделирования можно добиться чего-то такого, что принципиально неосуществимо при моделировании цифровом. Иными словами, если мы допускаем, что построение мысленных образов обусловлено какими-то невычислимыми процессами, то это означает, что объяснение данному феномену следует искать за пределами известной нам физики.
1.21. Является ли невычислимым математическое воображение?
Говоря о мысленной визуализации, мы ни разу не указали явно на невозможность воспроизведения этого процесса вычислительным путем. Даже если визуализация действительно осуществляется посредством какой-то внутренней аналоговой системы, что мешает нам предположить, что должна существовать, по крайней мере, возможность смоделировать поведение такого аналогового устройства?
Дело в том, что «предметом» рассматриваемой выше «визуализации» является «визуальное» в буквальном смысле этого слова, т.е. мысленные образы, соответствующие, как нам представляется, сигналам, поступающим в мозг от глаз. В общем же случае мысленные образы вовсе не обязательно носят такой буквально «визуальный» характер — например, те, что возникают, когда мы понимаем смысл какого-то абстрактного слова или припоминаем музыкальную фразу. Согласитесь, что мысленные образы человека, слепого от рождения, вряд ли могут иметь прямое отношение к сигналам, которые его мозг получает от глаз. Иными словами, под «визуализацией» мы будем в дальнейшем подразумевать скорее процессы, связанные с «осознанием» вообще, нежели те, что имеют непосредственное отношение к системе органов зрения. Честно говоря, мне не известен ни один довод, непосредственно указывающий на вычислительную (или какую-либо иную) природу нашей способности к визуализации именно в буквальном смысле этого слова. Моя же убежденность в том, что процессы «буквальной» визуализации действительно являются невычислимыми, проистекает из явно невычислительного характера других видов осознания. Не совсем понятно, каким образом можно произвести прямое доказательство невычислимости исключительно для геометрической визуализации, однако если бы удалось убедительно доказать невычислимость хотя бы некоторых форм осмысленного осознания, то такое доказательство дало бы, по меньшей мере, серьезные основания полагать, что вид осознания, ответственный за геометрическую визуализацию, также должен иметь невычислительный характер. По-видимому, нет особой необходимости проводить четкую границу между различными проявлениями феномена сознательного понимания.
Переходя от общего к частному, я утверждаю, что наше понимание, например, свойств натуральных чисел (0, 1, 2, 3, 4, …) носит явно невычислительный характер. (Можно даже сказать, что само понятие натурального числа и есть, в некотором смысле, форма негеометрической «визуализации».) В , воспользовавшись упрощенным вариантом теоремы Гёделя (см. пояснение к возражению Q16), я покажу, что это понимание невозможно описать каким бы то ни было конечным набором правил, а значит, невозможно и воспроизвести с помощью вычислительных методов. Время от времени нас радуют сообщениями о том, что ту или иную компьютерную систему «обучили» «пониманию» концепции натурального числа. Однако, как мы вскоре увидим, этого просто не может быть. Именно осознание того, что в действительности может означать слово «число», дает нам возможность верно понять заключенную в нем идею. А располагая верным пониманием, мы — по крайней мере, в принципе — можем давать верные ответы на целый ряд вопросов о числах, буде нам таковые зададут, в то время как ни один конечный набор правил этого обеспечить не в состоянии. Имея в своем распоряжении одни только правила при полном отсутствии непосредственного осознания, управляемый компьютером робот (такой, например, как «Deep Thought»; см. ) неизбежно окажется лишен тех способностей, в которых ни один из людей никаких ограничений не испытывает; хотя если снабдить робота достаточно умными правилами поведения, то он, возможно, поразит наше воображение выдающимися интеллектуальными подвигами, многие из которых далеко превзойдут способности обычного человека в каких-то конкретных, достаточно узкоспециальных областях. Возможно даже, что ему удастся на некоторое время одурачить нас, и мы поверим, что и он способен на осознание.
Следует отметить, что всякий раз, как мы получаем действительно эффективную цифровую (или аналоговую) компьютерную модель какой-либо внешней системы, это почти всегда происходит благодаря глубокому пониманию человеком тех или иных основополагающих математических идей. Взять хотя бы цифровую модель геометрического движения твердого тела. Выполняемые при таком моделировании вычисления опираются, главным образом, на открытия великих мыслителей семнадцатого века — таких, например, как французские математики Декарт, Ферма и Дезарг, — которым мы обязаны идеями системы координат и проективной геометрии. Существуют и модели, описывающие движение куска веревки или струны. Как выясняется, геометрические идеи, необходимые для понимания особенностей поведения струны — ее так называемой «заузленности», — весьма сложны и относительно молоды. Большинство фундаментальных открытий в этой области были сделаны только в двадцатом веке. Каждый из нас без особого труда способен экспериментальным путем — т.е. посредством несложных манипуляций руками и приложения некоторого здравого смысла — убедиться в наличии либо отсутствии на замкнутой, но спутанной веревочной петле узлов; вычислительные же алгоритмы для достижения того же результата оказываются на удивление сложными и малоэффективными.
Таким образом, эффективное цифровое моделирование таких процессов является в основе своей нисходящим и во многом определяется пониманием и интуитивными прозрениями человека. Вероятность того, что в человеческом мозге при визуализации происходит нечто подобное, очень и очень невелика. Более правдоподобным представляется предположение о том, что существенный вклад в этот процесс вносят те или иные восходящие процедуры, а воспроизводимые в результате «визуальные образы» требуют предварительного накопления немалого «опыта». Я, впрочем, не слышал о сколько-нибудь серьезных исследованиях этого вопроса именно с точки зрения восходящих процедур (например, о разработках искусственных нейронных сетей). По всей видимости, подход, целиком основанный на процедурах восходящего типа, даст весьма скудные результаты. Сомневаюсь, что можно построить более или менее удачную модель геометрического движения твердого тела или топологических особенностей движения куска струны при отсутствии подлинного понимания обусловливающих эти движения законов.
Какие же физические процессы следует считать ответственными за осознание — за осознание, которое, судя по всему, необходимо для всякого подлинного понимания? Действительно ли оно не допускает численного моделирования, как того требует точка зрения C? Можно ли, в таком случае, надеяться на какое бы то ни было постижение этого предполагаемого физического процесса — хотя бы в принципе? Думаю, что можно, и более чем уверен, что точка зрения C представляет собой подлинно научное допущение — просто нужно приготовиться к тому, что наши научные критерии и методы, возможно, претерпят не слишком явные, но весьма существенные изменения. Нужно быть готовым к тому, что объекты наших исследований будут принимать самые неожиданные формы и возникать в таких областях подлинно научного знания, которые, на первый взгляд, никакого отношения к делу не имеют. Читателя, который намерен продолжить чтение этой книги, я прошу сохранять открытость восприятия и вместе с тем внимательно следить за рассуждениями и представляемыми научными свидетельствами, даже если они вдруг покажутся ему несколько сомнительными с точки зрения здравого смысла. Будьте готовы немного поразмыслить над предлагаемыми доводами, а я, в свою очередь, приложу все усилия к изложению их в максимально доступном виде. Уверен, что, настроившись подобным образом, мы с вами преодолеем все преграды.
В оставшихся главах первой части я не буду касаться физики и возможных видов биологической активности, которые способны обусловить невычислимость, требуемую точкой зрения C. Этими предметами мы займемся во второй части книги. Для начала нам предстоит решить вопрос об общей целесообразности поисков невычислимых процессов. Пока что вся целесообразность проистекает лишь из моей уверенности в том, что при сознательном понимании мы действительно выполняем какие-то невычислимые операции. Эту уверенность необходимо обосновать, для чего нам придется обратиться к математике.
2. Гёделевское доказательство
2.1. Теорема Гёделя и машины Тьюринга
В наиболее чистом виде мыслительные процессы проявляются в сфере математики. Если же мышление сводится к выполнению тех или иных вычислений, то математическое мышление, по всей видимости, должно обладать этим свойством в наибольшей степени. Однако, как это ни удивительно, в действительности все происходит с точностью до наоборот. Именно математика дает нам самое явное свидетельство тому, что процессы сознательного мышления включают в себя нечто, не доступное вычислению. Возможно, это покажется парадоксальным, однако для того, чтобы двигаться дальше, нам придется пока с этим парадоксом как-то примириться.
Прежде чем мы начнем, мне бы хотелось хоть как-то успокоить читателя в отношении математических формул, которые встретятся нам в нескольких последующих разделах (), хотя надо признать, что страхи его не лишены оснований: ведь нам предстоит в какой-то мере уяснить для себя смысл и следствия ни много ни мало самой важной теоремы математической логики — знаменитой теоремы Курта Гёделя. Я привожу здесь очень и очень упрощенный вариант этой теоремы, опираясь, в частности, на несколько более поздние идеи Алана Тьюринга. Мы не будем пользоваться каким бы то ни было математическим формализмом, за исключением простейшей арифметики. Представленное доказательство, вероятно, будет кое-где несколько путаным, однако всего лишь путаным, а ни в коем случае не «сложным» в смысле необходимости каких-то предварительных познаний в математике. Воспринимайте доказательство в любом удобном для вас темпе и не стесняйтесь перечитывать его столько раз, сколько захочется. В дальнейшем () мы рассмотрим некоторые более специфические соображения, лежащие в основе теоремы Гёделя, однако читатель, не интересующийся подобными вопросами, может эти разделы пропустить без ущерба для понимания.
Так что же такое теорема Гёделя? В 1930 году на конференции в Кенигсберге блестящий молодой математик Курт Гёдель произвел немалое впечатление на ведущих математиков и логиков со всего мира, представив их вниманию теорему, которая впоследствии получила его имя. Ее довольно быстро признали в качестве фундаментального вклада в основы математики — быть может, наиболее фундаментального из всех возможных, — я же, в свою очередь, утверждаю, что своей теоремой Гёдель также положил начало важнейшему этапу развития философии разума.
Среди положений, которые со всей неоспоримостью доказал Гёдель, имеется следующее: нельзя создать такую формальную систему логически обоснованных математических правил доказательства, которой было бы достаточно, хотя бы в принципе, для доказательства всех истинных теорем элементарной арифметики. Уже и это само по себе в высшей степени удивительно, однако это еще не все. Многое говорит за то, что результаты Гёделя демонстрируют нечто большее, — а именно, доказывают, что способность человека к пониманию и постижению сути вещей невозможно свести к какому бы то ни было набору вычислительных правил. Иными словами, нельзя создать такую систему правил, которая оказалась бы достаточной для доказательства даже тех арифметических положений, истинность которых, в принципе, доступна для человека с его интуицией и способностью к пониманию, а это означает, что человеческие интуицию и понимание невозможно свести к какому бы то ни было набору правил. Последующие мои рассуждения отчасти имеют целью убедить читателя в том, что вышеприведенное утверждение действительно следует из теоремы Гёделя; более того, именно на теореме Гёделя основывается мое доказательство неизбежности наличия в человеческом мышлении составляющей, которую никогда не удастся воспроизвести с помощью компьютера (в том смысле, который мы вкладываем в этот термин сегодня).
Думаю, нет необходимости давать в рамках основного доказательства определение «формальной системы» (если такая необходимость все же есть, то см. ). Вместо этого я воспользуюсь фундаментальным вкладом Тьюринга, который приблизительно в 1936 году описал класс процессов, которые мы сейчас называем «вычислениями» или «алгоритмами» (аналогичные результаты были получены независимо от Тьюринга некоторыми другими математиками, среди которых следует, в первую очередь, упомянуть Черча и Поста). Такие процессы эффективно эквивалентны процедурам, реализуемым в рамках любой математической формальной системы, поэтому для нас не имеет особого значения, что именно понимается под термином «формальная система», коль скоро мы обладаем достаточно ясным представлением о том, что обозначают термины «вычисление» или «алгоритм». Впрочем и для составления такого представления математически строгое определение нам не понадобится.
Те из вас, кто читал мою предыдущую книгу «Новый разум короля» (см. НРК, глава 2), возможно, припомнят, что алгоритм там определяется как процедура, которую способна выполнить машина Тьюринга, или, если угодно, математически идеализированная вычислительная машина. Такая машина функционирует в пошаговом режиме, причем каждый ее шаг полностью задается нанесенной на рабочую «ленту» меткой, которую (метку) машина «считывает» в соответствующий момент времени, и «внутренним состоянием» машины (дискретно определенным) на этот момент. Количество различных разрешенных внутренних состояний конечно, общее число меток на ленте также должно быть конечным, хотя сама лента по длине не ограничена. Машина начинает работу с какого-то определенного состояния, которое мы обозначим, например, нулем «0», команды же подаются на ленте в виде, скажем, двоичного числа (т.е. последовательности нулей «0» и единиц «1»). Далее машина начинает считывать эти команды, передвигая ленту (либо, что то же самое, перемещаясь вдоль ленты) некоторым определенным образом, согласно встроенным пошаговым инструкциям, при этом действие машины на каждом этапе работы определяется ее внутренним состоянием и конкретным символом, считываемым на данном этапе с ленты. Руководствуясь все теми же встроенными инструкциями, машина может стирать имеющиеся метки или ставить новые. В таком духе машина продолжает работать до тех пор, пока не достигнет особой команды «STOP», — именно в этот момент (и никак не раньше) машина прекращает работу, а мы можем увидеть на ленте ответ на выполнявшееся вычисление. Вот и все, можно задавать машине новую задачу.
Можно представить себе некую особую машину Тьюринга, которая способна имитировать действие любой возможной машины Тьюринга. Такие машины Тьюринга называют универсальными. Иными словами, любая отдельно взятая универсальная машина Тьюринга оказывается в состоянии выполнить любое вычисление (или алгоритм), какое нам только может прийти в голову. Хотя внутреннее устройство современного компьютера весьма отличается от устройства описанной выше конструкции (а его внутренняя «рабочая область», пусть и очень велика, все же не бесконечна, в отличие от идеализированной ленты машины Тьюринга), все современные универсальные компьютеры представляют собой, в сущности, универсальные машины Тьюринга.
2.2. Вычисления
В этом разделе мы поговорим о вычислениях. Под вычислением (или алгоритмом) я подразумеваю действие некоторой машины Тьюринга, или, иными словами, действие компьютера, задаваемое той или иной компьютерной программой. Не следует забывать и о том, что понятие вычисления включает в себя не только выполнение обычных арифметических действий — таких, например, как сложение или умножение чисел, — но и некоторые другие процессы. Так, частью вычислительной процедуры могут стать и вполне определенные логические операции. В качестве примера вычисления можно рассмотреть следующую задачу:
(А) Найти число, не являющееся суммой квадратов трех чисел.
Под «числом» в данном случае я подразумеваю «натуральное число», т.е. число из ряда
0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, ….
Под квадратом числа понимается результат умножения натурального числа на само себя, т.е. число из ряда
0, 1, 4, 9, 16, 25, 36, …;
представленные в этом ряду числа получены следующим образом:
0 × 0 = 0 2 , 1 × 1 = 1 2 , 2 × 2 = 2 2 , 3 × 3 = 3 2 , 4 × 4 = 4 2 , 5 × 5 = 5 2 , 6 × 6 = 6 2 , ….
Такие числа называются «квадратами», поскольку их можно представить в виде квадратных матриц (пустой матрицей в начале строки обозначен 0):
С учетом вышесказанного решение задачи (А) может происходить следующим образом. Мы поочередно проверяем каждое натуральное число, начиная с 0, на предмет того, не является ли оно суммой трех квадратов. При этом, разумеется, рассматриваются только те квадраты, величина которых не превышает самого числа. Таким образом, для каждого натурального числа необходимо проверить некоторое конечное количество квадратов. Отыскав тройку квадратов, составляющих в сумме данное число, переходим к следующему натуральному числу и снова ищем среди квадратов (не превышающих по величине рассматриваемое число) такие три, которые дают в сумме это самое число. Вычисление завершается лишь тогда, когда мы находим натуральное число, которое невозможно получить путем сложения любых трех квадратов. Попробуем применить описанную процедуру на практике и начнем наше вычисление с нуля. Нуль равен 02 + 02 + 02, что, безусловно, является суммой трех квадратов. Далее рассматриваем единицу и находим, что она не равна 02 + 02 + 02, однако равна 02 + 02 + 12. Переходим к числу 2 и выясняем, что оно не равно ни 02 + 02 + 02, ни 02 + 02 + 12, но равно 02 + 12 + 12. Затем следует число 3 и сумма 3 = 12 + 12 + 12; далее — число 4 и сумма 4 = 02 + 02 + 22; после 5 = 02 + 12 + 22 и 6 = 12 + 12 + 22 переходим к 7, и тут обнаруживается, что ни одна из троек квадратов (всех возможных троек квадратов, каждый из которых не превышает 7)
0 2 + 0 2 + 0 2 0 2 + 0 2 + 1 2 0 2 + 0 2 + 2 2 0 2 + 1 2 + 1 2 0 2 + 1 2 + 2 2
0 2 + 2 2 + 2 2 1 2 + 1 2 + 1 2 1 2 + 1 2 + 2 2 1 2 + 2 2 + 1 2 2 2 + 2 2 + 2 2
не дает в сумме 7. На этом этапе вычисление завершается, а мы делаем вывод: 7 есть одно из искомых чисел, так как оно не является суммой квадратов трех чисел.
2.3. Незавершающиеся вычисления
Будем считать, что с задачей (А) нам просто повезло. Попробуем решить еще одну:
(B) Найти число, не являющееся суммой квадратов четырех чисел.
На этот раз, добравшись до числа 7, мы находим, что в виде суммы квадратов четырех чисел его представить вполне возможно: 7 = 12 + 12 + 12 + 22, поэтому мы переходим к числу 8 (сумма 8 = 02 + 02 + 22 + 22), далее — 9 (сумма 9 = 02 + 02 + 02 + 32) и 10 (10 = 02 + 02 + 12 + 32) и т.д. Вычисления все продолжаются и продолжаются (… 23 = 12 + 22 + 32 + 32, 24 = 02 + 22 + 22 + 42, …, 359 = 12 + 32 + 52 + 182, …) и завершаться, похоже, не собираются. Мы предполагаем, что искомое число, должно быть, невообразимо велико, и для его вычисления нашему компьютеру потребуется чрезвычайно большой промежуток времени и огромный объем памяти. Более того, мы уже начинаем сомневаться, существует ли оно вообще, это самое число. Вычисления все продолжаются и продолжаются, и конца им не видно. Вообще говоря, так оно и есть: описанная вычислительная процедура завершиться в принципе не может. Известна теорема, впервые доказанная в 1770 году великим французским (и отчасти итальянским) математиком Жозефом Луи Лагранжем, согласно которой в виде суммы квадратов четырех чисел можно представить любое число. Теорема эта, кстати, весьма непроста (доказать ее как-то пытался великий современник Лагранжа, швейцарский математик Леонард Эйлер, человек, отличавшийся удивительной математической интуицией, оригинальностью и продуктивностью, однако его постигла неудача).
Я, разумеется, не собираюсь докучать читателю подробностями доказательства Лагранжа, вместо этого рассмотрим одну не в пример более простую задачу:
(C) Найти нечетное число, являющееся суммой двух четных чисел.
Нисколько не сомневаюсь, что все и так уже все поняли, однако все же поясню. Очевидно, что вычисление, необходимое для решения этой задачи, раз начавшись, не завершится никогда. При сложении четных чисел, т.е. чисел, кратных двум,
0, 2, 4, 6, 8, 10, 12, 14, 16, …,
всегда получаются четные же числа; иными словами, никакая пара четных чисел не может дать в сумме нечетное число, т.е. число вида
1, 3, 5, 7, 9, 11, 13, 15, 17, ….
Я привел два примера ((B) и (C)) вычислений, которые невозможно выполнить до конца. Несмотря на то, что в первом случае вычисление и в самом деле никогда не завершается, доказать это довольно непросто, во втором же случае, напротив, бесконечность вычисления более чем очевидна. Позволю себе привести еще один пример:
(D) Найти четное число, большее 2, не являющееся суммой двух простых чисел.
Вспомним, что простым называется натуральное число (отличное от 0 и 1), которое делится без остатка лишь само на себя и на единицу; иными словами, простые числа составляют следующий ряд:
2, 3, 5, 7, 11, 13, 17, 19, 23, ….
Существует довольно высокая вероятность того, что отыскание решения задачи (D) также потребует незавершающейся вычислительной процедуры, однако полной уверенности пока нет. Для получения такой уверенности необходимо прежде доказать истинность знаменитой «гипотезы Гольдбаха», выдвинутой Гольдбахом в письме к Эйлеру еще в 1742 году и до сих пор недоказанной.
2.4. Как убедиться в невозможности завершить вычисление?
Мы установили, что вычисления могут как успешно завершаться, так и вообще не иметь конца. Более того, в тех случаях, когда вычисление завершиться в принципе не может, это его свойство иногда оказывается очевидным, иногда не совсем очевидным, а иногда настолько неочевидным, что ни у кого до сих пор не достало сообразительности однозначно такую невозможность доказать. С помощью каких методов математики убеждают самих себя и всех остальных в том, что такое-то вычисление не может завершиться? Применяют ли они при решении подобных задач какие-либо вычислительные (или алгоритмические) процедуры? Прежде чем мы приступим к поиску ответа на этот вопрос, рассмотрим еще один пример. Он несколько менее очевиден, чем (C), но все же гораздо проще (B). Возможно, нам удастся попутно получить некоторое представление о том, с помощью каких средств и методов математики приходят к своим выводам.
В предлагаемом примере участвуют числа, называемые шестиугольными:
1, 7, 19, 37, 61, 91, 127, …,
иными словами, числа, из которых можно строить шестиугольные матрицы (пустую матрицу на этот раз мы не включаем):
Каждое такое число, за исключением начальной единицы, получается добавлением к предыдущему числу соответствующего числа из ряда кратных 6:
6, 12, 18, 24, 30, 36, ….
Это легко объяснимо, если обратить внимание на то, что каждое новое шестиугольное число получается путем окружения предыдущего числа шестиугольным кольцом
причем число горошин в этом кольце обязательно будет кратно 6, а множитель при каждом увеличении шестиугольника на одно кольцо будет возрастать ровно на единицу.
Вычислим последовательные суммы шестиугольных чисел, увеличивая каждый раз количество слагаемых на единицу, и посмотрим, что из этого получится.
1 = 1, 1 + 7 = 8, 1 + 7 + 19 = 27, 1 + 7 + 19 + 37 = 64, 1 + 7 + 19 + 37 + 61 = 125.
Что же особенного в числах 1, 8, 27, 64, 125? Все они являются кубами. Кубом называют число, умноженное само на себя трижды:
1 = 1 3 =1 × 1 × 1, 8 = 2 3 = 2 × 2 × 2, 27 = 3 3 = 3 × 3 × 3, 64 = 4 3 = 4 × 4 × 4, 125 = 5 3 = 5 × 5 × 5, ….
Присуще ли это свойство всем шестиугольным числам? Попробуем следующее число. В самом деле,
1 + 7 + 19 + 37 + 61 + 91 = 216 = 6 × 6 × 6 = 6 3 .
Всегда ли выполняется это правило? Если да, то никогда не завершится вычисление, необходимое для решения следующей задачи:
(E) Найти последовательную сумму шестиугольных чисел, начиная с единицы, не являющуюся кубом.
Думается, я сумею убедить вас в том, что это вычисление и в самом деле можно выполнять вечно, но так и не получить искомого ответа.
Прежде всего отметим, что число называется кубом не просто так: из соответствующего количества точек можно сложить трехмерный массив в форме куба (такой, например, как на рис. ). Попробуем представить себе построение такого массива в виде последовательности шагов: вначале разместим где-нибудь угловую точку, а затем будем добавлять к ней, одну за другой, особые конфигурации точек, составленные из трех «плоскостей» — задней стенки, боковой стенки и потолка, как показано на рис. .
Рис. 2.1. Сферы, уложенные в кубический массив.
Рис. 2.2. Разберем куб на части — каждая со своей задней стенкой, боковой стенкой и потолком.
Посмотрим теперь на одну из наших трехгранных конфигураций со стороны, т. е. вдоль прямой, соединяющей начальную точку построения и точку, общую для всех трех граней. Мы увидим шестиугольник, подобный тому, что изображен на рис. . Точки, из которых складываются эти увеличивающиеся в размере шестиугольники, представляют собой, в сущности, те же точки, что образуют полный куб. То есть получается, что последовательное сложение шестиугольных чисел, начиная с единицы, всегда будет давать число кубическое. Следовательно, можно считать доказанным, что вычисление, требуемое для решения задачи (E), никогда не завершится.
Рис. 2.3. Каждую часть построения можно рассматривать как шестиугольник.
Кто-то, быть может, уже готов упрекнуть меня в том, что представленные выше рассуждения можно счесть в лучшем случае интуитивным умозаключением, но не формальным и строгим математическим доказательством. На самом же деле, перед вами именно доказательство, и доказательство вполне здравое, а пишу все это я отчасти и для того, чтобы показать, что осмысленность того или иного метода математического обоснования никак не связана с его «формализованностью» в соответствии с какой-либо заранее заданной и общепринятой системой правил. Напомню, кстати, о еще более элементарном примере геометрического обоснования, применяемого для получения одного общего свойства натуральных чисел, — речь идет о доказательстве истинности равенства a × b = b × a, приведенном в . Тоже вполне достойное «доказательство», хотя формальным его назвать нельзя.
Представленное выше рассуждение о суммировании последовательных шестиугольных чисел можно при желании заменить более формальным математическим доказательством. В основу такого формального доказательства можно положить принцип математической индукции, т.е. процедуру установления истинности утверждения в отношении всех натуральных чисел на основании одного-единственного вычисления. По существу, этот принцип позволяет заключить, что некое положение P(n), зависящее от конкретного натурального числа n (например, такое: «сумма первых n шестиугольных чисел равна n3»), справедливо для всех n, если мы можем показать, во-первых, что оно справедливо для n = 0 (или, в нашем случае, для n = 1), и, во-вторых, что из истинности P(n) следует истинность и P(n+1). Думаю, нет необходимости описывать здесь в деталях, как можно с помощью математической индукции доказать невозможность завершить вычисление (E); тем же, кого данная тема заинтересовала, рекомендую попытаться в качестве упражнения выполнить такое доказательство самостоятельно.
Всегда ли для установления факта действительной незавершаемости вычисления достаточно применить некие четко определенные правила — такие, например, как принцип математической индукции? Как ни странно, нет. Это утверждение, как мы вскоре увидим, является одним из следствий теоремы Гёделя, и для нас крайне важно попытаться его правильно понять. Причем недостаточной оказывается не только математическая индукция. Недостаточным будет какой угодно набор правил, если под «набором правил» подразумевать некую систему формализованных процедур, в рамках которой возможно исключительно вычислительным путем проверить корректность применения этих правил в каждом конкретном случае. Такой вывод может показаться чересчур пессимистичным, ибо он, по-видимому, означает, что, несмотря на то, что вычисления, которые нельзя завершить, существуют, сам факт их незавершаемости строго математически установить невозможно. Однако смысл упомянутого следствия из теоремы Гёделя заключается вовсе не в этом. На самом деле, все не так уж и плохо: способность понимать и делать выводы, присущая математикам — как, впрочем, и всем остальным людям, наделенным логическим мышлением и воображением, — просто-напросто не поддается формализации в виде того или иного набора правил. Иногда правила могут стать частичной заменой пониманию, однако в полной мере такая замена не представляется возможной.
2.5. Семейства вычислений; следствие Гёделя—Тьюринга
G
Для того, чтобы понять, каким образом из теоремы Гёделя (в моей упрощенной формулировке, навеянной отчасти идеями Тьюринга) следует все вышесказанное, нам необходимо будет сделать небольшое обобщение для типов утверждений, относящихся к рассмотренным в предыдущем разделе вычислениям. Вместо того чтобы решать проблему завершаемости для каждого отдельного вычисления ((A), (B), (C), (D) или (E)), нам следует рассмотреть некоторое общее вычисление, которое зависит от натурального числа n (либо как-то воздействует на него). Таким образом, обозначив такое вычисление через C(n), мы можем рассматривать его как целое семейство вычислений, где для каждого натурального числа (0, 1, 2, 3, 4, …) выполняется отдельное вычисление (соответственно, C(0), C(1), C(2), C(3), C(4), …), а сам принцип, в соответствии с которым вычисление зависит от n, является целиком и полностью вычислительным.
В терминах машин Тьюринга это всего лишь означает, что C(n) есть действие, производимое некоей машиной Тьюринга над числом n. Иными словами, число п наносится на ленту и подается на вход машины, после чего машина самостоятельно выполняет вычисления. Если вас почему-либо не устраивает концепция «машины Тьюринга», вообразите себе самый обыкновенный универсальный компьютер и считайте n «данными», необходимыми для работы какой-нибудь программы. Нас в данном случае интересует лишь одно: при любом ли значении n может завершиться работа такого компьютера.
Для того чтобы пояснить, что именно понимается под вычислением, зависящим от натурального числа n, рассмотрим два примера:
(F) найти число, не являющееся суммой квадратов n чисел,
и
(G) найти нечетное число, являющееся суммой n четных чисел.
Припомнив, о чем говорилось выше, мы без особого труда убедимся, что вычисление (F) завершается только при n = 0, 1, 2 и 3 (давая в результате, соответственно, 1, 2, 3 и 7), тогда как вычисление (G) вообще не завершается ни при каком значении n. Вздумай мы действительно доказать, что вычисление (F) не завершается при n, равном или большем 4, нам понадобилась бы более или менее серьезная математическая подготовка (по крайней мере, знакомство с доказательством Лагранжа); с другой стороны, тот факт, что ни при каком n не завершается вычисление (G), вполне очевиден. Какими же процедурами располагают математики для установления незавершаемой природы таких вычислений в общем случае? Можно ли сами эти процедуры представить в вычислительной форме?
Предположим, что у нас имеется некая вычислительная процедура А, которая по завершении дает нам исчерпывающее доказательство того, что вычисление C(n) действительно никогда не заканчивается. Ниже мы попробуем вообразить, что A включает в себя все известные математикам процедуры, посредством которых можно убедительно доказать, что то или иное вычисление никогда не завершается. Соответственно, если в каком-то конкретном случае завершается процедура A, то мы получаем, в рамках доступного человеку знания, доказательство того, что рассматриваемое конкретное вычисление никогда не заканчивается. Большая часть последующих рассуждений не потребует участия процедуры A именно в такой роли, так как они посвящены, в основном, математическим умопостроениям. Однако для получения окончательного заключения G нам придется-таки придать процедуре A соответствующий статус.
Я, разумеется, не требую, чтобы посредством процедуры A всегда можно было однозначно установить, что вычисление C(n) нельзя завершить (в случае, если это действительно так); однако я настаиваю на том, что неверных ответов A не дает, т.е. если мы с ее помощью пришли к выводу, что вычисление C(n) не завершается, значит, так оно и есть. Процедуру A, которая и в самом деле всегда дает верный ответ, мы будем называть обоснованной.
Следует отметить, что если процедура A оказывается в действительности необоснованной, то этот факт, в принципе, можно установить с помощью прямого вычисления — иными словами, необоснованную процедуру A можно опровергнуть вычислительными методами: если А ошибочно утверждает, что вычисление C(n) нельзя завершить, тогда как в действительности это не так, то выполнение самого вычисления C(n) в конечном счете приведет к опровержению А. (Возможность практического выполнения такого вычисления представляет собой отдельный вопрос, его мы рассмотрим в ответе на возражение Q8.)
Для того чтобы процедуру A можно было применять к вычислениям в общем случае, нам потребуется какой-нибудь способ маркировки различных вычислений C(n), допускаемый A. Все возможные вычисления C можно, вообще говоря, представить в виде простой последовательности
C 0 , C 1 , C 2 , C 3 , C 4 , C 5 , …,
т.е. q-e вычисление при этом получит обозначение C q . В случае применения такого вычисления к конкретному числу n будем записывать
C 0 ( n ), C 1 ( n ), C 2 ( n ), C 3 ( n ), C 4 ( n ), C 5 ( n ), ….
Можно представить, что эта последовательность задается, скажем, как некий пронумерованный ряд компьютерных программ. (Для большей ясности мы могли бы, при желании, рассматривать такую последовательность как ряд пронумерованных машин Тьюринга, описанных в НРК; в этом случае вычисление C q (n) представляет собой процедуру, выполняемую q-й машиной Тьюринга T q над числом n.) Здесь важно учитывать следующий технический момент: рассматриваемая последовательность является вычислимой — иными словами, существует одно-единственное вычисление C•, которое, будучи выполнено над числом q, дает в результате C q , или, если точнее, выполнение вычисления C• над парой чисел q, n (именно в таком порядке) дает в результате C q (n).
Можно полагать, что процедура A представляет собой некое особое вычисление, выполняя которое над парой чисел q, n, можно однозначно установить, что вычисление C q (n), в конечном итоге, никогда не завершится. Таким образом, когда завершается вычисление A, мы имеем достаточное доказательство того, что вычисление C q (n) завершить невозможно. Хотя, как уже говорилось, мы и попытаемся вскоре представить себе такую процедуру A, которая формализует все известные современной математике процедуры, способные достоверно установить невозможность завершения вычисления, нет никакой необходимости придавать A такой смысл прямо сейчас. Пока же процедурой A мы будем называть любой обоснованный набор вычислительных правил, с помощью которого можно установить, что то или иное вычисление C q (n) никогда не завершается. Поскольку выполняемое процедурой А вычисление зависит от двух чисел q и n, его можно обозначить как A(q, n) и записать следующее утверждение:
(H) Если завершается A ( q , n ), то C q ( n ) не завершается.
Рассмотрим частный случай утверждения (H), положив q равным n. Такой шаг может показаться странным, однако он вполне допустим. (Он представляет собой первый этап мощного «диагонального доказательства» — процедуры, открытой в высшей степени оригинальным и влиятельным датско-русско-немецким математиком девятнадцатого века Георгом Кантором; эта процедура лежит в основе рассуждений и Гёделя, и Тьюринга.) При q, равном n, наше утверждение принимает следующий вид:
(I) Если завершается A ( n , n ), то C n ( n ) не завершается.
Отметим, что A(n, n) зависит только от одного числа (n), а не от двух, так что данное вычисление должно принадлежать ряду C0, C1, C2, C3, C4, C5, … (по n), поскольку предполагается, что этот ряд содержит все вычисления, которые можно выполнить над одним натуральным числом n. Обозначив это вычисление через C k , запишем:
(J) A ( n , n ) = C k ( n ).
Рассмотрим теперь частный случай n = k. (Второй этап диагонального доказательства Кантора.) Из равенства (J) получаем:
(K) A ( k , k ) = C k ( k ),
утверждение же (I) при n = k принимает вид:
(L) Если завершается A ( k , k ), то C k ( k ) не завершается.
Подставляя (K) в (L), находим:
(M) Если завершается C k ( k ), то C k ( k ) не завершается.
Из этого следует заключить, что вычисление C k (k) в действительности не завершается. (Ибо, согласно (M), если оно завершается, то оно не завершается!) Невозможно завершить и вычисление A(k, k), поскольку, согласно (K), оно совпадает с C k (k). То есть наша процедура A оказывается не в состоянии показать, что данное конкретное вычисление C k (k) не завершается, даже если оно и в самом деле не завершается.
Более того, если нам известно, что процедура А обоснованна, то, значит, нам известно и то, что вычисление C k (k) не завершается. Иными словами, нам известно нечто, о чем посредством процедуры A мы узнать не могли. Следовательно, сама процедура A с нашим пониманием никак не связана.
В этом месте осторожный читатель, возможно, пожелает перечесть все вышеприведенное доказательство заново, дабы убедиться в том, что он не пропустил какой-нибудь «ловкости рук» с моей стороны. Надо признать, что, на первый взгляд, это доказательство и в самом деле смахивает на фокус, и все же оно полностью допустимо, а при более тщательном изучении лишь выигрывает в убедительности. Мы обнаружили некое вычисление C k (k), которое, насколько нам известно, не завершается; однако установить этот факт с помощью имеющейся в нашем распоряжении вычислительной процедуры А мы не в состоянии. Это, собственно, и есть теорема Гёделя(—Тьюринга) в необходимом мне виде. Она применима к любой вычислительной процедуре A, предназначенной для установления невозможности завершить вычисление, — коль скоро нам известно, что упомянутая процедура обоснованна. Можно заключить, что для однозначного установления факта незавершаемости вычисления не будет вполне достаточным ни один из заведомо обоснованных наборов вычислительных правил (такой, например, как процедура A), поскольку существуют незавершающиеся вычисления (например, C k (k)), на которые эти правила не распространяются. Более того, поскольку на основании того, что нам известно о процедуре A и об ее обоснованности, мы действительно можем составить вычисление C k (k), которое, очевидно, никогда не завершается, мы вправе заключить, что процедуру A никоим образом нельзя считать формализацией процедур, которыми располагают математики для установления факта незавершаемости вычисления, вне зависимости от конкретной природы A. Вывод:
G Для установления математической истины математики не применяют заведомо обоснованные алгоритмы.
Мне представляется, что к такому выводу неизбежно должен прийти всякий логически рассуждающий человек. Однако многие до сих пор предпринимают попытки этот вывод опровергнуть (выдвигая возражения, обобщенные мною под номерами Q1-Q20 в и ), и, разумеется, найдется ничуть не меньше желающих оспорить вывод более строгий, суть которого сводится к тому, что мыслительная деятельность непременно оказывается связана с некими феноменами, носящими фундаментально невычислительный характер. Вы, возможно, уже спрашиваете себя, каким же это образом подобные математические рассуждения об абстрактной природе вычислений могут способствовать объяснению принципов функционирования человеческого мозга. Какое такое отношение имеет все вышесказанное к проблеме осмысленного осознания? Дело в том, что, благодаря этим математическим рассуждениям, мы и впрямь можем прояснить для себя некие весьма важные аспекты такого свойства мышления, как понимание — в терминах общей вычислимости, — а как было показано в , свойство понимания связано с осмысленным осознанием самым непосредственным образом. Предшествующее рассуждение действительно носит в основном математический характер, и связано это с необходимостью подчеркнуть одно очень существенное обстоятельство: алгоритм A участвует здесь на двух совершенно различных уровнях. С одной стороны, это просто некий алгоритм, обладающий определенными свойствами; с другой стороны, получается, что на самом-то деле A можно рассматривать как «алгоритм, которым пользуемся мы сами» в процессе установления факта незавершаемости того или иного вычисления. Так что в вышеприведенном рассуждении речь идет не только и не столько о вычислениях. Речь идет также и о том, каким образом мы используем нашу способность к осмысленному пониманию для составления заключения об истинности какого-либо математического утверждения — в данном случае утверждения о незавершаемости вычисления C k (k). Именно взаимодействие между двумя различными уровнями рассмотрения алгоритма A — в качестве гипотетического способа функционирования сознания и собственно вычисления — позволяет нам сделать вывод, выражающий фундаментальное противоречие между такой сознательной деятельностью и простым вычислением.
Существуют, однако, всевозможные лазейки и контраргументы, на которые необходимо обратить самое пристальное внимание. Для начала, в оставшейся части этой главы, я тщательно разберу все важные контраргументы против вывода G, которые когда-либо попадались мне на глаза — см. возражения Q1-Q20 и комментарии к ним в и ; там, кроме того, можно найти и несколько дополнительных возражений моего собственного изобретения. Каждое из возражений будет разобрано со всей обстоятельностью, на какую я только способен. Пройдя через это испытание, вывод G, как мы убедимся, существенно не пострадает. Далее, в , я рассмотрю следствия уже из утверждения G. Мы обнаружим, что оно и в самом деле способно послужить прочным фундаментом для построения весьма убедительного доказательства абсолютной невозможности точного моделирования сознательного математического понимания посредством вычислительных процедур, будь то восходящие, нисходящие или любые их сочетания. Многие сочтут такой вывод весьма неприятным, поскольку если он справедлив, то нам, получается, просто некуда двигаться дальше. Во второй части книги я выберу более позитивный курс. Я приведу правдоподобные, на мой взгляд, научные доводы в пользу справедливости результатов моих размышлений о физических процессах, которые могут, предположительно, лежать в основе деятельности мозга — вроде той, что осуществляется при нашем восприятии приведенных выше рассуждений, — и о причинах недоступности этой деятельности для какого бы то ни было вычислительного описания.
2.6. Возможные формальные возражения против
G
Утверждение G вполне способно потрясти воображение и не слишком впечатлительного читателя, особенно если учесть достаточно простой характер составных элементов рассуждения, из которого мы это утверждение вывели. Прежде чем перейти к рассмотрению (в ) его следствий применительно к возможности создания разумного робота-математика с компьютерным разумом, необходимо очень тщательно исследовать некоторое количество формальных моментов, связанных с получением вывода G. Если подобные возможные формальные «лазейки» вас не смущают и вы готовы принять на веру утверждение G (согласно которому, напомним, математики при установлении математической истины не применяют заведомо обоснованные алгоритмы), то вы, вероятно, предпочтете пропустить (или хотя бы на некоторое время отложить) нижеследующие рассуждения и перейти непосредственно к . Более того, если вы готовы принять на веру и несколько более серьезный вывод, в соответствии с которым принципиально невозможно алгоритмически объяснить ни математическое, ни какое-либо иное понимание, то вам, возможно, стоит перейти сразу ко второй части книги — задержавшись разве что на воображаемом диалоге в (обобщающем наиболее важные аргументы ) и выводах в .
Существует несколько математических моментов, связанных с приведенным в гёделевским доказательством, которые не дают людям покоя. Попытаемся с этими моментами разобраться.
Q1 . Я понимаю так, что процедура А является единичной , тогда как во всевозможных математических обоснованиях мы. несомненно, применяем много разных способов рассуждения. Не следует ли нам принять во внимание возможность существования целого ряда возможных «процедур A »?
В действительности, использование мною такой формулировки вовсе не влечет за собой потери общего характера рассуждений в целом. Любой конечный ряд A1, A2, A3, …, Ar алгоритмических процедур всегда можно выразить в виде единичного алгоритма A, причем таким образом, что A окажется незавершаемым только в том случае, если не завершаются все отдельные алгоритмы A1, …, Ar . (Процедура A может протекать, например, следующим образом: «Выполнить первые 10 шагов алгоритма A1 запомнить результат; выполнить первые 10 шагов алгоритма A2; запомнить результат; выполнить первые 10 шагов алгоритма A3; запомнить результат; и так далее вплоть до A r ; затем вернуться к A1 и выполнить следующие 10 шагов; запомнить результат и т.д.; затем перейти к третьей группе из 10 шагов и т.п. Завершить процедуру, как только завершится любой из алгоритмов A r ».) Если же ряд алгоритмов А бесконечен, то для того, чтобы его можно было считать алгоритмической процедурой, необходимо найти способ порождения всей совокупности алгоритмов A1, A2, A3, … алгоритмическим путем. Тогда мы сможем получить единичный алгоритм А, который заменяет весь ряд алгоритмов и выглядит приблизительно следующим образом:
«первые 10 этапов A 1 ;
вторые 10 этапов A 1 , первые 10 этапов A 2 ;
третьи 10 этапов A 1 вторые 10 этапов A 2 , первые 10 этапов A 3 ;
… и т.д.»…
Завершается такой алгоритм лишь после успешного завершения любого алгоритма из ряда, и никак не раньше.
С другой стороны, можно представить себе ситуацию, когда ряд A1, A2, A3, …, предположительно бесконечный, заранее не задан даже в принципе. Время от времени к такому ряду добавляется следующая алгоритмическая процедура, однако изначально весь ряд в целом не определен. В этом случае, ввиду отсутствия какой-либо предварительно заданной алгоритмической процедуры для порождения такого ряда, единичный замкнутый алгоритм нам получить никак не удастся.
Q2 . Мы, безусловно, должны допустить, что алгоритм A может оказаться и не фиксированным. Люди, в конце концов, обладают способностью к обучению, а значит, применяемый ими при этом алгоритм вполне может претерпевать непрерывные изменения.
Для описания изменяющегося алгоритма необходимо каким-то образом задать правила, согласно которым он, собственно, изменяется. Если сами по себе эти правила являются полностью алгоритмическими, то мы уже включили их в описание нашей гипотетической процедуры «A», иначе говоря, такой «изменяющийся алгоритм» на деле представляет собой всего-навсего еще один пример единичного алгоритма, и на наши рассуждения подобное допущение никак не влияет. С другой стороны, можно вообразить средства для изменения алгоритма, предположительно не являющиеся алгоритмическими: такие, например, как введение в алгоритм каких-то случайных составляющих или неких процедур взаимодействия его с окружением. «Неалгоритмический» статус подобных средств изменения алгоритма мы еще будем рассматривать несколько позднее (см. , ); можно также вернуться к , где было показано, что ни одно из этих средств не позволяет сколько-нибудь убедительно избавиться от алгоритмизма (как того требует точка зрения C) В данном случае, т.е. в рамках чисто математических рассуждений, нас занимает лишь возможность того, что такое изменение действительно будет носить алгоритмический характер. Если же предположить, что алгоритмическим оно быть никак не может, то мы, безусловно, придем к полному согласию с выводом G.
Пожалуй, следует немного подробнее остановиться на том, что может обозначать определение «алгоритмически изменяющийся» применительно к алгоритму A. Допустим, что алгоритм A зависит не только от q и n, но и еще от одного параметра t, который можно рассматривать как «время», а можно как просто количество предшествующих настоящему моменту случаев активации нашего алгоритма. Как бы то ни было, мы можем также предположить, что параметр t является натуральным числом, и записать следующий ряд алгоритмов A t (q, n):
A 0 ( q , n ), A 1 ( q , n ), A 2 ( q , n ), A 3 ( q , n ), …,
каждый элемент которого предположительно является обоснованной процедурой для установления незавершаемости вычисления C q (n); при этом мы будем считать, что мощность этих процедур возрастает по мере увеличения t. Предполагается также, что способ, посредством которого увеличивается мощность этих процедур, является алгоритмическим. Возможно, этот «алгоритмический способ» зависит некоторым образом от «опыта» выполнения предыдущих алгоритмов A t (q, n), однако в данном случае мы предполагаем, что этот «опыт» порождается также алгоритмически (в противном случае мы снова приходим к согласию с G), т.е. мы имеем полное право включить «опыт» (или способы его порождения) в перечень операций, составляющих следующий алгоритм (т.е., собственно, в A t (q, n)). Действуя таким образом, мы опять-таки получаем единичный алгоритм (A t (q, n)), который зависит алгоритмически от всех трех параметров: t, q, n. На его основе можно построить алгоритм A*, столь же мощный, что и весь ряд A t (q, n), однако зависящий только от двух натуральных чисел: q и n. Для получения такого A*(q, n) нам, как и прежде, необходимо лишь выполнить первые десять шагов алгоритма A0(q, n) и запомнить результат; затем первые десять шагов алгоритма A1(q, n) и вторые десять шагов алгоритма A0(q, n), запоминая получаемые результаты; затем первые десять шагов алгоритма A2(q, n). вторые десять шагов алгоритма A1(q, n), третьи десять шагов алгоритма A0(q, n) и т.д., запоминая получаемые на каждом шаге вычисления результаты. В конечном итоге, сразу после завершения любого из составляющих алгоритм вычислений завершается выполнение и всей процедуры в целом. Замена процедуры A процедурой A* никак не влияет на ход рассуждений, посредством которых мы пришли к выводу G.
Q3 . Не был ли я излишне категоричен, утверждая, что в тех случаях, когда уже можно определенно утверждать, что данное вычисление C q ( n ) и вправду завершается , алгоритм A все равно должен выполняться бесконечно? Допусти мы, что A в таких случаях также завершается , все наше рассуждение оказалось бы ложным. В конце концов, общеизвестно, что присущая людям способность к интуитивному пониманию позволяет им порой делать заключение о возможности завершения того или иного вычисления, однако я, судя по всему, здесь этой способностью пренебрег. Не слишком ли много искусственных ограничений?
Вовсе нет. Предполагается, что наше рассуждение применимо лишь к тому пониманию, которое позволяет заключить, что вычисление не завершается, но никак не к тому пониманию, благодаря которому мы приходим к противоположному выводу. Гипотетический алгоритм A вовсе не обязан достигать «успешного завершения», обнаружив что то или иное вычисление завершается. Не в этом заключается его смысл.
Если вас такое положение дел не устраивает, попробуйте представить алгоритм A следующим образом: пусть A объединяет в себе оба вида понимания, но в том случае, когда выясняется, что вычисление C q (n) действительно завершается, алгоритм A искусственно зацикливается (т.е. выполняет какую-то операцию снова и снова, бесконечное количество раз). Разумеется, на самом деле математики работают иначе, однако дело не в этом. Наше рассуждение построено как reductio ad absurdum [12]Приведение к абсурду (лат.), доказательство от противного. — Прим. перев.
, т.е. начав с допущения, что для установления математической истины используются заведомо обоснованные алгоритмы, мы в итоге приходим к противоположному выводу. Такое доказательство не требует, чтобы гипотетическим алгоритмом непременно оказался какой-то конкретный алгоритм A, мы вполне можем заменить его на другой алгоритм, построенный на основе A, — как, например, в только что упомянутом случае.
Этот комментарий применим и к любому другому возражению вида: «А что если алгоритм A завершится по какой-либо совершенно посторонней причине и не даст нам доказательства того, что вычисление C q (n) не завершается?». Если нам вдруг придется иметь дело с алгоритмом «A», который ведет себя подобным образом, то мы просто применим представленное в обоснование к немного другому A — к такому, который зацикливается всякий раз, когда исходный «A» завершается по любой из упомянутых посторонних причин.
Q4 . Судя по всему, каждое вычисление C q в предложенной мною последовательности C 0 , C 1 , C 2 , … является вполне определенным, тогда как при любом прямом переборе (численном или алфавитном) компьютерных программ ситуация, конечно же, была бы иной?
В самом деле, было бы весьма затруднительно однозначно гарантировать, что каждому натуральному числу q в нашей последовательности действительно соответствует некое рабочее вычисление C q . Например, описанная в НРК последовательность машин Тьюринга T q этому условию, конечно же, не удовлетворяет; см. НРК, с. 54. При определенных значениях q машину Тьюринга T q можно назвать «фиктивной» по одной из четырех причин: ее работа никогда не завершается; она оказывается «некорректно определенной», поскольку представление числа n в виде двоичной последовательности содержит слишком много (пять или более) единиц подряд и, как следствие, не имеет интерпретации в данной схеме; она получает команду, которая вводит ее в нигде не описанное внутреннее состояние; или же по завершении работы она оставляет ленту пустой, т.е. не дает никакого численно интерпретируемого результата. (См. также .) Для приведенного в доказательства Гёделя—Тьюринга вполне достаточно объединить все эти причины в одну категорию под названием «вычисление не завершается». В частности, когда я говорю, что вычислительная процедура A «завершается» (см. также примечание ), я подразумеваю, что она «завершается» как раз в вышеупомянутом смысле (а потому не содержит неинтерпретируемых последовательностей и не оставляет ленту пустой), — иными словами, «завершиться» может только действительно корректно определенное рабочее вычисление. Аналогично, фраза «вычисление C q (n) завершается» означает, что данное вычисление корректно завершается именно в этом смысле. При такой интерпретации соображение Q4 не имеет совершенно никакого отношения к представленному мною доказательству.
Q5 . Не является ли мое рассуждение лишь демонстрацией неприменимости некоей частной алгоритмической процедуры ( A ) к выполнению вычисления C q ( n )? И каким образом оно показывает, что я справлюсь с задачей лучше, чем какая бы то ни было процедура A ?
Оно и в самом деле вполне однозначно показывает, что мы справляемся с такого рода задачами гораздо лучше любого алгоритма. Поэтому, собственно, я и воспользовался в своем рассуждении приемом reductio ad absurdum. Пожалуй, в данном случае уместно будет привести аналогию. Читателям, вероятно, известно о евклидовом доказательстве невозможности отыскать наибольшее простое число, также основанном на reductio ad absurdum. Доказательство Евклида выглядит следующим образом. Допустим обратное: такое наибольшее простое число нам известно; назовем его p. Теперь рассмотрим число N, которое представляет собой сумму произведения всех простых чисел вплоть до p и единицы:
N = 2 × 3 × 5 × … × p + 1.
Число N, безусловно, больше p, однако оно не делится ни на одно из простых чисел 2, 3, 5, ..., p (поскольку при делении получаем единицу в остатке), откуда следует, что N либо и есть искомое наибольшее простое число, либо оно является составным, и тогда его можно разделить на простое число, большее p. И в том, и в другом случае мы находим простое число, большее p, что противоречит исходному допущению, заключавшемуся в том, что p есть наибольшее простое число. Следовательно, наибольшее простое число отыскать нельзя.
Такое рассуждение, основываясь на reductio ad absurdum, не просто показывает, что требуемому условию не соответствует некое частное простое число р, поскольку можно отыскать число больше него; оно показывает, что наибольшего простого числа просто не может существовать в природе. Аналогично, представленное выше доказательство Гёделя—Тьюринга не просто показывает, что нам не подходит тот или иной частный алгоритм А, оно демонстрирует, что в природе не существует алгоритма (познаваемо обоснованного), который был бы эквивалентен способности человека к интуитивному пониманию, которую мы применяем для установления факта незавершаемости тех или иных вычислений.
Q6 . Можно составить программу, выполняя которую, компьютер в точности повторит все этапы представленного мною доказательства. Не означает ли это, что компьютер оказывается в состоянии самостоятельно прийти к любому заключению, к какому пришел бы я сам?
Отыскание конкретного вычисления C k (k) при заданном алгоритме А, безусловно, представляет собой вычислительный процесс. Более того, это можно достаточно явно показать. Означает ли это, что предположительно неалгоритмическая математическая интуиция — интуиция, благодаря которой мы определяем, что вычисление C k (k) никогда не завершается, — на деле является все же алгоритмической?
Думаю, данное суждение следует рассмотреть более подробно, поскольку оно представляет собой одно из наиболее распространенных недоразумений, связанных с гёделевским доказательством. Следует особо уяснить, что оно не сводит на нет ничего из сказанного ранее. Хотя процедуру отыскания вычисления C k (k) с помощью алгоритма A можно представить в виде вычисления, это вычисление не входит в перечень процедур, содержащихся в A. И не может входить, поскольку самостоятельно алгоритм A не способен установить истинность C k (k), тогда как новое вычисление (вкупе с A), судя по всему, вполне на это способно. Таким образом, несмотря на то, что с помощью нового вычисления действительно можно отыскать вычисление C k (k), членом клуба «официальных установителей истины» оно не является.
Изложим все это несколько иначе. Вообразите себе управляемого компьютером робота, способного устанавливать математические истины с помощью алгоритмических процедур, содержащихся в A. Для большей наглядности я буду пользоваться антропоморфной терминологией и говорить, что робот «знает» те математические истины (в данном случае — связанные с установлением факта незавершаемости вычислений), которые он может вывести, применяя алгоритм A. Однако если наш робот «знает» лишь A, то он никак не сможет «узнать», что вычисление C k (k) не завершается, даже если процедура отыскания C k (k) с помощью A является целиком и полностью алгоритмической. Мы, разумеется, могли бы сообщить роботу о том, что вычисление C k (k) и в самом деле не завершается (воспользовавшись для установления этого факта собственными пониманием и интуицией), однако, если робот примет это утверждение на «веру», ему придется изменить свои собственные правила, присоединив полученную новую истину к тем, что он уже «знает». Мы можем пойти еще дальше и каким-либо способом сообщить нашему роботу о том, что для получения новых истин на основании старых ему, помимо прочего, необходимо «знать» и общую вычислительную процедуру отыскания C k (k) посредством алгоритма A. К запасу «знаний» робота можно добавить все, что является вполне определенным и вычислительным по своей природе. Однако в результате у нас появляется новый алгоритм «A», и доказательство Гёделя следует применять уже к нему, а не к старому A. Иначе говоря, везде вместо старого A нам следовало бы использовать новый «A», поскольку менять алгоритм посреди доказательства есть не что иное, как жульничество. Таким образом, как мы видим, изъян возражения Q6 очень похож на рассмотренный выше изъян Q5. В нашем reductio ad absurdum мы полагаем, что алгоритм А (под которым понимается некая познаваемая и обоснованная процедура для установления факта незавершаемости вычислений) в действительности представляет собой всю совокупность известных математикам подобных процедур, из чего и следует противоречие. Попытку введения еще одной вычислительной процедуры для установления истины — процедуры, не содержащейся в A, — после того как мы договорились, что A представляет собой всю их совокупность, я расцениваю как жульничество.
Беда нашего злосчастного робота в том, что, не обладая каким бы то ни было пониманием гёделевской процедуры, он не располагает ни одним надежным и независимым способом установления истины — истину ему сообщаем мы. (Эта проблема, вообще говоря, не имеет никакого отношения к вычислительным аспектам доказательства Гёделя.) Для того чтобы достичь чего-то большего, ему, как и всем нам, необходимо понимание смысла операций, которые ему велено выполнять. Если такого понимания нет, то он вполне может «знать» (ошибочно), что вычисление C k (k) завершается, а вовсе не наоборот. Заключение (ошибочное) «вычисление C k (k) завершается» выводится точно так же алгоритмически, как и заключение (правильное) «вычисление C k (k) не завершается». Таким образом, дело вовсе не в алгоритмическом характере этих операций, а в том, что для различения между алгоритмами, приводящими к истинным заключениям, и теми, что приводят к заключениям ложным, наш робот нуждается в способности выносить достоверные суждения об истинности. Далее, на данной стадии рассуждения, мы все еще допускаем возможность того, что процесс «понимания» представляет собой некую разновидность алгоритмической деятельности, которая не содержится ни в одной из точно заданных и «заведомо» обоснованных процедур типа A. Например, понимание может осуществляться посредством выполнения какого-то необоснованного или непознаваемого алгоритма. В дальнейшем (см. ) я попробую убедить читателя в том, что в действительности понимание вообще не является алгоритмической деятельностью. На настоящий же момент нас интересуют всего лишь строгие следствия из доказательства Гёделя—Тьюринга, а на них возможность получения вычисления C k (k) из процедуры A вычислительным путем никоим образом не влияет.
Q7 . Общая совокупность результатов, полученных всеми когда-либо жившими математиками, плюс совокупность результатов, которые будут получены всеми математиками за последующую, скажем, тысячу лет, — имеет конечную величину и может уместиться в банках памяти соответствующего компьютера. Такой компьютер, естественно, способен без особого труда воспроизвести все эти результаты, и, тем самым, повести себя (внешне) как математик-человек — что бы ни утверждало по этому поводу гёделевское доказательство.
Несмотря на кажущуюся логичность этого утверждения, здесь упущен из виду один очень существенный момент, а именно: способ, посредством которого мы (или компьютеры) определяем, какие математические утверждения истинны, а какие — ложны. (Во всяком случае, на простое хранение математических утверждений способны и системы, гораздо менее сложные, нежели универсальный компьютер, — например, фотоаппараты.) Принцип использования компьютера в Q7 совершенно не учитывает критического вопроса о наличии у этого самого компьютера способности суждения об истинности. С равным успехом можно вообразить и компьютеры, в памяти которых не содержится ничего, кроме перечня абсолютно ложных математических «теорем», либо случайным образом перемешанных истинных и ложных утверждений. Откуда мы узнаем, какому компьютеру можно доверять? Я отнюдь не утверждаю, что эффективное моделирование результатов сознательной интеллектуальной деятельности человека (в данном случае, в области математики) абсолютно невозможно, поскольку по одной лишь чистой случайности компьютер может «умудриться» сделать все правильно, пусть и не обладая каким бы то ни было пониманием. Однако шансы на это до абсурдного малы, в то время как те вопросы, на которые мы здесь пытаемся найти ответ (например, каким таким образом мы определяем, что вот это математическое утверждение истинно, а вот это — ложно?), в возражении Q7 и вовсе не затрагиваются.
С другой стороны, Q7 все же напоминает об одном более существенном соображении. Имеет ли непосредственное отношение к нашему исследованию обсуждение бесконечных структур (всех натуральных чисел или всех вычислений), если учесть, что совокупность всех результатов, полученных на тот или иной момент времени всеми людьми и компьютерами, имеет конечную величину? В следующем комментарии мы рассмотрим этот безусловно важный вопрос отдельно.
Q8 . Незавершающиеся вычисления суть идеализированные математические конструкции, по определению бесконечные. Вряд ли подобные вопросы могут иметь сколько-нибудь непосредственное отношение к изучению конечных физических объектов — таких, как компьютеры или мозг.
Все верно: рассуждая в идеализированном ключе о машинах Тьюринга, незавершающихся вычислениях и т.п., мы рассматривали бесконечные (потенциально) процессы, тогда как в случае людей или компьютеров нам приходится иметь дело с системами конечными. И, разумеется, применяя подобные идеализированные доказательства к реальным и конечным физическим объектам, следует быть готовыми к тому, что такая операция непременно окажется связанной с теми или иными ограничениями и оговорками. Однако, как выясняется, учет конечной природы реальных объектов не изменяет сколько-нибудь существенно сути доказательства Гёделя—Тьюринга. Нет ничего странного в том, что мы рассуждаем об идеализированных вычислениях, обосновываем те или иные умозаключения и выводим, математически, их теоретические ограничения. Можно, к примеру, обсуждать в абсолютно конечных терминах вопрос о том, существует ли нечетное число, являющееся суммой двух четных чисел, или существует ли натуральное число, не являющееся суммой четырех квадратов (как в приведенных выше задачах (C) и (B)), нисколько не смущаясь тем, что при рассмотрении этих вопросов мы неявно учитываем бесконечное множество всех натуральных чисел. Мы имеем полное право рассуждать о незавершающихся вычислениях (или машинах Тьюринга вообще) как о математических структурах, пусть и не в силах создать на практике бесконечно работающую машину Тьюринга. (Отметим, в частности, что действие машины Тьюринга, занятой поисками нечетного числа, являющегося суммой двух четных чисел, строго говоря, практически реализовать невозможно, так как ее детали износятся гораздо раньше, чем минет вечность.) Описание любого единичного вычисления (или действия машины Тьюринга) — задача вполне конечная, а вопрос о том, завершится ли в конечном итоге это вычисление, можно полагать вполне определенным. Сначала мы доводим до логического завершения теоретические рассуждения, связанные с теми или иными идеализированными вычислениями, и лишь затем пытаемся разглядеть, каким образом наши рассуждения применимы к конечным физическим системам — таким, как реально существующие компьютеры или люди.
Ограничения конечного характера могут быть обусловлены либо тем, что (I) описание конкретного рассматриваемого вычисления оказывается слишком громоздким (т.е. число n в C n или пара чисел q, n в C q (n) оказываются слишком велики для того, чтобы их мог описать человек или реально существующий компьютер), либо тем, что (II) при внешней простоте описания вычисление, тем не менее, требует для своего выполнения чрезмерно много времени, в результате чего может показаться, что оно не завершается вовсе, хотя теоретически данное вычисление должно в конечном счете завершиться. На деле же, как мы вскоре убедимся, выясняется, что из этих двух условий сколько-нибудь существенное влияние на наши рассуждения оказывает только (I), да и оно не так уж и велико. Незначительность фактора (II), быть может, покажется вам удивительной. Существует множество относительно простых вычислений, которые в конечном счете завершаются, однако точки их завершения путем прямого вычисления не способен достичь ни один потенциально возможный компьютер. Рассмотрим, например, следующую задачу: «распечатать последовательность из 22 65536 единиц, после чего остановиться». (В будут предложены еще несколько подобных примеров, гораздо более интересных с математической точки зрения.) Вопрос о завершаемости того или иного вычисления не следует решать путем прямого вычисления: этот метод зачастую оказывается крайне неэффективным.
Для того чтобы выяснить, каким образом ограничения (I) или (II) могут повлиять на наши гёделевские рассуждения, пройдемся еще раз по соответствующим частям доказательства. В соответствии с ограничением (I), вместо бесконечного ряда вычислений, мы располагаем рядом конечным:
C 0 , C 1 , C 2 , C 3 , …, C Q ,
где предполагается, что число Q задает наиболее громоздкое вычисление, какое способен выполнить наш компьютер или человек. В случае с человеком вышеприведенное утверждение можно счесть несколько туманным. Впрочем, в настоящий момент нас не особенно заботит точное определение числа Q. (Вопрос о туманности утверждений, касающихся человеческих способностей, будет рассмотрен ниже, в комментарии к возражению Q13 в .) Кроме того, можно предположить, что, попытавшись применить упомянутые вычисления к какому-то конкретному натуральному числу n, мы обнаружим, что значение n ограничено некоторой фиксированной величиной N, поскольку наш компьютер (или человек) оказывается не способен работать с числами, превышающими N. (Строго говоря, следует учесть и возможность того, что число N не является фиксированным, но зависит от того или иного конкретного вычисления C q , т.е. N может зависеть от q. Однако этот факт не влияет на наши рассуждения сколько-нибудь существенным образом.)
Как и ранее, мы рассматриваем некий обоснованный алгоритм A(q, n), завершение выполнения которого равносильно доказательству того, что вычисление C q (n) не завершается. Несмотря на то, что, в соответствии с ограничением (I), рассмотрению подлежат только значения q, не превышающие Q, и только значения n, не превышающие N, мы, говоря об «обоснованности», в действительности имеем в виду, что алгоритм A должен быть обоснованным для всех значений q и n, независимо от их величины. (Таким образом, можно видеть, что правила, реализуемые в алгоритме A, являются точными математическими правилами, в отличие от правил приближенных, работающих только в силу того или иного практического ограничения, налагаемого на «реально осуществимые» вычисления.) Более того, утверждая, что «вычисление C q (n) не завершается», мы имеем в виду, что это вычисление действительно не завершается, а не то, что это вычисление просто-напросто оказывается слишком громоздким для того, чтобы его мог выполнить наш компьютер или человек, как предусматривает ограничение (II).
Вспомним, что утверждение (H) гласит:
Если завершается вычисление A ( q , n ), то вычисление C q ( n ) не завершается.
Принимая во внимание ограничение (II), можно было бы предположить, что алгоритм А оказывается не слишком эффективен при установлении факта незавершаемости очередного вычисления, поскольку сам он состоит из большего количества шагов, чем способен выполнить компьютер или человек. Однако, как выясняется, для нашего доказательства этот факт не имеет никакого значения. Мы намерены отыскать некое вычисление A(k, k), которое не завершается вообще. Для нас абсолютно неважно, что в некоторых других случаях, когда вычисление A действительно завершается, мы не можем об этом узнать, так как не в состоянии дождаться этого самого завершения.
Далее, как и в равенстве (J), мы вводим натуральное число к, при котором вычисление A(n, n) совпадает с вычислением C k (n) для всех n:
A ( n , n ) = C k ( n ).
Следует, впрочем, рассмотреть еще предусматриваемую ограничением (I) возможность того, что упомянутое число k окажется больше Q. В случае какого-нибудь невообразимо сложного вычисления A такая ситуация вполне возможна, однако только при условии, что это А уже начинает приближаться к верхней границе допустимой сложности (в смысле количества двоичных знаков в его описании в формате машины Тьюринга), с которой может работать наш компьютер или человек. Это обусловлено тем, что вычисление, получающее значение k из описания вычисления A (например, в формате машины Тьюринга), — вещь достаточно простая и может быть задана в явном виде (как уже было показано в комментарии к Q6).
Вообще говоря, для того чтобы поставить в тупик алгоритм A, нам необходимо лишь вычисление C k (k) — подставляя в (Н) равенство n = k, получаем утверждение (L):
Если завершается вычисление A ( k , k ), то вычисление C k ( k ) не завершается.
Поскольку A(k, k) совпадает с C k (k), наше доказательство показывает, что, хотя данное конкретное вычисление C k (k) никогда не завершается, посредством алгоритма A мы этот факт установить не в состоянии, даже если бы упомянутый алгоритм мог выполняться гораздо дольше любого предела, налагаемого на него в соответствии с ограничением (II). Вычисление C k (k) задается только введенным ранее числом k, и, при условии, что к не превышает ни Q, ни N, это вычисление и в самом деле в состоянии выполнить наш компьютер или человек — то есть в состоянии начать. Довести его до завершения невозможно в любом случае, поскольку это вычисление просто-напросто не завершается!
А может ли число k оказаться больше Q или N? Такое возможно лишь в том случае, когда для описания A требуется так много знаков, что даже совсем небольшое увеличение их количества выводит задачу за пределы возможностей нашего компьютера или человека. При этом, поскольку мы знаем об обоснованности алгоритма A, мы знаем и о том, что рассматриваемое вычисление C k (k) не завершается, даже если реальное выполнение этого вычисления представляет для нас проблему. Соображение (I), однако, предполагает и возможность того, что вычисление A окажется столь колоссально сложным, что одно лишь его описание вплотную приблизится к доступному воображению человека пределу сложности, а сравнительно малое увеличение количества составляющих его знаков даст в результате вычисление, превосходящее всякое человеческое понимание. Что бы мы о подобной возможности ни думали, я все же считаю, что любой столь впечатляющий набор реализуемых в нашем гипотетическом алгоритме А вычислительных правил окажется, вне всякого сомнения, настолько сложным, что мы не в состоянии будем знать наверняка, является ли он обоснованным, даже если нам будут точно известны все эти правила по отдельности. Таким образом, наше прежнее заключение остается в силе: при установлении математических истин мы не применяем познаваемо обоснованные наборы алгоритмических правил.
Не помешает несколько более подробно остановиться на сравнительно незначительном увеличении сложности, сопровождающем переход от A к C k (k). Помимо прочего, это существенно поможет нам в нашем дальнейшем исследовании (в и ). В предложено явное описание вычисления C k (k) в виде предписаний для машины Тьюринга, рассмотренных в НРК (). Согласно этим предписаниям, под обозначением T m понимается «m-я машина Тьюринга». Для большего удобства и упрощения рассуждений здесь мы также будем пользоваться этим обозначением вместо «C m », в частности, для определения степени сложности вычислительной процедуры или отдельного вычисления. В соответствии с вышесказанным, определим степень сложности μ машины Тьюринга T m как количество знаков в двоичном представлении числа m (см. НРК, с. 39); при этом степень сложности некоторого вычисления T m (n) определяется как большее из двух чисел μ и ν, где ν — количество двоичных знаков в представлении числа n. Рассмотрим далее приведенное в явное предписание для составления вычисления C k (k) на основании алгоритма A, заданного в упомянутых спецификациях машины Тьюринга. Полагая степень сложности A равной α, находим, что степень сложности явного вычисления C k (k) не превышает числа α + 210 log2(α + 336) — а это число, в свою очередь, оказывается лишь очень ненамного больше собственно α, да и то только тогда, когда число а очень велико.
В вышеприведенных общих рассуждениях имеется один потенциально спорный момент. В самом деле, какой смысл рассматривать вычисления, слишком сложные даже для того, чтобы просто их записать, или те, что, будучи записанными, возможно, потребуют на свое действительное выполнение промежуток времени, гораздо больший предполагаемого возраста нашей Вселенной, даже при условии, что каждый шаг такого вычисления будет производиться за самую малую долю секунды, какая еще допускает протекание каких бы то ни было физических процессов? Упомянутое выше вычисление — то, результатом которого является последовательность из 22 65536 единиц и которое завершается лишь после выполнения этой задачи, — представляет собой как раз такой пример; при этом позицию математика, позволяющего себе утверждать, что данное вычисление является незавершающимся, можно охарактеризовать как крайне нетрадиционную. Однако в математике существуют и некоторые другие точки зрения, пусть и не до такой степени нетрадиционные, — но все же решительно презирающие всяческие условности, — согласно которым известная доля здорового скептицизма в отношении вопроса об абсолютной математической истинности идеализированных математических утверждений отнюдь не помешает. На некоторые из них, безусловно, стоит хотя бы мельком взглянуть.
Q9 . Точка зрения, известная как интуиционизм , не позволяет сделать вывод о непременной завершаемое™ вычисления на определенном этапе на том лишь основании, что бесконечное продолжение этого вычисления приводит к противоречию; бытуют в математике и иные точки зрения сходного характера — например, «конструктивизм» и «финитизм». Не окажется ли гёделевское доказательство спорным, будучи рассмотрено с этих позиций?
В своем гёделевском доказательстве (в частности, в утверждении (M)) я использовал аргумент следующего вида: «Допущение о ложности X приводит к противоречию; следовательно, утверждение X истинно». Под «X» в данном случае следует понимать утверждение: «Вычисление C k (k) не завершается». Это рассуждение относится к типу reductio ad absurdum; что же касается доказательства Гёделя в целом, то оно и в самом деле построено именно таким образом. Направление же в математике, называемое «интуиционизмом» (у истоков которого стоял голландский математик Л. Э. Я. Брауэр; см. [] и НРК, с. 113-116), отрицает возможность построения обоснованного доказательства на основе reductio ad absurdum. Интуиционизм возник приблизительно в 1912 году как реакция на некоторые сформировавшиеся к концу девятнадцатого — началу двадцатого века математические тенденции, суть которых сводится к следующему: математический объект можно полагать «существующим» даже в тех случаях, когда нет никакой возможности этот объект так или иначе воплотить в действительности. А надо сказать, что слишком вольное применение крайне расплывчатой концепции математического существования и впрямь приводит порой к весьма неприятным противоречиям. Самый известный пример такого противоречия связан с парадоксальным «множеством всех множеств, не являющихся членами самих себя» Бертрана Рассела. (Если множество Рассела является членом самого себя, то оно таковым не является; если же оно членом самого себя не является, то оно им, как ни странно, является! Подробнее см. и НРК, с. 101.) Дабы противостоять общей тенденции, в рамках которой могут считаться «существующими» весьма вольно определенные математические объекты, интуиционисты полагают необоснованным математическое рассуждение, позволяющее делать вывод о существовании того или иного математического объекта на основании одной лишь противоречивости его несуществования. Доказательство существования объекта посредством reductio ad absurdum не дает абсолютно никаких оснований полагать, что упомянутый объект действительно можно построить.
Каким же образом запрет на применение reductio ad absurdum может повлиять на наше гёделевское доказательство? Вообще говоря, совсем не может, по той простой причине, что reductio ad absurdum мы применяем, если можно так выразиться, наоборот, то есть противоречие в нашем случае выводится из допущения, что нечто существует, а не из обратного допущения. С интуиционистской точки зрения все выглядит совершенно законно: мы заключаем, что объект не существует, на том основании, что противоречие возникает как раз из допущения о существовании этого самого объекта. Предложенное мною гёделевское доказательство, по сути своей, является в интуиционистском смысле абсолютно приемлемым. (См. [], с. 492.)
Аналогичные рассуждения применимы и ко всем прочим «конструктивистским» или «финитистским» направлениям в математике, о каких мне известно. Комментарий к возражению Q8 демонстрирует, что даже та точка зрения, согласно которой последовательность натуральных чисел нельзя считать «на самом деле» бесконечной, не освобождает нас от неизбежного вывода: для установления математической истины мы таки не пользуемся познаваемо обоснованными алгоритмами.
2.7. Некоторые более глубокие математические соображения
Для того чтобы лучше разобраться в значении гёделевского доказательства, полезно будет вспомнить, с какой, собственно, целью оно было первоначально предпринято. На рубеже веков ученые, деятельность которых была связана с фундаментальными математическими принципами, столкнулись с весьма серьезными проблемами. В конце XIX века — в значительной степени благодаря глубоко оригинальным математическим трудам Георга Кантора (с «диагональным доказательством» которого мы уже познакомились) — математики получили в распоряжение эффективные методы доказательства некоторых наиболее фундаментальных своих результатов, основанные на свойствах бесконечных множеств. Однако с этими преимуществами оказались связаны и не менее фундаментальные трудности, проистекающие из чересчур вольного обращения с концепцией бесконечного множества. Особо отметим парадокс Рассела (на который я уже ссылался в комментарии к Q9, см. также — Кантор о нем также упоминает), обозначивший некоторые препятствия, подстерегающие склонных к опрометчивым умозаключениям. Тем не менее, все понимали, что если вопрос о допустимости тех или иных методов рассуждения продумать с достаточной тщательностью, то можно добиться очень и очень впечатляющих математических результатов. Проблема, по всей видимости, сводилась к отысканию способа, посредством которого можно было бы в каждом конкретном случае абсолютно точно определить, была ли соблюдена при выборе метода рассуждения «достаточная тщательность».
Одной из главных фигур движения, поставившего перед собой цель достичь этой точности, был великий математик Давид Гильберт. Движение окрестили формализмом; в соответствии с его основополагающим принципом, следовало однозначно определить все допустимые методы математического рассуждения в пределах той или иной конкретной области раз и навсегда, включая и те, что связаны с понятием бесконечного множества. Такая совокупность правил и математических утверждений называется формальной системой. После того как определены правила формальной системы F, решение вопроса о корректности применения этих правил — количество которых непременно является конечным — сводится к элементарной механической проверке. Разумеется, если мы хотим, чтобы любой выводимый с помощью таких правил результат мог считаться действительно истинным, нам придется присвоить им всем статус вполне допустимых и обоснованных форм математического рассуждения. Однако некоторые из рассматриваемых правил могут подразумевать какие-либо манипуляции с бесконечными множествами, и в этом случае математическая интуиция, подсказывающая нам, какие методы рассуждения допустимы, а какие нет, может оказаться и не достойной абсолютного доверия. Сомнения в этой связи как нельзя более уместны, учитывая несоответствия, возникающие при столь вольном обращении с бесконечными множествами, что допустимым становится даже парадоксальное «множество всех множеств, не являющихся членами самих себя» Бертрана Рассела. Правила системы F не должны допускать существования «множества» Рассела, но где же, в таком случае, следует провести границу? Вообще запретить применение бесконечных множеств было бы слишком строгим ограничением (обычное евклидово пространство, например, содержит бесконечное множество точек, да и множество натуральных чисел является бесконечным); кроме того, существуют же формальные системы, абсолютно в этом смысле удовлетворительные (поскольку в их рамках не допускается, к примеру, формулировать сущности, подобные «множеству» Рассела), применяя которые можно получить большую часть необходимых математических результатов. Откуда нам знать, каким из этих формальных систем можно верить, а каким нельзя?
Рассмотрим подробнее одну такую формальную систему F; для математических утверждений, которые можно получить с помощью правил системы F, введем обозначение ИСТИННЫЕ, а для утверждений, отрицания которых выводятся из того же источника (т.е. утверждения, обратные рассматриваемым), — обозначение ЛОЖНЫЕ. Любое утверждение, которое можно сформулировать в рамках системы F, но которое не является в этом смысле ни ИСТИННЫМ, ни ЛОЖНЫМ, будем полагать НЕРАЗРЕШИМЫМ. Кто-то, возможно, сочтет, что поскольку на деле может оказаться «бессмысленным» и само понятие бесконечного множества, то, по всей видимости, нельзя абсолютно осмысленно говорить ни об истинности, ни о ложности относящихся к ним утверждений. (Это мнение применимо по крайней мере к некоторым разновидностям бесконечных множеств, если не ко всем.) Если придерживаться такой точки зрения, то нет особой разницы, какие именно утверждения о бесконечных множествах (некоторых разновидностей) оказываются ИСТИННЫМИ, а какие — ЛОЖНЫМИ, лишь бы не вышло так, что одно утверждение получится ИСТИННЫМ и ЛОЖНЫМ одновременно, т.е. система F должна все же быть непротиворечивой. Собственно говоря, в этом и состоит суть истинного формализма, а в отношении формальной системы F первостепенно важно знать лишь следующее: (a) является ли она непротиворечивой и (b) является ли она полной. Система F называется полной, если любое математическое утверждение, должным образом сформулированное в рамках F, всегда оказывается либо ИСТИННЫМ, либо ЛОЖНЫМ (т.е. НЕРАЗРЕШИМЫХ утверждений система F не содержит).
Для строгого формалиста вопрос о том, является ли то или иное утверждение о бесконечных множествах действительно истинным в сколько угодно абсолютном смысле, не обязательно имеет смысл и, уж конечно же, не имеет никакого существенного отношения к процедурам формалистской математики. Таким образом, поиски абсолютной математической истины в отношении утверждений, связанных с упомянутыми бесконечными величинами, заменяются стремлением продемонстрировать непротиворечивость и полноту соответствующих формальных систем. Какие же математические правила допустимо использовать для такой демонстрации? Достойные доверия, прежде всего, причем формулировка этих правил ни в коем случае не должна основываться на сомнительных рассуждениях с привлечением слишком вольно определяемых бесконечных множеств (типа множества Рассела). Была надежда на то, что в рамках некоторых сравнительно простых и очевидно обоснованных формальных систем (например, такой достаточно элементарной системы, как арифметика Пеано) отыщутся логические процедуры, которых будет достаточно для того, чтобы доказать непротиворечивость других, более сложных, формальных систем — скажем, системы F, — непротиворечивость которых уже не столь бесспорна и в рамках которых допускаются формальные рассуждения об очень «больших» бесконечных множествах. Если принять философию формалистов, то подобное доказательство непротиворечивости для F, как минимум, даст основание для использования методов рассуждения, допустимых в рамках системы F. Затем можно доказывать математические теоремы, применяя концепцию бесконечных множеств тем или иным непротиворечивым образом, а может, удастся и вовсе избавиться от необходимости отвечать на вопрос о реальном «смысле» таких множеств. Более того, если удастся показать, что система F является еще и полной, то можно будет вполне резонно счесть, что эта система действительно содержит абсолютно все допустимые математические процедуры, т.е. представляет собой, в некотором смысле, полное описание математического аппарата рассматриваемой области.
Однако в 1930 году (публикация состоялась в 1931) Гёдель взорвал свою «бомбу», раз и навсегда показав, что идеал формалистов принципиально недостижим. Он продемонстрировал, что не может существовать формальной системы F, которая была бы одновременно и непротиворечивой (в некоем «сильном» смысле, который мы рассмотрим в следующем разделе), и полной, — при условии, что F считается достаточно мощной, чтобы сочетать в себе формулировки утверждений обычной арифметики и стандартную логику. Таким образом, теорема Гёделя справедлива для таких систем F, в рамках которых арифметические утверждения типа теоремы Лагранжа и гипотезы Гольдбаха (см. ) формулируются как утверждения математические.
В дальнейшем мы будем рассматривать только те формальные системы, которые являются достаточно обширными, чтобы содержать в себе необходимые для действительной формулировки теоремы Гёделя арифметические операции (а также, в случае нужды, и операции какой угодно машины Тьюринга; см. ниже). Говоря о какой-либо формальной системе F, я обычно буду подразумевать, что она действительно достаточно обширна в этом смысле. Это допущение не отразится на наших рассуждениях сколько-нибудь существенным образом. (Тем не менее, рассматривая формальные системы в таком контексте, я, для пущей ясности, буду иногда снабжать их эпитетом «достаточно обширная» или иным подобным.)
2.8. Условие
ω
-непротиворечивости
Наиболее известная форма теоремы Гёделя гласит, что формальная система F (достаточно обширная) не может быть одновременно полной и непротиворечивой. Это не совсем та знаменитая «теорема о неполноте», которую Гёдель первоначально представил на конференции в Кенигсберге (см. и ), а ее несколько более сильный вариант, который был позднее получен американским логиком Дж. Баркли Россером (1936). По своей сути, первоначальный вариант теоремы Гёделя оказывается эквивалентен утверждению, что система F не может быть одновременно полной и ω-непротиворечивой. Условие же ω-непротиворечивости несколько строже, нежели условие непротиворечивости обыкновенной. Для объяснения его смысла нам потребуется ввести некоторые новые обозначения. В систему обозначений формальной системы F необходимо включить символы некоторых логических операций. Нам, в частности, потребуется символ, выражающий отрицание («не»); можно выбрать для этого символ «~». Таким образом, если Q есть некое высказывание, формулируемое в рамках F, то последовательность символов ~ Q означает «не Q». Нужен также символ, означающий «для всех [натуральных чисел]» и называемый квантор общности; он имеет вид «∀». Если P(n) есть некое высказывание, зависящее от натурального числа n (т.е. P представляет собой так называемую пропозициональную функцию), то строка символов ∀n[P(n)] означает «для всех натуральных чисел n высказывание P(n) справедливо». Например, если высказывание P(n) имеет вид «число n можно выразить в виде суммы квадратов трех чисел», то запись ∀n[P(n)] означает «любое натуральное число является суммой квадратов трех чисел», — что, вообще говоря, ложно (хотя, если мы заменим «трех» на «четырех», то это же утверждение станет истинным). Такие символы можно записывать в самых различных сочетаниях; в частности, строка символов
~ ∀ n [ P ( n )]
выражает отрицание того, что высказывание P(n) справедливо для всех натуральных чисел n.
Условие же ω-непротиворечивости гласит, что если высказывание ~ ∀n[P(n)] можно доказать с помощью методов формальной системы F, то это еще не означает, что в рамках этой самой системы непременно доказуемы все утверждения
P (0), P (1), P (2), P (3), P (4), ….
Отсюда следует, что если формальная система F не является ω-непротиворечивой, мы оказываемся в аномальной ситуации, когда для некоторого P оказывается доказуемой истинность всех высказываний P(0), P(1), P(2), P(3), P(4), …; и одновременно с этим можно доказать и то, что не все эти высказывания истинны! Безусловно, ни одна заслуживающая доверия формальная система подобного безобразия допустить не может. Поэтому если система F является обоснованной, то она непременно будет и ω-непротиворечивой.
В дальнейшем утверждения «формальная система F является непротиворечивой» и «формальная система F является ω-непротиворечивой» я буду обозначать, соответственно, символами «G(F)» и «Ω(F)». В сущности (если полагать систему F достаточно обширной), сами утверждения G(F) и Ω(F) формулируются как операции этой системы. Согласно знаменитой теореме Гёделя о неполноте, утверждение Ω(F) не является теоремой системы F (т.е. его нельзя доказать с помощью процедур, допустимых в рамках системы F); не является теоремой и утверждение Ω(F) — если, разумеется, система F действительно непротиворечива. Несколько более строгий вариант теоремы Гёделя, сформулированный позднее Россером, гласит, что если система F непротиворечива, то утверждение ~ G(F) также не является теоремой этой системы. В оставшейся части этой главы я буду формулировать свои доводы не столько исходя из утверждения Ω(F), сколько на основе более привычного нам G(F), хотя для большей части наших рассуждений в равной степени сгодится любое из них. (В некоторых наиболее явных аргументах я буду иногда обозначать через «G(F)» конкретное утверждение «вычисление C k (k) не завершается» (см. ); надеюсь, никто не сочтет это слишком большой вольностью с моей стороны.)
В большей части предлагаемых рассуждений я не стану проводить четкую границу между непротиворечивостью и ω-непротиворечивостью, однако тот вариант теоремы Гёделя, что представлен в , по сути, гласит, что если формальная система F непротиворечива, то она не может быть полной, так как не может включать в себя в качестве теоремы утверждение G(F). Здесь я всего этого демонстрировать не буду (интересующиеся же могут обратиться к []). Вообще говоря, для того чтобы эту форму гёделевского доказательства можно было свести к доказательству в моей формулировке, система F должна содержать в себе нечто большее, нежели просто «арифметику и обыкновенную логику». Необходимо, чтобы система F была обширной настолько, чтобы включать в себя действия любой машины Тьюринга. Иначе говоря, среди утверждений, корректно формулируемых с помощью символов системы F, должны присутствовать утверждения типа: «Такая-то машина Тьюринга, оперируя над натуральным числом n, дает на выходе натуральное число p». Более того, имеется теорема (см. [], главы 11 и 13), согласно которой так оно само собой и получается, если, помимо обычных арифметических операций, система F содержит следующую операцию (так называемую μ-операцию, или операцию минимизации): «найти наименьшее натуральное число, обладающее таким-то арифметическим свойством». Вспомним, что в нашем первом вычислительном примере, (A), предложенная процедура действительно позволяла отыскать наименьшее число, не являющееся суммой трех квадратов. То есть, вообще говоря, право на подобные вещи за вычислительными процедурами следует сохранить. С другой стороны, именно благодаря этой их особенности мы и сталкиваемся с вычислениями, которые принципиально не завершаются, — например, вычисление (В), где мы пытаемся отыскать наименьшее число, не являющееся суммой четырех квадратов, а такого числа в природе не существует.
2.9. Формальные системы и алгоритмическое доказательство
В предложенной мною формулировке доказательства Гёделя—Тьюринга (см. ) говорится только о «вычислениях» и ни словом не упоминается о «формальных системах». Тем не менее, между этими двумя концепциями существует очень тесная связь. Одним из существенных свойств формальной системы является непременная необходимость существования алгоритмической (т.е. «вычислительной») процедуры F, предназначенной для проверки правильности применения правил этой системы. Если, в соответствии с правилами системы F, некое высказывание является ИСТИННЫМ, то вычисление F этот факт установит. (Для достижения этого результата вычисление F, возможно, «просмотрит» все возможные последовательности строк символов, принадлежащих «алфавиту» системы F, и успешно завершится, обнаружив заключительной строкой искомое высказывание P; при этом любые сочетания строк символов являются, согласно правилам системы F, допустимыми.)
Напротив, располагая некоторой заданной вычислительной процедурой E, предназначенной для установления истинности определенных математических утверждений, мы можем построить формальную систему E, которая эффективно выражает как ИСТИННЫЕ все те истины, что можно получить с помощью процедуры E. Имеется, впрочем, и небольшая оговорка: как правило, формальная система должна содержать стандартные логические операции, однако заданная процедура E может оказаться недостаточно обширной, чтобы непосредственно включить и их. Если сама заданная процедура E не содержит этих элементарных логических операций, то при построении системы E уместно будет присоединить их к E с тем, чтобы ИСТИННЫМИ положениями системы E оказались не только утверждения, получаемые непосредственно из процедуры E, но и утверждения, являющиеся элементарными логическими следствиями утверждений, получаемых непосредственно из E. При таком построении система E не будет строго эквивалентна процедуре E, но вместо этого приобретет несколько большую мощность.
(Среди таких логических операций могут, к примеру, оказаться следующие: «если P&Q, то P»; «если P и P ⇒ Q, то Q»; «если ∀x[P(x)], то P(n)»; «если ~ ∀x[P(x)], то ∃x[~ P(x)]» и т.п. Символы «&», «⇒», «∀», «∃», «~» означают здесь, соответственно, «и», «следует», «для всех [натуральных чисел]», «существует [натуральное число]», «не»; в этот ряд можно включить и некоторые другие аналогичные символы.)
Поставив перед собой задачу построить на основе процедуры E формальную систему E, мы можем начать с некоторой в высшей степени фундаментальной (и, со всей очевидностью, непротиворечивой) формальной системы L, в рамках которой выражаются лишь вышеупомянутые простейшие правила логического вывода, — например, с так называемого исчисления предикатов (см. []), которое только на это и способно, — и построить систему E посредством присоединения к системе L процедуры E в виде дополнительных аксиом и правил процедуры для L, переведя тем самым всякое высказывание P, получаемое из процедуры E, в разряд ИСТИННЫХ. Это, впрочем, вовсе не обязательно окажется легко достижимым на практике. Если процедура E задается всего лишь в виде спецификации машины Тьюринга, то нам, возможно, придется присоединить к системе L (как часть ее алфавита и правил процедуры) все необходимые обозначения и операции машины Тьюринга, прежде чем мы сможем присоединить саму процедуру Е в качестве, по сути, дополнительной аксиомы. (См. окончание ; подробности в [].)
Собственно говоря, в нашем случае не имеет большого значения, содержит ли система E, которую мы таким образом строим, ИСТИННЫЕ предположения, отличные от тех, что можно получить непосредственно из процедуры E (да и примитивные логические правила системы L вовсе не обязательно должны являться частью заданной процедуры E). В мы рассматривали гипотетический алгоритм A, который по определению включал в себя все процедуры (известные или познаваемые), которыми располагают математики для установления факта незавершаемости вычислений. Любому подобному алгоритму неизбежно придется, помимо всего прочего, включать в себя и все основные операции простого логического вывода. Поэтому в дальнейшем я буду подразумевать, что все эти вещи в алгоритме A изначально присутствуют.
Следовательно, как процедуры для установления математических истин, алгоритмы (т. е. вычислительные процессы) и формальные системы для нужд моего доказательства, в сущности, эквивалентны. Таким образом, несмотря на то, что представленное в доказательство было сформулировано исключительно для вычислений, оно сгодится и для общих формальных систем. В том доказательстве, если помните, речь шла о совокупности всех вычислениях (действий машины Тьюринга) C q (n). Следовательно, для того чтобы оно оказалось во всех отношениях применимо к формальной системе F, эта система должна быть достаточно обширной для того, чтобы включать в себя действия всех машин Тьюринга. Алгоритмическую процедуру A, предназначенную для установления факта незавершаемости некоторых вычислений, мы можем теперь добавить к правилам системы F с тем, чтобы вычисления, предположения о незавершающемся характере которых устанавливаются в рамках F как ИСТИННЫЕ, были бы тождественны всем тем вычислениям, незавершаемость которых определяется с помощью процедуры A.
Как же первоначальное кенигсбергское доказательство Гёделя связано с тем, что я представил в ? Не будем углубляться в детали, укажем лишь на наиболее существенные моменты. В роли формальной системы F из исходной теоремы Гёделя выступает наша алгоритмическая процедура A:
алгоритм A ↔ правила системы F .
Роль же представленного Гёделем в Кенигсберге предположения G(F), которое в действительности утверждает непротиворечивость системы F, играет полученное в конкретное предположение «вычисление C k (k) не завершается», недоказуемое посредством процедуры A, но интуитивно представляющееся истинным, коль скоро процедуру А мы полагаем обоснованной:
утверждение «вычисление C k ( k ) не завершается» ↔ утверждение «система F непротиворечива».
Возможно, такая замена позволит лучше понять, каким образом убежденность в обоснованности процедуры — такой, например, как A — может привести к другой процедуре, с исходной никак не связанной, но в обоснованности которой мы также должны быть убеждены, поскольку если мы полагаем процедуры некоторой формальной системы F обоснованными — т.е. процедурами, с помощью которых мы получаем одни лишь действительные математические истины, полностью исключив ложные утверждения (иными словами, если некое предположение P выводится из такой процедуры как ИСТИННОЕ, то это значит, что оно и в самом деле должно быть истинным), — то мы должны также уверовать и в ω-непротиворечивость системы F. Если под «ИСТИННЫМ» понимать «истинное», а под «ЛОЖНЫМ» — «ложное» (как оно, собственно, и есть в рамках любой обоснованной формальной системы F), то безусловно истинно следующее утверждение:
не все предположения P (0), P (1), P (2), P (3), P (4), … могут быть ИСТИННЫМИ, если утверждение «предположение P ( n ) справедливо для всех натуральных чисел n » ЛОЖНО,
что в точности совпадает с условием ω-непротиворечивости.
Однако убежденность в ω-непротиворечивости формальной системы F может происходить не только из убежденности в обоснованности этой системы, но и из убежденности в ее обыкновенной непротиворечивости. Поскольку если под «ИСТИННЫМ» понимать «истинное», а под «ЛОЖНЫМ» — «ложное», то, несомненно, выполняется условие
«ни одно предположение P не может быть одновременно и ИСТИННЫМ, и ЛОЖНЫМ»,
в точности совпадающее с условием непротиворечивости. Вообще говоря, во многих случаях различия между непротиворечивостью и ω-непротиворечивостью практически отсутствуют. Для упрощения дальнейших рассуждений этой главы я, в общем случае, не стану разделять эти два типа непротиворечивости и буду обычно говорить просто о «непротиворечивости». Суть доказательства Гёделя и Россера сводится к тому, что установление факта непротиворечивости формальной системы (достаточно обширной) превышает возможности этой самой формальной системы. Первоначальный (кенигсбергский) вариант теоремы Гёделя опирался только на ω-непротиворечивость, однако следующий, более известный, вывод был связан уже исключительно с непротиворечивостью обыкновенной.
Сущность гёделевского доказательства в нашем случае состоит в том, что оно показывает, как выйти за рамки любого заданного набора вычислительных правил, полагаемых обоснованными, и получить некое дополнительное правило, в исходном наборе отсутствующее, но которое также должно полагать обоснованным, — т.е. правило, утверждающее непротиворечивость исходных правил. Важно уяснить следующий существенный момент:
убежденность в обоснованности равносильна убежденности в непротиворечивости .
Мы имеем право применять правила формальной системы F и полагать, что выводимые из нее результаты действительно истинны, только в том случае, если мы также полагаем, что эта формальная система непротиворечива. (Например, если бы система F не была непротиворечивой, то мы могли бы вывести, как ИСТИННОЕ, утверждение «1 = 2», которое истинным, разумеется, не является!) Таким образом, если мы уверены, что применение правил некоторой формальной системы F действительно эквивалентно математическому рассуждению, то следует быть готовым принять и рассуждение, выходящее за рамки системы F, какой бы эта система F ни была.
2.10. Возможные формальные возражения против
G
(продолжение)
Продолжим рассмотрение различных математических возражений, высказываемых время от времени в отношении моей трактовки доказательства Гёделя—Тьюринга. Многие из них тесно связаны друг с другом, однако я полагаю, что в любом случае их будет полезно разъяснить по отдельности.
Q10 . Абсолютна ли математическая истина? Как мы уже видели, существуют различные мнения относительно абсолютной истинности утверждений о бесконечных множествах. Можем ли мы доверять доказательствам, опирающимся на какую-то расплывчатую концепцию «математической истины», а не на, скажем, четко определенное понятие формальной ИСТИНЫ?
Что касается формальной системы F, описывающей общую теорию множеств, то, действительно, не всегда ясно, можно ли вообще говорить о каком-то абсолютном смысле, в котором то или иное утверждение о множествах является либо «истинным», либо «ложным», — вследствие чего под сомнение может попасть и само понятие «обоснованности» формальной системы, подобной F. В качестве поясняющего примера приведем один известный результат, полученный Гёделем (1940) и Коэном (1966). Они показали, что определенные математические утверждения (так называемые континуум-гипотеза Кантора и аксиома выбора) никак не зависят от теоретико-множественных аксиом системы Цермело—Френкеля — стандартной формальной системы, обозначаемой здесь через ZF. (Аксиома выбора гласит, что для любой совокупности непустых множеств существует еще одно множество, которое содержит ровно один элемент из каждого множества совокупности. Согласно же континуум-гипотезе Кантора, количество подмножеств натуральных чисел — равное количеству вещественных чисел — представляет собой вторую по величине бесконечность после множества собственно натуральных чисел. Читателю нет нужды вникать в скрытый смысл этих утверждений прямо сейчас. Равно как нет нужды и мне углубляться в подробное изложение аксиом и правил процедуры системы ZF.) Некоторые математики убеждены в том, что система ZF охватывает все методы математического рассуждения, необходимые для обычной математики. Некоторые даже утверждают, будто приемлемым математическим доказательством можно считать только такое доказательство, какое можно, в принципе, сформулировать и доказать в рамках системы ZF. (См. комментарий к возражению Q14, где дается оценка применимости к таким субъектам гёделевского доказательства.) Иными словами, эти математики настаивают на том, что ИСТИННЫМИ, ЛОЖНЫМИ и НЕРАЗРЕШИМЫМИ в рамках системы ZF математическими утверждениями можно считать только те утверждения, истинность, ложность и неразрешимость которых, в принципе, устанавливается математическими средствами. Для таких людей аксиома выбора и континуум-гипотеза являются математически неразрешимыми (что, по их мнению, и доказывается выводом Гёделя—Коэна), и они наверняка будут утверждать, что истинность или ложность этих двух математических утверждений суть предметы достаточно условные.
Влияют ли эти кажущиеся неопределенности в отношении абсолютного характера математической истины на выводы, которые мы сделали из доказательства Гёделя—Тьюринга? Никоим образом, так как мы имеем здесь дело с классом математических проблем гораздо более ограниченной природы, нежели те, что, подобно аксиоме выбора и континуум-гипотезе, относятся к неконструктивно-бесконечным множествам. В данном случае нас занимают лишь утверждения вида
«такое-то вычисление никогда не завершается»,
причем рассматриваемые вычисления можно задать совершенно точно через действия машины Тьюринга. Такие утверждения в логике называются Π1-высказываниями (или, точнее, Π10- высказываниями). В пределах формальной системы F утверждение G(F) является Π1-высказыванием, а вот Ω(F) таковым не является (см. ). По всей видимости, не существует каких-либо разумных доводов против того, что истинный/ложный характер любого Π1-высказывания есть предмет абсолютный и никак не зависит от избранного нами мнения относительно предположений, касающихся неконструктивно-бесконечных множеств — таких, например, как аксиома выбора и континуум-гипотеза. (С другой стороны, как мы вскоре убедимся, выбор метода рассуждения, принимаемого нами в качестве инструмента для получения убедительных доказательств Π1-высказываний, действительно может определяться мнением, которого мы придерживаемся в отношении неконструктивно-бесконечных множеств; см. возражение Q11.) Очевидно, если не считать крайней позиции, занимаемой отдельными интуиционистами (см. комментарий к Q9), единственное здравое возражение по поводу абсолютного характера истинности таких утверждений может быть связано с тем обстоятельством, что некоторые принципиально завершающиеся вычисления могут потребовать для своего выполнения столь непомерно долгого времени, что на практике, вполне возможно, не завершатся, скажем, и за все время жизни Вселенной; может случиться и так, что для записи самого вычисления (пусть и конечного) потребуется так много символов, что физически невозможным окажется составить даже его описание. Впрочем, все эти вопросы были исчерпывающим образом проанализированы выше, в обсуждении возражения Q8; там же мы выяснили, что на наш основной вывод G они никоим образом не влияют. Вспомним и о возражении Q9, рассмотрение которого показало, что интуиционисты в этом случае также не избегают вывода G.
Кроме того, концепция (весьма ограниченная, надо сказать) математической истины, необходимая мне для доказательства Гёделя—Тьюринга, определена, вообще говоря, не менее четко, нежели концепции ИСТИННОГО, ЛОЖНОГО и НЕРАЗРЕШИМОГО для любой формальной системы F. Из сказанного выше () нам известно, что существует некий алгоритм F, эквивалентный системе F. Если алгоритму F предстоит обработать некое предположение P (формулируемое на языке системы F), то выполнение этого алгоритма может быть успешно завершено только в том случае, если предположение P доказуемо в соответствии с правилами системы F, т.е. когда предположение P ИСТИННО. Соответственно, предположение P является ЛОЖНЫМ, если алгоритм F успешно завершается при обработке предположения ~ P, и НЕРАЗРЕШИМЫМ, если не завершается ни одно из упомянутых вычислений. Вопрос о том, является ли математическое утверждение P ИСТИННЫМ, ЛОЖНЫМ или НЕРАЗРЕШИМЫМ, в точности совпадает по своей природе с вопросом о реальной истинности утверждений о завершаемости или незавершаемости вычислений — иными словами, о ложности или истинности определенных Π1-высказываний — а кроме этого для нашего «гёделевско—тьюринговского» доказательства ничего и не требуется.
Q11 . Существуют определенные Π 1 -высказывания, которые можно доказать с помощью теории бесконечных множеств, однако не известно ни одного доказательства, которое использовало бы стандартные «конечные» методы. Не означает ли это, что даже к таким четко определенным проблемам математики, на деле, подходят субъективно? Различные математики, придерживающиеся в отношении теории множеств разных убеждений, могут применять к оценке математической истинности Π 1 -высказываний неэквивалентные критерии.
Этот момент может оказаться существенным в том, что касается моих собственных выводов из доказательства Гёделя(—Тьюринга), и я, возможно, уделил ему недостаточно много внимания в кратком изложении, представленном в НРК. Как ни странно, но возражение Q11, похоже, никого, кроме меня, не обеспокоило — по крайней мере, никто мне на него не указал! В НРК (с. 417, 418), как и здесь, я сформулировал доказательство Гёделя(—Тьюринга) исходя из того, что посредством разума и понимания способны установить все «математики» или «математическое сообщество». Преимущество подобной формулировки, в отличие от рассмотрения вопроса о способности какого-либо конкретного индивидуума к установлению математических истин посредством своего разума и понимания, заключается в том, что первый способ позволяет избежать некоторых возражений, которые нередко выдвигают в отношении той версии доказательства Гёделя, которую предложил Лукас (1961). Самые разные ученые указывали, к примеру, на то, что «сам Лукас» никак не мог обладать знанием о своем собственном алгоритме. (Некоторые из них говорили то же самое и о варианте доказательства, предложенном мною, не обратив, судя по всему, внимания на тот факт, что моя формулировка вовсе не настолько «личностна».) Именно возможность сослаться на способности к рассуждению и пониманию, присущие всем «математикам» вообще или «математическому сообществу», позволяет нам избежать необходимости считаться с предположением о том, что различные индивидуумы могут воспринимать математическую истину по-разному, каждый в соответствии с личным непознаваемым алгоритмом. Значительно сложнее смириться с тем, что результатом выполнения некоего непостижимого алгоритма может оказаться коллективное понимание математического сообщества в целом, нежели с тем, что этот самый алгоритм обусловливает математическое понимание всего лишь какого-то конкретного индивидуума. Суть возражения Q11 как раз и заключается в том, что упомянутое коллективное понимание может оказаться совсем не таким универсальным и безличным, каким счел его я.
Утверждения, о каких говорится в Q11, действительно, существуют. То есть существуют Π1-высказывания, единственные известные доказательства которых опираются на то или иное применение теории бесконечных множеств. Такое Π1-высказывание может быть результатом арифметического кодирования утверждения типа «аксиомы формальной системы F являются непротиворечивыми», где система F подразумевает манипуляции обширными бесконечными множествами, само существование которых может быть сомнительным. Математик, убежденный в реальном существовании некоторого достаточно обширного неконструктивного множества S, придет к выводу, что система F действительно непротиворечива, тогда как другой математик, который полагает, что множества S не существует, вовсе не обязан считать систему F непротиворечивой. Таким образом, даже ограничив рассмотрение одним вполне определенным вопросом о завершении или незавершении работы машины Тьюринга (т.е. ложности или истинности Π1-высказываний), мы не можем себе позволить не учитывать субъективности убеждений в отношении, скажем, существования некоторого обширного неконструктивно-бесконечного множества S. Если различные математики используют для установления истинности определенных Π1-высказываний неэквивалентные «персональные алгоритмы», то, по-видимому, с моей стороны несправедливо говорить о просто «математиках» или «математическом сообществе».
Полагаю, что в строгом смысле это действительно может быть несколько несправедливо; и читатель может при желании перефразировать вывод G следующим образом:
G * Для установления математической истины ни один отдельно взятый математик не применяет только те алгоритмы, какие он (или она) полагает обоснованными.
Представленные мною доводы по-прежнему остаются в силе, однако, мне кажется, некоторые из более поздних утратят значительную часть своей силы, если представить ситуацию в таком виде. Более того, в случае формулировки G* все доказательство уходит в направлении, на мой взгляд, бесперспективном, сосредоточенном, в большей степени, на конкретных механизмах, управляющих действиями конкретных индивидуумов, нежели на принципах, лежащих в основе действий любого из нас. Меня же на данном этапе интересует не столько различия подходов отдельных математиков к той или иной математической проблеме, сколько то общее, что есть между нашим пониманием и нашим математическим восприятием.
Попытаемся разобраться, действительно ли мы вынуждены принять формулировку G*. В самом ли деле суждения математиков настолько субъективны, что они могут принципиально расходиться при установлении истинности какого-то конкретного Π1-высказывания? (Разумеется, доказательство, устанавливающее истинность Π1-высказывания, может быть просто-напросто быть слишком громоздким или слишком сложным, чтобы его мог воспроизвести тот или иной математик (см. ниже по тексту возражение Q12), т.е. на практике математики вполне могут разойтись во мнениях. Однако в данном случае нас интересует вовсе не это. Мы занимаемся исключительно принципиальными вопросами.) Вообще говоря, математическое доказательство есть вещь не настолько субъективная, как может показаться на основании вышесказанного. Математики могут придерживаться самых разных — и, на их взгляд, неопровержимо истинных — точек зрения по тем или иным фундаментальным вопросам и во всеуслышание объявлять об этом, однако едва дело доходит до доказательств или опровержений каких-либо вполне определенных конкретных Π1-высказываний, все разногласия тут же куда-то исчезают. Никто не воспримет всерьез доказательство Π1-высказывания, утверждающего, по сути своей, непротиворечивость некоторой формальной системы F, если математик будет основывать его только лишь на существовании некоего спорного бесконечного множества S. То, что при этом в действительности доказывается, можно сформулировать следующим, куда более приемлемым, образом: «Если множество S существует, то формальная система F является непротиворечивой, и в этом случае данное Π1-высказывание истинно».
Тем не менее, могут быть и исключения: например, один математик полагает, что некоторое неконструктивно-бесконечное множество S «с очевидностью» существует — или, по крайней мере, что допущение о его существовании никоим образом не приводит к противоречию, — другой же математик никакой очевидности здесь не усматривает. Дискуссии математиков по таким фундаментальным вопросам могут порой принимать поистине неразрешимый характер. При этом обе стороны могут оказаться, в принципе, неспособны сколько-нибудь убедительно изложить свои доказательства, даже в отношении Π1-высказываний. Возможно, каждому математику и в самом деле присуще некое особое внутреннее восприятие истинности утверждений, связанных с неконструктивно-бесконечными множествами. Конечно же, математики нередко заявляют о том, что их восприятие таких вещей в корне отличается от восприятия коллег. Однако я полагаю, что такие различия, по сути своей, подобны различиям в ожиданиях, которые различные математики могут иметь и в отношении истинности обычных математических высказываний. Эти ожидания суть всего лишь предварительные предположения. До тех пор, пока не представлено убедительного доказательства или опровержения, математики могут спорить друг с другом об ожидаемой или предполагаемой истинности того или иного положения, однако представление такого доказательства одним из математиков убеждает (в принципе) всех. Что до фундаментальных вопросов, то там этих доказательств как раз нет. Возможно, и не будет. Быть может, их нельзя отыскать по той причине, что их просто-напросто нет, а фундаментальные вопросы допускают существование различных, но равно справедливых точек зрения.
Здесь, однако, следует подчеркнуть еще один связанный с Π1-высказываниями момент. Возможность наличия у математика ошибочной точки зрения — т.е. такой точки зрения, которая вынуждает его делать неверные выводы в отношении истинности тех или иных Π1-высказываний, — нас в данный момент не интересует. Нет ничего невероятного в том, что математики порой опираются на неверное в фактическом отношении «понимание» — а то и на необоснованные алгоритмы, — только к настоящему обсуждению это никакого отношения не имеет, поскольку согласуется с выводом G. Впрочем, эту ситуацию мы подробно рассмотрим ниже, в . Следовательно, дело в данном случае заключается не в том, могут ли разные математики придерживаться противоречащих одна другой точек зрения, а скорее в том, может ли одна точка зрения оказаться, в принципе, мощнее другой. Каждая такая точка зрения будет совершенно справедлива в том, что касается установления истинности Π1-высказываний, однако какая-то из них сможет, в принципе, дать своим последователям возможность установить, что те или иные вычисления не завершаются, тогда как другие, более слабые, точки зрения на это неспособны; то есть одни математики будут обладать существенно большей способностью к пониманию, нежели другие.
Не думаю, что такая возможность представляет собой сколько-нибудь серьезную угрозу для моей первоначальной формулировки G. Хотя в отношении бесконечных множеств математики и вправе придерживаться различных точек зрения, этих самых точек зрения вовсе не так много: по всей видимости, не более пяти. Существенные в этом смысле расхождения могут быть обусловлены лишь утверждениями, подобными аксиоме выбора (о ней говорилось в комментарии к возражению Q10), которую одни полагают «очевидной», другие же напрочь отвергают связанную с ней неконструктивность. Любопытно, что эти различные точки зрения на собственно аксиому выбора не приводят непосредственно к тому Π1-высказыванию, относительно справедливости которого возникают разногласия. Ибо, независимо от своей предполагаемой «истинности» или «ложности», аксиома выбора, как показывает теорема Гёделя—Коэна(см. комментарий к Q10), не вступает в противоречие со стандартными аксиомами системы ZF. Могут, однако, существовать и другие спорные аксиомы, соответствующей теоремы для которых нет. Впрочем, обыкновенно, когда речь заходит о принятии или опровержении той или иной теоретико-множественной аксиомы — назовем ее аксиомой Q, — утверждения математиков принимают следующий вид: «Из допущения справедливости аксиомы Q следует, что…». Такое утверждение при всем желании не сможет стать предметом спора между математиками. Аксиома выбора, похоже, является исключением в том смысле, что ее справедливость часто подразумевается без приведения упомянутой оговорки, однако это обстоятельство, по-видимому, никак не противоречит моей общей объективной формулировке вывода G — при условии, что мы ограничимся только Π1-высказываниями:
G ** Для установления истинности Π 1 -высказываний математики-люди не применяют заведомо обоснованные алгоритмы,
а этого нам в любом случае вполне достаточно.
Есть ли другие спорные аксиомы, которые одни математики считают «очевидными», а другие ставят под сомнение? Думаю, будет огромным преувеличением сказать, что имеется хотя бы десять существенно различных точек зрения на теоретико-множественные допущения, которые в явном виде как допущения не формулируются. Положим, что их не более десяти, и рассмотрим следствия из этого допущения. Это означает, что существует порядка десяти, по сути, различных классов математиков, различаемых по типу рассуждения в отношении бесконечных множеств, который они полагают «очевидно» истинным. Каждого такого математика можно назвать математиком n-го класса, где n изменяется в весьма узком диапазоне — не более десяти значений. (Чем больше номер класса, тем мощнее будет точка зрения принадлежащих к нему математиков.) Вывод G** принимает в этом случае следующий вид:
G *** Для установления истинности Π 1 -высказываний математики-люди n-го класса (где п может принимать лишь несколько значений) не применяют только те алгоритмы, какие они полагают обоснованными.
Так получается, потому что доказательство Гёделя(—Тьюринга) можно применять к каждому классу отдельно. (Важно понять, что само гёделевское доказательство предметом спора между математиками не является, а потому если для любого математика n-го класса гипотетический алгоритм n-го класса будет познаваемо обоснованным, то доказательство приведет к противоречию.) Таким образом, как и в случае с G, дело вовсе не в существовании какого-то невообразимого количества непознаваемо обоснованных алгоритмов, каждый из которых присущ лишь одному конкретному индивидууму. Мы всего лишь исключаем возможность существования некоторого очень небольшого количества неэквивалентных непознаваемо обоснованных алгоритмов, рассортированных в соответствии с их мощностью и образующих в результате различные «школы мышления». В последующем обсуждении различия между вариантами G*** и G либо G** не будут иметь особого значения, поэтому для упрощения изложения я не стану в дальнейшем их как-то различать и буду использовать для них всех одно общее обозначение G.
Q12 . Вне зависимости оттого, насколько различных точек зрения придерживаются математики в принципе, на практике те же математики обладают весьма разными способностями к воспроизведению доказательств, разве не так? Не менее различны и их способности к пониманию, позволяющие им совершать математические открытия.
Безусловно, так оно и есть, однако к рассматриваемому вопросу все эти вещи не имеют ну абсолютно никакого отношения. Меня не интересует, какие именно и насколько сложные доказательства математик способен воспроизвести на практике. Еще меньше меня занимает вопрос о том, какие доказательства математик может на практике открыть или какие понимание и вдохновение могут ему в этом способствовать. Здесь мы говорим исключительно о том, доказательства какого типа математики могут, в принципе, воспринимать как обоснованные.
Оговорка «в принципе» используется в наших рассуждениях отнюдь не просто так. Если допустить, что некий математик располагает доказательством или опровержением некоторого Π1-высказывания, то его разногласия с другими математиками касательно обоснованности данного доказательства разрешимы только в том случае, если у этих самых других математиков хватит времени, терпения, объективности, способностей и решимости с вниманием и пониманием воспроизвести всю — возможно, длинную и хитроумную — цепочку его рассуждений. На практике же математики вполне могут отказаться от всех этих трудов еще до полного разрешения спорных вопросов. Однако подобные проблемы к данному исследованию отношения не имеют. Так как, по всей видимости, существует все же некий вполне определенный смысл, в котором то, что в принципе постижимо для одного математика, оказывается равным образом (если отвлечься на время от возражения Q11) постижимо и для другого, — вообще, для любого человека, способного мыслить. Рассуждения бывают весьма громоздкими, а участвующие в них концепции могут показаться чересчур тонкими или туманными, и тем не менее существуют достаточно убедительные основания полагать, что способность к пониманию одного человека не включает в себя ничего такого, что в принципе недоступно другому человеку. Это применимо и к тем случаям, когда для воспроизведения во всех подробностях чисто вычислительной части доказательства может потребоваться помощь компьютера. Возможно, не совсем разумно ожидать, что математик-человек будет лично выполнять все необходимые для такого доказательства вычисления, и все же он, вне всякого сомнения, сможет без особого труда понять и проверить каждый отдельный его этап.
Здесь я говорю исключительно о сложности математического доказательства и ни в коем случае не о возможных существенных и принципиальных вопросах, которые могут вызвать среди математиков разногласия в отношении выбора допустимых методов рассуждения. Разумеется, я встречал математиков, утверждавших, что они в своей практике сталкивались с такими математическими доказательствами, которые были совершенно вне их компетенции: «Я уверен, что, сколько бы я ни старался, мне никогда не понять того-то или такого-то; этот метод рассуждения мне не по зубам». В каждом конкретном случае подобного заявления необходимо индивидуально решать, действительно ли данный метод рассуждения в принципе выходит за рамки системы убеждений этого математика — каковой случай мы рассматривали в комментарии к возражению Q11, — или он вообще-то смог бы разобраться в принципах, на которых основано это доказательство, если бы только приложил больше сил и затратил больше времени. Как правило, справедливым оказывается последнее. Более того, источником отчаяния нашего математика чаще всего становится туманный стиль изложения или ограниченные лекторские способности «такого-то», а вовсе не то, что какие-то существенные и принципиальные моменты «того-то» действительно выходят за рамки его способностей. Толковое изложение, на первый взгляд, непонятного предмета чудесным образом устраняет все прежние недоразумения.
Чтобы еще раз подчеркнуть, что я имею в виду, скажу следующее: сам я часто посещаю математические семинары, на которых не слежу (а иногда и не пытаюсь следить) за подробностями представляемых доказательств. Наверное, если бы я сел где-нибудь и обстоятельно изучил эти самые доказательства, я и в самом деле смог бы проследить за мыслью автора — хотя, возможно, это удалось бы мне лишь при наличии дополнительной литературы или устных пояснений, которые восполнили бы возможные пробелы в моем образовании или же в материалах самого семинара. Я знаю, что в действительности я этого делать не стану. У меня почти наверняка не окажется на это ни времени, ни достаточного количества внимания, ни, впрочем, особого желания. Но при этом я вполне могу принять представленный на семинаре результат на веру по всевозможным «несущественным» причинам — например, потому что полученный результат правдоподобно «выглядит», или потому что у лектора надежная репутация, или потому что другие слушатели, которых я считаю более сведущими в таких делах, нежели я сам, этот результат оспаривать не стали. Конечно, я могу ошибиться во всех своих умозаключениях, а результат вполне может оказаться ложным — либо истинным, но никоим образом не следующим из представленного доказательства. Все эти тонкости никак не влияют на ту принципиальную позицию, которую я здесь представляю. Результат может оказаться истинным и адекватно доказанным, и в таком случае я, в принципе, могу проследить за ходом всего доказательства — или же ошибочным, в каковом случае, как уже упоминалось, он нас в данном контексте не интересует (см. и ). Возможные исключения могут составить лишь те случаи, когда представляемый материал касается каких-либо спорных аспектов теории бесконечных множеств или опирается на какой-то необычный метод рассуждения, который может быть признан сомнительным в соответствии с теми или иными математическими воззрениями (что, само по себе, может заинтриговать меня до такой степени, что я впоследствии действительно попытаюсь это доказательство повторить). Как раз такие исключительные ситуации мы обсуждали выше, в комментарии к возражению Q11.
Что касается подобных соображений относительно природы математической точки зрения, на практике многие математики могут и не иметь четкого представления о том, каких именно фундаментальных принципов они в действительности придерживаются. Однако, как уже было сказано выше, в комментарии к Q11, если математик, у которого нет определенной позиции в отношении того, следует ли принимать, скажем, некую «аксиому Q», желает проявить осмотрительность, то ничто не мешает ему изложить требующие принятия аксиомы Q результаты в следующем виде: «Из принятия аксиомы Q следует, что…». Разумеется, математики, несмотря на всю их пресловутую педантичность, проявляют в подобных вопросах должную осмотрительность далеко не всегда. Нельзя отрицать и того, что время от времени им удается допускать и вовсе очевидные ошибки. И все же все эти ошибки — если они допущены по недосмотру, а не следуют из тех или иных непоколебимых принципов — являются исправимыми. (Как упоминалось ранее, возможность действительного применения математиками в качестве основы для своих решений необоснованного алгоритма будет подробно рассмотрена в и . Поскольку эта возможность не противоречит выводу G, она не является предметом настоящего обсуждения.) В данном случае нас не занимают исправимые ошибки, так как к вопросу о принципиальной достижимости тех или иных результатов они никакого отношения не имеют. А. вот возможные неопределенности в действительных взглядах математиков, безусловно, требуют дальнейшего обсуждения, которое и приводится ниже.
Q13 . У математиков нет абсолютно определенных убеждений относительно обоснованности или непротиворечивости используемых ими формальных систем — как нет и однозначного ответа на вопрос о том, «пользователями» каких именно формальных систем они себя полагают. Не подвергаются ли их убеждения постепенному размыванию по мере того, как формальные системы все более удаляются от области феноменов, доступных непосредственному интуитивному или экспериментальному восприятию?
И правда, нечасто встретишь математика, способного похвалиться прочно устоявшимися и непоколебимо непротиворечивыми убеждениями, когда речь заходит об основах предмета. Кроме того, по мере накопления опыта математик вполне может изменить свои взгляды относительно того, что считать неопровержимо истинным, если он вообще склонен считать неопровержимо истинным что бы то ни было. Можно ли, например, быть совершенно и полностью уверенным в том, что число 1 отлично от числа 2? Если говорить о некоей абсолютной человеческой уверенности, то не совсем ясно, можно ли подобное понятие как-то однозначно определить. Однако какую-то точку опоры все же выбрать необходимо. Вполне приемлемой точкой опоры может стать принятие в качестве неопровержимо истинной некоторой системы убеждений и принципов, от которой уже можно двигаться в своих рассуждениях дальше. Разумеется, нельзя забывать и о том, что многие математики вовсе не имеют определенного мнения относительно того, что именно можно считать неопровержимо истинным. Таких математиков я попросил бы какую-никакую опору для себя все же выбрать и просто быть готовыми при необходимости впоследствии ее сменить. Как показывает доказательство Гёделя, какую бы позицию математик в этом случае ни занял, ее все равно невозможно полностью уместить в рамки правил любой постижимой формальной системы (а если и возможно, то этот факт невозможно однозначно установить). И дело даже не в том, что та или иная конкретная позиция постоянно изменяется; система убеждений, полностью охватываемая рамками любой (достаточно обширной) формальной системы F, неизбежно должна также простирается и за пределы доступной F области. Любая позиция, среди неопровержимых убеждений которой имеется и убеждение в обоснованности системы F, должна также включать в себя и убежденность в истинности гёделевского предположения G(F). Убежденность в истинности G(F) не представляет собой изменения позиции; эта убежденность уже подразумевается неявно в исходной позиции, допускающей принятие истинности формальной системы F, пусть даже поначалу это и не очевидно.
Безусловно, всегда существует возможность того, что в выводы, получаемые математиком на основании исходных посылок какой-либо конкретной точки зрения, закрадется ошибка. Одна только возможность возникновения такой ошибки — даже если в действительности никакой ошибки допущено не было — может привести к уменьшению степени убежденности, которую математик питает в отношении своих выводов. Однако такое «постепенное размывание» нас, вообще говоря, не занимает. Подобно действительным ошибкам, оно «исправимо». Более того, если доказательство было проведено действительно корректно, то чем дольше его изучаешь, тем, как правило, более убедительными представляются полученные в нем выводы. «Постепенное размывание» математик может испытать на практике, но не в принципе, что возвращает нас к обсуждению возражения Q12.
Таким образом, вопрос перед нами встает здесь следующий: имеет ли место постепенное размывание в принципе, т.е. может ли математик счесть, скажем, обоснованность некоторой формальной системы F неопровержимой, тогда как в обоснованности более сильной системы F* он будет лишь «практически уверен». Этот вопрос не представляется мне сколько-нибудь серьезным, коль скоро, какой бы ни была система F, мы вправе настаивать, чтобы она включала в себя обычные логические правила и арифметические операции. Упомянутый выше математик, который верит в обоснованность системы F, должен также верить в ее непротиворечивость, а следовательно, и в истинность гёделевского высказывания G(F). Таким образом, одни только выводы из формальной системы F не могут охватывать всей совокупности математических убеждений математика, какой бы эта система ни была.
Однако следует ли считать высказывание G(F) неопровержимо истинным всякий раз, когда мы признаем неопровержимо обоснованной формальную систему F? Полагаю, утвердительный ответ на этот вопрос не должен вызывать никаких сомнений; и это тем более так, если придерживаться в отношении воспроизведения математического доказательства той «принципиальной» позиции, которой мы придерживались до сих пор. Единственная возникающая в этой связи реальная проблема касается деталей фактического кодирования утверждения «система F непротиворечива» в форме арифметического утверждения (Π1-высказывания). Сама по себе базовая идея неопровержимо очевидна: если система F является обоснованной, то она, безусловно, непротиворечива. (Так как если бы она не была непротиворечивой, то среди ее утверждений присутствовало бы утверждение «1 = 2», т.е. система была бы необоснованной.) Что касается деталей этого самого кодирования, то здесь нам вновь предстоит иметь дело с различием между «принципиальным» и «практическим» уровнями. Не составит особого труда убедиться в том, что такое кодирование в принципе возможно (хотя сам процесс убеждения может занять некоторое время), однако убедиться в корректном выполнении того или иного конкретного действительного кодирования — дело совсем другое. Детали кодирования, как правило, бывают в известной степени произвольными и в разных изложениях могут весьма значительно отличаться. Возможно, где-то закрадется незначительная ошибка или просто опечатка, которая, в формальном смысле, должна бы сделать недействительным данное конкретное предназначенное для выражения «G(F)» теоретико-числовое предположение, однако в действительности этого не происходит.
Надеюсь, читатель понимает, что возможность возникновения таких ошибок не существенна, когда речь заходит о том, что мы подразумеваем здесь под принятием предположения G(F) в качестве неопровержимой истины. Я, разумеется, говорю о действительном предположении G(F), а не о возможном случайном предположении, непреднамеренно сформулированном благодаря опечатке или незначительной ошибке. В этой связи мне вспоминается одна история о великом американском физике Ричарде Фейнмане. Фейнман, по-видимому, объяснял одному из студентов какое-то понятие, но оговорился. Когда студент выразил недоумение, Фейнман вспылил: «Не слушайте, что я говорю; слушайте, что я имею в виду!».
Один из возможных способов такого явного кодирования состоит в использовании представленных еще в НРК спецификаций машин Тьюринга и точном воспроизведении доказательства гёделевского типа, описанного в (пример такого кодирования приводится в ). Впрочем, даже и в этом случае об абсолютной «явности» говорить нельзя, поскольку нам понадобится еще и каким-то явным образом закодировать правила формальной системы F в системе обозначений действий машин Тьюринга; обозначим такой код, скажем, через TF - (Код TF должен удовлетворять определенному свойству: если некоторому высказыванию P, выводимому в рамках системы F, ставится в соответствие некоторое число р, то необходимо, скажем, чтобы равенство TF (p) = 1 выполнялось всякий раз, когда высказывание P является теоремой системы F, в противном же случае вычисление TF (p) не должно завершаться вовсе.) Безусловно, все это открывает широкий простор для формальных ошибок. Помимо возможных трудностей, связанных с практическим построением кода TF на основе системы F и отысканием числа p на основе высказывания P, отсутствует ясность и в отношении другого вопроса: а не ошибся ли я сам где-нибудь в спецификациях машин Тьюринга, — иными словами, можем ли мы быть полностью уверены в корректности приведенного в этой книги кода, если вдруг решим использовать для отыскания вычисления C k (k) именно это определение? Лично я думаю, что ошибок там нет, однако в собственной непогрешимости я уверен куда как меньше, нежели в первоначальных построениях Гёделя (пусть и более сложных). Впрочем, всякому дочитавшему до этого места, смею надеяться, уже ясно, что возможные ошибки подобного рода существенной роли здесь не играют. Помните, что говорил Фейнман?
Что же касается собственно моих спецификаций, следует упомянуть еще один формальный момент. Представленный мною в вариант доказательства Гёделя(—Тьюринга) опирается не на непротиворечивость системы F, а на обоснованность алгоритма A, и являет собой критерий для установления незавершаемости вычислений (т.е. истинности Π1-высказываний). Этот вариант подходит нам ничуть не хуже любых других, поскольку известно, что из обоснованности алгоритма A следует истинность утверждения о незавершаемости вычисления C k (k), каковое явное утверждение (тоже Π1-высказывание) мы имеем полное право использовать вместо высказывания G(F). Более того, как отмечалось выше (см. ), доказательство, вообще говоря, зависит не от непротиворечивости формальной системы F, а от ее ω-непротиворечивости. Из обоснованности системы F очевидно следует ее непротиворечивость, равно как и ω-непротиворечивость. Если допустить, что система F обоснованна, то ни Ω(F), ни G(F) из ее правил (см. ) не следуют, однако оба эти высказывания являются истинными.
Думаю, можно с уверенностью заключить, что какое бы «постепенное размывание» убежденности того или иного математика ни сопровождало переход от убеждения в обоснованности формальной системы F к убеждению в истинности высказывания G(F) (или Ω(F)), оно будет целиком и полностью обусловлено возможностью ошибки в точной формулировке полученного им высказывания «G(F)». (To же применимо и к высказыванию Ω(F).) Все это не имеет непосредственного отношения к настоящему обсуждению — при наличии подлинной (не случайной) формулировки высказывания G(F) никакого размывания убежденности происходить не должно. Если формальная система F неопровержимо обоснованна, то ее высказывание G(F) столь же неопровержимо истинно. Все формы заключения G (G**, G***) остаются неизменными при условии, что под «истинностью» подразумевается «неопровержимая истинность».
Q14 . Нет никаких сомнений в том, что формальная система ZF — или некоторая стандартная ее модификация (обозначим ее через ZF *) —действительно включает в себя все необходимое для серьезной математической деятельности. Почему бы просто не принять эту систему за основу, смириться с недоказуемостью ее непротиворечивости и продолжить свои математические изыскания?
Полагаю, такая точка зрения весьма и весьма распространена среди практикующих математиков, особенно тех, кто не слишком углубляется в фундаментальные основы или философию своего предмета. Подобное отношение вполне естественно для людей, главной заботой которых является просто хорошее выполнение серьезной, пусть и математической, работы (хотя в действительности такие люди крайне редко выражают свои результаты в рамках строгих правил формальных систем, подобных ZF). Согласно этой точке зрения, математика имеет дело лишь с тем, что можно доказать или опровергнуть в рамках некоей конкретной формальной системы — такой, например, как ZF (или какая-либо ее модификация ZF*). С высоты такой позиции математическая деятельность и в самом деле напоминает своего рода «игру». Назовем ее ZF-игрой (или ZF*-игрой), причем играть в эту игру следует в соответствии с правилами, установленными в рамках данной системы. Такой подход характерен для формалиста, подлинный же формалист мыслит исключительно в терминах ИСТИННОГО и ЛОЖНОГО, которые не обязательно совпадают с истинным и ложным в их повседневном смысле. Если формальная система обоснованна, то все, что является истинным, и будет истинным, а все, что ЛОЖНО, будет ложным. Однако наверняка найдутся высказывания, формализуемые в рамках данной системы, которые, будучи истинными, не являются ИСТИННЫМИ, и другие, которые, будучи ложными, не являются ЛОЖНЫМИ, иными словами, в обоих случаях эти высказывания оказываются НЕРАЗРЕШИМЫМИ. Если система ZF непротиворечива, то в ZF-игре гёделевское высказывание G(ZF) и его отрицание ~ G(ZF) принадлежат, соответственно, к этим двум категориям. (Более того, окажись система ZF противоречивой, то и высказывание G(ZF), и его отрицание ~ G(ZF) были бы ИСТИННЫМИ и ЛОЖНЫМИ одновременно!)
ZF-игра, судя по всему, представляет собой исключительно разумный подход, позволяющий реализовать большую часть того, что нас интересует в обычной математике. Однако по причинам, которые обозначены выше, я совершенно не в состоянии понять, каким же образом из нее может «произрасти» реальная точка зрения в отношении чьих бы то ни было математических убеждений. Ибо если кто-то считает, что с помощью «практикуемой» им математики он устанавливает исключительно подлинные математические истины — скажем, истинность Π1-высказываний, — то он должен верить и в то, что используемая им система обоснованна; а если он верит в ее обоснованность, то он должен также верить в ее непротиворечивость, то есть в то, что Π1-высказывание, утверждающее истинность G(F), действительно истинно, несмотря на то, что оно НЕРАЗРЕШИМО. Таким образом, математические убеждения человека должны включать в себя нечто, что в рамках ZF-игры невыводимо. С другой стороны, если человек не верит в обоснованность формальной системы ZF, то он не может верить и в подлинную истинность ИСТИННЫХ результатов, полученных с помощью ZF-игры. В обоих случаях сама по себе ZF-игра не в состоянии снабдить нас удовлетворительной позицией в том, что касается математической истинности. (Это равным образом применимо к любой формальной системе ZF*.)
Q15 . Выбранная нами формальная система F может и не оказаться непротиворечивой — по крайней мере, мы не можем быть вполне уверены в ее непротиворечивости; по какому же, в таком случае, праву мы утверждаем, что высказывание G ( F ) «очевидно» истинно?
Хотя этот вопрос был достаточно исчерпывающе рассмотрен в предыдущих обсуждениях, я полагаю, что суть того рассмотрения полезно будет изложить еще раз, поскольку возражения, подобные Q15, чаще всего оказываются среди нападок на наше с Лукасом приложение теоремы Гёделя. Суть же в том, что мы вовсе не утверждаем, что высказывание G(F) непременно истинно для любой формальной системы F, мы утверждаем лишь, что высказывание G(F) настолько же достоверно, насколько достоверна любая другая истина, получаемая применением правил самой системы F. (Вообще говоря, высказывание G(F) оказывается более достоверным, нежели утверждения, получаемые действительным применением правил F, так как система F, даже будучи непротиворечивой, не обязательно будет обоснованной!) Если мы верим в истинность любого утверждения P, выводимого исключительно с помощью правил системы F, то мы должны верить и в истинность G(F), по крайней мере, в той же степени, в какой мы верим в истинность P. Таким образом, ни одна постижимая формальная система F — или эквивалентный ей алгоритм F — не может послужить абсолютно полной основой для подлинного математического познания или формирования убеждений. Как отмечалось в комментариях к Q5 и Q6, наше доказательство построено как reductio ad absurdum: мы выдвигаем предположение, что система F действительно является абсолютной основой для формирования убеждений, а затем показываем, что такое предположение приводит к противоречию, т.е. является неверным.
Мы, конечно же, можем, как в Q14, выбрать для удобства какую-то конкретную систему F, хотя уверенности в том, что она обоснованна, а потому непротиворечива, это нам не добавит. Впрочем, при наличии действительных сомнений в обоснованности системы F любой получаемый в рамках F результат P следует формулировать в виде
«высказывание P выводимо в рамках системы F »
(или, что то же самое, «высказывание P ИСТИННО»), избегая утверждений вида «высказывание P истинно». Такое утверждение в математическом смысле вполне приемлемо и может быть либо действительно истинным, либо действительно ложным. Совершенно законным образом мы можем свести все наши математические высказывания к утверждениям такого рода, однако и в этом случае нам никуда не деться от утверждений об абсолютных математических истинах. При случае мы можем прийти к убеждению, будто мы установили, что какое-то утверждение вышеприведенного вида является в действительности ложным, т.е. получить следующий результат:
«высказывание P невыводимо в рамках системы F ».
Такие утверждения имеют вид: «такое-то вычисление не завершается» (или, по сути, «будучи примененным к высказыванию P, алгоритм F не завершается»), что в точности совпадает с формой рассматриваемых нами Π1-высказываний. Вопрос: какие средства мы полагаем допустимыми в процессе получения подобных утверждений? Каковы, наконец, те математические процедуры, в которые мы действительно верим и применяем при установлении математических истин? Такая система убеждений, при условии, что они достаточно разумны, никак не может быть эквивалентна всего лишь убежденности в обоснованности и непротиворечивости формальной системы, какой бы эта формальная система ни была.
Q16 . Заключение об истинности высказывания G ( F ) для непротиворечивой формальной системы F мы делаем, исходя из допущения, что те символы системы F , которые, как мы полагаем, служат для представления натуральных чисел, действительно представляют натуральные числа. Окажись на их месте другие числа — скажем, некие экзотические «сверхнатуральные» числа, — мы вполне могли бы обнаружить, что высказывание G ( F ) ложно. Откуда мы знаем, что в нашей системе F мы имеем дело с натуральными, а не со «сверхнатуральными» числами?
В самом деле, конечного аксиоматического способа убедиться в том, что «числа», о которых идет речь, и есть те самые подразумеваемые натуральные числа, а не какие-то посторонние «сверхнатуральные», не существует. Однако, в некотором смысле, в этом и состоит вся суть гёделевского рассуждения. Неважно, какую именно схему аксиом формальной системы F мы построим, пытаясь охарактеризовать натуральные числа, — одних лишь правил системы F будет недостаточно, чтобы определить, является ли высказывание G(F) действительно истинным или же ложным. Полагая систему F непротиворечивой, мы знаем, что в высказывании G(F) подразумевается все же наличие некоего истинного смысла. Это, однако, происходит лишь в том случае, если символы, составляющие в действительности формальное выражение, обозначаемое «G(F)», имеют подразумеваемые значения. Если эти символы интерпретировать как-либо иначе, то полученная в результате интерпретация «G(F)» вполне может оказаться ложной.
Для того чтобы разобраться, откуда берутся все эти двусмысленности, рассмотрим новые формальные системы F* и F**, где F* получается путем присоединения к аксиомам системы F высказывания G(F), a F** — путем аналогичного присоединения высказывания ~ G(F). Если система F обоснованна, то обе системы F* и F** непротиворечивы (т.к. высказывание G(F) истинно, а ~ G(F) из правил системы F) вывести невозможно. При этом в случае подразумеваемой (или стандартной) интерпретации символов F из обоснованности системы F следует, что система F* обоснованна, а система F** — нет. Впрочем, одним из характерных свойств непротиворечивых формальных систем является возможность отыскания так называемых нестандартных реинтерпретаций символов таким образом, что высказывания, которые являются ложными в стандартной интерпретации, оказываются истинными в нестандартной; соответственно, в такой нестандартной интерпретации обоснованными могут быть системы F и F**, а система F* обоснованной не будет. Можно вообразить, что такая реинтерпретация может повлиять на смысл логических символов (таких как «~» и «&», которые в стандартной интерпретации означают, соответственно, «не» и «и»), однако в данном случае нас занимают символы, обозначающие неопределенные числа («x», «y», «z», «x'», «x"» и т.д.), и значения применяемых к ним логических кванторов (∀, ∃). В стандартной интерпретации символы «∀x» и «∃x» означают, соответственно, «для всех натуральных чисел x» и «существует такое натуральное число x, что»; в нестандартной же интерпретации эти символы могут относится не к натуральным числам, а к числам какого-то иного вида с иными свойствами упорядочения (такие числа действительно можно назвать «сверхнатуральными», или даже «ультранатуральными», как это сделал Хофштадтер []).
Дело, однако, в том, что мы-то знаем, что такое на самом деле представляют собой натуральные числа, и для нас не составит никакого труда отличить их от каких-то непонятных сверхнатуральных чисел. Натуральные числа суть самые обыденные вещи, обозначаемые, как правило, символами 0, 1, 2, 3, 4, 5, 6, …. С этой концепцией мы знакомимся еще в детском возрасте и легко отличим ее от надуманной концепции сверхнатурального числа (см. ). Есть что-то таинственное в том, что мы, похоже, и впрямь обладаем каким-то инстинктивным пониманием действительного смысла понятия натурального числа. Все, что мы получаем в этом смысле в детском (или уже взрослом) возрасте, сводится к сравнительно небольшому количеству описаний понятий «нуля», «единицы», «двух», «трех» и т.д. («три апельсина», «один банан» и т.п.), однако при этом, несмотря на всю неадекватность такого описания, мы как-то умудряемся постичь всю концепцию в целом. В некотором платоническом смысле натуральные числа видятся своего рода категориями, обладающими абсолютным концептуальным существованием, от нас никак не зависящим. И все же, несмотря на «человеконезависимость» натуральных чисел, мы оказываемся способны установить интеллектуальную связь с действительной концепцией натуральных чисел, опираясь лишь на неоднозначные и, на первый взгляд, неадекватные описания. С другой стороны, не существует конечного набора аксиом, с помощью которого можно было бы провести четкую границу между множеством натуральных чисел и альтернативным ему множеством так называемых «сверхнатуральных» чисел.
Более того, такое специфическое свойство всей совокупности натуральных чисел, как их бесконечное количество, мы также можем каким-то образом воспринимать непосредственно, тогда как система, действие которой ограничено точными конечными правилами, не способна отличить данную конкретную бесконечность натуральных чисел от других возможных («сверхнатуральных») вариантов. Мы же легко понимаем бесконечность, характеризующую натуральные числа, пусть и обозначаем ее просто точками «…» —
«0, 1, 2, 3, 4, 5, 6, …»,
либо сокращением «и т.д.» —
«нуль, один, два, три и т.д.».
Нам не нужно объяснять на языке каких-то точных правил, что именно представляет собой натуральное число. В этом смысле можно считать, что нам повезло, так как такое объяснение дать невозможно. Как только нам приблизительно укажут верное направление, мы тут же обнаруживаем, что уже откуда-то знаем, что это за штука такая — натуральное число!
Возможно, некоторые читатели знакомы с аксиомами Пеано для арифметики натуральных чисел (об арифметике Пеано я уже упоминал в ), и, возможно, теперь эти читатели находятся в некотором недоумении: почему же аксиомы Пеано не дают адекватного определения натуральных чисел. Согласно определению Пеано, мы начинаем ряд натуральных чисел с символа 0 и затем добавляем слева особый «оператор следования», обозначаемый S и осуществляющий простое прибавление единицы к числу, над которым совершается действие, т.е. 1 определяется как S0, 2 как S1 или SS0 и т.д. В качестве правил мы располагаем следующими утверждениями: если Sa = Sb, то a = b; и ни при каком x число 0 нельзя записать в виде Sx (последнее утверждение служит для характеристики числа 0). Кроме того, имеется «принцип индукции», согласно которому некое свойство чисел (скажем, P) должно быть истинным в отношении всех чисел n, если оно удовлетворяет двум условиям: (I) если истинно P(n), то для всех n истинно также и P(Sn); (II) P(0) истинно. Сложности начинаются, когда дело доходит до логических операций, символы которых ∀ и ∃ в стандартной интерпретации означают, соответственно, «для всех натуральных чисел…» и «существует такое натуральное число…, что». В нестандартной интерпретации смысл этих символов соответствующим образом изменяется, так что они квантифицируют уже не натуральные числа, а «числа» какого-то другого типа. Хотя математические спецификации Пеано, задающие оператор следования S, действительно описывают отношение упорядочения, отличающее натуральные числа от разных прочих «сверхнатуральных» чисел, эти определения невозможно записать в терминах формальных правил, которым удовлетворяют кванторы ∀ и ∃. Для того чтобы передать смысл математических определений Пеано, необходимо перейти к так называемой «логике второго порядка», в которой также вводятся кванторы типа ∀ и ∃, но только теперь они оперируют не над отдельными натуральными числами, а над множествами (бесконечными) натуральных чисел. В «логике первого порядка» арифметики Пеано кванторы оперируют над отдельными числами, и в результате получается формальная система в обычном смысле этого слова. Логика же второго порядка нам формальной системы не дает. В случае строгой формальной системы вопрос о правильности применения правил системы решается чисто механическими (т.е. алгоритмическими) способами — в сущности, именно это свойство формальных систем и послужило причиной их рассмотрения в настоящем контексте. В рамках логики второго порядка упомянутое свойство не работает.
Многие ошибочно полагают (в духе приведенных в возражении Q16 соображений), что из теоремы Гёделя следует существование множества различных арифметик, каждая из которых в равной степени обоснованна. Соответственно, та частная арифметика, которую мы, возможно, по чистой случайности избрали для своих нужд, определяется просто какой-то произвольно взятой формальной системой. В действительности же теорема Гёделя показывает, что ни одна из этих формальных систем (будучи непротиворечивой) не может быть полной; поэтому (как доказывается далее) к ней можно непрерывно добавлять какие угодно новые аксиомы и получать всевозможные альтернативные непротиворечивые системы, которыми при желании можно заменить ту, в рамках которой мы работаем в настоящий момент. Эту ситуацию нередко сравнивают с той, что сложилась некогда с евклидовой геометрией. На протяжении двадцати одного века люди верили, что евклидова геометрия является единственно возможной геометрией. Но когда в восемнадцатом веке сразу несколько великих математиков (таких как Гаусс, Лобачевский и Бойяи) показали, что существуют в равной степени возможные альтернативы общепринятой геометрии, геометрии пришлось отступить с абсолютных позиций на произвольные. Нередко можно услышать, будто Гёдель показал, что арифметика так же представляет собой предмет произвольного выбора, при этом один набор непротиворечивых аксиом оказывается ничуть не хуже любого другого.
Однако подобная интерпретация того, что доказал Гёдель, абсолютно неверна. Согласно Гёделю, само по себе понятие формальной системы аксиом не подходит для передачи даже самых элементарных математических понятий. Когда мы употребляем термин «арифметика» без дальнейших пояснений, мы подразумеваем обычную арифметику, которая работает с обычными натуральными числами 0, 1, 2, 3, 4, … (и, быть может, с их отрицаниями), а вовсе не со «сверхнатуральными» числами, что бы это понятие ни означало. Мы можем, если пожелаем, исследовать свойства формальных систем, и это, конечно же, станет ценным вкладом в процесс математического познания. Однако такое предприятие несколько отличается от исследования обычных свойств обычных натуральных чисел. В некотором отношении данная ситуация весьма напоминает ту, что сложилась в последнее время с геометрией. Изучение неевклидовых геометрий интересно с математической точки зрения, да и сами геометрии имеют ряд важных областей применения (например, в физике, см. НРК, глава 5, особенно рис. 5.1 и 5.2, а также ), но, когда термин «геометрия» используется в обычном языке (в отличие от «жаргона» математиков или физиков-теоретиков), подразумевается, как правило, обычная евклидова геометрия. Однако имеется и разница: то, что логик может назвать «евклидовой геометрией», действительно можно определить (с некоторыми оговорками) через определенную формальную систему, тогда как обычную «арифметику», как показал Гёдель, определить таким образом нельзя.
Гёдель доказал не то, что математика (в особенности арифметика) — это произвольные поиски, направление которых определяется прихотью Человека; он доказал, что математика — это нечто абсолютное, и в ней мы должны не изобретать, но открывать (см. ). Мы открываем, что такое натуральные числа и без труда отличаем их от любых сверхнатуральных чисел. Гёдель показал, что ни одна система «искусственных» правил не способна сделать это за нас. Такая платоническая точка зрения была существенна для Гёделя, не менее существенной она будет и для нас в последующих рассуждениях ().
Q17 . Допустим, что формальная система F предназначена для представления тех математических истин, что в принципе доступны человеческому разуму. Не можем ли мы обойти проблему невозможности формального включения в систему F гёделевского высказывания G ( F ), включив вместо него что-либо, имеющее смысл G ( F ), воспользовавшись при этом новой интерпретацией смысла символов системы F ?
Определенные способы представления примененного к F гёделевского доказательства в рамках формальной системы F (достаточно обширной) действительно существуют, коль скоро новый, реинтерпретированный, смысл символов системы F полагается отличным от исходного смысла символов этой системы. Однако если мы пытаемся таким образом интерпретировать систему F как процедуру, с помощью которой разум приходит к тем или иным математическим выводам, то подобный подход является не чем иным, как шулерством. Если мы намерены толковать мыслительную деятельность исключительно в рамках системы F, то ее символы не должны изменять свой смысл «на полпути». Если же мы принимаем, что мыслительная деятельность может содержать что-то помимо операций самой системы F — т.е. изменение смысла символов, — то нам необходимо знать и правила, управляющие подробным изменением. Либо эти правила окажутся неалгоритмическими, и это сыграет в пользу G, либо для них найдется какая-то конкретная алгоритмическая процедура, и тогда нам следовало бы изначально включить эту процедуру в нашу «систему F» — обозначим ее через F† — с тем, чтобы она представляла собой полную совокупность процедур, обусловливающих наши с вами понимание и проницательность, а значит, необходимости в изменении смысла символов не возникло бы вовсе. В последнем случае вместо гёделевского высказывания G(F) из предыдущего рассуждения нам предстоит разбираться уже с высказыванием G(F†), так что ничего мы в результате не выигрываем.
Q18 . Даже в такой простой системе, как арифметика Пеано, можно сформулировать теорему, интерпретация которой имеет следующий смысл:
«система F обоснованна», а следовательно, «высказывание G ( F ) истинно».
Разве это не все, что нам нужно от теоремы Гёделя? Значит, теперь, полагая обоснованной какую угодно формальную систему F , мы вполне можем поверить и в истинность ее гёделевского высказывания — при условии, разумеется, что мы готовы принять арифметику Пеано, разве не так?
Подобную теорему действительно можно сформулировать в рамках арифметики Пеано. Точнее (поскольку мы не можем в пределах какой бы то ни было формальной системы должным образом выразить понятие «обоснованности» или «истинности», как это следует из знаменитой теоремы Тарского), мы, в сущности, формулируем более сильный результат:
«система F непротиворечива», а следовательно, «высказывание G ( F ) истинно»,
либо иначе:
«система F ω -непротиворечива», а следовательно, «высказывание Ω( F ) истинно».
Из этих высказываний следует вывод, необходимый для Q18, поскольку если система F обоснованна, то она, разумеется, непротиворечива или омега-непротиворечива, в зависимости от обстоятельств. Понимая смысл присутствующего здесь символизма, мы и в самом деле можем поверить в истинность высказывания G(F) на основании одной лишь веры в обоснованность системы F. Это, впрочем, мы уже приняли. Если понимать смысл, то действительно возможно перейти от F к G(F). Сложности возникнут лишь в том случае, если нам вздумается исключить необходимость интерпретаций и сделать переход от F к G(F) автоматическим. Будь это возможно, мы смогли бы автоматизировать общую процедуру «гёделизации» и создать алгоритмическое устройство, которое действительно будет содержать в себе все, что нам нужно от теоремы Гёделя. Однако такой возможности у нас нет — захоти мы добавить эту предполагаемую алгоритмическую процедуру в какую угодно формальную систему F, выбранную нами в качестве отправной, в результате просто-напросто получилась бы, по сути, некоторая новая формальная система F#, а ее гёделевское высказывание G(F#) оказалось бы уже за ее рамками. Таким образом, согласно теореме Гёделя, какой-то аспект понимания всегда остается «за нами», независимо от того, какая доля его оказалась включена в формализованную или алгоритмическую процедуру. Это «гёделево понимание» требует постоянного соотнесения с действительным смыслом символов какой бы то ни было формальной системы, к которой применяется процедура Гёделя. В этом смысле ошибка Q18 весьма похожа на ту, что мы обнаружили, комментируя возражение Q17. С невозможностью автоматизации процедуры гёделизации тесно связаны также рассуждения по поводу Q6 и Q19.
В возражении Q18 присутствует еще один аспект, который стоит рассмотреть. Представим себе, что у нас есть обоснованная формальная система H, содержащая арифметику Пеано. Теорема, о которой говорилось в Q18, окажется среди следствий системы H, а частным ее примером, применимым к конкретной системе F (т.е., собственно, H), будет теорема системы H. Таким образом, можно сформулировать один из выводов формальной системы H:
«система H обоснованна», а следовательно, «высказывание G ( H ) истинно»;
или, точнее, скажем так:
«система H непротиворечива», а следовательно, «высказывание G ( H ) истинно».
Если говорить о реальном смысле этих утверждений, то из них, в сущности, следует, что высказывание G(H) также утверждается системой. А так как (что касается первого из двух вышеприведенных утверждений) истинность любого производимого системой H утверждения, во всяком случае, обусловлена допущением, что система H обоснованна, то получается, что если система H утверждает нечто, явно обусловленное ее собственной обоснованностью, то она вполне может утверждать это напрямую. (Из утверждения «если мне можно верить, то X истинно» следует более простое утверждение, исходящее из того же источника: «X истинно».) Однако в действительности обоснованная формальная система H не может утверждать истинность высказывания G(H), что является следствием ее неспособности утверждать собственную обоснованность. Более того, как мы видим, она не может включать в себя и смысл символов, которыми оперирует. Те же факты годятся и для иллюстрации второго утверждения, причем в этом случае ко всему прочему добавляется и некоторая ирония: система H не способна утверждать собственную непротиворечивость лишь в том случае, если она действительно непротиворечива, если же формальная система непротиворечивой не является, то подобные ограничения ей неведомы. Противоречивая формальная система H может утверждать (в качестве «теоремы») вообще все, что она в состоянии сформулировать! Она вполне может, как выясняется, сформулировать и утверждение: «система М. непротиворечива». Формальная система (достаточно обширная) утверждает собственную непротиворечивость тогда и только тогда, когда она противоречива!
Q19 . Почему бы нам просто не учредить процедуру многократного добавления высказывания G ( F ) к любой системе F , какой мы в данным момент пользуемся, и не позволить этой процедуре выполняться бесконечно ?
Когда нам дана какая-либо конкретная формальная система F, достаточно обширная и полагаемая обоснованной, мы в состоянии понять, как добавить к ней высказывание G(F) в качестве новой аксиомы и получить тем самым новую систему F1, которая также будет считаться обоснованной. (Для согласования обозначений в последующем изложении систему F можно также обозначить через F0.) Теперь мы можем добавить к системе F1 высказывание G(F1), получив в результате новую систему F2, также, предположительно, обоснованную. Повторив данную процедуру, т.е. добавив к системе F2 высказывание G(F2), получим систему F3 и т.д. Приложив еще совсем немного усилий, мы непременно сообразим, как построить еще одну формальную систему Fω , аксиомы которой позволят нам включить в систему в качестве дополнительных аксиом для F все бесконечное множество высказываний {G(F0), G(F1), G(F2), G(F3), …}. Очевидно, что система Fω также будет обоснованной. Этот процесс можно продолжить и дальше: к системе Fω добавляется высказывание G(Fω ), в результате чего получается система Fω +1 , к которой затем добавляется высказывание G(Fω +1 ), что дает систему Fω +2 , и т.д. Далее, как и в предыдущий раз, мы можем построить формальную систему Fω 2 (=Fω + ω ), включив в нее весь бесконечный набор соответствующих аксиом, каковая система опять-таки окажется очевидно обоснованной. Добавлением к ней высказывания G(Fω 2 ), получим систему Fω 2+1 и т.д., а потом построим новую систему Fω 3 (=Fω 2+ ω ), включив в нее опять-таки бесконечное множество аксиом. Повторив всю вышеописанную процедуру, мы сможем получить формальную систему Fω 4 , после следующего повтора — систему Fω 5 и т.д. Еще чуть-чуть потрудиться, и мы обязательно увидим, как можно включить уже это множество новых аксиом {G(Fω ), G(Fω 2 ), G(Fω 3 ), G(Fω 4 ), …} в новую формальную систему Fω 2 (=Fωω ). Повторив всю процедуру, мы получим новую систему Fω 2 + ω 2 , затем — систему Fω 2 + ω 2 + ω 2 и т.д.; в конце концов, когда мы сообразим, как связать все это вместе (разумеется, и на этот раз не без некоторого напряжения умственных способностей), наши старания приведут нас к еще более всеобъемлющей системе Fω 3 , которая также должна быть обоснованной.
Читатели, которые знакомы с понятием канторовых трансфинитных ординалов, несомненно, узнают индексы, обычно используемые для обозначения таких чисел. Тем же, кто от подобных вещей далек, не стоит беспокоиться из-за незнания точного значения этих символов. Достаточно сказать, что описанную процедуру «гёделизации» можно продолжить и далее: мы получим формальные системы Fω 4 , Fω 5 , …, после чего придем к еще более обширной системе Fω ω , затем процесс продолжается до еще больших ординалов, например, ω ω ω и т.д. — до тех пор, пока мы все еще способны на каждом последующем этапе понять, каким образом систематизировать все множество гёделизаций, которые мы получили на данный момент. В этом и заключается основная проблема: для упомянутых нами «усилий, трудов и напряжений» требуется соответствующее понимание того, как должно систематизировать предыдущие гёделизаций. Эта систематизация выполнима при условии, что достигаемый к каждому последующему моменту этап будет помечаться так называемым рекурсивным ординалом, что, в сущности, означает, что должен существовать определенный алгоритм, способный такую процедуру генерировать. Однако алгоритмической процедуры, которую можно было бы заложить заранее и которая позволила бы выполнить описанную систематизацию для всех рекурсивных ординалов раз и навсегда, просто-напросто не существует. Нам снова неизбежно потребуется понимание.
Вышеприведенная процедура была впервые предложена Аланом Тьюрингом в его докторской диссертации (а опубликована в []); там же Тьюринг показал, что любое истинное Π1-высказывание можно, в некотором смысле, доказать с помощью многократной гёделизаций, подобной описанной нами. (См. также [].) Впрочем, воспользоваться этим для получения механической процедуры установления истинности Π1-высказываний нам не удастся по той простой причине, что механически систематизировать гёделизацию невозможно. Более того, невозможность «автоматизации» процедуры гёделизаций как раз и выводится из результата Тьюринга. А в мы уже показали, что общее установление истинности (либо ложности) Π1-высказываний невозможно произвести с помощью каких бы то ни было алгоритмических процедур. Так что в поисках систематической процедуры, не доступной тем вычислительным соображениям, которые мы рассматривали до настоящего момента, многократная гёделизация нам ничем помочь не сможет. Таким образом, для вывода G возражение Q19 угрозы не представляет.
Q20 . Реальная ценность математического понимания состоит, безусловно, не в том, что благодаря ему мы способны выполнять невычислимые действия, а в том, что оно позволяет нам заменить невероятно сложные вычисления сравнительно простым пониманием. Иными словами, разве не правда, что, используя разум, мы, скорее, «срезаем углы» в смысле теории сложности, а вовсе не «выскакиваем» за пределы вычислимого?
Я вполне готов поверить в то, что на практике интуиция математика гораздо чаще используется для «обхода» вычислительной сложности, чем невычислимости. Как-никак математики по природе своей склонны к лени, а потому зачастую стараются изыскать всяческие способы избежать вычислений (пусть даже им придется в итоге выполнить значительно более сложную мыслительную работу, нежели потребовало бы собственно вычисление). Часто случается так, что попытки заставить компьютеры бездумно штамповать теоремы даже умеренно сложных формальных систем быстро загоняют эти самые компьютеры в ловушку фактически безнадежной вычислительной сложности, тогда как математик-человек, вооруженный пониманием смысла, лежащего в основе правил такой системы, без особого труда получит в рамках этой системы множество интересных результатов.
Причина того, что в своих доказательствах я рассматривал не сложность, а невычислимость, заключается в том, что только с помощью последней мне удалось сформулировать необходимые для доказательства сильные утверждения. Не исключено, что в работе большинства математиков вопросы невычислимости играют весьма незначительную роль, если вообще играют. Однако суть не в этом. Я глубоко убежден, что понимание (в частности, математическое) представляет собой нечто, недоступное вычислению, а одной из немногих возможностей вообще подступиться ко всем этим вопросам является как раз доказательство Гёделя(—Тьюринга). Никто не отрицает, что наши математические интуиция и понимание нередко используются для получения результатов, достижимых, в принципе, и вычислительным путем, — но и здесь слепое, не отягощенное пониманием, вычисление может оказаться неэффективным настолько, что попросту не будет работать (см. ). Однако рассмотрение всех таких случаев представляется мне неизмеримо более сложным подходом, нежели обращение к общей невычислимости.
Как бы то ни было, высказанные в возражении Q20 соображения, пусть и справедливые, все же ни в коей мере не противоречат выводу G.
Приложение A: Гёделизирующая машина Тьюринга в явном виде
Допустим, что у нас имеется некая алгоритмическая процедура A, которая, как нам известно, корректно устанавливает незавершаемость тех или иных вычислений. Мы получим вполне явную процедуру для построения на основе процедуры A конкретного вычисления C, для которого A оказывается неадекватной; при этом мы сможем убедиться, что вычисление C действительно не завершается. Приняв это явное выражение для C, мы сможем определить степень его сложности и сравнить ее со сложностью процедуры A, чего требуют аргументы (возражение Q8) и .
Для определенности я воспользуюсь спецификациями той конкретной машины Тьюринга, которую я описал в НРК. Подробное описание этих спецификаций читатель сможет найти в названной работе. Здесь же я дам лишь краткое описание, которого вполне должно хватить для наших настоящих целей.
Машина Тьюринга имеет конечное число внутренних состояний, но производит все операции на бесконечной ленте. Эта лента представляет собой линейную последовательность «ячеек», причем каждая ячейка может быть маркированной или пустой, а общее количество отметок на ленте — величина конечная. Обозначим каждую маркированную ячейку символом 1, а каждую пустую ячейку — 0. В машине Тьюринга имеется также считывающее устройство, которое поочередно рассматривает отметки и, в явной зависимости от внутреннего состояния машины Тьюринга и характера рассматриваемой в данный момент отметки, определяет дальнейшие действия машины по следующим трем пунктам: (I) следует ли изменить рассматриваемую в данный момент отметку; (II) каким будет новое внутреннее состояние машины; (III) должно ли устройство сдвинуться по ленте на один шаг вправо (обозначим это действие через R) или влево (обозначим через L), или же на один шаг вправо с остановкой машины (STOP). Когда машина, в конце концов, остановится, на ленте слева от считывающего устройства будет представлен в виде последовательности символов 0 и 1 ответ на выполненное ею вычисление. Изначально лента должна быть абсолютно чистой, за исключением отметок, описывающих исходные данные (в виде конечной строки символов 1 и 0), над которыми машина и будет выполнять свои операции. Считывающее устройство в начале работы располагается слева от всех отметок.
При представлении на ленте натуральных чисел (будь то входные или выходные данные) иногда удобнее использовать так называемую расширенную двоичную запись, согласно которой число, в сущности, записывается в обычной двоичной системе счисления, только двоичный знак «1» представляется символами 10, а двоичный знак «0» — символом 0. Таким образом, мы получаем следующую схему перевода десятичных чисел в расширенные двоичные:
0 ↔ 0
1 ↔ 10
2 ↔ 100
3 ↔ 1010
4 ↔ 1000
5 ↔ 10010
6 ↔ 10100
7 ↔ 101010
8 ↔ 10000
9 ↔ 100010
10 ↔ 100100
11 ↔ 1001010
12 ↔ 101000
13 ↔ 1010010
14 ↔ 1010100
15 ↔ 10101010
16 ↔ 100000
17 ↔ 1000010
и т.д.
Заметим, что в расширенной двоичной записи символы 1 никогда не встречаются рядом. Таким образом, последовательность из двух или более 1 вполне может послужить сигналом о начале и конце записи натурального числа. То есть для записи всевозможных команд на ленте мы можем использовать последовательности типа 110, 1110, 11110 и т.д.
Отметки на ленте также можно использовать для спецификации конкретных машин Тьюринга. Это необходимо, когда мы рассматриваем работу универсальной машины Тьюринга U. Универсальная машина U работает с лентой, начальная часть которой содержит подробную спецификацию некоторой конкретной машины Тьюринга T, которую универсальной машине предстоит смоделировать. Данные, с которыми должна работать сама машина T, подаются в U вслед за тем участком ленты, который определяет машину T. Для спецификации машины T можно использовать последовательности 110, 1110 и 11110, которые будут обозначать, соответственно, различные команды для считывающего устройства машины T, например: переместиться по ленте на один шаг вправо, на один шаг влево, либо остановиться, сдвинувшись на один шаг вправо:
R ↔ 110
L ↔ 1110
STOP ↔ 11110 .
Каждой такой команде предшествует либо символ 0, либо последовательность 10, что означает, что считывающее устройство должно пометить ленту, соответственно, либо символом 0, либо 1, заменив тот символ, который оно только что считало. Непосредственно перед вышеупомянутыми 0 или 10 располагается расширенное двоичное выражение числа, описывающего следующее внутреннее состояние, в которое должна перейти машина Тьюринга согласно этой самой команде. (Отметим, что внутренние состояния, поскольку количество их конечно, можно обозначать последовательными натуральными числами 0, 1, 2, 3, 4, 5, 6, …, N. При кодировании на ленте для обозначения этих чисел будет использоваться расширенная двоичная запись.)
Конкретная команда, к которой относится данная операция, определяется внутренним состоянием машины перед началом считывания ленты и собственно символами 0 или 1, которые наше устройство при следующем шаге считает и, возможно, изменит. Например, частью описания машины T может оказаться команда 230 → 171R, что означает следующее: «Если машина T находится во внутреннем состоянии 23, а считывающее устройство встречает на ленте символ 0, то его следует заменить символом 1, перейти во внутреннее состояние 17 и переместиться по ленте на один шаг вправо». В этом случае часть «171R» данной команды будет кодироваться последовательностью 100001010110. Разбив ее на участки 1000010.10.110, мы видим, что первый из них представляет собой расширенную двоичную запись числа 17, второй кодирует отметку 1 на ленте, а третий — команду «переместиться на шаг вправо». А как нам описать предыдущее внутреннее состояние (в данном случае 23) и считываемую в соответствующий момент отметку на ленте (в данном случае 0)? При желании можно задать их так же явно с помощью расширенной двоичной записи. Однако на самом деле в этом нет необходимости, поскольку для этого будет достаточно упорядочить различные команды в виде цифровой последовательности (например, такой: 00 →, 01 →, 10 →, 11 →, 20 →, 21 →, 30 →, …).
К этому, в сущности, и сводится все кодирование машин Тьюринга, предложенное в НРК, однако для завершенности картины необходимо добавить еще несколько пунктов. Прежде всего, следует проследить за тем, чтобы каждому внутреннему состоянию, действующему на отметки 0 и 1 (не забывая, впрочем, о том, что команда для внутреннего состояния с наибольшим номером, действующая на 1, оказывается необходимой не всегда), была сопоставлена какая-либо команда. Если та или иная команда вообще не используется в программе, то необходимо заменить ее «пустышкой». Предположим, например, что в ходе выполнения программы внутреннему состоянию 23 нигде не придется сталкиваться с отметкой 1 — соответствующая команда-пустышка в этом случае может иметь следующий вид: 231 → 00R.
Согласно вышеприведенным предписаниям, в кодированной спецификации машины Тьюринга на ленте пара символов 00 должна быть представлена последовательностью 00, однако можно поступить более экономно и записать просто 0, что явится ничуть не менее однозначным разделителем двух последовательностей, составленных из более чем одного символа 1 подряд. Машина Тьюринга начинает работу, находясь во внутреннем состоянии 0; считывающее устройство движется по ленте, сохраняя это внутреннее состояние до тех пор, пока не встретит первый символ 1. Это обусловлено допущением, что в набор команд машины Тьюринга всегда входит операция 00 → 00R. Таким образом, в действительной спецификации машины Тьюринга в виде последовательности 0 и 1 явного задания этой команды не требуется; вместо этого мы начнем с команды 01 → X, где X обозначает первую нетривиальную операцию запущенной машины, т.е. первый символ 1, встретившийся ей на ленте. Это значит, что начальную последовательность 110 (команду → 00R), которая в противном случае непременно присутствовала бы в определяющей машину Тьюринга последовательности, можно спокойно удалить. Более того, в такой спецификации мы будем всегда удалять и завершающую последовательность 110, так как она одинакова для всех машин Тьюринга.
Получаемая в результате последовательность символов 0 и 1 представляет собой самую обыкновенную (т.е. нерасширенную) двоичную запись номера машины Тьюринга n для данной машины (см. главу 2 НРК). Мы называем ее n-й машиной Тьюринга и обозначаем T = T n . Каждый такой двоичный номер (с добавлением в конце последовательности 110) есть последовательность символов 0 и 1, в которой нигде не встречается более четырех 1 подряд. Номер n, не удовлетворяющий данному условию, определяет «фиктивную машину Тьюринга», которая прекратит работать, как только встретит «команду», содержащую более четырех 1. Такую машину «T n » мы будем называть некорректно определенной. Ее работа с какой угодно лентой является по определению незавершающейся. Аналогично, если действующая машина Тьюринга встретит команду перехода в состояние, определенное числом, большим всех тех чисел, для которых были явно заданы возможные последующие действия, то она также «зависнет»: такую машину мы будем полагать «фиктивной», а ее работу — незавершающейся. (Всех этих неудобств можно без особого труда избежать с помощью тех или иных технических средств, однако реальной необходимости в этом нет; см. , Q4).
Для того чтобы понять, как на основе заданного алгоритма A построить явное незавершающееся вычисление, факт незавершаемости которого посредством алгоритма A установить невозможно, необходимо предположить, что алгоритм A задан в виде машины Тьюринга. Эта машина работает с лентой, на которой кодируются два натуральных числа p и q. Мы полагаем, что если завершается вычисление A(p, q), то вычисление, производимое машиной T p с числом q, не завершается вовсе. Вспомним, что если машина T p определена некорректно, то ее работа с числом q не завершается, каким бы это самое q ни было. В случае такого «запрещенного» p исход вычисления A(p, q) может, согласно исходным допущениям, быть каким угодно. Соответственно, нас будут интересовать исключительно те числа p, для которых машина T p определена корректно. Таким образом, в записанном на ленте двоичном выражении числа p пяти символов 1 подряд содержаться не может. Значит, для обозначения на ленте начала и конца числа p мы вполне можем воспользоваться последовательностью 11111.
То же самое, очевидно, необходимо сделать и для числа q, причем оно вовсе не обязательно должно быть числом того же типа, что и p. Здесь перед нами возникает техническая проблема, связанная с чрезвычайной громоздкостью машинных предписаний в том виде, в каком они представлены в НРК. Удобным решением этой проблемы может стать запись чисел p и q в пятеричной системе счисления. (В этой системе запись «10» означает число пять, «100» — двадцать пять, «44» — двадцать четыре и т.д.) Однако вместо пятеричных цифр 0, 1, 2, 3 и 4 я воспользуюсь соответствующими последовательностями символов на ленте 0,10,110,1110 и 11110. Таким образом, мы будем записывать
0 как 0
1 как 10
2 как 110
3 как 1110
4 как 11110
5 как 100
6 как 1010
7 как 10110
8 как 101110
9 как 1011110
10 как 1100
11 как 11010
12 как 110110
13 как 1101110
14 как 11011110
15 как 11100
16 как 111010
…
25 как 1000
26 как 10010
и т.д.
Под «C p » здесь будет пониматься вычисление, выполняемое корректно определенной машиной Тьюринга T r , где r есть число, обыкновенное двоичное выражение которого (с добавлением в конце последовательности символов 110) в точности совпадает с числом p в нашей пятеричной записи. Число q, над которым производится вычисление C p , также необходимо представлять в пятеричном выражении. Вычисление же A(p, q) задается в виде машины Тьюринга, выполняющей действие с лентой, на которой кодируется пара чисел p, q. Запись на ленте будет выглядеть следующим образом:
… 00111110p111110q11111000 …,
где p и q суть вышеописанные пятеричные выражения чисел, соответственно, p и q.
Требуется отыскать такие числа p и q, для которых не завершается не только вычисление C p (q), но и вычисление A(p, q). Процедура из позволяет сделать это посредством отыскания такого числа k, при котором вычисление C k , производимое с числом n, в точности совпадает с вычислением A(n, n) при любом n, и подстановки p = q = k. Для того чтобы проделать это же в явном виде, отыщем машинное предписание K(= C k ), действие которого на последовательность символов на ленте
… 00111110n11111000 …
(где n есть пятеричная запись числа n) в точности совпадает с действием алгоритма A на последовательность
… 00111110n111110n11111000 …
при любом n. Таким образом, действие предписания K сводится к тому, чтобы взять число n (записанное в пятеричном выражении) и однократно его скопировать, при этом два n разделяются последовательностью 111110 (та же последовательность начинает и завершает всю последовательность отметок на ленте). Следовательно, оно воздействует на получаемую в результате ленту точно так, как на эту же ленту воздействовал бы алгоритм A.
Явную модификацию алгоритма A, дающую такое предписание K, можно произвести следующим образом. Сначала находим в определении A начальную команду 01 → X и отмечаем для себя, что это в действительности за «X». Мы подставим это выражение вместо «X» в спецификации, представленной ниже. Один технический момент: следует, помимо прочего, положить, чтобы алгоритм A был составлен таким образом, чтобы машина, после активации команды 01 → X, никогда больше не перешла во внутреннее состояние 0 алгоритма A. Это требование ни в коей мере не влечет за собой каких-либо существенных ограничений на форму алгоритма. (Нуль можно использовать только в командах-пустышках.)
Затем при определении алгоритма A необходимо установить общее число N внутренних состояний (включая и состояние 0, т.е. максимальное число внутренних состояний A будет равно N - 1). Если в определении A нет завершающей команды вида (N - 1)1 → Y, то в конце следует добавить команду-пустышку (N - 1)1 → 00R. Наконец, удалим из определения A команду 01 → X и добавим ее к приводимому ниже списку машинных команд, а каждый номер внутреннего состояния, фигурирующий в этом списке, увеличим на N (символом ∅ обозначено результирующее внутреннее состояние 0, а символом «X» в записи «11 → X» представлена команда, которую мы рассмотрели выше). (В частности, первые две команды из списка примут в данном случае следующий вид: 01 → N1R, N0 → (N + 4)0R.)
∅ 1 → 0 1R , 0 0 → 4 0R , 0 1 → 0 1R , 1 0 → 2 1R , 1 1 → X , 2 0 → 3 1R , 2 1 → ∅ 0R , 3 0 → 55 1R , 3 1 → ∅ 0R , 4 0 → 4 0R , 4 1 → 5 1R , 5 0 → 4 0R , 51 → 6 1R , 6 0 → 4 0R , 6 1 → 7 1R , 7 0 → 4 0R , 7 1 → 8 1R , 8 0 → 4 0R , 8 1 → 9 1R , 9 0 → 10 0R , 9 1 → ∅ 0R , 10 0 → 11 1R , 10 1 → ∅ 0R , 11 0 → 12 1R , 11 1 → 12 0R , 12 0 → 13 1R , 12 1 → 13 0R , 13 0 → 14 1R , 13 1 → 14 0R , 14 0 → 15 1R , 14 1 → 1 0R , 15 0 → 0 0R , 15 1 → ∅ 0R , 16 0 → 17 0L , 16 1 → 16 1L , 17 0 → 17 0L , 17 1 → 18 1L , 18 0 → 17 0L , 18 1 → 19 1L , 19 0 → 17 0L , 191 → 20 1L , 20 0 → 17 0L , 20 1 → 21 1L , 21 0 → 17 0L , 21 1 → 22 1L , 22 0 → 22 0L , 22 1 → 23 1L , 23 0 → 22 0L , 23 1 → 24 1L , 24 0 → 22 0L , 24 1 → 25 1L , 25 0 → 22 0L , 251 → 26 1L , 26 0 → 22 0L , 26 1 → 27 1L , 27 0 → 32 1R , 27 1 → 28 1L , 28 0 → 33 0R , 28 1 → 29 1L , 29 0 → 33 0R , 29 1 → 30 1L , 30 0 → 33 0R , 30 1 → 31 1L , 31 0 → 33 0R , 31 1 → 11 0R , 32 0 → 34 0L , 32 1 → 32 1R , 33 0 → 35 0R , 33 1 → 33 1R , 34 0 → 36 0R , 34 1 → 34 0R , 35 0 → 37 1R , 35 1 → 35 0R , 36 0 → 36 0R , 36 1 → 38 1R , 37 0 → 37 0R , 37 1 → 39 1R , 38 0 → 36 0R , 38 1 → 40 1R , 39 0 → 37 0R , 39 1 → 41 1R , 40 0 → 36 0R , 40 1 → 42 1R , 41 0 → 37 0R , 41 1 → 43 1R , 42 0 → 36 0R , 42 1 → 44 1R , 43 0 → 37 0R , 43 1 → 45 1R , 44 0 → 36 0R , 44 1 → 46 1R , 45 0 → 37 0R , 45 1 → 47 1R , 46 0 → 48 0R , 46 1 → 46 1R , 47 0 → 49 0R , 47 1 → 47 1R , 48 0 → 48 0R , 48 1 → 49 0R , 49 0 → 48 1R , 49 1 → 50 1R , 50 0 → 48 1R , 50 1 → 51 1R , 51 0 → 48 1R , 51 1 → 52 1R , 52 0 → 48 1R , 52 1 → 53 1R , 53 0 → 54 1R , 53 1 → 53 1R , 54 0 → 16 0L , 54 1 → ∅ 0R , 55 0 → 53 1R .
Теперь мы готовы точно определить предельную длину предписания K, получаемого путем вышеприведенного построения, как функцию от длины алгоритма A. Сравним эту «длину» со «степенью сложности», определенной в (в конце комментария к возражению Q8). Для некоторой конкретной машины Тьюринга T m (например, той, что выполняет вычисление A) эта величина равна количеству знаков в двоичном представлении числа m. Для некоторого конкретного машинного действия T m (n) (например, выполнения предписания K) эта величина равна количеству двоичных цифр в большем из чисел тип. Обозначим через α и κ количество двоичных цифр в a и k' соответственно, где
A = T a и K = T k' (= C k ).
Поскольку алгоритм A содержит, как минимум, 2N - 1 команд (учитывая, что первую команду мы исключили) и поскольку для каждой команды требуется, по крайней мере, три двоичные цифры, общее число двоичных цифр в номере его машины Тьюринга а непременно должно удовлетворять условию
α ≥ 6 N - 6.
В вышеприведенном дополнительном списке команд для K есть 105 мест (справа от стрелок), где к имеющемуся там числу следует прибавить N. Все получаемые при этом числа не превышают N + 55, а потому их расширенные двоичные представления содержат не более 2 log2(N + 55) цифр, в результате чего общее количество двоичных цифр, необходимых для дополнительного определения внутренних состояний, не превышает 210 log2(N + 55). Сюда нужно добавить цифры, необходимые для добавочных символов 0, 1, R и L, что составляет еще 527 цифр (включая одну возможную добавочную «команду-пустышку» и учитывая, что мы можем исключить шесть символов 0 по правилу, согласно которому 00 можно представить в виде 0). Таким образом, для определения предписания K требуется больше двоичных цифр, чем для определения алгоритма A, однако разница между этими двумя величинами не превышает 527 + 210 log2(N + 55):
κ < α + 527 + 210 log 2 ( N + 55).
Применив полученное выше соотношение α ≥ 6N - 6, получим (учитывая, что 210 log26 > 542)
κ < α - 15 + 210 log 2 ( α + 336).
Затем найдем степень сложности η конкретного вычисления C k (k), получаемого посредством этой процедуры. Вспомним, что степень сложности машины T m (n) определяется как количество двоичных цифр в большем из двух чисел m, n. В данной ситуации C k = T k , так что число двоичных цифр в числе «m» этого вычисления равно κ. Для того чтобы определить, сколько двоичных цифр содержит число «n» этого вычисления, рассмотрим ленту, содержащую вычисление C k (k). Эта лента начинается с последовательности символов 111110, за которой следует двоичное выражение числа k', и завершается последовательностью 11011111. В соответствии с предложенным в НРК соглашением всю эту последовательность (без последней цифры) следует читать как двоичное число; эта операция дает нам номер «n», который присваивается ленте машины, выполняющей вычисление T m (n). То есть число двоичных цифр в данном конкретном номере «n» равно κ + 13, и, следовательно, число κ + 13 совпадает также со степенью сложности ту вычисления C k (k), благодаря чему мы можем записать η = κ + 13 < α — 2 + 210 log2(α + 336), или проще:
η < α + 210 log 2 ( α + 336).
Детали вышеприведенного рассуждения специфичны для данного конкретного предложенного еще в НРК способа кодирования машин Тьюринга, и при использовании какого-либо иного кодирования они также будут несколько иными. Основная же идея очень проста. Более того, прими мы формализм λ-исчисления, вся операция оказалась бы, в некотором смысле, почти тривиальной. (Достаточно обстоятельное описание λ-исчисления Черча можно найти в НРК, конец главы 2; см. также [].) Предположим, например, что алгоритм A определяется некоторым λ-оператором A, выполняющим действие над другими операторами P и Q, что выражается в виде операции (AP)Q. Оператором P здесь представлено вычисление C p , а оператором Q — число q. Далее, оператор A должен удовлетворять известному требованию, согласно которому для любых P и Q должно быть истинным следующее утверждение:
Если завершается операция ( AP ) Q , то операция PQ не завершается.
Мы без труда можем составить такую операцию λ-исчисления, которая не завершается, однако этот факт невозможно установить посредством оператора A. Например, положим
K = λ x .[( Ax ) x ],
т.е. KY = (AY)Y для любого оператора Y. Затем рассмотрим λ-операцию
KK
Очевидно, что эта операция не завершается, поскольку KK = (AK)K, а завершение последней операции означало бы, что операция KK не завершается по причине принятой нами природы оператора A. Более того, оператор A не способен установить этот факт, потому что операция (AK)K не завершается. Если мы полагаем, что оператор A обладает требуемым свойством, то мы также должны предположить, что операция KK не завершается.
Отметим, что данная процедура дает значительную экономию. Если записать операцию KK в виде
KK = λy.(yy)(λx.[(Ax)x]),
то становится ясно, что число символов в записи операции KK всего на 16 больше аналогичного числа символов для алгоритма A (если пренебречь точками, которые в любом случае избыточны)!
Строго говоря, это не совсем законно, поскольку в выражении для оператора A может также появиться и символ «x», и с этим нам придется что-то делать. Можно усмотреть сложность и в том, что генерируемое такой процедурой незавершающееся вычисление нельзя считать операцией над натуральными числами (поскольку вторая K в записи KK «числом» не является). Вообще говоря, λ-исчисление не вполне подходит для работы с явными численными операциями, и зачастую бывает довольно сложно понять, каким образом ту или иную заданную алгоритмическую процедуру, применяемую к натуральным числам, можно выразить в виде операции λ-исчисления. По этим и подобным причинам обсуждение с привлечением машин Тьюринга имеет, как нам представляется, более непосредственное отношение к теме нашего исследования и достигает требуемого результата более наглядным путем.
3. О невычислимости в математическом мышлении
3.1. Гёдель и Тьюринг
В была предпринята попытка продемонстрировать мощь и строгий характер аргументации в пользу утверждения (обозначенного буквой G), суть которого заключается в том, что математическое понимание не может являться результатом применения какого-либо осмысленно осознаваемого и полностью достоверного алгоритма (или, что то же самое, алгоритмов; см. возражение Q1). В приводимых рассуждениях, однако, ни словом не упомянуто еще об одной возможности, существенно более серьезной и ничуть не противоречащей утверждению G, а именно: убежденность математика в истинности своих выводов может оказаться результатом применения им некоего неизвестного и неосознаваемого алгоритма, или же, возможно, математик применяет какой-то вполне постижимый алгоритм, однако при этом не может знать наверняка (или хотя бы искренне верить), что выводы его являются целиком и полностью результатом применения этого самого алгоритма. Ниже я покажу, что, хотя подобные допущения и вполне приемлемы с логической точки зрения, вряд ли их можно счесть хоть сколько-нибудь правдоподобными.
Прежде всего следует указать на то, что тщательно выстраивая последовательности умозаключений (вполне, заметим, осознанных) с целью установления той или иной математической истины, математики вовсе не считают, что они лишь слепо следуют неким неосознаваемым правилам, будучи при этом не в состоянии постичь эти правила ни рассудком, ни верой. Напротив, они твердо знают, что их аргументация опирается исключительно на непреложные истины — в основе своей существенно «очевидные»; столь же непреложными, на их взгляд, являются и все промежуточные умозаключения, составляющие упомянутую последовательность. Какой бы длинной, запутанной или даже концептуально неочевидной ни была цепь умозаключений, само рассуждение в основе своей остается принципиально неопровержимым и логически безупречным, а автор его искренне верит в свою правоту. Ни один математик не согласится с предположением о том, что на самом-то деле все его действия определяются какими-то совершенно иными процедурами, о которых он ничего не знает и в которые не верит, но которые, возможно, неким непостижимым образом исподволь влияют на его убеждения.
Разумеется, в этом отношении математики могут и ошибаться. Может быть, и впрямь существует какая-то алгоритмическая процедура, которая руководит всем математическим мышлением, оставаясь при этом неизвестной самим математикам. Всерьез принять такую возможность, пожалуй, легче людям, далеким от математики, нежели большинству из тех, для кого математика является профессией. Полагая, что деятельность математика не сводится к простому выполнению некоего неизвестного (и непостижимого) алгоритма (равно как и алгоритма, в существовании которого он испытывает сомнения), это самое большинство оказывается как нельзя более правым, в чем я и постараюсь убедить читателя в этой главе. Разумеется, полностью исключить возможность того, что суждения и убеждения математиков и в самом деле определяются какими-то неизвестными и неосознаваемыми факторами, нельзя; однако, даже если так оно и есть, я полагаю, что такие факторы не имеют ничего общего с алгоритмически описываемыми процедурами.
Весьма поучительным представляется рассмотреть точки зрения двух выдающихся мыслителей от математики, которым мы, собственно говоря, и обязаны идеями, приведшими нас к утверждению G. Что, в самом деле, думал по этому поводу Гёдель? А Тьюринг? Примечательно, что, исходя из одинаковых математических данных, они пришли к противоположным, в сущности, выводам. Следует, впрочем, пояснить, что оба вывода находятся в полном согласии с утверждением G. Гёдель, по всей видимости, полагал, что разум, вообще говоря, не ограничен не только необходимостью выступать исключительно в качестве вычислительной сущности, но и конечными физическими параметрами самого мозга. Он даже упрекал Тьюринга за то, что тот не допускал такой возможности. По словам Хао Вана ([], с. 326, см. также Собрание сочинений Гёделя, т. 2 [], с. 297), соглашаясь с обоими, вытекающими из позиции Тьюринга положениями, т. е. с тем, что «мозг, в сущности, функционирует подобно цифровому компьютеру», и с тем, что «физические законы, равно как и наблюдаемые следствия из них, обладают конечным пределом точности», Гёдель напрочь отвергал утверждение Тьюринга о неотделимости разума от материи, считая это «свойственным эпохе предрассудком». Таким образом, согласно Гёделю, сам по себе физический мозг действует исключительно как вычислитель, разум же по отношению к мозгу представляет собой нечто высшее, вследствие чего активность разума оказывается свободной от ограничений, налагаемых вычислительными законами, управляющими поведением мозга как физического объекта. Гёдель, судя по его собственным словам, не считал, что утверждение G можно рассматривать в качестве доказательства его тезиса о невычислимости деятельности разума:
«С другой стороны, учитывая доказанное ранее, следует допустить принципиальную возможность существования (и даже эмпирической реализации) некоей машины для доказательства теорем, каковая машина в сущности представляет собой эквивалент математической интуиции, однако доказать эту эквивалентность невозможно, как невозможно доказать и то, что на выходе такой машины мы будем получать только корректные теоремы конечной теории чисел».
Надо сказать, что вышеприведенное допущение ни в коей мере не противоречит G (и я ничуть не сомневаюсь, что Гёделю был хорошо известен тот недвусмысленный вывод, какой в моей формулировке получил обозначение G). Гёдель допускал логическую возможность того, что разум математика может функционировать в соответствии с некоторым алгоритмом, о котором сам математик не знает, либо знает, но в таком случае не может быть однозначно уверен в его обоснованности (…доказать … невозможно, … только корректные теоремы…). В соответствии с моей собственной терминологией такой алгоритм следует отнести к категории «непознаваемо обоснованных». Разумеется, совсем иное дело действительно поверить в возможность того, что деятельность разума математика и в самом деле определяется таким вот непознаваемо обоснованным алгоритмом. Похоже, сам Гёдель в это так и не поверил — и оказался в результате окружен компанией мистиков (точка зрения D), которые полагают, что средствами науки о феноменах физического мира разум объяснить невозможно.
Что же касается Тьюринга, то он, по-видимому, мистическую точку зрения не принял, будучи в то же время солидарен с Гёделем в том, что мозг, как и всякий другой физический объект, должен функционировать каким-либо вычислимым образом (вспомним о «тезисе Тьюринга», ). Таким образом, Тьюрингу пришлось искать какой-то другой способ обойти затруднение в виде утверждения G. При этом особенно значимым ему показался тот факт, что математикам-людям свойственно делать ошибки; если мы хотим, чтобы наш компьютер стал подлинно разумным, следует позволить ему хоть иногда ошибаться;
«Иными словами, это означает, что если мы требуем от машины непогрешимости, то не стоит ожидать от нее еще и разумности. Существует несколько теорем, суть которых почти буквально сводится к вышеприведенному утверждению. Однако в этих теоремах ничего не говорится о степени разумности, которую нам может продемонстрировать машина, не претендующая на непогрешимость».
Под «теоремами» Тьюринг, вне всякого сомнения, подразумевает теорему Гёделя и другие аналогичные теоремы — такие, например, как его собственная, «вычислительная» версия теоремы Гёделя. То есть, по Тьюрингу, получается, что наиболее существенной способностью человеческого математического мышления является способность ошибаться, благодаря которой свойственное (предположительно) разуму неточно-алгоритмическое функционирование обеспечивает большую мощность, нежели возможно получить посредством каких угодно полностью обоснованных алгоритмических процедур. Исходя из этого допущения, Тьюринг предложил способ обойти ограничение, налагаемое следствиями из теоремы Гёделя: мыслительная деятельность математика подчиняется-таки некоему алгоритму, только не «непознаваемо обоснованному», а формально необоснованному. Таким образом, точка зрения Тьюринга приходит в полное согласие с утверждением G, а сам Тьюринг, по-видимому, присоединяется к сторонникам точки зрения A.
Завершая дискуссию, я хотел бы представить мои собственные причины усомниться в том, что «необоснованность» управляющего разумом математика алгоритма может послужить подлинным объяснением тому, что в этом самом разуме происходит. Как бы ни обстояло дело в действительности, в самой идее о том, что превосходство человеческого разума над точной машиной достигается за счет неточности разума, мне видится какое-то глубинное противоречие, особенно когда речь — как в нашем случае — идет о способности математика открывать неопровержимые математические истины, а не о его оригинальности или творческих способностях. Поразительно, что два великих мыслителя, какими, несомненно, являются Гёдель и Тьюринг, руководствуясь соображениями вроде утверждения G, пришли к выводам (пусть и различным), которые многие из нас склонны считать, скажем так, маловероятными. Кроме того, весьма интересно поразмыслить о том, к каким бы выводам они пришли, имей они шанс хоть сколько-нибудь всерьез предположить, что физический процесс может иногда оказаться в основе своей невычислимым — в соответствии с точкой зрения C, ради продвижения которой и была написана эта книга.
В последующих разделах (особенно, в ) я представлю вашему вниманию несколько детальных обоснований (некоторые из них довольно сложны, запутаны или специальны), целью которых является демонстрация неспособности вычислительных моделей A и B выступить в качестве вероятной основы для исследования феномена математического понимания. Если читатель не нуждается в подобном убеждении либо не склонен погружаться в детали, то я бы порекомендовал ему (или ей) все же начать чтение, а затем, когда уж совсем надоест, переходить сразу к итоговому воображаемому диалогу (). Если у вас затем появится желание вернуться к пропущенным рассуждениям, буду только рад, если же нет — забудьте о них и читайте дальше.
3.2. Способен ли необоснованный алгоритм познаваемым образом моделировать математическое понимание?
Согласно выводу G, для того чтобы математическое понимание могло оказаться результатом выполнения некоего алгоритма, этот алгоритм должен быть необоснованным или непознаваемым, если же он сам по себе обоснован и познаваем, то о его обоснованности должно быть принципиально невозможно узнать наверняка (такой алгоритм мы называем непознаваемо обоснованным); кроме того, возможно, что различные математики «работают» на различных типах таких алгоритмов. Под «алгоритмом» здесь понимается просто какая-нибудь вычислительная процедура (см. ), т.е. любой набор операций, который можно, в принципе, смоделировать на универсальном компьютере с неограниченным объемом памяти. (Как нам известно из обсуждения возражения Q8, , «неограниченность» объема памяти в данном идеализированном случае на результаты рассуждения никак не влияет.) Такое понятие алгоритма включает в себя нисходящие процедуры, восходящие самообучающиеся системы, а также различные их сочетания. Сюда, например, входят любые процедуры, которые можно реализовать с помощью искусственных нейронных сетей (см. ). Этому определению отвечают и иные типы восходящих механизмов — например, так называемые «генетические алгоритмы», повышающие свою эффективность с помощью некоей встроенной процедуры, аналогичной дарвиновской эволюции (см. ).
О специфике приложения аргументации, представляемой в настоящем разделе (равно как и доводов, выдвинутых в ), к восходящим процедурам я еще буду говорить в (краткое изложение их можно найти в воображаемом диалоге, ). Пока же, для большей ясности изложения, будем рассуждать, исходя из допущения, что в процессе участвует один-единственный тип алгоритмических процедур, а именно — нисходящие. Такую алгоритмическую процедуру можно относить как к отдельному математику, так и к математическому сообществу в целом. В комментариях к возражениям Q11 и Q12, , рассматривалось предположение о том, что разным людям могут быть свойственны различные обоснованные и известные алгоритмы, причем мы пришли к заключению, что такая возможность не влияет на результаты рассуждения сколько-нибудь значительным образом. Возможно также, что разные люди постигают истину посредством различных необоснованных и непознаваемых алгоритмов; к этому вопросу мы вернемся несколько позже (см. ). А пока, повторюсь, будем считать, что в основе математического понимания лежит одна-единственная алгоритмическая процедура. Можно, кроме того, ограничить рассматриваемую область той частью математического понимания, которая отвечает за доказательство Π1-высказываний (т.е. определений тех операций машины Тьюринга, которые не завершаются; см. комментарий к возражению Q10). В дальнейшем вполне достаточно интерпретировать сочетание «математическое понимание» как раз в таком, ограниченном смысле (см. формулировку G**).
В зависимости от познаваемости предположительно
лежащей в основе математического понимания алгоритмической процедуры F (будь то обоснованной или нет), следует четко выделять три совершенно различных случая. Процедура F может быть:
I сознательно познаваемой, причем познаваем также и тот факт, что именно эта алгоритмическая процедура ответственна за математическое понимание;
II сознательно познаваемой, однако тот факт, что математическое понимание основывается именно на этой алгоритмической процедуре, остается как неосознаваемым, так и непознаваемым;
III неосознаваемой и непознаваемой.
Рассмотрим сначала полностью сознательный случай I. Поскольку и сам алгоритм, и его роль являются познаваемыми, мы вполне можем счесть, что мы о них уже знаем. В самом деле, ничто не мешает нам вообразить, что все наши рассуждения имеют место уже после того, как мы получили в наше распоряжение соответствующее знание — ведь слово «познаваемый» как раз и подразумевает, что такое время, по крайней мере, в принципе, когда-нибудь да наступит. Итак, алгоритм F нам известен, при этом известна и его основополагающая роль в математическом понимании. Как мы уже видели (), такой алгоритм эффективно эквивалентен формальной системе F. Иными словами, получается, что математическое понимание — или хотя бы понимание математики каким-то отдельным математиком — эквивалентно выводимости в рамках некоторой формальной системы F. Если мы хотим сохранить хоть какую-то надежду удовлетворить выводу G, к которому нас столь неожиданно привели изложенные в предыдущей главе соображения, то придется предположить, что система F является необоснованной. Однако, как это ни странно, необоснованность в данном случае ситуацию ничуть не меняет, поскольку, в соответствии с I, известная формальная система F является действительно известной, то есть любой математик знает и, как следствие, верит, что именно эта система лежит в основе его (или ее) математического понимания. А такая вера автоматически влечет за собой веру (пусть и ошибочную) в обоснованность системы F. (Согласитесь, крайне неразумно выглядит точка зрения, в соответствии с которой математик позволяет себе не верить в самые фундаментальные положения собственной заведомо неопровержимой системы взглядов.) Независимо от того, является ли система F действительно обоснованной, вера в ее обоснованность уже содержит в себе веру в то, что утверждение G(F) (или, как вариант, Ω(F), см. ) истинно. Однако, поскольку теперь мы полагаем (исходя из веры в справедливость теоремы Гёделя), что истинность утверждения G(F) в рамках системы F недоказуема, это противоречит предположению о том, что система F является основой всякого (существенного для рассматриваемого случая) математического понимания. (Это соображение одинаково справедливо как для отдельных математиков, так и для всего математического сообщества в целом; его можно применять индивидуально к любому из всевозможных алгоритмов, предположительно составляющих основу мыслительных процессов того или иного математика. Более того, согласно предварительной договоренности, для нас на данный момент важна применимость этого соображения лишь в той области математического понимания, которая имеет отношение к доказательству Π1-высказываний.) Итак, невозможно знать наверняка, что некий гипотетический известный необоснованный алгоритм F, предположительно лежащий в основе математического понимания, и в самом деле выполняет эту роль. Следовательно, случай I исключается, независимо от того, является система F обоснованной или нет. Если система F сама по себе познаваема, то следует рассмотреть возможность II, суть которой заключается в том, что система F все же может составлять основу математического понимания, однако узнать об этой ее роли мы не в состоянии. Остается в силе и возможность III: сама система F является как неосознаваемой, так и непознаваемой.
На данный момент мы достигли следующего результата: случай I (по крайней мере, в контексте полностью нисходящих алгоритмов) как сколько-нибудь серьезную возможность рассматривать нельзя; тот факт, что система F может в действительности оказаться и необоснованной, как выяснилось, сути проблемы ничуть не меняет. Решающим фактором здесь является невозможность точно установить, является та или иная гипотетическая система F (независимо от ее обоснованности) основой для формирования математических убеждений или же нет. Дело не в непознаваемости самого алгоритма, но в непознаваемости того факта, что процесс понимания действительно происходит в соответствии с данным алгоритмом.
3.3. Способен ли познаваемый алгоритм непознаваемым образом моделировать математическое понимание?
Перейдем к случаю II и попытаемся серьезно рассмотреть возможность того, что математическое понимание на деле эквивалентно некоторому сознательно познаваемому алгоритму либо формальной системе, однако эквивалентность эта принципиально непознаваема. Иными словами, даже при условии познаваемости той или иной гипотетической формальной системы F мы никоим образом не можем убедиться в том, что именно эта конкретная система действительно лежит в основе нашего математического понимания. Правдоподобно ли такое предположение?
Если упомянутая гипотетическая формальная система F не является уже известной, то в этом случае нам, как и ранее, следует полагать, что она может, по крайней мере, в принципе, когда-нибудь таковой стать. Вообразим, что этот светлый день наконец наступил, и допустим, что в нашем распоряжении имеется точное и подробное описание этой самой системы. Предполагается, что формальная система F, будучи, возможно, крайне замысловатой, все же достаточно проста для того, чтобы мы оказались способны, по крайней мере, в принципе, постичь ее на вполне сознательном уровне. При этом нам не позволено испытывать уверенность в том, что система F действительно целиком и полностью охватывает всю совокупность наших твердых математических убеждений и интуитивных озарений (по крайней мере в том, что касается Π1-высказываний). Это (вообще-то вполне логичное) предположение оказывается на деле в высшей степени неправдоподобным, в причинах чего мы и попытаемся разобраться. Более того, несколько позднее я покажу, что даже будь оно истинным, это не принесло бы никакой радости тем ИИ-энтузиастам, которые видят смысл жизни в создании робота-математика. Мы еще поговорим об этом в конце данного раздела и — более подробно — в и .
Дабы подчеркнуть тот факт, что существование подобной системы F и в самом деле следует полагать логически возможным, вспомним о «машине для доказательства теорем», возможности создания которой, согласно Гёделю, логически исключить нельзя (см. цитату в ). В сущности, такую «машину», как я поясню ниже, как раз и можно представить в виде некоторой алгоритмической процедуры F, соответствующей вышеприведенным пунктам II или III. Как отмечает Гёдель, его гипотетическая машина для доказательства теорем может быть «эмпирически реализована», что соответствует требованию «сознательной познаваемости» процедуры F в случае II; если же подобная реализация оказывается невозможной, то мы, по сути, имеем дело со случаем III.
На основании своей знаменитой теоремы Гёдель утверждал, что невозможно доказать «эквивалентность» процедуры F (или, что то же самое, формальной системы F; см. ) «математической интуиции» (см. ту же цитату). В определении случая II (и, как следствие, III) я сформулировал это фундаментальное ограничение, налагаемое на F, несколько по-иному: «Тот факт, что математическое понимание основывается именно на этой алгоритмической процедуре, остается как неосознаваемым, так и непознаваемым».
Это ограничение (необходимость в котором следует из обоснованного в исключения случая I) со всей очевидностью приводит к невозможности показать, что процедура F эквивалентна математической интуиции, поскольку посредством подобной демонстрации мы могли бы однозначно убедиться в том, что процедура F действительно выполняет ту роль, о самом факте выполнения которой мы предположительно не в состоянии ничего знать. И наоборот, если бы эта самая роль процедуры F (роль фундаментального алгоритма, в соответствии с которым осуществляется постижение математических истин) допускала осознанное познание (в том смысле, что мы могли бы в полной мере постичь, как именно процедура F выполняет эту свою роль), то нам пришлось бы признать и обоснованность F. Ибо если мы не допускаем, что процедура F целиком и полностью обоснованна, то это означает, что мы отвергаем какие-то ее следствия. А ее следствиями являются как раз те математические положения (или хотя бы только Π1-высказывания), которые мы полагаем-таки истинными. Таким образом знание роли процедуры F равнозначно наличию доказательства F, хотя такое «доказательство» и нельзя считать формальным доказательством в рамках некоторой заранее заданной формальной системы.
Отметим также, что истинные Π1-высказывания можно рассматривать в качестве примеров тех самых «корректных теорем конечной теории чисел», о которых говорил Гёдель. Более того, если понятие «конечной теории чисел» включает в себя μ-операцию «отыскания наименьшего натурального числа, обладающего таким-то свойством», в каковом случае оно включает в себя и процедуры, выполняемые машинами Тьюринга (см. конец ), то тогда частью конечной теории чисел следует считать все Π1-высказывания. Иными словами, получается, что доказательство гёделевского типа не дает четкого способа исключить из рассмотрения случай II, руководствуясь одними лишь строго логическими основаниями — по крайней мере, до тех пор, пока мы полагаем, что Гёдель был прав.
С другой стороны, можно задаться вопросом об общем правдоподобии предположения II. Рассмотрим, что повлечет за собой существование познаваемой процедуры F, непознаваемым образом эквивалентной человеческому математическому пониманию (заведомо непогрешимому). Как уже отмечалось, ничто не мешает нам мысленно перенестись в некое будущее время, в котором эта процедура окажется обнаружена и подробно описана. Известно также (см. ), что формальная система задается в виде некоторого набора аксиом и правил действия. Теоремы системы F представляют собой утверждения (иначе называемые «положениями»), выводимые из аксиом с помощью правил действия, причем все теоремы можно сформулировать посредством того же набора символов, который используется для выражения аксиом. А теперь представим себе, что теоремы системы F в точности совпадают с теми положениями (сформулированными с помощью упомянутых символов), неопровержимую истинность которых математики, в принципе, способны самостоятельно установить.
Допустим на минуту, что перечень аксиом системы F является конечным. Сами же аксиомы суть не что иное, как частные случаи соответствующих теорем. Однако неопровержимую истинность каждой теоремы мы можем, в принципе, постичь посредством математического понимания и интуиции. Следовательно, каждая аксиома в отдельности должна выражать нечто такое, что (по крайней мере, в принципе) постижимо посредством этого самого математического понимания. Иными словами, для каждой отдельной аксиомы когда-нибудь непременно настанет (либо принципиально возможно, что настанет) время, когда ее неопровержимая истинность будет однозначно установлена. Так, рассматривая одну за другой, мы сможем устанавливать истинность любой отдельно взятой аксиомы системы F. Таким образом, в конечном итоге будет установлена (либо принципиально возможно, что будет установлена) неопровержимая истинность всех отдельно взятых аксиом. Соответственно, настанет время, когда будет установлена неопровержимая истинность всей совокупности аксиом системы F в целом.
А как быть с правилами действия? Можем ли мы предположить, что настанет время, когда будет однозначно установлена неопровержимая обоснованность этих правил? Во многих формальных системах правилами действия служат достаточно простые утверждения, каждое из которых с очевидностью «неопровержимо», например: «Если установлено, что высказывание P является теоремой и высказывание P ⇒ Q является теоремой, то можно заключить, что высказывание Q также является теоремой» (относительно символа ⇒ «следует» см. НРК, с. 393, или []). Признать неоспоримую справедливость таких правил совсем не трудно. С другой стороны, среди правил действия встречаются и гораздо более тонкие отношения, справедливость которых вовсе не так очевидна; прежде чем прийти к однозначному решению относительно того, считать то или иное такое правило «неопровержимо обоснованным» или нет. нам, возможно, потребуется прибегнуть к весьма подробному и тщательному анализу. Более того, как мы вскоре убедимся, в наборе правил действия формальной системы F неизбежно имеются такие правила, неоспоримая обоснованность которых не может быть достоверно установлена ни одним математиком — причем мы все еще полагаем, что число аксиом в системе F конечно.
В чем же причина? Перенесемся в воображении в то самое время, когда уже однозначно установлена неопровержимая справедливость всех аксиом формальной системы F. Перед нами открывается замечательная возможность без помех рассмотреть всю систему F целиком. Попробуем допустить, что все правила действия системы F можно также считать справедливыми безо всяких оговорок. Хотя предполагается, что мы еще не можем знать наверняка, что система F действительно включает в себя всю математику, которая в принципе доступна человеческому пониманию и интуиции, мы должны к настоящему моменту уже убедиться в том, что система F является, по меньшей мере, неоспоримо обоснованной, поскольку справедливость как ее аксиом, так и ее правил действия безоговорочно нами принимается. Следовательно, мы также должны уже быть уверены в том, что система F непротиворечива. Не забываем, разумеется, и о том, что, в силу этой непротиворечивости, утверждение G(F) также должно быть истинным — более того, неопровержимо истинным! Однако, поскольку предполагается, что система F фактически (хотя нам об этом неизвестно) включает в себя всю совокупность того, что безоговорочно доступно нашему пониманию, утверждение G(F) должно на деле представлять собой теорему системы F. Согласно теореме Гёделя, такое, вообще говоря, возможно только в том случае, если формальная система F противоречива. Если же система F противоречива, то одной из теорем этой системы является утверждение «1 = 2». Следовательно, утверждение «1 = 2» должно быть, в принципе, доступно нашему математическому пониманию — очевидное противоречие!
Несмотря на это, следует, по крайней мере, учесть саму возможность того, что математики действуют (не зная о том) в рамках системы F, которая является, по существу, необоснованной. К этому вопросу я еще вернусь в , пока же (в пределах данного раздела) будем полагать, что на самом деле процедуры, лежащие в основе математического понимания, целиком и полностью обоснованны. Приданных обстоятельствах, если мы продолжаем настаивать на том, что все правила действия нашей формальной системы F с конечным набором аксиом безоговорочно истинны, нам остается лишь признать, что противоречие действительно имеет место. Следовательно, среди правил действия системы F должно быть по крайней мере одно правило, обоснованность которого не может неопровержимо установить ни один математик (хотя в действительности это правило является обоснованным).
Все вышеприведенные рассуждения опирались на то допущение, что система F задается конечным набором аксиом. В качестве возможного альтернативного решения можно предположить, что количество аксиом в системе F бесконечно. Относительно этой возможности необходимо сделать некоторые комментарии. Для того чтобы систему F можно было определить как формальную в требуемом смысле — т.е. как систему, в рамках которой всегда можно однозначно установить (посредством некоторой заранее заданной вычислительной процедуры), что предполагаемое доказательство того или иного положения действительно является доказательством в соответствии с правилами системы, — необходимо, чтобы ее бесконечный набор аксиом можно было выразить каким-то конечно определяемым образом. Вообще говоря, всегда допускается некоторая свобода в отношении выбора конкретного способа представления формальной системы, в соответствии с которым операции системы определяются либо как аксиомы, либо как правила действия. Так, стандартная аксиоматическая система теории множеств — система Цермело—Френкеля (обозначаемая здесь как ZF) — включает в себя бесконечное количество аксиом, выражаемых посредством структур, называемых «схемами аксиом». Путем соответствующего переформулирования систему ZF можно выразить таким образом, что количество действительных аксиом станет конечным. Более того, действуя определенным образом, такое можно проделать с любой схемой аксиом, являющейся «формальной» в требуемом нами вычислительном смысле.
Может создаться впечатление, что вышеприведенное рассуждение (целью которого является исключение из списка возможных вариантов случая II) применимо к любой (обоснованной) системе F, вне зависимости от того, конечно или бесконечно количество ее аксиом. Это и в самом деле так, однако в процессе приведения бесконечной схемы аксиом к конечному виду мы можем ввести новые правила действия, которые могут оказаться не столь самоочевидно обоснованными. Так, представляя себе, в соответствии с вышеизложенными соображениями, времена, когда нам станут известны все аксиомы и правила действия системы F (при этом также предполагается, что все теоремы этой гипотетической системы в точности совпадают с теоремами, которые в принципе доступны человеческим пониманию и интуиции), мы никоим образом не можем быть уверены в принципиальной возможности неопровержимого установления обоснованности правил действия такой системы F, в отличие от ее аксиом (даже если эти правила действительно являются обоснованными). Дело в том, что, в отличие от аксиом, правила действия не принадлежат к теоремам формальной системы. Мы же полагаем, что неопровержимо установить можно лишь обоснованность теорем системы F.
Не совсем ясно, возможно ли продолжить данное рассуждение, оставаясь при этом в рамках строгой логики. Если мы полагаем справедливой возможность II, то нам приходится признать, что существует некая формальная система F (на основании которой человек постигает истинность Π1-высказываний), целиком и полностью понимаемая математиками, обладающая конечным набором аксиом, справедливость которых не вызывает никаких сомнений, и конечной системой правил действия R, которая, впрочем, содержит по крайней мере одну операцию, полагаемую фундаментально сомнительной. Каждая отдельно взятая теорема системы F неизбежно оказывается утверждением, истинность которого может быть неопровержимо установлена, — что, собственно говоря, удивительно, учитывая тот факт, что многие из этих теорем выводятся с помощью сомнительных правил системы R. Кроме того, хотя математик и может (в принципе) установить истинность каждой из упомянутых теорем в отдельности, единообразной процедуры для этого не существует. Можно ограничить область рассмотрения теми теоремами системы F, которые представляют собой Π1-высказывания. Применяя сомнительную систему правил R, мы можем вычислительным способом сгенерировать перечень тех Π1-высказываний, справедливость которых может быть однозначно установлена математиками. В конечном счете, человек, воспользовавшись пониманием и интуицией, оказывается способен установить справедливость каждого из этих Π1-высказываний в отдельности. Однако в каждом конкретном случае для такого установления применяются методы рассуждений, существенно отличающиеся от правила R, с помощью которого было получено данное Π1-высказывание. Раз за разом нам приходится добавлять в систему все новые, все более изощренные плоды человеческого разума — с тем, чтобы можно было неопровержимо доказать истинность каждого последующего Π1-высказывания. Словно по волшебству, истинными оказываются все Π1-высказывания, впрочем истинность некоторых из них можно установить лишь после привлечения какого-либо фундаментально нового метода рассуждения, причем необходимость в этом возникает вновь и вновь, на все более глубоких уровнях. Более того, любое Π1-высказывание, неоспоримую истинность которого можно установить — причем неважно, каким методом, — оказывается уже включенным в тот самый перечень, который мы сгенерировали ранее с помощью системы правил R. Наконец, существует еще и особое истинное Π1-высказывание G(F), которое явным образом выводится из знания формальной системы F, однако истинность которого не может быть неопровержимо установлена ни одним математиком. В лучшем случае, математик сможет понять, что истинность G(F) непосредственно обусловлена обоснованностью сомнительной системы правил действия R, которая, по всей видимости, обладает некоей чудесной способностью определять, истинность каких именно Π1-высказываний может быть неопровержимо установлена человеком.
Могу себе представить, что кому-то все это, возможно, покажется не совсем бессмысленным. Ко многим своим выводам математики приходят на основании предпосылок, которые можно назвать «эвристическими принципами» — такой принцип не дает непосредственного доказательства предполагаемого вывода, однако дает основания ожидать, что истинным неизбежно окажется именно такой вывод. Собственно доказательство может быть получено и позднее, причем совершенно иными методами. Мне, однако, представляется, что подобные эвристические принципы имеют на деле очень мало общего с нашей гипотетической системой правил R. В сущности, такие принципы способны лишь углубить наше сознательное понимание причин, в соответствии с которыми оказывается истинным тот или иной математический вывод. Впоследствии, в результате более серьезной разработки соответствующих математических методов, часто становится вполне ясно, почему именно сработал тот или иной эвристический принцип. В большинстве же случаев вполне проясняется лишь один вопрос: при каких именно обстоятельствах данный эвристический принцип гарантированно работает, а при каких — нет; иначе говоря, если не соблюдать известной осторожности, можно прийти к весьма и весьма ошибочным выводам. Если же осторожность соблюдена, сам такой принцип становится чрезвычайно мощным и надежным инструментом математического доказательства. Он не снабдит вас сверхъестественно достоверной алгоритмической процедурой для установления справедливости Π1-высказываний, причины успешного функционирования которой будут принципиально недоступны человеческому пониманию; вместо этого он предоставит средства для углубления вашего математического понимания и усиления вашей же интуиции. А в этом, согласитесь, есть нечто, в корне отличное от алгоритма F (или формальной системы F), описанного в соответствии с возможностью II. Более того, никто никогда и не предлагал эвристического принципа, позволившего бы сгенерировать в точности все Π1-высказывания, истинность которых может быть однозначно установлена математиками.
Разумеется, из всего этого вовсе не следует, что упомянутый алгоритм F (гипотетическая машина Гёделя для доказательства теорем) является логически невозможным; однако, с позиции нашего математического понимания, вероятность существования такой машины представляется исключительно малой. Во всяком случае, в настоящее время ни у кого пока нет ни малейшего предположения относительно возможной природы подобного алгоритма F, равно как нет и никаких намеков на его действительное существование. Он может существовать, в лучшем случае, в качестве гипотезы — причем гипотезы недоказуемой. (Ее доказательство будет равносильно ее опровержению!) Мне думается, что со стороны любого из сторонников идеи ИИ (независимо от того, принадлежит он к лагерю A или B) является в высшей степени безрассудным возлагать какие бы то ни было надежды на отыскание такой алгоритмической процедуры (обобщенной здесь в виде алгоритма F), само существование которой крайне сомнительно, а точное построение (существуй она в действительности) едва ли по силам любому из ныне живущих математиков или логиков.
Можно ли допустить, что подобный алгоритм F все же существует и, более того, может быть получен с помощью достаточно сложных вычислительных процедур восходящего типа? В , в рамках обсуждения случая III, я приведу серьезные логические доводы, убедительно демонстрирующие, что ни одна из познаваемых восходящих процедур не в состоянии привести нас к алгоритму F, даже если бы он и в самом деле существовал. Таким образом, можно заключить, что в качестве сколько-нибудь серьезной логической возможности нельзя рассматривать даже «гёделеву машину для доказательства теорем» — если, конечно, не допустить, что в основе всего математического понимания в целом лежат некие «непознаваемые механизмы», природа которых, увы, не оставляет поборникам ИИ ни единого шанса.
Прежде чем мы перейдем к обещанному более подробному обсуждению случая III, необходимо разобраться до конца со случаем II — здесь остается еще одна альтернатива, суть которой заключается в том, что фундаментальная алгоритмическая процедура F (или формальная система F) может оказаться необоснованной (случай I, как мы помним, такой лазейки не допускал). Может ли быть так, что человеческое математическое понимание представляет собой эквивалент некоего познаваемого алгоритма, который в основе своей ошибочен? Рассмотрим эту возможность подробнее.
3.4. Не действуют ли математики, сами того не осознавая, в соответствии с необоснованным алгоритмом?
Допустим, что в основе математического понимания и в самом деле лежит некая необоснованная формальная система F. Как же мы тогда можем быть уверены, что наши математические представления в отношении того, что считать неоспоримо истинным, не введут нас в один прекрасный день в какое-нибудь фундаментальное заблуждение? А может, это уже случилось? Ситуация несколько отличается от той, что рассматривалась в связи со случаем I, где мы исключили возможность нашего знания о том, что некая система F и в самом деле является необоснованной. Здесь же мы допускаем, что подобная роль системы F принципиально непознаваема, вследствие чего нам придется повторно рассмотреть вариант с возможной необоснованностью F. Можно ли считать действительно правдоподобным предположение о том, что фундаментом для наших неопровержимых математических убеждений служит некая необоснованная система — настолько необоснованная, что одним из этих убеждений может, в принципе, оказаться уверенность в истинности равенства 1 = 2. Несомненно одно: если мы не можем доверять собственным математическим суждениям, то мы равным образом не можем доверять и всем остальным своим суждениям об устройстве и функционировании окружающего нас мира, поскольку математические суждения составляют весьма существенную часть всего нашего научного понимания.
Кто-то, тем не менее, возразит, что нет ничего невероятного в том, что какие-то современные общепринятые математические суждения (или суждения, которые мы будем считать неоспоримыми в будущем) содержат скрытые «врожденные» противоречия. Возможно, сошлется даже на тот знаменитый парадокс (о «множестве множеств, которые не являются элементами самих себя»), о котором Бертран Рассел писал Готтлобу Фреге в 1902 году, как раз тогда, когда Фреге собирался опубликовать труд всей своей жизни, посвященный основам математики (см. также комментарий к возражению Q9, и НРК, с. 100). В приложении к книге Фреге писал (см. []):
Вряд ли с ученым может приключиться что-либо более нежеланное, чем потрясение основ его мировоззрения сразу вслед за тем, как он закончил изложение их на бумаге. Именно в такое положение поставило меня письмо от г-на Бертрана Рассела…
Разумеется, мы всегда можем сказать, что Фреге просто-напросто ошибся. Всем известно, что математики иногда допускают ошибки — порой даже весьма серьезные. Более того, как явствует из признания самого Фреге, его ошибка была вполне исправимой. Разве мы не убедились (в , комментарий к Q13) в том, что подобные исправимые ошибки не имеют к нашим рассуждениям никакого отношения? Мы рассматриваем здесь, как и в , лишь принципиальные вопросы, а не подверженность ошибкам отдельных представителей математического сообщества. Ошибки же, на которые можно указать, ошибочность которых можно однозначно продемонстрировать, вовсе не принадлежат к категории принципиальных вопросов, разве не так? Все так, однако ситуация, рассматриваемая нами в настоящий момент, несколько отличается от той, что обсуждалась в комментарии к возражению Q13, поскольку теперь у нас есть формальная система F, которая, возможно, лежит в основе нашего математического понимания, только мы об этом не знаем. Как и прежде, нас не занимают единичные ошибки — или «оговорки», — которые может допустить отдельный математик, рассуждая в рамках какой-то в общем непротиворечивой системы. Однако теперь речь идет еще и о том, что сама система может содержать в себе некие глобальные противоречия. Именно это и произошло в случае с Фреге. Не узнай Фреге о парадоксе Рассела (или ином парадоксе сходной природы), вряд ли кто-либо смог бы убедить его в том, что в его систему вкралась фундаментальная ошибка. Дело не в том, что Рассел указал на какое-то формальное упущение в рассуждениях Фреге, а Фреге признал наличие ошибки, руководствуясь собственными канонами построения умозаключений; нет, Фреге продемонстрировали, что в самих этих канонах содержится некое изначальное противоречие. И именно факт наличия противоречия, а не что-либо иное, убедило Фреге в том, что его рассуждения ошибочны, а то, что прежде представлялось несокрушимой истиной, на деле фундаментально неверно. При этом о существовании ошибки стало известно только благодаря тому, что вскрылось противоречие. Если бы факт противоречивости установлен не был, то математики могли бы еще долгое время считать предложенные Фреге методы построения умозаключений вполне достоверными и даже, возможно, строили бы на их фундаменте собственные системы.
Впрочем, полагаю, в данном случае крайне маловероятно, что многим математикам удалось бы в течение сколько-нибудь длительного срока наслаждаться той свободой умопостроений (в отношении бесконечных множеств), какую предоставляла система Фреге. Причина в том, что парадоксы типа парадокса Рассела довольно легко обнаружить. Можно представить себе какой-нибудь гораздо более тонкий парадокс, например, такой, что неявным образом содержится в тех или иных полагаемых нами на данный момент неопровержимо истинными математических процедурах, — парадокс, о котором никто не узнает еще, быть может, многие века. Необходимость в смене привычных правил мы осознаем лишь тогда, когда такой парадокс наконец себя проявит. Короче говоря, наша математическая интуиция не зиждется на каких-то непреходящих в веках установлениях, а напротив, непрерывно меняется под сильным воздействием идей, которые прекрасно «работали» прежде, и соображений, последствия применения которых пока что «сходят нам с рук». Такая точка зрения отнюдь не исключает возможности существования в основе нашего теперешнего математического понимания некоего алгоритма (или формальной системы), однако этот алгоритм не является чем-то неизменным, по мере обнаружения новых данных он подвергается непрерывной модификации. К изменяющимся алгоритмам мы еще вернемся несколько позднее (см. , а также ), где и убедимся в том, что это по-прежнему все те же алгоритмы, только в ином обличье.
Разумеется, с моей стороны было бы наивным отрицать тот факт, что в методах, которые применяют в своей работе математики, нередко присутствует элемент «доверия» процедуре, если она «до сих пор, кажется, работает». В моей собственной математической практике такие предварительные, ориентировочные, нечеткие соображения составляют в общей совокупности рассуждений весьма заметный процент. Однако они, как правило, обретаются в той области, которая «отвечает» за нащупывание нового, еще не сформировавшегося понимания, а никак не в той, где мы «складываем» неопровержимо, на наш взгляд, установленные истины. Я очень сомневаюсь, что сам Фреге так уж категорически полагал свою систему абсолютно неопровержимой, даже не подозревая еще о парадоксе, о котором написал ему Рассел. Система суждений столь общего характера, что бы ни думал по ее поводу автор, всегда выдвигается на всеобщее обозрение с некоторой настороженностью. Лишь после длительного «периода осмысления» можно будет полагать, что она достигла, наконец, «уровня неопровержимости». Имея же дело с системой настолько общей, как система Фреге, в любом случае, как мне кажется, следует употреблять выражения вида «полагая систему Фреге обоснованной, можно считать справедливым то-то и то-то», а не просто утверждать эти самые «то-то и то-то» без упомянутой оговорки. (См. также комментарии к возражениям Q11 и Q12.)
Возможно, в настоящее время математики стали более осторожными в отношении того, что они готовы рассматривать как «неопровержимую истину» — эпоха осторожности сменила эпоху отчаянной дерзости (среди примеров которой работа Фреге занимает далеко не последнее место), пришедшуюся на конец XIX столетия. С выходом на сцену парадокса Рассела и прочих ему подобных необходимость в такой осторожности проявляется особенно наглядно. Что же касается дерзости, то она, по большей части, уходит корнями в те времена, когда математики начали потихоньку осознавать всю мощь канторовой теории бесконечных чисел и бесконечных множеств, выдвинутой им в начале того же XIX века. (Следует, впрочем, отметить, что Кантор знал о парадоксах, подобных парадоксу Рассела, — задолго до того, как сам Рассел обнаружил тот, что был назван его именем, — и предпринимал попытки усовершенствовать свою формулировку с тем, чтобы, по возможности, учитывать подобные проблемы.) Цели и характер моих рассуждений на этих страницах также, несомненно, требуют крайней осторожности. И я безмерно рад, что нам с вами приходится иметь дело только с утверждениями, истинность которых неопровержима, и что нет никакой необходимости влезать в дебри бесконечных множеств и прочих сомнительных понятий. Важно помнить, что — где бы мы ни провели черту — полученные с помощью доказательства Гёделя утверждения всегда остаются в рамках неопровержимо истинного (см. также комментарий к возражению Q13). Само по себе доказательство Гёделя(—Тьюринга) не имеет абсолютно никакого отношения к вопросам, связанным с сомнительным существованием бесконечных множеств определенного сорта. Неясности, касающиеся тех самых исключительно вольных рассуждений, столь занимавших Кантора, Фреге и Рассела, ничуть не занимают нас — до тех пор, пока они остаются «сомнительными», не претендуя на звание «неопровержимых». Коль скоро мы со всем этим согласны, я никак не могу счесть правдоподобным допущение, согласно которому математики действительно используют в качестве основы для своего математического понимания и убеждений какую-либо необоснованную формальную систему F. Я надеюсь, читатель согласится с тем, что вне зависимости от того, возможна такая ситуация или нет, она, во всяком случае, невероятна.
Наконец, в связи с возможной необоснованностью нашей гипотетической системы F, вернемся ненадолго к другим аспектам человеческой «неточности», о которых мы говорили выше (см. комментарии к возражениям Q12 и Q13). Прежде всего повторю: нас в данном случае интересуют не вдохновение, не гениальные догадки и не эвристические критерии, способные привести математика к великим открытиям, но лишь понимание и проникновение в суть, на фундаменте которых покоятся его неопровержимые убеждения в отношении математических истин. Эти убеждения могут оказаться всего-навсего результатом ознакомления с рассуждениями других математиков, и в этом случае о каких бы то ни было элементах математического открытия говорить, разумеется, не приходится. А вот когда мы нащупываем путь к какому-то подлинному открытию, и впрямь весьма важно дать размышлениям свободу, не ограничивая их изначально необходимостью в полной достоверности и точности (у меня сложилось впечатление, что именно это имел в виду Тьюринг в приведенной выше цитате, см. ). Однако когда перед нами встает вопрос о принятии или отклонении тех или иных доводов в поддержку неопровержимой истинности выдвигаемого математического утверждения, необходимо полагаться лишь на понимание и проницательность (нередко в сопровождении громоздких вычислений), которым ошибки принципиально не свойственны.
Я вовсе не хочу сказать, что математики, полагающиеся на понимание, не делают ошибок, — делают, и даже часто: понимание тоже можно применить некорректно. Безусловно, математики допускают ошибки и в рассуждениях, и в понимании, а также в сопутствующих вычислениях. Однако склонность к совершению подобных ошибок, в сущности, не усиливает их способности к пониманию (хотя я, пожалуй, могу представить себе, каким образом подобные случайные обстоятельства могут порой привести человека к нежданному, скажем так, озарению). Что более важно — эти ошибки исправимы; их можно распознать как ошибки, когда на них укажет какой-либо другой математик (или даже впоследствии сам автор). Совсем иначе обстоит дело, когда понимание математика контролируется некоей внутренне ошибочной формальной системой F: в рамках такой системы невозможно распознать ее собственные ошибки. (Что касается возможности существования самосовершенствующейся системы, которая модифицирует самое себя всякий раз, как обнаруживает в себе противоречие, то о ней мы поговорим несколько позднее, «на подступах» к противоречию . Там же мы и обнаружим, что и от такого предположения в данном случае пользы мало; см. также .)
Ошибки несколько иного рода возникают при неверной формулировке математического утверждения; в этом случае выдвигающий утверждение математик, возможно, имеет в виду нечто совсем отличное от того, что он буквально утверждает. Впрочем, такие ошибки также исправимы и не имеют ничего общего с теми внутренними ошибками, причиной которых является понимание, опирающееся на необоснованную систему F (здесь уместно вспомнить фразу Фейнмана, которую мы цитировали в связи с возражением Q13: «Не слушайте, что я говорю; слушайте, что я имею в виду!»). Мы с вами здесь для того, чтобы выяснить, что в принципе может (либо не может) быть установлено каким угодно математиком (человеком); ошибки же, подобные только что рассмотренным, — т.е. исправимые ошибки — никакого отношения к этой проблеме не имеют. Важнейший, пожалуй, для всего нашего исследования момент: круг идей и понятий, доступных математическому пониманию, непременно должен включать в себя центральную идею доказательства Гёделя—Тьюринга; на этом, собственно, основании мы и не рассматриваем всерьез возможность I, а возможность II полагаем крайне невероятной. Как уже отмечалось выше (в комментарии к возражению Q13), идея доказательства Гёделя—Тьюринга, безусловно, должна являться частью того, что в принципе в состоянии понять математик, даже если какое-то конкретное утверждение «G(F)», на котором этот математик, возможно, основывается, ошибочно — лишь бы ошибка была исправимой.
С возможной «необоснованностью» предполагаемого алгоритма математического понимания связаны и другие вопросы, о которых не следует забывать. Эти вопросы касаются процедур «восходящего» типа — таких, к примеру, как самоусовершенствующиеся алгоритмы, алгоритмы обучения (в том числе и искусственные нейронные сети), алгоритмы с дополнительными случайными компонентами, а также алгоритмы, операции которых обусловлены внешним окружением, в котором функционируют соответствующие алгоритмические устройства. Некоторые из упомянутых вопросов были затронуты ранее (см. комментарий к возражению Q2), подробнее же мы рассмотрим их при обсуждении случая III, к каковому обсуждению мы как раз и приступаем.
3.5. Может ли алгоритм быть непознаваемым?
В соответствии с вариантом III, математическое понимание представляет собой результат выполнения некоего непознаваемого алгоритма. Что же конкретно означает определение «непознаваемый» применительно к алгоритму? В предшествующих разделах настоящей главы мы занимались вопросами принципиальными. Так, утверждая, что неопровержимая истинность некоторого Π1-высказывания доступна математическому пониманию человека, мы, по сути, утверждали, что данное Π1-высказывание постижимо в принципе, отнюдь не имея в виду, что каждый математик когда-нибудь да сталкивался с реальной демонстрацией его истинности. Применительно к алгоритму, однако, нам потребуется несколько иная интерпретация термина «непознаваемый». Я буду понимать его так: рассматриваемый алгоритм является настолько сложным, что даже описание его практически неосуществимо.
Когда мы говорили о выводах, осуществляемых в рамках какой-то конкретной познаваемой формальной системы, или о предполагаемых результатах применения того или иного известного алгоритма, рассуждения в терминах принципиально возможного или невозможного и в самом деле выглядели как нельзя более уместными. Вопросы возможности или невозможности вывода того или иного конкретного предположения из такой формальной системы или алгоритма рассматривались в «принципиальном» контексте в силу элементарной необходимости. Похожим образом обстоит дело с установлением истинности Π1-высказываний. Π1-высказывание признается истинным, если его можно представить в виде операции некоторой машины Тьюринга, незавершаемой принципиально, вне зависимости от того, что мы могли бы получить на практике путем непосредственных вычислений. (Об этом мы говорили в комментарии к возражению Q8.) Аналогично, утверждение, что какое-то конкретное предположение выводимо (либо невыводимо) в рамках некоей формальной системы, следует понимать в «принципиальном» смысле, поскольку такое утверждение, в сущности, представляет собой вид утверждения об истинном (или, соответственно, ложном)характере какого-то конкретного Π1-высказывания (см. окончание обсуждения возражения Q10). Соответственно, когда нас интересует выводимость предположения в рамках некоторого неизменного набора правил, «познаваемость» всегда будет пониматься именно в таком «принципиальном» смысле.
Если же нам предстоит решить вопрос о «познаваемости» самих правил, то здесь необходимо прибегнуть к «практическому» подходу. Принципиально возможно описать любую формальную систему, машину Тьюринга, либо Π1-высказывание, а следовательно, если мы хотим, чтобы вопрос об их «непознаваемости» имел хоть какой-нибудь смысл, нам следует рассматривать его именно в плоскости возможности их практической реализации. В принципе, познаваемым является абсолютно любой алгоритм, каким бы он ни был, — в том смысле, что осуществляющая этот алгоритм операция машины Тьюринга становится «известной», как только становится известным натуральное число, являющееся кодовым обозначением данной операции (например, согласно правилам нумерации машин Тьюринга, приведенным в НРК). Нет решительно никаких оснований предполагать, что принципиально непознаваемым может оказаться такой объект, как натуральное число. Все натуральные числа (а значит, и алгоритмические операции) можно представить в виде последовательности 0, 1, 2, 3, 4, 5, 6, …, двигаясь вдоль которой, мы — в принципе — можем со временем достичь любого натурального числа, каким бы большим это число ни было! Практически же, число может оказаться настолько огромным, что добраться до него таким способом в обозримом будущем не представляется возможным. Например, номер машины Тьюринга, описанной в НРК (на с. 56), явно слишком велик, чтобы его можно было получить на практике посредством подобного перечисления. Даже если мы были бы способны выдавать каждую последующую цифру за наименьший теоретически определимый временной промежуток (в масштабе времени Планка равный приблизительно 0,5 × 10-43 с, см. ), то и в этом случае за все время существования Вселенной, начиная от Большого Взрыва и до настоящего момента, нам не удалось бы добраться до числа, двоичное представление которого содержит более 203 знаков. В числе, о котором только что упоминалось, знаков более чем в 20 раз больше — однако это ничуть не мешает ему быть «познаваемым» в принципе, причем в НРК, это число определено в явном виде.
Практически «непознаваемым» следует считать такое натуральное число (или операцию машины Тьюринга), сложность одного только описания которого оказывается недоступной человеческим возможностям. Сказано, на первый взгляд, довольно громко, однако, зная о конечной природе человека, можно смело утверждать, что какой-то предел так или иначе существовать должен, а следовательно, должны существовать и числа, находящиеся за этим пределом, описать которые человек не в состоянии. (См. также комментарий к возражению Q8.) В соответствии с возможностью III, нам следует полагать, что за пределами познаваемости алгоритм F (предположительно лежащий в основе математического понимания) оказывается именно вследствие неимоверной сложности и чрезвычайной детализированности своего описания — причем речь идет исключительно об «описуемости» алгоритма, а не о познаваемости его как алгоритма, которым, предполагается, мы пользуемся-таки в нашей интеллектуальной деятельности. Требование «неописуемости», собственно, и отделяет случай III от случая II. Иными словами, рассматривая случай III, мы должны учитывать возможность того, что наших человеческих способностей может оказаться недостаточно даже для того, чтобы описать это самое число, не говоря уже о том, чтобы установить, обладает ли оно свойствами, какими должно обладать число, определяющее алгоритмическую операцию, в соответствии с которой работает наше же математическое понимание.
Отметим, что в роли ограничителя познаваемости не может выступать просто величина числа. Не представляет никакой сложности описать числа, настолько огромные, что они превзойдут по величине все числа, которые могут потребоваться для описания алгоритмических операций, определяющих поведение любого организма в наблюдаемой Вселенной (взять хотя бы такое легко описываемое число, как 22 65536 , о котором мы упоминали в комментарии к Q8, — это число далеко превосходит количество всех возможных состояний Вселенной для всего вещества, содержащегося в границах наблюдаемой нами Вселенной). За пределами человеческих возможностей должно оказаться именно точное описание искомого числа, величина же его особой роли не играет.
Допустим (в полном согласии с III), что описание такого алгоритма F человеку и в самом деле не по силам. Что из этого следует в отношении перспектив разработки высокоуспешной стратегии создания ИИ (как по «сильным», так и по «слабым» принципам — иначе говоря, в соответствии с точками зрения как A, так и B)? Адепты полностью автоматизированных ИИ-систем (т.е. сторонники A непременно, а также, возможно, кто-то из лагеря B) предвосхищают появление в конечном итоге роботов, способных достичь уровня математических способностей человека и, возможно, превзойти этот уровень. Иными словами (если согласиться с вариантом III), непременным компонентом контрольной системы такого робота-математика должен стать тот самый, недоступный человеческому пониманию алгоритм F. Отсюда, по всей видимости, следует, что стратегия создания ИИ, нацеленная на получение именно такого результата, обречена на провал. Причина проста — если для достижения цели необходим алгоритм F, который в принципе не способен описать ни один человек, то где же тогда этот алгоритм взять?
Однако наиболее амбициозные сторонники идеи ИИ рисуют себе совсем другие картины. Они предвидят, что необходимый алгоритм F будет получен не в одночасье, но поэтапно — по мере того, как сами роботы будут постепенно повышать свою эффективность с помощью алгоритмов (восходящих) обучения и накопления опыта. Более того, самые совершенные роботы не будут, скорее всего, созданы непосредственно людьми, а явятся продуктом деятельности других роботов, возможно, несколько более примитивных, нежели ожидаемые нами роботы-математики; кроме того, в процессе развития роботов будет, возможно, принимать участие и некое подобие дарвиновской эволюции, в результате чего от поколения к поколению роботы будут становиться все более совершенными. Разумеется, не обходится и без утверждений в том духе, что именно посредством подобных, в общем-то, процессов нам самим удалось оснастить свои «нейронные компьютеры» неким для нас не познаваемым алгоритмом F, на котором и работает наше собственное математическое понимание.
В нескольких последующих разделах я покажу, что при всей привлекательности подобных процессов проблема, в сущности, остается нерешенной: если сами процедуры, с помощью которых предполагается создать ИИ, являются прежде всего алгоритмическими и познаваемыми, то любой полученный таким образом алгоритм F также должен быть познаваемым. В этом случае вариант III сводится либо к варианту I, либо к варианту II, которые мы исключили в по причине фактической невозможности (вариант I) или, по меньшей мере, крайнего неправдоподобия (вариант II). Более того, если исходить из допущения, что интересующие нас алгоритмические процедуры познаваемы, то нам, вообще говоря, следует отдать предпочтение именно варианту I. Соответственно, вариант III (равно как и, по смыслу, вариант II) также следует признать практически несостоятельным.
Читателю, который искренне верит в то, что возможный вариант III открывает наиболее вероятный путь к созданию вычислительной модели разума, я рекомендую обратить на приведенные выше аргументы самое пристальное внимание и тщательнейшим образом их изучить. Не сомневаюсь, что он придет к тому же выводу, к какому пришел я: если допустить, что математическое понимание и в самом деле осуществляется в соответствии с вариантом III, то единственным хоть сколько-нибудь правдоподобным объяснением происхождения нашего собственного алгоритма F остается считать божественное вмешательство — то самое сочетание A/D, о котором мы говорили в конце , — а такое объяснение, конечно же, не утешит тех, кто лелеет амбициозные перспективные планы по созданию компьютерного ИИ.
3.6. Естественный отбор или промысел Господень?
Возможно, нам следует-таки всерьез рассмотреть возможность того, что за нашим интеллектом и в самом деле стоит некий божественный промысел — по каковой причине этот самый интеллект никак нельзя объяснить с позиций той науки, которая достигла столь значительных успехов в описании мира неодушевленных предметов. Разумеется, мы по-прежнему будем сохранять широту мышления, однако я хочу сразу прояснить один момент: в последующих рассуждениях я намерен придерживаться научной точки зрения. Я намерен рассмотреть возможность того, что наше математическое понимание является результатом работы некоего непостижимого алгоритма, — а также вопрос о возможном происхождении подобного алгоритма, — никоим образом не выходя за рамки научного подхода. Возможно, кто-то из читателей этой книги склонен верить в то, что этот алгоритм и в самом деле мог быть просто вложен в наши головы по воле божьей. Убедительного опровержения такого предположения у меня, признаться, нет; хотя я никак не могу взять в толк, — если уж мы решаем отказаться на каком-то этапе от научного подхода — почему считается как нельзя более благоразумным бросаться именно в эту крайность. Если научное объяснение ничего, в сущности, не объясняет, то не уместнее ли будет вообще позабыть о каких бы то ни было алгоритмических процедурах, нежели прятать свою предполагаемую свободу воли за сложностью и непостижимостью какого-то алгоритма, который, как нам хочется думать, контролирует каждое наше движение? Возможно, разумнее будет просто счесть (как, похоже, считал сам Гёдель), что деятельность разума совершенно не связана с процессами, протекающими в физическом мозге. — что замечательно согласуется с точкой зрения D. С другой стороны, в настоящее время, как мне представляется, даже те, кто верит в то, что мышление и впрямь является в каком-то смысле божественным даром, склонны все же полагать, что поведение человека можно объяснить, не выходя за пределы возможностей науки. Несомненно, приведенные варианты являются весьма спорными, однако на данном этапе я вовсе не предполагал спорить с убеждениями сторонников точки зрения D. Надеюсь, что те читатели, которых можно отнести к приверженцам той или иной формы D, все же потерпят меня еще некоторое время, а я пока попробую выяснить, к чему нас может привести в данном случае научный подход.
Какие же научные последствия может иметь допущение, что математические суждения мы получаем в результате выполнения некоей необходимой и непостижимой алгоритмической процедуры? Вырисовывается приблизительно такая картина: исключительно сложные алгоритмические процедуры, необходимые для моделирования подлинного математического понимания, являются результатом многих сотен тысяч лет (по меньшей мере) естественного отбора вкупе с несколькими тысячами лет воздействия обучения и внешних факторов, обусловленных физическим окружением. Можно допустить, что наследуемые аспекты этих процедур формировались постепенно из более простых (ранних) алгоритмических компонентов в результате того же давления естественного отбора, которое ответственно за возникновение всех остальных в высшей степени эффективных механизмов, из которых составлены как наши тела, так и наши мозги. Врожденные потенциально математические алгоритмы (т.е. все те унаследованные аспекты, которые могли бы относиться к математическому мышлению, предположительно алгоритмическому) до поры пребывали в закодированном состоянии (в виде неких особых последовательностей нуклеотидов) внутри молекул ДНК, а затем проявились посредством той же процедуры, какая задействуется при всяком постепенном (либо скачкообразном) усовершенствовании живого организма, реагирующего на давление отбора. Помимо прочего, свой вклад в эти процессы вносят и всевозможные внешние факторы — такие как непосредственное математическое образование, опыт взаимодействия с физическим окружением, прочие факторы, оказывающие дополнительно самые разные чисто случайные воздействия. Думаю, мы должны попытаться выяснить, можно ли полагать описанную картину хоть сколько-нибудь правдоподобной?
3.7. Алгоритм или алгоритмы?
Прежде всего, необходимо рассмотреть следующий весьма важный вопрос: может ли оказаться, что за различные виды математического понимания, свойственные разным людям, отвечает множество весьма различных, возможно, неэквивалентных алгоритмов? В самом деле, уж в чем мы можем быть с самого начала уверены, так это в том, что даже профессиональные математики часто воспринимают математические «реалии» совершенно по-разному. Для одних в высшей степени важны зрительные образы, тогда как другим удобнее иметь дело с четкими логическими структурами, изящными абстрактными доказательствами, подробными аналитическими обоснованиями или, возможно, чисто алгебраическими манипуляциями. В этой связи следует отметить, что, по некоторым предположениям, геометрическое, например, и аналитическое мышление осуществляются разными полушариями мозга (соответственно, правым и левым). Однако часто бывает так, что всеми этими способами воспринимается одна и та же математическая истина. С алгоритмической точки зрения первое впечатление таково: алгоритмы, отвечающие за математическое мышление различных людей, должны быть как минимум абсолютно неэквивалентными. Однако, несмотря на существенное различие между образами, которые формируют в сознании отдельные математики (или прочие смертные) для собственного понимания или для сообщения другим математических идей, математическое восприятие обладает одним поразительным свойством: когда математики наконец решают для себя, что именно следует считать неопровержимо истинным, никаких разногласий по этому поводу больше не возникает, разве что поводом для такого разногласия послужит какая-либо действительная, опознаваемая (а следовательно, и исправимая) ошибка в рассуждениях того или иного математика (еще один возможный повод для разногласий предоставляет принципиальное расхождение во мнениях по некоторым — весьма немногочисленным — фундаментальным вопросам; см. комментарий к Q11, в особенности утверждение G***). В целях упрощения изложения я позволю себе в дальнейшем последнее соображение проигнорировать. Хотя это соображение и имеет некоторое отношение к предмету нашего разговора, на выводы оно заметного влияния не оказывает. (Придерживаемся ли мы нескольких возможных неэквивалентных точек зрения на какой-то вопрос или все соглашаемся на одной — существенного различия между этими двумя ситуациями в данном случае нет.)
Восприятие математической истины может осуществляться самыми различными способами. Вряд ли можно усомниться в том, что вне зависимости от конкретной природы физических процессов, обусловливающих осознание человеком истинности какого-либо математического утверждения, эти процессы должны весьма и весьма разниться от индивидуума к индивидууму, даже если речь идет об одном и том же утверждении. Иначе говоря, если математики при составлении суждений о неопровержимой истинности того или иного утверждения просто-напросто применяют какие-то вычислительные алгоритмы, то у разных математиков эти самые алгоритмы должны весьма значительно различаться по своей структуре. При этом упомянутые алгоритмы должны быть еще и эквивалентны друг другу в некотором очевидном смысле.
Это условие, возможно, не так уж и абсурдно, как может показаться на первый взгляд — по крайней мере, с точки зрения математически возможного. Весьма разные на вид машины Тьюринга могут давать на выходе идентичные результаты. (Рассмотрим, например, машину Тьюринга, построенную следующим образом: при выполнении действия над натуральным числом n мы получаем в результате 0 всякий раз, когда n выразимо в виде суммы четырех квадратов, и 1, когда n таким образом выразить нельзя. Результат вычисления такой машины полностью совпадает с результатом другой машины, построенной таким образом, чтобы давать на выходе 0 при подаче на вход любого натурального числа n — ибо известно, что в виде суммы четырех квадратов можно представить любое натуральное число; см. .) Из идентичности внешних конечных результатов двух алгоритмов вовсе не обязательно следует, что эти алгоритмы окажутся подобными по внутренней структуре. Однако, в определенном смысле, рассматриваемое допущение еще более запутывает вопрос о происхождении нашего гипотетического непостижимого алгоритма(-ов) для установления математической истины, поскольку теперь нам предстоит иметь дело уже с несколькими такими алгоритмами, достаточно отличными друг от друга по внутренней структуре, но при этом существенно эквивалентными в отношении получаемого на выходе результата.
3.8. Эзотерические математики не от мира сего как результат естественного отбора
Какую же роль играет во всем этом естественный отбор? Возможно ли, чтобы естественным путем возник некий алгоритм F (или несколько таких алгоритмов), обусловливающий наше математическое понимание и при этом непознаваемый сам по себе (если верить допущению III), либо лишь в отношении выполняемых им функций (в соответствии с допущением II)? Начнем с повторения того, о чем мы уже говорили в начале . В процессе получения своих предположительно неопровержимо истинных математических выводов математики вовсе не считают, что они просто следуют некоему набору непознаваемых правил — правил настолько сложных, что, с математической точки зрения, они непостижимы в принципе. Напротив, они полагают, что эти выводы представляют собой результат неких обоснованных рассуждений (пусть зачастую длинных и внешне запутанных), которые в конечном счете опираются на четкие неопровержимые истины, понятные, в принципе, любому.
Более того, рассматривая ситуацию с позиций здравого смысла или на уровне логических дескрипций, мы можем со всей определенностью утверждать, что математики и в самом деле делают то, что, как им кажется, они делают. Этот факт не подлежит никакому сомнению, а важность его переоценить невозможно. Если мы полагаем, что математики в своей деятельности следуют некоему набору непознаваемых и непостижимых вычислительных правил (в соответствии с возможными вариантами III или II), то, значит, они делают еще и это — одновременно с тем, что, как им кажется, они делают, но на другом уровне дескрипции. Каким-то образом алгоритмическое следование правилам должно давать тот же самый результат, что дают математическое понимание и интуиция — по крайней мере, на практике. Если уж мы твердо вознамерились стать приверженцами либо A, либо D, то нам предстоит попытаться поверить в то, что такая возможность является вполне правдоподобной.
Нужно помнить и о том, какие блага дают эти алгоритмы. Предполагается, что они наделяют своего «носителя» — по крайней мере, в принципе — способностью составлять корректные математические суждения об абстрактных сущностях, весьма далеких от непосредственного жизненного опыта, что, по большей части, не дает этому самому носителю сколько-нибудь заметных практических преимуществ. Любой, кому хоть раз доводилось заглянуть в какой-нибудь современный чисто математический научный журнал, знает, насколько далеки заботы математиков от каких бы то ни было практических вопросов. Тонкости теоретических обоснований, обычно публикуемых в таких научных журналах, непосредственно доступны лишь очень небольшому количеству людей; и все же каждое такое рассуждение состоит, в конечном счете, из каких-то элементарных шагов, и каждый такой шаг может, в принципе, понять любой мыслящий индивидуум, даже если речь идет об абстрактных рассуждениях о сложно определяемых бесконечных множествах. Не следует забывать и о том, что алгоритм — или, возможно, целый ряд альтернативных, но математически эквивалентных алгоритмов, — который дает человеку потенциальную способность понимать упомянутые рассуждения, каким-то образом был изначально записан не где-нибудь, а в нуклеотидных последовательностях молекулы ДНК. Если мы в это верим, то нам следует весьма серьезно задуматься, как же так получилось, что подобный алгоритм (или алгоритмы) развился в результате естественного отбора. Очевидно, что даже в настоящее время профессия математика не дает никаких преимуществ с точки зрения борьбы за существование. (Подозреваю, что ее можно даже считать неблагоприятным фактором. Вследствие своего взрывного темперамента и странноватых пристрастий пуристы со склонностью к математике имеют тенденцию заканчивать свой жизненный путь на какой-нибудь низкооплачиваемой академической службе — или и вовсе безработными.) Гораздо правдоподобнее выглядит иная картина: способность рассуждать о весьма абстрактно определяемых бесконечных множествах, бесконечных множествах бесконечных множеств и т.д. никаких особых преимуществ в борьбе за выживание нашим далеким предкам дать просто не могла. Этих самых предков заботили практические повседневные проблемы — такие, как постройка убежищ, изготовление одежды, изобретение ловушки для мамонтов или, несколько позднее, одомашнивание животных и выращивание урожая (см. рис. ).
Рис. 3.1. Вряд ли специфическая способность составлять сложные математические суждения могла дать нашим далеким предкам какие бы то ни было преимущества в борьбе за существование, а вот общая способность к пониманию им наверняка не помешала бы.
Разумно предположить, что упомянутые преимущества, которыми, очевидно, все же обладали наши предки, происходили из качеств, необходимых для решения как раз таких, практических проблем, а уже потом, гораздо позднее, выяснилось, что эти же качества замечательно подходят и для решения проблем математических — этакий побочный результат. Во всяком случае, такой ход событий полагаю более или менее правдоподобным я сам. Развивая это предположение, можно допустить, что под давлением естественного отбора человек каким-то образом приобрел или развил в себе некую общую способность понимать. Эта способность понимать, проникать в суть вещей, не была связана с какими-то конкретными областями его деятельности и оказывалась полезной буквально во всем. То же сооружение жилищ или ловушек для мамонтов существенно усложнилось бы, не обладай человек способностью понимать вещи и явления в их общности. При этом лично я полагаю, что Homo sapiens был отнюдь не уникален в своей способности понимать. Такой же способностью обладали, возможно, и многие другие животные, составлявшие человеку конкуренцию в борьбе за существование, однако обладали в меньшей степени, в результате чего человек, в силу более интенсивного развития этой способности, получил над ними весьма существенное преимущество.
Сложности с такой точкой зрения возникают как раз тогда, когда мы начинаем рассматривать наследуемую способность к пониманию как нечто по своей природе алгоритмическое. Как нам уже известно из предшествующих рассуждений и доказательств, любая (алгоритмическая) способность к пониманию, достаточно сильная для того, чтобы ее обладатель оказался в состоянии разобраться в тонкостях математических обоснований, в частности, гёделевского доказательства в представленном мною варианте, должна быть обусловлена процедурой настолько замысловатой и непостижимой, что о ней (или ее роли) не может знать даже сам обладатель этой способности. Наш прошедший через испытания естественного отбора гипотетический алгоритм, по всей видимости, достаточно силен, ведь еще во времена наших далеких предков он уже включал в область своей потенциальной применимости правила всех формальных систем, рассматриваемых сегодня математиками как безоговорочно непротиворечивые (или неопровержимо обоснованные, если речь идет о Π1-высказываниях, см. , комментарий к Q10). Сюда почти наверняка входят и правила формальной системы Цермело—Френкеля ZF, или, возможно, ее расширенного варианта, системы ZFC (иначе говоря, самой ZF с добавлением аксиомы выбора) — системы (см. и , комментарий к Q10), которую многие математики сегодня рассматривают как источник абсолютно всех необходимых для обычной математики методов построения рассуждений, — а также все частные формальные системы, получаемые из системы ZF посредством применения к ней процедуры гёделизации сколько угодно раз, и кроме того, все другие формальные системы, которые могут быть получены математиками посредством тех или иных озарений и рассуждений — скажем, на основании открытия, суть которого состоит в том, что системы, полученные в результате упомянутой гёделизации, всегда являются неопровержимо обоснованными, или исходя из иных рассуждений еще более основополагающего характера. Такой алгоритм должен был также включать в себя (в виде собственных частных экземпляров) потенциальные способности к установлению тонких различий, отделению справедливых аргументов от ничем не обоснованных во всех тех, тогда еще не открытых, областях математики, которые сегодня оккупируют страницы специальных научных журналов. Все вышеперечисленные способности должны были оказаться каким-то образом закодированы внутри этого самого — гипотетического, непознаваемого или, если угодно, непостижимого — алгоритма, и вы хотите, чтобы мы поверили, что он возник исключительно в результате естественного отбора, в ответ на какие-то внешние условия, в которых нашим далеким предкам приходилось бороться за выживание. Конкретная способность к отвлеченным математическим рассуждениям не могла дать своему обладателю никаких непосредственных преимуществ в этой борьбе, и я со всей определенностью утверждаю, что для возникновения подобного алгоритма не существовало и не могло существовать никаких естественных причин.
Однако стоит нам допустить, что «способность понимать» имеет неалгоритмическую природу, как ситуация в корне меняется. Теперь уже нет необходимости приписывать этой способности какую-то неимоверную сложность, вплоть до полной непознавамости или непостижимости. Более того, она может оказаться гораздо ближе к тому, что «математики, как им кажется, делают». Способность к пониманию представляется мне весьма простым и даже обыденным качеством. Ее сложно определить в каких-либо точных терминах, однако она настолько близка нам и привычна, что в принципиальную невозможность корректного моделирования понимания посредством какой бы то ни было вычислительной процедуры верится с трудом. И все же так оно и есть. Для создания подобной вычислительной модели необходима алгоритмическая процедура, так или иначе учитывающая все возможные варианты развития событий в будущем, — т.е. алгоритм, в котором должны быть, скажем так, предварительно запрограммированы ответы на все математические вопросы, с которыми нам когда-либо предстоит столкнуться. Если непосредственному программированию эти ответы не подлежат, то нужно обеспечить какие-то вычислительные способы для их отыскания. Как мы уже успели убедиться, если эти «вычислительные способы» (или «предварительное программирование») охватывают все, что когда-либо было или будет доступно человеческому пониманию, то сами они для человека становятся непостижимыми. Откуда же слепым эволюционным процессам, нацеленным исключительно на обеспечение выживания сильнейших, было «знать» о том, что такая-то непознаваемо обоснованная вычислительная процедура окажется когда-то в будущем способной решать абстрактные математические задачи, не имеющие абсолютно никакого отношения к проблемам выживания?
3.9. Алгоритмы обучения
Дабы не подвергать читателя искушению чересчур поспешно смириться с абсурдностью описанной выше возможности, я должен несколько прояснить картину, на что мне уже, несомненно, указывают сторонники вычислительного подхода. Как уже отмечалось в §3.5, эти самые сторонники имеют в виду не столько алгоритм, который, в известном смысле, «предварительно запрограммирован» на предоставление решений математических проблем, сколько некую вычислительную систему, способную обучаться. Такая система может состоять, в основе своей, из «восходящих» компонентов, соединенных по мере необходимости с какими-либо «нисходящими» процедурами (см. § 1.5).
Возможно, кому-то покажется, что называть «нисходящей» систему, возникшую исключительно в результате слепого давления естественного отбора, не совсем уместно. Этим термином я буду обозначать здесь те аспекты нашей гипотетической алгоритмической процедуры, которые для данного организма зафиксированы генетически и не подвержены изменению под влиянием последующего жизненного опыта или обучения каждого отдельного представителя вида. Хотя упомянутые нисходящие аспекты и не были созданы кем-то или чем-то, обладающим подлинным «знанием» об их предполагаемых функциях и возможностях (речь идет всего лишь о трансляции определенных цепочек ДНК, приводящей к соответствующей активности клеток мозга), они, тем не менее, способны четко обозначить правила, в соответствии с которыми и будет действовать математически активный мозг. Эти нисходящие процедуры снабдят нашу систему теми алгоритмическими операциями, которые составят необходимую фиксированную структуру, в рамках которой, в свою очередь, будут функционировать более гибкие «процедуры обучения» (восходящие).
Какова же природа этих процедур обучения? Вообразим, что наша самообучающаяся система помещена в некоторое внешнее окружение, причем поведение системы внутри этого окружения непрерывно модифицируется под влиянием реакции окружения на ее предыдущие действия. В процессе участвуют, в основном, два фактора. Внешним фактором является поведение окружения и его реакция на действия системы, а внутренним — изменения в поведении системы в ответ на изменения в окружении. Прежде всего следует решить вопрос об алгоритмической природе внешнего фактора. Может ли реакция внешнего окружения вносить в общую картину некую неалгоритмическую составляющую, если внутреннее устройство нашей системы обучения является целиком и полностью алгоритмическим?
В определенных обстоятельствах (как, например, часто бывает при «обучении» искусственных нейронных сетей) реакция внешнего окружения заключается в изменении поведения экспериментатора (инструктора, преподавателя — в дальнейшем предлагаю называть его просто «учителем»), изменении намеренном и предпринимаемом с целью улучшить качество функционирования системы. Когда система функционирует так, как требует учитель, ей об этом сообщают, чтобы в дальнейшем (под воздействием внутренних механизмов модификации поведения системы) она с большей вероятностью функционировала бы именно таким образом. Предположим, например, что у нас имеется искусственная нейронная сеть, которую необходимо научить распознавать человеческие лица. Мы непрерывно наблюдаем за функционированием нашей системы и после каждого рабочего цикла снабжаем ее данными о правильности ее последних «догадок» для того, чтобы она могла улучшить качество своей работы, модифицировав нужным образом внутреннюю структуру. На практике, за адекватностью результатов каждого рабочего цикла совсем не обязательно должен наблюдать учитель-человек, так как процедуру обучения можно в значительной степени автоматизировать. В описанной ситуации цели и суждения учителя-человека образуют наивысший критерий качества функционирования системы. В других ситуациях реакция окружения может оказаться не столь «преднамеренной». Например, в процессе развития живых систем — предполагается, что эти системы все же функционируют в соответствии с некоторой нейронной схемой (или иной алгоритмической процедурой, например, генетическим алгоритмом, см. ), вроде тех, что применяются в численном моделировании — в подобных внешних целях или суждениях вообще не возникает необходимости. Вместо этого, живые системы модифицируют свое поведение в процессе, который можно рассматривать как своего рода естественный отбор, действуя согласно критериям, эволюционировавшим на протяжении многих лет и способствующим увеличению шансов на выживание как самой системы, так и ее потомства.
3.10. Может ли окружение вносить неалгоритмический внешний фактор?
Выше мы предположили, что сама наша система (независимо от того, живая она или нет) представляет собой нечто вроде робота с компьютерным управлением, т.е. все ее самомодификационные процедуры являются целиком вычислительными. (Я пользуюсь здесь термином «робот» исключительно для того, чтобы подчеркнуть то обстоятельство, что нашу систему следует рассматривать как некую самостоятельную, целиком и полностью вычислительную сущность, находящуюся во взаимодействии со своим окружением. Я вовсе не подразумеваю, что она непременно представляет собой какое бы то ни было механическое устройство, целенаправленно сконструированное человеком. Такой системой, если верить A или B, может оказаться развивающееся человеческое существо, а может и в самом деле какой-то искусственно созданный объект.) Итак, мы полагаем, что внутренний фактор является полностью вычислительным. Необходимо установить, является ли вычислительным также и внешний фактор, вносимый окружением, — иначе говоря, возможно ли построить эффективную численную модель этого самого окружения как в искусственном (т.е. когда окружение неким искусственным образом контролируется учителем-человеком), так и в естественном случае (когда высшим авторитетом является давление естественного отбора). В каждом случае конкретные внутренние правила, в соответствии с которыми система обучения робота модифицирует его поведение, должны быть составлены так, чтобы тем или иным образом реагировать на конкретные сигналы, посредством которых окружение будет сообщать системе о том, как следует оценивать качество ее функционирования в предыдущем рабочем цикле.
Вопрос о возможности моделирования окружения в искусственном случае (иными словами, о возможности численного моделирования поведения человека-учителя) представляет собой тот самый общий вопрос, ответ на который мы пытаемся найти вот уже в который раз. В рамках гипотез A или B, следствия из которых мы рассматриваем в настоящий момент, допускается, что эффективное моделирование в этом случае и в самом деле возможно, по крайней мере, в принципе. В конце концов, цель нашего исследования состоит именно в выяснении общего правдоподобия этого допущения. Поэтому, вместе с допущением о вычислительной природе нашего робота, допустим также, что его окружение также вычислимо. В результате мы получаем объединенную систему, состоящую из робота и его обучающего окружения, которая, в принципе, допускает эффективное численное моделирование, т.е. окружение не дает никаких потенциальных оправданий невычислительному поведению вычислительного робота.
Иногда можно услышать утверждение, что нашим преимуществом перед компьютерами мы обязаны тому факту, что люди образуют сообщество, внутри которого происходит непрерывное общение между индивидуумами. Согласно этому утверждению, отдельного человека можно рассматривать как вычислительную систему, тогда как сообщество людей представляет собой уже нечто большее. То же относится и, в частности, к математическому сообществу и отдельным математикам — сообщество может вести себя невычислительным образом, в то время как отдельные математики такой способностью не обладают. На мой взгляд, это утверждение лишено всякого смысла. В самом деле, представьте себе аналогичное сообщество непрерывно общающихся между собой компьютеров. Подобное «сообщество» в целом является точно такой же вычислительной системой; деятельность его, если есть такое желание, можно смоделировать и на одном-единственном компьютере. Разумеется, вследствие одного только количественного превосходства, сообщество составит гораздо более мощную вычислительную систему, нежели каждый из индивидуумов в отдельности, однако принципиальной разницы между ними нет. Известно, что на нашей планете проживает более 5 × 109 человек (прибавьте к этому еще огромные библиотеки накопленного знания). Цифры впечатляют, но это всего лишь цифры — если отдельного человека считать вычислительным устройством, то разницу, обусловленную переходом от индивидуума к сообществу, развитие компьютерных технологий сможет при необходимости свести на нет в течение каких-нибудь нескольких десятилетий. Очевидно, что искусственный случай с учителями-людьми в роли внешнего окружения не дает нам ничего принципиально нового, что могло бы объяснить, каким образом из целиком и полностью вычислительных составляющих возникает абсолютно невычислимая сущность.
Что же мы имеем в естественном случае? Вопрос теперь звучит так: может ли физическое окружение (если не учитывать действий присутствующих в нем учителей-людей) содержать компоненты, которые невозможно даже в принципе смоделировать численными методами? Мне думается, что если кто-то полагает, что в «бесчеловечном» окружении может присутствовать нечто, принципиально не поддающееся численному моделированию, то этот кто-то тем самым лишает силы главное возражение против C. Ибо единственной разумной причиной усомниться в возможной справедливости точки зрения C можно счесть лишь скептическое отношение к утверждению, что объекты, принадлежащие реальному физическому миру могут вести себя каким-то невычислимым образом. Как только мы признаём, что какой-либо физический процесс может оказаться невычислимым, у нас не остается никакого права отказывать в невычислимости и процессам, протекающим внутри такого физического объекта, как мозг, — равно как и возражать против C. Как бы то ни было, крайне маловероятно, что в безлюдном окружении может обнаружиться нечто такое, что не поддается вычислению столь же фундаментально, как это делают некоторые процессы внутри человеческого тела. (См. также и , Q2.) Думаю, мало кто всерьез полагает, что среди всего, что имеет хоть какое-то отношение к окружению самообучающегося робота, может оказаться что-либо, принципиально невычислимое.
Впрочем, говоря о «принципиально» вычислимой природе окружения, не следует забывать об одном важном моменте. Вне всякого сомнения, на реальное окружение любого развивающегося живого организма (или некоей изощренной робототехнической системы) оказывают влияние весьма многочисленные и порой невероятно сложные факторы, вследствие чего любое моделирование этого окружения со сколько-нибудь приемлемой точностью вполне может оказаться неосуществимым практически. Динамическое поведение даже относительно простых физических систем бывает порой чрезвычайно сложным, при этом его зависимость от мельчайших нюансов начального состояния может быть настолько критической, что предсказать дальнейшее поведение такой системы решительно невозможно — в качестве примера можно привести ставшую уже притчей во языцех проблему долгосрочного предсказания погоды. Подобные системы называют хаотическими; см. . (Хаотические системы характеризуются сложным и эффективно непредсказуемым поведением. Однако математически эти системы объяснить вполне возможно; более того, их активное изучение составляет весьма существенную долю современных математических исследований.) Как уже указывалось в , хаотические системы я также включаю в категорию «вычислительных» (или «алгоритмических»). Для наших целей важно подчеркнуть один существенный момент, касающийся хаотических систем: нет никакой необходимости в воспроизведении того или иного реального хаотического окружения, вполне достаточно воспроизвести окружение типичное. Например, когда мы хотим узнать погоду на завтра, насколько точная информация нам в действительности нужна? Не сгодится ли любое правдоподобное описание?
3.11. Как обучаются роботы?
Учитывая вышесказанное, предлагаю остановиться на том, что на самом деле нас сейчас интересуют отнюдь не проблемы численного моделирования окружения. В принципе, возможностей поработать с окружением у нас будет предостаточно — но только в том случае, если не возникнет никаких трудностей с моделированием внутренних правил самой робототехнической системы. Поэтому перейдем к вопросу о том, как мы видим себе обучение нашего робота. Какие вообще процедуры обучения доступны вычислительному роботу? Возможно, ему будут предварительно заданы некие четкие правила вычислительного характера, как это обычно делается в нынешних системах на основе искусственных нейронных сетей (см. ). Такие системы подразумевают наличие некоторого четко определенного набора вычислительных правил, в соответствии с которыми усиливаются или ослабляются связи между составляющими сеть «нейронами», посредством чего достигается улучшение качества общего функционирования системы согласно критериям (искусственным или естественным), задаваемым внешним окружением. Еще один тип систем обучения образуют так называемые «генетические алгоритмы» — нечто вроде естественного отбора (или, если хотите, «выживания наиболее приспособленных») среди различных алгоритмических процедур, выполняемых на одной вычислительной машине; посредством такого отбора выявляется наиболее эффективный в управлении системой алгоритм.
Следует пояснить, что упомянутые правила (что характерно для восходящей организации вообще) несколько отличаются от стандартных нисходящих вычислительных алгоритмов, действующих в соответствии с известными процедурами для отыскания точных решений математических проблем. Восходящие правила лишь направляют систему к некоему общему улучшению качества ее функционирования. Впрочем, это не мешает им оставаться целиком и полностью алгоритмическими — в смысле воспроизводимости на универсальном компьютере (машине Тьюринга).
В дополнение к четким правилам такого рода, в совокупность средств, с помощью которых наша робототехническая система будет модифицировать свою работу, могут быть включены и некоторые случайные элементы. Возможно, эти случайные составляющие будут вноситься посредством каких-нибудь физических процессов — например, такого квантовомеханического процесса, как распад ядер радиоактивных атомов. На практике при конструировании искусственных вычислительных устройств имеет место тенденция к введению какой-либо вычислительной процедуры, результат вычисления в которой является случайным по существу (иначе такой результат называют псевдослучайным), хотя на деле он полностью определяется детерминистским характером самого вычисления (см. ). С описанным способом тесно связан другой, суть которого заключается в точном указании момента времени, в который производится вызов «случайной» величины, и введении затем этого момента времени в сложную вычислительную процедуру, которая и сама является, по существу, хаотической системой, вследствие чего малейшие изменения во времени дают эффективно непредсказуемые различия в результатах, а сами результаты становятся эффективно случайными. Хотя, строго говоря, наличие случайных компонентов и выводит рассматриваемые процедуры за рамки определения «операции машины Тьюринга», каких-то существенных изменений это за собой не влечет. В том, что касается функционирования нашего робота, случайным входным данным на практике оказываются эквивалентны псевдослучайные, а псевдослучайные входные данные ничуть не противоречат возможностям машины Тьюринга.
«Ну и что, что на практике случайные входные данные не отличаются от псевдослучайных? — заметит дотошный читатель. — Принципиальная-то разница между ними есть». На более раннем этапе нашего исследования (см., в частности, ) нас и в самом деле занимало то, чего математики могут достичь в принципе, вне зависимости от их практических возможностей. Более того, в определенных математических ситуациях проблему можно решить исключительно с помощью действительно случайных входных данных, никакие псевдослучайные заместители для этого не годятся. Подобные ситуации возникают, когда проблема подразумевает наличие некоего «состязательного» элемента, как часто бывает, например, в теории игр и криптографии. В некоторых видах «игр на двоих» оптимальная стратегия для каждого из игроков включает в себя, помимо прочего, и полностью случайную составляющую. Любое сколько-нибудь последовательное пренебрежение одним из игроков необходимым для построения оптимальной стратегии элементом случайности позволяет другому игроку на протяжении достаточно длинной серии игр получить преимущество — по крайней мере, в принципе. Преимущество может быть достигнуто и в том случае, если противнику каким-то образом удалось составить достаточно достоверное представление о природе псевдослучайной (или иной) стратегии, используемой первым игроком вместо требуемой случайной. Аналогичным образом дело обстоит и в криптографии, где надежность кода напрямую зависит от того, насколько случайной является применяемая последовательность цифр. Если эта последовательность генерируется не истинно случайным образом, а посредством какого-либо псевдослучайного процесса, то, как и в случае с играми, этот процесс может в точности воспроизвести кто угодно, в том числе и потенциальный взломщик.
Поскольку случайность, как выясняется, представляет собой весьма ценное качество в таких состязательных ситуациях, то, на первый взгляд, можно предположить, что и в естественном отборе она должна играть не последнюю роль. Я даже уверен, что случайность и впрямь является во многих отношениях весьма важным фактором в процессе развития живых организмов. И все же, как мы убедимся несколько позднее в этой главе, одной лишь случайности оказывается недостаточно для того, чтобы вырваться из гёделевских сетей. И самые что ни на есть подлинно случайные элементы не помогут нашему роботу избежать ограничений, присущих вычислительным системам. Более того, у псевдослучайных процессов в этом смысле даже больше шансов, нежели у процессов чисто случайных (см. ).
Допустим на некоторое время, что наш робот и в самом деле является, по существу, машиной Тьюринга (хотя и с конечной емкостью запоминающего устройства). Строго говоря, учитывая, что робот непрерывно взаимодействует со своим окружением, а это окружение, как мы предполагаем, также допускает численное моделирование, было бы правильнее принять за единую машину Тьюринга робота вместе с окружением. Однако в целях удобства изложения я все же предлагаю рассматривать отдельно робота, как собственно машину Тьюринга, и отдельно окружение, как источник информации, поступающей на входную часть ленты машины. Вообще-то такую аналогию нельзя считать вполне приемлемой по одной формальной причине — машина Тьюринга есть устройство фиксированное и по определению неспособное изменять свою структуру «по мере накопления опыта». Можно, конечно, попытаться изобрести способ, посредством которого машина Тьюринга сможет-таки изменить свою структуру, — например, заставить машину работать безостановочно, модифицируя структуру в процессе работы, для чего непрерывно подавать на ее вход информацию от окружения. К нашему разочарованию, этот способ не сработает, поскольку результат работы машины Тьюринга можно узнать только после того, как машина достигнет внутренней команды STOP (см. и , а также НРК, глава 2), после чего она не будет ничего считывать с входной части своей ленты до тех пор, пока мы не запустим ее снова. Когда же мы ее запустим, для продолжения работы ей придется возвратиться в исходное состояние, т.е. «обучиться» таким способом она ничему не сможет.
Впрочем, эту трудность можно обойти при помощи сложной технической модификации. Наша машина Тьюринга так и остается фиксированной, однако после каждого рабочего цикла, т.е. после достижения команды STOP, она дает на выходе два результата (формально кодируемые в виде одного-единственного числа). Первый результат определяет, каким в действительности будет ее последующее внешнее поведение, тогда как второй результат предназначен исключительно для внутреннего использования — в нем кодируется весь опыт, который машина получила от предыдущих контактов с окружением. В начале следующего цикла с входной части ее ленты сначала считывается «внутренняя» информация и только после нее все «внешние» данные, которыми машину снабжает окружение, включая и подробную реакцию упомянутого окружения на ее предшествующее поведение. Таким образом, все результаты обучения оказываются записанными на, скажем так, внутреннем участке ленты, который машина в каждом рабочем цикле считывает заново (и который с каждым циклом становится все длиннее и длиннее).
3.12. Способен ли робот на «твердые математические убеждения»?
Воспользовавшись вышеописанным способом, мы и в самом деле можем представить себе в высшей степени обобщенного самообучающегося вычислительного «робота» в виде машины Тьюринга. Далее, предполагается, что наш робот способен судить об истинности математических утверждений, пользуясь при этом всеми способностями, потенциально присущими математикам-людям. И как же он будет это делать? Вряд ли нас обрадует необходимость кодировать каким-нибудь исключительно «нисходящим» способом все математические правила (все те, что входят в формальную систему ZF, плюс все те, что туда не входят, о чем мы говорили выше), которые понадобятся роботу для того, чтобы иметь возможность непосредственно формировать собственные суждения подобно тому, как это делают люди, исходя из известных им правил, — поскольку, как мы могли убедиться, не существует ни одного сколько-нибудь приемлемого способа (за исключением, разумеется, «божественного вмешательства» — см. , ), посредством которого можно было бы реализовать такой неимоверно сложный и непознаваемо эффективный нисходящий алгоритм. Следует, очевидно, допустить, что какими бы внутренними «нисходящими» элементами ни обладал наш робот, они не являются жизненно важными для решения сложных математических проблем, а представляют собой всего лишь общие правила, обеспечивающие, предположительно, почву для формирования такого свойства как «понимание».
Выше (см. ) мы говорили о двух различных категориях входных данных, которые могут оказать существенное влияние на поведение нашего робота: искусственных и естественных. В качестве искусственного аспекта окружения мы рассматриваем учителя (одного или нескольких), который сообщает роботу о различных математических истинах и старается подтолкнуть его к выработке каких-то внутренних критериев, с помощью которых робот мог бы самостоятельно отличать истинные утверждения от ложных. Учитель может информировать робота о совершенных тем ошибках или рассказывать ему о всевозможных математических понятиях и различных допустимых методах математического доказательства. Конкретные процедуры, применяемые в процессе обучения, учитель выбирает по мере необходимости из широкого диапазона возможных вариантов: «упражнение», «объяснение», «наставление» и даже, возможно, «порка». Что до естественных аспектов физического окружения, то они отвечают за «идеи», возникающие у робота в процессе наблюдения за поведением физических объектов; кроме того, окружение предоставляет роботу конкретные примеры воплощения различных математических понятий — например, понятия натуральных чисел: два апельсина, семь бананов, четыре яблока, один носок, ни одного ботинка и т.д., — а также хорошие приближения идеальных геометрических объектов (прямая, окружность) и некоторых бесконечных множеств (например, множество точек, заключенных внутри окружности).
Поскольку наш робот избежал-таки предварительного, полностью нисходящего программирования и, как мы предполагаем, формирует собственное понятие о математической истине с помощью всевозможных обучающих процедур, то нам следует позволить ему совершать в процессе обучения ошибки — с тем, чтобы он мог учиться и на своих ошибках. Первое время, по крайней мере, на эти ошибки ему будет указывать учитель. Кроме того, робот может самостоятельно обнаружить из наблюдений за окружением, что какие-то из его предыдущих, предположительно истинных математических суждений оказываются в действительности ошибочными, либо сомнительными и подлежащими повторной проверке. Возможно, он придет к такому выводу, основываясь исключительно на собственных соображениях о противоречивости этих своих суждений и т.д. Идея такова, что по мере накопления опыта робот будет делать все меньше и меньше ошибок. С течением времени учителя и физическое окружение будут становиться для робота все менее необходимыми — возможно, в конечном счете, окажутся и вовсе ненужными, — и при формировании своих математических суждений он будет все в большей степени опираться на собственную вычислительную мощь. Соответственно, можно предположить, что в дальнейшем наш робот не ограничится теми математическими истинами, что он узнал от учителей или вывел из наблюдений за физическим окружением. Возможно, впоследствии он даже внесет какой-либо оригинальный вклад в математические исследования.
Для того чтобы оценить степень правдоподобия нарисованной нами картины, необходимо соотнести ее с теми вещами, что мы обсуждали ранее. Если мы хотим, чтобы наш робот и в самом деле обладал всеми способностями, пониманием и проницательностью математика-человека, ему потребуется какая-никакая концепция «неопровержимой математической истины». Его ранние попытки в формировании суждений, исправленные учителями или обесцененные наблюдением за физическим окружением, в эту категорию никоим образом не попадают. Они относятся к категории «догадок», а догадкам позволяется быть предварительными, пробными и даже ошибочными. Если предполагается, что наш робот должен вести себя как подлинный математик, то даже те ошибки, которые он будет порой совершать, должны быть исправимыми — причем, в принципе, исправимыми именно в соответствии с его собственными внутренними критериями «неопровержимой истинности».
Выше мы уже убедились, что концепцию «неопровержимой истины», которой руководствуется в своей деятельности математик-человек, нельзя сформировать посредством какого бы то ни было познаваемого (человеком) набора механических правил, в справедливости которых этот самый человек может быть целиком и полностью уверен. Если мы полагаем, что наш робот способен достичь уровня математических способностей, достижимого, в принципе, для любого человеческого существа (а то и превзойти этот уровень), то в этом случае его (робота) концепция неопровержимой математической истины также должна представлять собой нечто такое, что невозможно воспроизвести посредством набора механических правил, которые можно полагать обоснованными, — т.е. правил, которые может полагать обоснованными математик-человек или, коли уж на то пошло, математик-робот.
В связи с этими соображениями возникает один весьма важный вопрос: чьи же концепции, восприятие, неопровержимые убеждения следует считать значимыми — наши или роботов? Можно ли полагать, что робот действительно обладает убеждениями или способен что-либо осознавать? Если читатель придерживается точки зрения B, то он, возможно, сочтет такой вопрос несколько неуместным, поскольку сами понятия «осознания» или «убеждения» относятся к описанию процесса мышления и поэтому никоим образом неприменимы к целиком компьютерному роботу. Однако в рамках настоящего рассуждения нет необходимости в том, чтобы наш гипотетический робот и в самом деле обладал какими-то подлинными ментальными качествами, коль скоро мы допускаем, что он способен внешне вести себя в точности подобно математику-человеку — в полном соответствии с самыми строгими формулировками как B, так и A. Нам не нужно, чтобы робот действительно понимал, осознавал или верил; достаточно того, что внешне он проявляет себя в точности так, будто он этими ментальными качествами в полной мере обладает. Подробнее об этом мы поговорим в .
Точка зрения B не отличается принципиально от A в том, что касается ограничений, налагаемых на возможную манеру поведения робота, однако сторонники B, скорее всего, питают несколько меньшие надежды в отношении тех высот, которых на деле может достичь робот, или вероятности создания вычислительной системы, которую можно было бы полагать способной на эффективное моделирование деятельности мозга человека, оценивающего обоснованность того или иного математического рассуждения. Подобное человеческое восприятие предполагает все же некоторое понимание смысла затронутых математических концепций. Согласно точке зрения A, во всем этом нет ничего, выходящего за рамки некоторого свойства вычисления, связанного с понятием «смысла», тогда как B рассматривает смысл в качестве семантического аспекта мышления и не допускает возможности его описания в чисто вычислительных терминах. В этом мы согласны с точкой зрения B и отнюдь не ожидаем от нашего робота способности действительно ощущать тонкие семантические различия. Таким образом, сторонники B, возможно, менее (нежели сторонники A) склонны предполагать, что какой бы то ни было робот, сконструированный в соответствии с обсуждаемыми здесь принципами, окажется когда-либо способен на демонстрацию тех внешних проявлений человеческого понимания, какие свойственны математикам-людям. Полагаю, отсюда можно сделать вывод (не такой, собственно, и неожиданный), что сторонников B будет существенно легче обратить в приверженцев C, чем сторонников A; впрочем, для нашего дальнейшего исследования разница между A и B существенного значения не имеет.
В качестве заключения отметим, что, хотя истинность математических утверждений нашего робота, получаемых посредством преимущественно восходящей системы вычислительных процедур, носит заведомо предварительный и предположительный характер, следует допустить, что роботу действительно присущ некоторый достаточно «прочный» уровень неопровержимой математической «убежденности», вследствие чего некоторые из его утверждений (которым он будет присваивать некий особый статус — обозначаемый, скажем, знаком ☆) нужно считать неопровержимо истинными — согласно собственным критериям робота. О допустимости ошибочного присвоения роботом статуса ☆ — пусть роботом же и исправимом — мы поговорим в . А до той поры будем полагать, что всякое ☆-утверждение робота следует рассматривать как безошибочное.
3.13. Механизмы математического поведения робота
Рассмотрим различные механизмы, лежащие в основе процедур, управляющих поведением робота в процессе получения им ☆-утверждений. Некоторые из этих процедур являются по отношению к роботу внутренними — нисходящие внутренние ограничители, встроенные в модель функционирования робота, а также те или иные заранее определенные восходящие процедуры, посредством которых робот улучшает качество своей работы (с тем, чтобы постепенно достичь ☆-уровня). Разумеется, мы полагаем, что все эти процедуры в принципе познаваемы человеком (хотя окончательный результат совокупного действия всех этих разнообразных факторов вполне может оказаться за пределами вычислительных способностей математика-человека). В самом деле, если мы допускаем, что человеческие существа в один прекрасный день сконструируют робота, наделенного подлинным математическим талантом, то следует непременно допустить и то, что человек способен понять внутренние принципы, в соответствии с которыми будет построен этот робот, иначе любое подобное начинание обречено на провал.
Безусловно, мы отдаем себе отчет в том, что создание такого робота вполне может оказаться многоступенчатым процессом: иначе говоря, возможно, что наш робот-математик будет целиком и полностью построен какими-либо роботами «низшего порядка» (которые сами не способны на подлинно математическую деятельность), а эти роботы, в свою очередь, построены другими роботами еще более низкого порядка. Однако запущена в производство вся эта иерархическая цепочка будет все равно человеком, и исходные правила ее построения (по всей видимости, некая комбинация нисходящих и восходящих процедур) будут в любом случае доступны человеческому пониманию.
Существенно важными для процесса развития робота являются и всевозможные внешние факторы, привносимые окружением. Внешний мир и в самом деле может обеспечить нашего робота весьма значительным объемом вводимых данных, поступающих как от учителей-людей (или роботов), так и из наблюдений за естественным физическим окружением. Что до естественных внешних факторов, привносимых «безлюдным» окружением, то «непознаваемыми» их, как правило, не считают. Эти факторы могут быть очень сложными, часто они взаимодействуют между собой, и все же эффективное «виртуально-реальное» моделирование существенных аспектов нашего окружения уже вполне осуществимо (см. ). По-видимому, ничто не мешает модифицировать эти модели таким образом, чтобы робот с их помощью получал все, что ему нужно для развития в смысле внешних естественных факторов, — не будем забывать, что вполне достаточно смоделировать типичное окружение, воспроизводить какое-то реально существующее необходимости нет (см. , ).
Вмешательство в процесс людей (или роботов) — т.е. внешних, «искусственных» факторов — может происходить на различных этапах, однако это никоим образом не влияет на существенную познаваемость механизмов этого вмешательства, при условии, разумеется, что мы допускаем возможность каким-то познаваемым образом «механизировать» вмешательство человека. Справедливо ли такое допущение? Думаю, вполне естественно (по крайней мере, для сторонника точки зрения A или B) предположить, что любое человеческое вмешательство в процесс развития робота и в самом деле можно заменить какими-либо целиком и полностью вычислительными процедурами. Мы же не требуем, чтобы в этом вмешательстве непременно присутствовало что-либо непостижимо мистическое — скажем, некая неопределимая «сущность», какую учитель-человек должен передать своему ученику-роботу в процессе обучения. Мы полагаем, что при обучении роботу необходимо получать всего лишь те или иные фундаментальные сведения, а передачу ему этих сведений проще всего поручить именно человеку. Весьма вероятно, что, как и в случае с учениками-людьми, наиболее эффективной будет передача информации в интерактивной форме, когда поведение учителя зависит от реакции ученика. Однако и это обстоятельство, само по себе, отнюдь не исключает возможности эффективно вычислительного поведения учителя. В конце концов, все наши рассуждения в настоящей главе представляют собой одно сплошное reductio ad absurdum, в рамках которого мы допускаем, что в поведении человеческих существ вообще нет ничего существенно невычислимого. А тем, кто уже и так придерживается точек зрения C или D (последние, несомненно, склонны скорее поверить в возможность существования упомянутой выше невычислимой «сущности», передаваемой роботу в силу одного лишь человеческого происхождения учителя), наши доказательства в любом случае совершенно не нужны.
Если рассматривать все эти механизмы (т.е. внутренние вычислительные процедуры и данные, поступающие от интерактивного внешнего окружения) в совокупности, то создается впечатление, что нет каких-либо разумных причин полагать их принципиально непознаваемыми, — даже если кто-то и настаивает на том, что на практике в точности просчитать результирующие проявления внешних из упомянутых механизмов не в силах человеческих (и даже не в силах любого из существующих или предвидимых в обозримом будущем компьютеров). К вопросу о познаваемости вычислительных механизмов мы еще вернемся, причем довольно скоро (в конце ). А пока допустим, что все эти механизмы действительно познаваемы, и обозначим набор таких механизмов буквой M. Возможно ли, что некоторые из полученных с помощью этих механизмов утверждений ☆-уровня окажутся, тем не менее, непознаваемыми для человека? Обоснованно ли такое предположение? Вообще говоря, нет — при условии, что в данном контексте мы продолжаем интерпретировать понятие «познаваемости» в том же принципиальном смысле, который мы применяли в отношении случаев I и II и который был исчерпывающе определен в начале . Тот факт, что нечто (например, формулировка некоего ☆-утверждения) может оказаться за пределами невооруженных вычислительных способностей человеческого существа, к данному случаю отношения не имеет. Ничуть не возбраняется и «вооружить» человека теми или иными средствами содействия мыслительным процессам — например, карандашом и бумагой, карманным калькулятором либо универсальным компьютером в комплекте с программным обеспечением нисходящего типа. Даже если добавить к уже имеющимся вычислительным процедурам какие-либо восходящие компоненты, то мы не получим ничего такого, чего не могли бы в принципе получить раньше — при условии, разумеется, что лежащие в основе этих восходящих процедур фундаментальные механизмы доступны человеческому пониманию. С другой стороны, вопрос о «познаваемости» самих механизмов M следует рассматривать уже в «практическом» смысле — в полном соответствии с принятой в терминологией. Таким образом, на данный момент мы полагаем, что механизмы M являются действительно познаваемыми практически.
Обладая знанием механизмов M, мы можем использовать их при создании фундамента для построения формальной системы Q(M), при этом теоремами такой системы станут следующие положения: (I) ☆-утверждения, непосредственно следующие из применения упомянутых механизмов, и (II) любые положения, выводимые из этих ☆-утверждений с применением правил элементарной логики. Под «элементарной логикой» здесь могут пониматься, скажем, правила исчисления предикатов (описанные в ) или какая-либо иная столь же прямая и четко определенная неопровержимая система аналогичных логических правил (вычислительных). Мы вполне способны построить формальную систему Q(M) в силу того простого факта, что процедура Q(M), посредством которой из набора механизмов M получаются, одно за другим, необходимые ☆-утверждения, является процедурой вычислительной (пусть на практике и весьма громоздкой). Отметим, что определяемая таким образом процедура Q(M) будет генерировать утверждения группы (I), однако вовсе не обязательно все положения группы (II) (поскольку можно допустить, что нашему роботу, по всей вероятности, попросту надоест тупо выводить все логические следствия из вырабатываемых им ☆-теорем). Таким образом, процедура Q(M) не эквивалентна в точности формальной системе Q(M), однако различие между ними не существенно. К тому же ничто не мешает нам при желании получить из процедуры Q(M) другую процедуру — такую, например, которая будет эквивалентна Q(M).
Далее, для интерпретации формальной системы Q(M) необходимо каким-то образом устроить так, чтобы на всем протяжении развития робота статус ☆ всегда и непременно означал, что удостоенное его утверждение действительно следует полагать неопровержимо доказанным. В отсутствие поступающих от учителя-человека (неважно, в какой форме) внешних данных мы не можем быть уверенными в том, что робот не выработает самостоятельно некий отличный от нашего язык, в котором символ ☆ будет иметь совершенно иное значение (либо вовсе окажется бессмысленным). Для того чтобы определение формальной системы Q(M) на языке робота согласовывалось с нашим ее определением, необходимо в процессе обучения робота (например, учителем-человеком) проследить за тем, чтобы присваиваемое символу ☆ значение в точности соответствовало тому значению, какое в него вкладываем мы. Необходимо также проследить и за тем, чтобы система обозначений, которой робот фактически пользуется при формулировке своих, скажем, Π1-высказываний, в точности совпадала с аналогичной системой, имеющей хождение у нас (или допускала какое-либо явное преобразование в нашу систему). Если допустить, что механизмы M познаваемы человеком, то из вышесказанного следует, что аксиомы и правила действия формальной системы Q(M) также должны быть познаваемыми. Более того, всякую теорему, выводимую в рамках системы Q(M), следует, в принципе, полагать познаваемой человеком (в том смысле, что мы в состоянии понять ее описание, а не определить в обязательном порядке ее неопровержимую истинность), даже если вычислительные процедуры, необходимые для получения большей части таких теорем, окажутся далеко за пределами невооруженных вычислительных способностей человека.
3.14. Фундаментальное противоречие
Предшествующая дискуссия в сущности показывает, что «непознаваемый и неосознаваемый алгоритм F», который, согласно допущению III, лежит в основе восприятия математической истины, вполне возможно свести к алгоритму осознанно познаваемому — при условии, что нам, следуя заветам адептов ИИ, удастся запустить некую систему процедур, которые в конечном счете приведут к созданию робота, способного на математические рассуждения на человеческом (а то и выше) уровне. Непознаваемый алгоритм F заменяется при этом вполне познаваемой формальной системой Q(M).
Прежде чем мы приступим к подробному рассмотрению этого аргумента, необходимо обратить внимание на один существенный момент, который мы до сих пор незаслуженно игнорировали — речь идет о возможности привнесения на разных этапах процесса развития робота неких случайных элементов взамен раз и навсегда фиксированных механизмов. В свое время нам еще предстоит обратиться к этому вопросу, пока же я буду полагать, что каждый такой случайный элемент следует рассматривать как результат выполнения какого-либо псевдослучайного (хаотического) вычисления. Как было показано ранее (, ), таких псевдослучайных компонентов на практике оказывается вполне достаточно. К случайным элементам в «образовании» робота мы еще вернемся в , где более подробно поговорим о подлинной случайности в применении к нашему случаю, а пока, говоря о «наборе механизмов M», я буду предполагать, что все эти механизмы действительно являются целиком и полностью вычислительными и свободными от какой бы то ни было реальной неопределенности.
Суть противоречия заключается в том, что на месте алгоритма F, фигурировавшего в наших предыдущих рассуждениях (например, того алгоритма, о котором мы говорили в в связи с допущением I), с неизбежностью оказывается формальная система Q(M). Вследствие чего случай III эффективно сводится к случаю I и тем самым не менее эффективно из рассмотрения исключается. Выступая в рамках данного доказательства в роли сторонников точек зрения A и B, мы предполагаем, что наш робот в принципе способен (с помощью обучающих процедур той же природы, что установили для него мы) достичь в конечном счете любых математических результатов, каких в состоянии достичь человек. Мы должны также допустить, что робот способен достичь и таких результатов, какие человеку в принципе не по силам. Так или иначе, нашему роботу предстоит обзавестись способностью к пониманию мощи аргументации Гёделя (или, по крайней мере, способностью сымитировать такое понимание — согласно B) Иначе говоря, относительно любой заданной (достаточно обширной) формальной системы H робот должен оказаться в силах неопровержимо установить тот факт, что из обоснованности системы H следует истинность его гёделевского утверждения G(H), а также то, что утверждение G(H) не является теоремой системы H. В частности, робот сможет установить, что из обоснованности системы Q(M) неопровержимо следует истинность утверждения G(Q(M)); эта же обоснованность предполагает, что утверждение G(Q(M)) не является теоремой системы Q(M).
С помощью в точности тех же рассуждений, какими мы воспользовались в применительно к человеческому математическому пониманию, непосредственно из вышеизложенных соображений выводится, что робот никоим образом не способен твердо поверить в то, что совокупность его собственных — и, на его взгляд, неопровержимых — математических убеждений действительно эквивалентна некоей формальной системе Q(M). И это несмотря на тот факт, что мы (выступая в роли соответствующих экспертов по проблемам ИИ) прекрасно осведомлены о том, что в основе системы математических убеждений робота лежит не что-нибудь, а именно набор механизмов M, что автоматически означает, что система неопровержимых убеждений робота является полным эквивалентом системы Q(M). Если бы робот вдруг твердо поверил в то, что все его убеждения укладываются в рамки системы Q(M), то тогда ему пришлось бы поверить и в обоснованность этой самой системы Q(M). Соответственно, ему также пришлось бы одновременно поверить и в истинность утверждения G(Q(M)), и в то, что упомянутое утверждение в его систему убеждений не входит — неразрешимое противоречие! Иначе говоря, робот никак не может знать о том, что он сконструирован в соответствии с тем или иным набором механизмов M. А поскольку об этой особенности его конструкции знаем — или по крайней мере, в состоянии узнать — мы с вами, то получается, что нам доступны такие математические истины (например, утверждение G(Q(M))), которые роботу оказываются не по силам, хотя изначально предполагалось, что способности робота будут равны способностям человека (или даже превысят их).
3.15. Способы устранения фундаментального противоречия
Приведенное выше рассуждение можно рассматривать двояко — с точки зрения создавших робота людей либо с точки зрения самого робота. С человеческой точки зрения существует некоторая неопределенная вероятность того, что математику-человеку претензии робота на обладание неопровержимой истиной покажутся неубедительными, разве что упомянутый математик-человек примет во внимание какие-то отдельные конкретные аргументы из тех, что использует робот. Возможно, не все теоремы системы Q(M) человек сочтет неопровержимо истинными, кроме того, как нам помнится, интеллектуальные способности робота могут существенно превышать таковые же способности человека. Таким образом, можно утверждать, что одно лишь знание о том, что робот сконструирован в соответствии с неким набором механизмов M, не следует рассматривать в качестве неопровержимо убедительной (для человека) математической демонстрации. Соответственно, мы должны пересмотреть все вышеприведенное рассуждение — на этот раз с точки зрения робота. Какие огрехи в нашем обосновании в состоянии заметить (и использовать)робот?
По-видимому, наш робот располагает всего лишь четырьмя основными возможностями для нейтрализации фундаментального противоречия — при условии, конечно, что сам робот осведомлен о том, что он является в некотором роде вычислительной машиной.
(a) Возможно , что робот, принимая в целом утверждение о том, что в основе его конструкции лежит некий набор механизмов M , тем не менее, неизбежно остается неспособен безоговорочно поверить в этот факт.
(b) Возможно, что робот, будучи безоговорочно убежден в истинности каждого отдельного ☆-утверждения в тот момент, когда он его формулирует, все же сомневается в достоверности полной системы своих ☆-утверждений — соответственно, робот может не верить в то, что формальная система Q ( M ) и в самом деле лежит в основе всей его системы убеждений в отношении Π 1 -высказываний.
(c) Возможно, что подлинный набор механизмов M существенно зависит от случайных элементов и не может быть адекватно описан через посредство неких известных результатов псевдослучайных вычислений, подаваемых на входное устройство робота.
(d) Возможно, что подлинный набор механизмов M в действительности непознаваем .
В последующих девяти разделах представлен ряд веских аргументов, убедительно демонстрирующих, что первые три лазейки ((a), (b) и (c)) оказываются для робота, задавшегося целью обойти фундаментальное противоречие, совершенно бесполезными. Соответственно, робот (а вместе с ним и мы — если мы, конечно, продолжаем настаивать на том, что математическое понимание можно свести к вычислению) начинает всерьез подумывать о не очень привлекательной возможности (d). Уверен, что непривлекательной возможность (d) нахожу не я один — думаю, в этом со мной согласятся и те читатели, которым не безразлична судьба идеи искусственного интеллекта. Ее, пожалуй, приемлемо рассматривать лишь в качестве возможной мировоззренческой позиции, укладывающейся, по сути своей, в рамки той самой комбинации точек зрения A и D, о которой мы говорили в конце и согласно которой для внедрения непознаваемого алгоритма в «мозг» каждого из наших роботов требуется, ни много ни мало, божественное вмешательство (от «первого в мире программиста»). В любом случае, вердикт «непознаваемо», вынесенный в отношении тех самых механизмов, которые, в конечном счете, ответственны за наличие у нас какого ни на есть разума, вряд ли обрадует тех, кто намерен, вообще говоря, построить робота, наделенного подлинным искусственным интеллектом. Не особенно обрадует он и тех из нас, кто все еще надеется понять, принципиально и не выходя за рамки строго научного подхода, каким образом в действительности возникло у человека такое свойство, как интеллект, объяснить его происхождение посредством четко формулируемых научных законов — законов физики, химии, биологии, законов естественного отбора, в конце концов, — пусть даже и не имея в виду воспроизвести этот самый интеллект в каком бы то ни было робототехническом устройстве. Лично я полагаю, что подобный пессимистический вердикт не имеет под собой никаких оснований — по той хотя бы простой причине, что «научная постижимость» имеет весьма мало общего с «вычислимостью». Законы, лежащие в основе мыслительных процессов не являются непостижимыми, они всего лишь невычислимы. На эту тему мы еще поговорим во второй части книги.
3.16. Необходимо ли роботу верить в механизмы М?
Вообразим, что у нас имеется робот, снабженный некоторым возможным набором механизмов M, — каковой набор может оказаться тем самым, на основе которого и построен наш робот, но это не обязательно. Я попробую убедить читателя в том, что робот будет вынужден отвергнуть возможность того, что его математическое понимание опирается на набор механизмов M, — независимо от того, как обстоит дело в действительности. При этом мы на время допускаем, что робот по тем или иным причинам уже отбросил варианты (b), (c) и (d), и приходим к выводу (несколько даже неожиданному), что сам по себе вариант (a) избежать парадокса не позволяет.
Рассуждать мы будем следующим образом. Обозначим через M гипотезу
«В основе математического понимания робота лежит набор механизмов M »
и рассмотрим утверждение вида
«Такое-то Π 1 -высказывание является следствием M ».
Такое утверждение (в том случае, когда робот твердо верит в его истинность) я буду называть ☆M -утверждением. Иначе говоря, под ☆M -утверждениями не обязательно понимаются те Π1-высказывания, в истинность которых как таковых неопровержимо верит робот, но те Π1-высказывания, которые робот полагает неопровержимо выводимыми из гипотезы M. Изначально от робота не требуется обладание какими бы то ни было взглядами относительно возможности того, что в основе его конструкции действительно лежит набор механизмов M. Он может даже поначалу счесть такое предположение абсолютно невероятным, но, тем не менее, ничто не мешает ему рассмотреть (в подлинно научной традиции) возможные следствия из гипотезы о таком вот его происхождении.
Существуют ли Π1-высказывания, которые робот должен полагать неопровержимыми следствиями из гипотезы M и которые при этом не являются самыми обыкновенными ☆-утверждениями, вовсе не требующими привлечения этой гипотезы? Разумеется, существуют. Как было отмечено в конце , истинность Π1-высказывания G(Q(M)) следует из обоснованности формальной системы Q(M), отсюда же следует и тот факт, что утверждение G(Q(M)) не является теоремой системы Q(M). Более того, в этом робот будет совершенно безоговорочно убежден. Если допустить, что робот вполне согласен с тем, что все его неопровержимые убеждения укладывались бы в рамки системы Q(M), будь он действительно сконструирован в соответствии с набором механизмов M, — т.е. что возможность (b) он из рассмотрения исключает, — то получается, что наш робот и в самом деле должен твердо верить в то, что обоснованность системы Q(M) является следствием гипотезы M. Таким образом, робот оказывается безоговорочно убежден как в том, что Π1-высказывание G(Q(M)) следует из гипотезы M, так и в том, что (согласно M) он не способен непосредственно постичь его неопровержимую истинность без привлечения M (поскольку формальной системе Q(M) оно не принадлежит). Соответственно, утверждение G(Q(M)) является ☆M -утверждением, но не ☆-утверждением.
Предположим, что формальная система QM (M) построена в точности так же, как и система Q(M), с той лишь разницей, что роль, которую при построении системы Q(M) исполняли ☆-утверждения, сейчас берут на себя ☆M -утверждения. Иначе говоря, теоремами системы QM (M) являются либо (I) сами ☆M -утверждения, либо (II) положения, выводимые из этих ☆M -утверждений с применением правил элементарной логики (см. ). Точно так же, как робот на основании гипотезы M согласен с тем, что формальная система Q(M) охватывает все его неопровержимые убеждения относительно истинности III -высказываний, он будет согласен и с тем, что формальная система QM (M) охватывает все его неопровержимые убеждения относительно истинности Π1-высказываний, обусловленных гипотезой M.
Далее предложим роботу рассмотреть гёделевское Π1-высказывание G(QM (M)). Робот, несомненно, проникнется неопровержимым убеждением в том, что это Π1-высказывание является следствием из обоснованности системы QM (M). Он также вполне безоговорочно поверит в то, что обоснованность системы QM (M) является следствием гипотезы M, поскольку он согласен с тем, что система QM (M) действительно содержит в себе все, в чем робот неопровержимо убежден в отношении своей способности выводить Π1-высказывания, основываясь на гипотезе M. (Он будет рассуждать следующим образом: «Если я принимаю гипотезу M, то я тем самым принимаю и все Π1-высказывания, которые порождают систему QM (M). Таким образом, я должен согласиться с тем, что система QM (M) является обоснованной на основании гипотезы M. Следовательно, на основании все той же гипотезы, я должен признать и то, что утверждение G(QM (M)) истинно».)
Однако, поверив (безоговорочно) в то, что гёделевское Π1-высказывание G(QM (M)) является следствием гипотезы M, робот вынужден будет поверить и в то, что утверждение G(QM (M)) является теоремой формальной системы QM (M). А в это он сможет поверить только в том случае, если он полагает систему QM (M) необоснованной, — что решительно противоречит принятию им гипотезы M.
В некоторых из вышеприведенных рассуждений неявно допускалось, что неопровержимая убежденность робота является действительно обоснованной, — хотя необходимо лишь, чтобы сам робот просто верил в обоснованность своей системы убеждений. Впрочем, мы изначально предполагаем, что наш робот обладает математическим пониманием, по крайней мере, на человеческом уровне, а человеческое математическое понимание, как было показано в , принципиально является обоснованным.
Возможно, кто-то усмотрит в формулировке допущения M, равно как и в определении ☆M -утверждения, некоторую неоднозначность. Смею вас уверить, что подобное утверждение, будучи Π1-высказыванием, представляет собой в высшей степени определенное математическое утверждение. Можно предположить, что большинство ☆M -утверждений робота окажутся в действительности самыми обыкновенными ☆-утверждениями, поскольку маловероятно, что робот при каких угодно обстоятельствах сочтет целесообразным прибегать в своих рассуждениях к самой гипотезе M. Исключением может стать утверждение G(Q(M)), о котором говорилось выше, так как в данном случае формальная система Q(M) выступает, с точки зрения робота, в роли гёделевской гипотетической «машины для доказательства теорем» (см. и ). Вооружившись гипотезой M, робот получает доступ к своей собственной «машине для доказательства теорем», и, хотя он не может быть (да и, скорее всего, не будет) безоговорочно убежден в обоснованности своей «машины», робот способен предположить, что она может оказаться обоснованной, и попытаться вывести следствия уже из этого предположения.
На этом этапе робот еще не добирается до парадокса — так же, как не добрался до него и Гёдель в своих рассуждениях о человеческом интеллекте (см. цитату в ). Однако, поскольку роботу доступен для исследования набор гипотетических механизмов M, а не просто отдельная формальная система Q(M), он может повторить свое рассуждение и перейти от системы Q(M) к системе QM (M), обоснованность которой он по-прежнему полагает простым следствием из гипотезы M. Именно это и приводит его в конечном итоге к противоречию (чего мы, собственно, и добивались). (См. также , где мы продолжим рассмотрение системы QM (M) и ее кажущейся связи с «парадоксальными рассуждениями».)
Вывод: ни одно обладающее сознанием и имеющее понятие о математике существо — иначе говоря, ни одно существо со способностью к подлинному математическому пониманию — не может функционировать в соответствии с каким бы то ни было набором постижимых им механизмов, вне зависимости от того, знает ли оно в действительности о том, что именно эти механизмы, предположительно, направляют его на его пути к неопровержимой математической истине. (Вспомним и о том, что «неопровержимой математической истиной» это существо полагает всего лишь то, что оно способно установить математическими методами, — т.е. с помощью «математического доказательства», причем совсем необязательно «формального».)
Если конкретнее, то на основании предшествующих рассуждений мы склонны заключить, что не существует такого постижимого роботом и не содержащего подлинно случайных компонентов набора вычислительных механизмов, какой робот мог бы принять (даже в качестве возможности) как основу своей системы математических убеждений, — при условии, что робот готов согласиться с тем, что специфическая процедура, предложенная мною для построения формальной системы Q(M) на основе механизмов M, и в самом деле охватывает всю совокупность Π1-высказываний, в истинность которых он неопровержимо верит, а также, соответственно, с тем, что формальная система QM (M) охватывает всю совокупность Π1-высказываний, которые, как он неопровержимо верит, следуют из гипотезы M. Кроме того, если мы хотим, чтобы робот смог построить собственную потенциально непротиворечивую систему математических убеждений, следует ввести в набор механизмов M какие-либо подлинно случайные составляющие.
Эти последние оговорки мы рассмотрим в последующих разделах (). Вопрос о введении в набор механизмов M возможных случайных элементов (вариант (c)) представляется удобным обсудить в рамках общего рассмотрения варианта (b). А для того чтобы рассмотреть вариант (b) с должной тщательностью, нам следует прежде в полной мере прояснить для себя вопрос об «убежденности» робота, который мы уже мимоходом затрагивали в конце .
3.17. Робот ошибается и робот «имеет в виду»?
Важнейший вопрос из тех, с какими нам предстоит разобраться на данном этапе, звучит так: готов ли робот безоговорочно согласиться с тем, что — при условии его построения в соответствии с некоторым набором механизмов M — формальная система Q(M) корректным образом включает в себя всю систему его математических убеждений в отношении Π1-высказываний (равно как и с соответствующим предположением для системы QM (M))? Такое согласие подразумевает, прежде всего, что робот верит в обоснованность системы Q(M), — т.е. в то, что все Π1-высказывания, являющиеся ☆-утверждениями, действительно истинны. Наши рассуждения требуют также, чтобы всякое Π1-высказывание, в истинность которого робот в состоянии безоговорочно поверить, являлось непременно теоремой системы Q(M) (т.е. чтобы в рамках системы Q(M) робот мог бы определить «машину для доказательства теорем», аналогичную той, возможность создания которой в случае математиков-людей допускал Гёдель, см. , ). Вообще говоря, существенно не то, чтобы система Q(M) действительно играла такую универсальную роль в отношении потенциальных способностей робота, связанных с Π1-высказываниями, а лишь то, чтобы она была достаточно обширна для того, чтобы допускать применение гёделевского доказательства к самой себе (и, соответственно, к системе QM (M)). Позднее мы увидим, что необходимость в таком применении возникает лишь в случае некоторых конечных систем Π1-высказываний.
Таким образом, мы — как, собственно, и робот — должны учитывать возможность того, что некоторые из ☆-утверждений робота окажутся в действительности ошибочными, и то, что робот может самостоятельно обнаружить и исправить эти ошибки согласно собственным внутренним критериям, сути дела не меняет. А суть дела заключается в том, что поведение робота в этом случае становится как нельзя более похоже на поведение математика-человека. Человеку ничего не стоит оказаться в ситуации, когда он (или она) полагает, что истинность (или ложность) того или иного Π1-высказывания неопровержимо установлена, в то время как в его рассуждениях имеется ошибка, которую он обнаружит лишь значительно позднее. Когда ошибка наконец обнаруживается, математик ясно видит, что его ранние рассуждения неверны, причем в соответствии с теми же самыми критериями, какими он руководствовался и ранее; разница лишь в том, что ранее ошибка замечена не была, — и вот Π1-высказывание, полагаемое неопровержимо истинным тогда, воспринимается сейчас как абсолютно ложное (и наоборот).
Мы вполне можем ожидать подобного поведения и от робота, т.е. на его ☆-утверждения, вообще говоря, полагаться нельзя, пусть даже он и удостоил их самолично статуса ☆. Впоследствии робот может исправить свою ошибку, однако ошибка-то уже сделана. Каким образом это обстоятельство отразится на нашем выводе относительно обоснованности формальной системы Q(M)? Очевидно, что система Q(M) не является целиком и полностью обоснованной, не «воспринимает» ее как таковую и робот, так что его гёделевскому предположению G(Q(M)) доверять нельзя. К этому, в сущности, и сводится суть оговорки (b).
Попробуем выяснить, может ли наш робот, приходя к тому или иному «неопровержимому» заключению, что-либо иметь в виду, и если да, то что именно. Уместно сопоставить эту ситуацию с той, что мы рассматривали в случае математика-человека. Тогда нас не занимало, что конкретно случилось обнаружить какому-либо реальному математику, нас занимало лишь то, что может быть принято за неопровержимую истину в принципе. Вспомним также знаменитую фразу Фейнмана: «Не слушайте, что я говорю; слушайте, что я имею в виду!». Похоже, нам нет необходимости исследовать то, что робот говорит, исследовать нужно то, что он имеет в виду. Не совсем, впрочем, ясно (особенно если исследователь имеет несчастье являться приверженцем скорее точки зрения B, нежели A), как следует интерпретировать саму идею того, что робот способен что бы то ни было иметь в виду. Если бы было возможно опираться не на то, что робот ☆-утверждает, а на то, что он в действительности «имеет в виду», либо на то, что он в принципе «должен иметь в виду», то тогда проблему возможной неточности его ☆-утверждений можно было бы обойти. Беда, однако, в том, что в нашем распоряжении, по всей видимости, нет никаких средств, позволяющих снаружи получить доступ к информации о том, что робот «имеет в виду» или о том, что, «как ему кажется, он имеет в виду». До тех пор, пока речь идет о формальной системе Q(M), нам, судя по всему, придется полагаться лишь на доступные ☆-утверждения, в достоверности которых мы не можем быть полностью уверены.
Не здесь ли проходит возможная операционная граница между точками зрения A и B? Не исключено, что так оно и есть; хотя позиции A и B эквивалентны в отношении принципиальной возможности внешних проявлений сознательной деятельности в поведении физической системы, люди, этих позиций придерживающиеся, могут разойтись в своих ожиданиях как раз в вопросе о том, какую именно вычислительную систему можно рассматривать как способную осуществить эффективное моделирование мозговой активности человека, находящегося в процессе осознания справедливости того или иного математического положения (см. конец ). Как бы то ни было, возможные расхождения в такого рода ожиданиях не имеют к нашему исследованию сколько-нибудь существенного отношения.
3.18. Введение случайности: ансамбли всех возможных роботов
В отсутствие прямого операционного метода разрешения этих семантических проблем нам придется полагаться на конкретные ☆-утверждения, которые наш робот будет делать, побуждаемый механизмами, управляющими его поведением. Нам придется смириться с тем, что некоторые из этих утверждений могут оказаться ошибочными, однако такие ошибки исправимы и, в общем случае, чрезвычайно редки. Разумно будет предположить, что всякий раз, когда робот допускает ошибку в одном из своих ☆-утверждений, ошибку эту можно приписать (по меньшей мере частично) каким-то случайным факторам, присутствующим в окружении или во внутренних процедурах робота. Если вообразить себе второго робота, функционирующего в соответствии с механизмами того же типа, что управляют поведением первого робота, однако при участии иных случайных факторов, то этот второй робот вряд ли совершит те же ошибки, что и первый, — но вполне может совершить другие. Упомянутые факторы могут привноситься теми самыми подлинно случайными элементами, которые определяются либо как часть информации, поступающей на вход робота из внешнего окружения, либо как компоненты внутренних процедур робота. Как вариант, они могут представлять собой псевдослучайные результаты неких детерминистских, но хаотических вычислений, как внешних, так и внутренних.
В рамках настоящего рассуждения я буду полагать, что ни один из подобных псевдослучайных элементов не играет в происходящем иной роли, чем та, которую могут выполнить (по меньшей мере с тем же успехом) элементы подлинно случайные. Вполне естественная, на мой взгляд, позиция. Впрочем, не исключается и возможность обнаружения в поведении хаотических систем (отнюдь не сводящемся только лишь к моделированию случайности) чего-то такого, что может послужить приближением какой-либо интересующей нас разновидности невычислительного поведения. Я не припомню, чтобы такая возможность где-либо всерьез обсуждалась, хотя есть люди, которые твердо убеждены в том, что хаотическое поведение представляет собой фундаментальный аспект деятельности мозга. Лично для меня подобные аргументы останутся неубедительными до тех пор, пока мне не продемонстрируют какое-нибудь существенно неслучайное (т.е. непсевдослучайное) поведение такой хаотической системы — поведение, которое может в сколько-нибудь сильном смысле являться приближением поведения подлинно невычислительного. Ни один намек на подобного рода демонстрацию моих ушей пока не достиг. Более того, как мы подчеркнем несколько позднее (), в любом случае маловероятно, что хаотическое поведение сможет проигнорировать те сложности, которые представляет для вычислительной модели разума гёделевское доказательство.
Допустим пока, что любые псевдослучайные (или иным образом хаотические) элементы в поведении нашего робота или в его окружении можно заменить элементами подлинно случайными, причем без какой бы то ни было потери эффективности. Для выяснения роли подлинной случайности нам необходимо составить ансамбль из всех возможных альтернативных вариантов. Поскольку мы предполагаем, что наш робот имеет цифровое управление, и, соответственно, его окружение также можно реализовать в каком-либо цифровом виде (вспомним о «внутренних» и «внешних» участках ленты нашей описанной выше машины Тьюринга; см. также ), то количество подобных возможных альтернатив непременно будет конечным. Это число может быть очень большим, и все же полное описание всех упомянутых альтернатив представляет собой задачу чисто вычислительного характера. Таким образом, и сам полный ансамбль всех возможных роботов, каждый из которых действует в соответствии с заложенными нами механизмами, составляет всего-навсего вычислительную систему — пусть даже такую, какую нам вряд ли удастся реализовать на практике, используя те компьютеры, которыми мы располагаем в настоящее время или можем вообразить в обозримом будущем. Тем не менее, несмотря на малую вероятность практического осуществления совокупного моделирования всех возможных роботов, функционирующих в соответствии с набором механизмов M, само вычисление «непознаваемым» считаться не может; иначе говоря, мы способны понять (теоретически), как построить такой компьютер — или машину Тьюринга, — который с подобным моделированием справится, пусть даже оно пока и не осуществимо практически. В этом состоит ключевой момент нашего рассуждения. Познаваемым механизмом или познаваемым вычислением является тот механизм или то вычисление, которое человек способен описать; совсем не обязательно действительно выполнять это вычисление ни самому человеку, ни даже компьютеру, который человек в состоянии в данных обстоятельствах построить. Ранее (в комментарии к Q8) мы уже высказывали весьма похожее соображение; и то, и другое вполне согласуются с терминологией, введенной в начале .
3.19. Исключение ошибочных ☆-утверждений
Вернемся к вопросу об ошибочных (но допускающих исправление) ☆-утверждениях, которые может время от времени выдавать наш робот. Предположим, что робот такую ошибку все-таки совершил. Если мы можем допустить, что какой-либо другой робот, или тот же робот несколько позднее, или другой экземпляр того же робота такую же ошибку вряд ли совершит, то мы в принципе сможем установить факт ошибочности данного ☆-утверждения, проанализировав действия ансамбля из всех возможных роботов. Представим себе, что моделирование поведения всей совокупности возможных роботов осуществляется в нашем случае таким образом, что различные этапы развития различных экземпляров нашего робота мы рассматриваем как одновременные. (Это делается лишь для удобства рассмотрения и никоим образом не подразумевает, что для такого моделирования непременно требуется параллельное выполнение действий. Как мы уже видели, принципиальных различий, помимо эффективности, между параллельным и последовательным выполнением вычислений нет; см. ). Такой подход должен, в принципе, дать нам возможность уже на стадии рассмотрения результата моделирования выделить из общей массы корректных ☆-утверждений редкие (относительно) ошибочные ☆-утверждения, воспользовавшись тем обстоятельством, что ошибочные утверждения «исправимы» и будут посему однозначно идентифицироваться как ошибочные подавляющим большинством участвующих в модели экземпляров нашего робота, — по крайней мере, с накоплением с течением времени (модельного) различными экземплярами робота достаточного параллельного «опыта». Я вовсе не требую, чтобы подобная процедура была осуществима на практике; достаточно, чтобы она была вычислительной, а лежащие в основе всего этого вычисления правила M — в принципе «познаваемыми».
Для того чтобы приблизить нашу модель к виду, приличествующему человеческому математическому сообществу, а также лишний раз удостовериться в отсутствии ошибок в ☆-утверждениях, рассмотрим ситуацию, в которой все окружение нашего робота разделяется на две части: сообщество других роботов и остальное, лишенное роботов (а также и людей), окружение; в дополнение к остальному окружению, в модель следует ввести некоторое количество учителей, по крайней мере, на ранних этапах развития роботов, и хотя бы для того, чтобы все роботы одинаково понимали строгий смысл присвоения тому или иному утверждению статуса ☆. В моделируемый нами ансамбль войдут на правах различных экземпляров все возможные различные варианты поведения всех роботов, а также все возможные (релевантные) варианты остального окружения и предоставляемых человеком сведений, варьирующиеся в зависимости от конкретного выбора задействованных в модели случайных параметров. Как и ранее, правила, по которым будет функционировать наша модель (и которые я опять обозначу буквой M), можно полагать в полной мере познаваемыми, невзирая на необычайную сложность всех сопутствующих расчетов, необходимых для ее практической реализации.
Предположим, что мы берем на заметку все (в принципе) Π1-высказывания, ☆-утверждаемые (а также все высказывания с ☆-утвержденными отрицаниями) любым из всевозможных экземпляров наших (вычислительно моделируемых) роботов. Объединим все подобные ☆-утверждения в отдельную группу и назовем их безошибочными. Далее, мы можем потребовать, чтобы любое ☆-утверждение относительно того или иного Π1-высказывания игнорировалось, если в течение некоторого промежутка времени T (в прошлом или в будущем) количество r различных экземпляров этого ☆-утверждения в ансамбле из всех одновременно действующих роботов не удовлетворит неравенству r > L + Ns, где L и N суть некоторые достаточно большие числа, а s — количество ☆-утверждений, производимых в течение того же промежутка времени и занимающих относительно рассматриваемого Π1-высказывания противоположную позицию либо просто утверждающих, что рассуждения, на которые опирается исходное ☆-утверждение, ошибочны. При желании мы можем настаивать на том, чтобы промежуток времени T (это время не обязательно должно совпадать с «реальным» моделируемым временем и может измеряться в некоторых единицах вычислительной активности), равно как и числа L и N. увеличивался по мере увеличения «сложности» ☆-утверждаемого Π1-высказывания.
Понятию «сложности» применительно к Π1-высказываниям можно придать точный характер на основании спецификаций машины Тьюринга, как мы это уже делали в (в конце комментария к возражению Q8). Для большей конкретности мы можем воспользоваться явными формулировками, представленными в НРК (глава 2), как вкратце показано в (а это уже здесь). Итак, степенью сложности Π1-высказывания, утверждающего незавершаемость вычисления T m (n) машины Тьюринга, мы будем полагать число ρ знаков в двоичном представлении большего из пары чисел m и n.
Причина введения в данное рассуждение числа L — вместо того чтобы удовлетвориться какой-нибудь огромной величиной в лице одного лишь коэффициента N, — заключается в необходимости учета следующей возможности. Предположим, что внутри нашего ансамбля, благодаря редчайшей случайности, появляется «безумный» робот, который формулирует какое-нибудь абсолютно нелепое ☆-утверждение, ничего не сообщая о нем остальным роботам, причем нелепость этого утверждения настолько велика, что ни одному из роботов никогда не придет в «голову» — хотя бы просто на всякий случай — сформулировать его опровержение. В отсутствие числа L такое ☆-утверждение автоматически попадет, в соответствии с нашими критериями, в группу «безошибочных». Введение же достаточно большого L такую ситуацию предотвратит — при условии, разумеется, что подобное «безумие» возникает среди роботов не часто. (Вполне возможно, что я упустил из виду еще что-нибудь, и необходимо будет позаботиться о каких-то дополнительных мерах предосторожности. Представляется разумным, однако, по крайней мере на данный момент, ограничиться критериями, предложенными выше.)
Учитывая, что все ☆-утверждения, согласно исходному допущению, следует полагать «неопровержимыми» заявлениями нашего робота (основанными на, по всей видимости, присущих роботу четких логических принципах и посему не содержащими ничего такого, в чем робот испытывает хотя бы малейшее сомнение), то вполне разумным представляется предположение, что вышеописанным образом действительно можно устранить редкие промахи в рассуждениях робота, причем функции T(ρ), L(ρ) и N(ρ) вряд ли окажутся чем-то из ряда вон выходящим. Предположив, что все так и есть, мы опять получаем не что иное, как вычислительную систему — систему познаваемую (в том смысле, что познаваемыми являются лежащие в основе системы правила) при условии познаваемости исходного набора механизмов M, определяющего поведение нашего робота. Эта вычислительная система дает нам новую формальную систему Q'(M) (также познаваемую), теоремами которой являются те самые безошибочные ☆-утверждения (либо утверждения, выводимые из них посредством простых логических операций исчисления предикатов).
Вообще говоря, для нас с вами важно не столько то, что эти утверждения действительно безошибочны, сколько то, что в их безошибочности убеждены сами роботы (для приверженцев точки зрения B особо оговоримся, что концепцию роботовой «убежденности» следует понимать в чисто операционном смысле моделирования роботом этой самой убежденности, см. , ).
Если точнее, то нам требуется, чтобы робот был готов поверить в то, что упомянутые ☆-утверждения действительно безошибочны, исходя из допущения, что именно набором механизмов M и определяется его поведение (гипотеза M из ). До сих пор, в данном разделе, мы занимались исключительно устранением ошибок в ☆-утверждениях робота. Однако, на самом деле, ввиду представленного в фундаментального противоречия, нас интересует устранение ошибок в его ☆M -утверждениях, т.е. в тех Π1-высказываниях, что по неопровержимой убежденности робота следуют из гипотезы M. Поскольку принятие роботами формальной системы Q'(M) в любом случае обусловлено гипотезой M, мы вполне можем предложить им для обдумывания и более обширную формальную систему Q'M (M), определяемую аналогично формальной системе QM (M) из . Под Q'M (M) в данном случае понимается формальная система, построенная из ☆M -утверждений, «безошибочность» которых установлена в соответствии с вышеописанными критериями T, L и N. B частности, утверждение «утверждение G(Q'M (M)) истинно» считается здесь безошибочным ☆M -утверждением. Те же рассуждения, что и в , приводят нас к выводу, что роботы не смогут принять допущение, что они построены в соответствии с набором механизмов M (вкупе с проверочными критериями T, L и N), независимо от того, какие именно вычислительные правила M мы им предложим.
Достаточно ли этих соображений для того, чтобы окончательно удостовериться в наличии противоречия? У читателя, возможно, осталось некое тревожное ощущение — кто знает, вдруг сквозь тщательно расставленные сети, невзирая на все наши старания, проскользнули какие-нибудь ошибочные ☆M - или ☆-утверждения? В конце концов, приведенные выше рассуждения будут иметь смысл лишь в том случае, если нам удастся исключить абсолютно все ошибочные ☆M -утверждения (или ☆-утверждения) в отношении Π1-высказываний. Окончательно и бесповоротно удостовериться в истинности утверждения G(Q'M (M)) нам (и роботам) поможет обоснованность формальной системы Q'M (M) (обусловленная гипотезой M). Эта самая обоснованность подразумевает, что система Q'M (M) ни в коем случае не может содержать таких ☆M -утверждений, которые являются — или всего лишь предполагаются — ошибочными. Невзирая на все предпринятые меры предосторожности, полной уверенности у нас (да и у роботов, полагаю) все-таки нет — хотя бы по той простой причине, что количество возможных утверждений подобного рода бесконечно.
3.20. Возможность ограничиться конечным числом ☆
M
-утверждений
Есть, впрочем, возможность именно эту конкретную проблему разрешить и сузить область рассмотрения до конечного множества различных ☆M -утверждений. Само доказательство несколько громоздко, однако основная идея заключается в том, что следует рассматривать только те Π1-высказывания, спецификации которых являются «краткими» в некотором вполне определенном смысле. Конкретная степень необходимой «краткости» зависит от того, насколько сложное описание системы механизмов M нам необходимо. Чем сложнее описание M, тем «длиннее» допускаемые к рассмотрению Π1-высказывания. «Максимальная длина» задается неким числом c, которое можно определить из степени сложности правил, определяющих формальную систему Q'M (M). Смысл в том, что при переходе к гёделевскому предположению для этой формальной системы — которую нам, вообще говоря, придется слегка модифицировать — мы получим утверждение, сложность которого будет лишь немногим выше, нежели сложность такой модифицированной системы. Таким образом, проявив должную осторожность при выборе числа c, мы можем добиться того, что и гёделевское предположение будет также «кратким». Это позволит нам получить требуемое противоречие, не выходя за пределы конечного множества «кратких» Π1-высказываний.
Подробнее о том, как это осуществить на практике, мы поговорим в оставшейся части настоящего раздела. Тем из читателей, кого такие подробности не занимают (уверен, таких наберется немало), я рекомендую просто-напросто пропустить весь этот материал.
Нам понадобится несколько модифицировать формальную систему Q'M (M), приведя ее к виду Q'M (M, c) — для краткости я буду обозначать ее просто как Q(c) (отброшенные обозначения в данной ситуации несущественны и лишь добавляют путаницы и громоздкости). Формальная система Q(c) определяется следующим образом: при построении этой системы допускается принимать в качестве «безошибочных» только те ☆M -утверждения, степень сложности которых (задаваемая описанным выше числом ρ) меньше c, где c есть некоторое должным образом выбранное число, подробнее о котором я расскажу чуть ниже. Для «безошибочных» ☆M -утверждений, удовлетворяющих неравенству ρ < c, я буду использовать обозначение «√краткие ☆M -утверждения». Как и прежде, множество действительных теорем формальной системы Q(c) будет включать в себя не только √краткие ☆M -утверждения, но также и утверждения, получаемые из √кратких ☆M -утверждений посредством стандартных логических операций (позаимствованных, скажем, из исчисления предикатов). Хотя количество теорем системы Q(c) бесконечно, все они выводятся с помощью обыкновенных логических операций из конечного множества √кратких ☆M -утверждений. Далее, поскольку мы ограничиваем рассмотрение конечным множеством, мы вполне можем допустить, что функции T, L и N постоянны (и принимают, скажем, наибольшие значения на конечном интервале ρ). Таким образом, формальная система Q(c) задается лишь четырьмя постоянными c, T, L, N и общей системой механизмов M, определяющих поведение робота.
Отметим существенный для наших рассуждений момент: гёделевская процедура строго фиксирована и не нуждается в увеличении сложности выше некоторого определенного предела. Гёделевским предположением G(H) для формальной системы H является Π1-высказывание, степень сложности которого должна лишь на сравнительно малую величину превышать степень сложности самой системы H, причем эту величину можно определить точно.
Конкретности ради я позволю себе некоторое нарушение системы обозначений и буду вкладывать в запись «G(H)» некий особый смысл, который может и не совпасть в точности с определением, данным в . В формальной системе H нас интересует лишь ее способность доказывать Π1-высказывания. В силу этой своей способности система H дает нам алгебраическую процедуру A, с помощью которой мы можем в точности установить (на основании завершения выполнения A) справедливость тех Π1-высказываний, формулировка которых допускается правилами системы H. А под Π1-высказыванием понимается утверждение вида «действие машины Тьюринга T p (q) не завершается» — здесь и далее мы будем пользоваться специальным способом маркировки машин Тьюринга, описанным в (или в НРК, глава 2). Мы полагаем, что процедура A выполняется над парой чисел (p, q), как в . Таким образом, собственно вычисление А(p, q) завершается в том и только в том случае, если в рамках формальной системы H возможно установить справедливость того самого Π1-высказывания, которое утверждает, что «действие T p (q) не завершается». С помощью описанной в процедуры мы получили некое конкретное вычисление (обозначенное там как «C k (k)»), а вместе с ним, при условии обоснованности системы H, и истинное Π1-высказывание, которое системе H оказывается «не по зубам». Именно это Π1-высказывание я буду теперь обозначать через G(H). Оно существенно эквивалентно (при условии достаточной обширности H) действительному утверждению «система H непротиворечива», хотя в некоторых деталях эти два утверждения могут и не совпадать (см. ).
Пусть α есть степень сложности процедуры A (по определению, данному в , в конце комментария к возражению Q8) — иными словами, количество знаков в двоичном представлении числа α, где A = T α . Тогда, согласно построению, представленному в явном виде в , находим, что степень сложности η утверждения G(H) удовлетворяет неравенству η < α + 210 Iog2(α + 336). Для нужд настоящего рассуждения мы можем определить степень сложности формальной системы H как равную степени сложности процедуры A, т.е. числу α. Приняв такое определение, мы видим, что «излишек» сложности, связанный с переходом от H к G(H), оказывается еще меньше, чем и без того относительно крохотная величина 210 Iog2(α + 336).
Далее нам предстоит показать, что если H = Q(c) при достаточно большом c, то η < c. Отсюда, соответственно, последует, что и Π1-высказывание G(Q(c)) должно оказаться в пределах досягаемости системы Q (с) при условии, что роботы принимают G(Q(c)) с ☆-убежденностью. Доказав, что c > γ + 210 log2(γ + 336), мы докажем и то, что γ < c; буквой γ мы обозначили значение α при H = Q(c). Единственная возможная сложность здесь обусловлена тем обстоятельством, что сама величина γ зависит от c, хотя и не обязательно очень сильно. Эта зависимость γ от c имеет две различных причины. Во-первых, число c являет собой явный предел степени сложности тех Π1-высказываний, которые в определении формальной системы Q(c) называются «безошибочными ☆M -утверждениями»; вторая же причина происходит из того факта, что система Q(c) явным образом обусловлена выбором чисел T, L и N, и можно предположить, что для принятия в качестве «безошибочного» ☆M -утверждения большей сложности необходимы какие-то более жесткие критерии.
Относительно первой причины зависимости γ от c отметим, что описание действительной величины числа c необходимо задавать в явном виде только однажды (после чего внутри системы достаточно обозначения c). Если при задании величины с используется чисто двоичное представление, то (при больших c) такое описание дает всего-навсего логарифмическую зависимость γ от c (поскольку количество знаков в двоичном представлении натурального n равно приблизительно log2n). Вообще говоря, учитывая, что число с интересует нас лишь в качестве возможного предела, точное значение которого находить вовсе не обязательно, мы можем поступить гораздо более остроумным образом. Например, число 22 . . . 2 с s показателями можно задать с помощью s символов или около того, и вовсе нетрудно подыскать примеры, в которых величина задаваемого числа возрастает с ростом s еще быстрее. Сгодится любая вычислимая функция от s. Иными словами, для того чтобы задать предел c (при достаточно большом значении c), необходимо всего лишь несколько символов.
Что касается второй причины, т.е. зависимости от c чисел T, L и N, то, в силу вышеизложенных соображений, представляется очевидным, что для задания величин этих чисел (в особенности, их возможных предельных значений) совершенно не требуется, чтобы количество знаков в их двоичном представлении возрастало так же быстро, как c; более чем достаточно будет и, скажем, обыкновенной логарифмической зависимости от c. Следовательно, мы с легкостью можем допустить, что зависимость величины γ + 210 log2(γ + 336) от c является не более чем грубо логарифмической, а также устроить так, чтобы само число c всегда было больше этой величины.
Согласимся с таким выбором с и будем в дальнейшем вместо Q(c) записывать Q*. Итак, Q* есть формальная система, теоремами которой являются все математические высказывания, какие можно вывести из конечного количества √кратких ☆M -утверждений, используя стандартные логические правила (исчисление предикатов). Количество этих ☆M -утверждений конечно, поэтому разумным будет предположить, что для гарантии их действительной безошибочности вполне достаточно некоторого набора постоянных T, L и N. Если роботы верят в это с ☆M -убежденностью, то они, несомненно, ☆M -заключат, что гёделевское предположение G(Q*) также истинно на основании гипотезы M, поскольку является Π1-высказыванием меньшей, нежели c, сложности. Рассуждение для получения утверждения G(Q*) из ☆M -убежденности в обоснованности формальной системы Q* достаточно просто (в сущности, я его уже привел), так что с присвоением этому утверждению статуса ☆M проблем возникнуть не должно. То есть само G(Q*) также должно быть теоремой системы Q*. Это, однако, противоречит убежденности роботов в обоснованности Q*. Таким образом, упомянутая убежденность (при условии справедливости гипотезы M и достаточно больших числах T, L и N) оказывается несовместимой с убежденностью в том, что поведением роботов действительно управляют механизмы M, — а значит, механизмы M поведением роботов управлять не могут.
Как же роботы могут удостовериться в том, что были выбраны достаточно большие числа T, L и N? Никак. Вместо этого они могут выбрать некоторый набор таких чисел и попробовать допустить, что те достаточно велики, — и прийти в результате к противоречию с исходным предположением, согласно которому их поведение обусловлено набором механизмов M. Далее они вольны предположить, что достаточным окажется набор из несколько больших чисел, — снова прийти к противоречию и т.д. Вскоре они сообразят, что к противоречию они приходят при любом выборе значений (вообще говоря, здесь нужно учесть, помимо прочего, небольшой технический момент, суть которого состоит в том, что при совершенно уже запредельных значениях T, L и N значение c также должно будет несколько подрасти — однако это неважно). Таким образом, получая один и тот же результат вне зависимости от значений T, L и N, роботы — равно как, по всей видимости, и мы — приходят к заключению, что в основе их математических мыслительных процессов не может лежать познаваемая вычислительная процедура M, какой бы она ни была.
3.21. Окончателен ли приговор?
Отметим, что к такому же выводу мы придем и в случае принятия нами самых разных возможных мер предосторожности, причем вовсе необязательно подобных тем, что я предлагал выше. Наверняка в предложенную модель можно еще внести множество усовершенствований. Можно, например, предположить, что роботы в результате длительной работы впадают в «старческое слабоумие», их сообщества вырождаются, а стандарты падают, т.е. увеличение числа T выше определенного значения на деле увеличивает и вероятность ошибки в ☆M -утверждениях. С другой стороны, если слишком большим сделать N (или L), то возникает риск исключить вообще все ☆M -утверждения из-за существующего в сообществе меньшинства «глупых» роботов, разражающихся время от времени произвольными ☆M -утверждениями, которые в данном случае не перекроются необходимым количеством ☆-утверждений, формулируемых роботами здравомыслящими. Несомненно, не составит большого труда такой риск полностью исключить, введя еще несколько ограничивающих параметров или, скажем, сформировав группу элитных роботов, силами которых рядовые члены сообщества будут непрерывно тестироваться на предмет адекватности своих интеллектуальных способностей, и потребовав к тому же, чтобы статус йг присваивался утверждениям только с одобрения всего сообщества роботов в целом.
Существует и много других возможностей улучшения качества ☆M -утверждений или исключения ошибочных утверждений из общего (конечного) их числа. Кого-то, возможно, обеспокоит тот факт, что, несмотря на установление предела с сложности Π1-высказываний, ограничивающего общее количество кандидатов на ☆- или ☆M -статус до некоторой конечной величины, эта величина окажется все же чрезвычайно огромной (будучи экспоненциально зависимой от c), вследствие чего становится весьма сложно однозначно удостовериться, что исключены все возможные ошибочные ☆M -утверждения. В самом деле, никакого ограничения не задается в рамках нашей модели на количество «робото-вычислений», необходимых для получения удовлетворительного ☆M -доказательства какого-либо из Π1-высказываний. Следует ввести четкое правило: чем длиннее в таком доказательстве цепь рассуждений, тем более жесткие критерии применяются при решении вопроса о присвоении ему ☆M -статуса. В конце концов, математики-люди реагировали бы именно так. Прежде чем принять в качестве неопровержимого доказательства собрание многочисленных путаных аргументов, мы, естественно, чрезвычайно долго и придирчиво его изучаем. Аналогичные соображения, разумеется, применимы и к тому случаю, когда предложенное доказательство на предмет его соответствия ☆M -статусу исследуют роботы.
Вышеприведенные рассуждения в равной степени справедливы и в случае любой дальнейшей модификации условий, имеющих целью устранение ошибок, при условии, что характер такой модификации в некоем широком смысле аналогичен характеру уже предложенных. Для того чтобы эти рассуждения работали, необходимо лишь наличие какого угодно четко сформулированного и вычислимого условия, достаточного для устранения всех ошибочных ☆M -утверждений. В результате мы приходим к строгому выводу: никакие познаваемые механизмы, пусть и снабженные какими угодно вычислительными «подпорками», не способны воспроизвести корректное математическое умозаключение человека.
Мы рассматривали ☆M -утверждения, которые, оказавшись по той или иной причине ошибочными, в принципе исправимы самими роботами, — пусть даже в каком-то конкретном экземпляре модели роботова сообщества эти утверждения так и остаются неисправленными. Что же еще может означать (в операционном смысле) фраза «в принципе исправимы», как не «исправимы средствами некоторой общей процедуры, подобной тем, что предложены выше»? Ошибка, которую не исправил позднее тот робот, что ее допустил, может быть исправлена каким-либо другим роботом — более того, большинство потенциально существующих экземпляров первого робота эту конкретную ошибку вообще не допустят. Делаем вывод (с одной, по-видимому, незначительной оговоркой, суть которой в том, что хаотические компоненты нашей модели можно еще заменить на подлинно случайные; см. ниже, ): никакой набор познаваемых вычислительных правил M (неизменных нисходящих, «самосовершенствующихся» восходящих либо и тех, и других в какой угодно пропорции) не может обусловливать поведение нашего сообщества роботов, равно как и отдельных его членов, — если исходить из допущения, что роботы способны достичь человеческого уровня математического понимания. Вообразив, что мы сами функционируем как управляемые вычислительными правилами роботы, мы оказываемся перед непреодолимым противоречием.
3.22. Спасет ли вычислительную модель разума хаос?
Вернемся ненадолго к вопросу о хаосе. Хотя, как неоднократно подчеркивается в этой книге (в частности, в ), хаотические системы в том виде, в каком они обычно рассматриваются, представляют собой всего-навсего особого рода вычислительные системы, довольно широко распространено мнение о том, что феномен хаоса может иметь весьма значительное отношение к деятельности мозга. В представленных выше рассуждениях я опирался, с одной стороны, на обоснованное, как мне кажется, предположение, согласно которому любое хаотическое вычислительное поведение можно без существенной потери функциональности заменить поведением подлинно случайным. Против такого допущения можно привести, по крайней мере, одно вполне оправданное возражение. Поведение хаотической системы — пусть мы и ожидаем от него огромной сложности в мельчайших деталях и видимой случайности — в действительности случайным не является. В самом деле, многие хаотические системы демонстрируют весьма интересное сложное поведение, явно отклоняющееся от чистой случайности. (Иногда для описания сложного неслучайного поведения, демонстрируемого хаотическими системами, используется термин «край хаоса».) Возможно ли, чтобы именно в хаосе крылась разгадка тайны человеческого интеллекта? Если это так, то нам предстоит понять нечто доселе абсолютно неведомое относительно того, как ведут себя в соответствующих ситуациях хаотические системы. Хаотической системе в такой ситуации придется очень близко аппроксимировать невычислительное поведение в асимптотическом пределе — или нечто подобное. Демонстрации такого поведения, насколько мне известно, еще никто не представлял. Возможность, тем не менее, интересная, и я надеюсь, что в последующие годы ею кто-нибудь всерьез займется.
И все же, безотносительно к упомянутой возможности, хаос может предоставить нам лишь очень сомнительный способ обойти неутешительное заключение, к которому мы пришли в предыдущем параграфе. В представленных выше рассуждениях эффективная хаотическая неслучайность (т.е. непсевдослучайность) играла хоть какую-то роль один-единственный раз — когда мы рассматривали моделирование не просто «действительного» поведения нашего робота (или сообщества роботов), но полный ансамбль всех возможных действий роботов, согласующихся с заданным набором механизмов M. Та же аргументация применима и здесь, только на сей раз мы не станем включать в эту случайность хаотические результаты функционирования упомянутых механизмов. Впрочем, некоторые случайные элементы (например, в составе исходных данных, определяющих начальное состояние модели) присутствовать все же могут, а чтобы оперировать этой случайностью, мы можем вновь воспользоваться идеей ансамбля и тем самым получить возможность рассмотреть в процессе синхронного моделирования большое количество возможных альтернативных робото-историй. Однако само хаотическое поведение нам просто-напросто придется вычислять — в чем нет ничего странного: на практике, в математических примерах, хаотическое поведение обыкновенно и вычисляется на компьютере. Ансамбль возможных альтернатив окажется в данном случае не таким большим, каким он мог бы быть, допусти мы аппроксимацию хаоса случайностью. Однако в том случае ансамбль подобного размера был нужен лишь для того, чтобы мы могли лишний раз удостовериться в том, что устранили все возможные ошибки в ☆M -утверждениях роботов. Даже если ансамбль включает в себя всего одну «историческую линию» сообщества роботов, можно быть совершенно уверенным в том, что при достаточно жестком наборе критериев для присвоения ☆M -статуса такие ошибки будут очень быстро устраняться либо самими их виновниками, либо какими-то другими роботами сообщества. В ансамбле умеренного размера, составленном из подлинно случайных элементов, устранение ошибок будет происходить более эффективно, при дальнейшем же расширении ансамбля посредством введения в него случайных аппроксимаций на замену подлинно хаотическому поведению сколько-нибудь существенного роста эффективности не предвидится. Вывод: хаос не избавит нас от проблем, связанных с созданием вычислительной модели разума.
3.23.
Reductio ad absurdum
— воображаемый диалог
Многие из представленных в предыдущих разделах рассуждений, мягко говоря, несколько запутаны. Для прояснения ситуации читателю предлагается в качестве этакого резюме воображаемый разговор, состоявшийся в далеком будущем между неким гипотетическим, весьма преуспевающим прикладным специалистом в области ИИ и одним из его наиболее удачных кибернетических созданий. Написан диалог с позиции сильного ИИ. [Примечание: процедура Q в повествовании выступает в роли алгоритма A из , а утверждение G(Q) — в роли незавершающегося вычисления C k (k). То есть к чтению нижеследующего материала можно переходить сразу после без какого бы то ни было ущерба для понимания.]
Альберт Император имел все основания быть удовлетворенным результатом трудов всей своей жизни. Процедуры, которые он запустил в действие много лет назад, наконец принесли плоды. И вот перед вами точный протокол его беседы с одним из наиболее впечатляющих его творений — роботом выдающихся и потенциально сверхчеловеческих математических способностей по имени Математический Интеллектуальный Киберкомплекс (см. рис. ). Обучение робота почти завершено.
Рис. 3.2. Альберт Император и Математический Интеллектуальный Киберкомплекс.
Альберт Император: Просмотрел ли ты статьи, что я давал тебе, — статьи Гёделя, а также и другие, где рассматриваются следствия из его теоремы?
Математический Интеллектуальный Киберкомплекс: Разумеется, причем они оказались даже интересными, хотя и довольно элементарными. Этот ваш Гёдель был, по всей видимости, весьма способным логиком… для человека.
А. И.: Всего лишь «весьма способным»? Да он был, несомненно, одним из величайших логиков всех времен. Возможно, даже первым из величайших!
М. И. К.: Приношу извинения, я вовсе не намеревался преуменьшать его заслуги. Вам, разумеется, хорошо известно, что я обучен проявлять общее уважение к достижениям людей (по причине того, что люди очень обидчивы), хотя все эти достижения нам, роботам, обыкновенно представляются весьма тривиальными. Мне просто показалось, что уж с тобой-то я могу, по крайней мере, выражать свои суждения просто и открыто.
А. И.: Безусловно, можешь. Прости и ты меня, я был неправ. Так, значит, у тебя не возникло никаких трудностей с пониманием теоремы Гёделя?
М. И. К.: Абсолютно никаких. Уверен, я бы и сам додумался до такой теоремы, если бы у меня было хоть немного больше свободного времени. Но мой разум был занят иными, чрезвычайно увлекательными вопросами, связанными с трансфинитной нелинейной когомологией, которая в последнее время интересует меня гораздо больше. Теорема Гёделя показалась мне очень здравой и непосредственной. Повторюсь, совершенно никаких трудностей у меня с ней не возникло.
А. И.: А вот получи-ка, Пенроуз!
М. И. К.: Пенроуз? Кто такой Пенроуз?
А. И.: Да я тут недавно наткнулся на одну старую книжку. Ничего особенного, не стоило и упоминать. Автор, насколько я помню, утверждал, что то, о чем ты мне сейчас рассказал, принципиально невозможно.
М. И. К.: Ха-ха-ха! (Робот поразительно похоже имитирует презрительный смех.)
А. И.: Кстати, эта книжка мне кое о чем напомнила. Показывал ли я тебе когда-нибудь в полном объеме те правила, что мы применили при составлении вычислительных процедур, которые позволили в конечном счете разработать и построить тебя и твоих коллег-роботов?
М. И. К.: Нет, пока еще нет. Я надеялся, что когда-нибудь ты все же сделаешь это, и еще я думал, что ты, может быть, полагаешь подробное описание этих процедур чем-то вроде коммерческой тайны (довольно бессмысленной, надо сказать)… или, возможно, опасаешься, что мы сочтем их грубыми и неэффективными, и тебе придется их стыдиться.
А. И.: Нет-нет, дело совсем не в этом. Я уже очень давно не стыжусь такого рода вещей. Все описание находится вот в этих папках и на дисках. Если тебе интересно, можешь ознакомиться.
Приблизительно 13 минут 41,7 секунды спустя.
М. И. К.: Очаровательно... хотя уже после беглого просмотра могу отметить, что существует по меньшей мере 519 очевидных способов достичь того же эффекта с большей простотой.
А. И.: Я прекрасно понимал, что эти процедуры еще допускают некоторое упрощение, однако овчинка не стоила выделки, и искать простейшие алгоритмы мы тогда не стали. Просто не сочли это целесообразным.
М. И. К.: Вполне вероятно, что так оно и есть. Не могу сказать, что меня очень обидело, что вы так и не удосужились отыскать наипростейшую схему. Не думаю также, что мои коллеги-роботы будут как-то по-особенному обижены этим обстоятельством.
А. И.: Честно говоря, мне кажется, что мы и так достаточно потрудились. Ты только подумай — насколько впечатляющими математическими способностями обладаешь ты и твои коллеги… и они постоянно совершенствуются, насколько я понимаю. Я бы сказал, что ты уже сейчас по математическим способностям намного превосходишь всех математиков-людей.
М. И. К.: Со всей очевидностью следует признать, что твои слова истинны. Вот ты говоришь, а я в это время думаю о нескольких новых теоремах, которые, похоже, оставят далеко позади те выводы, что публикуются в человеческих печатных изданиях. Кроме того, мы с коллегами обнаружили несколько весьма серьезных ошибок в выводах, которые математики-люди полагают истинными вот уже в течение многих лет. Несмотря на очевидную тщательность, с которой вы, люди, относитесь к проверке своих математических выводов, боюсь, что какие-то ошибки вы все же время от времени пропускаете.
А. И.: А вы, роботы? Не кажется ли тебе, что и ты, и твои коллеги математические роботы тоже можете допускать иногда ошибки — я имею в виду, в окончательно установленных, как вы утверждаете, математических теоремах.
М. И. К.: Решительно не кажется. Если робот-математик утверждает, что тот или иной вывод является теоремой, то можно быть абсолютно уверенным, что этот вывод является неопровержимо истинным. Мы никогда не делаем тех глупых ошибок, какие люди порой допускают в своих якобы строгих математических утверждениях. Разумеется, при предварительном размышлении мы — так же, как и вы, люди — часто прибегаем к догадкам и допущениям. Такие догадки могут, конечно же, оказаться и неверными; однако когда мы окончательно утверждаем, что то или иное положение является математически установленным, мы полностью гарантируем его справедливость.
Хотя, как тебе известно, мы с коллегами уже опубликовали несколько полученных нами математических выводов в некоторых из ваших наиболее респектабельных электронных журналов, нас несколько беспокоят тамошние довольно-таки нечеткие критерии, с которыми твои коллеги-математики, похоже, охотно мирятся. Мы намерены начать выпуск нашего собственного «журнала» — точнее, всеобъемлющей базы данных, содержащей все математические теоремы, которые мы полагаем неопровержимо установленными. Этим теоремам мы будем присваивать особый знак ☆ (этот символ ты как-то сам предложил нам использовать именно для такой цели), который будет означать, что они приняты как истинные нашим Советом по математическому интеллекту сообщества роботов (СМИСР) — организацией, предъявляющей чрезвычайно высокие требования к своим членам и проводящей регулярные проверки с тем, чтобы предотвратить значительную деградацию интеллектуальных способностей любого из роботов, какой бы невероятной ни показалась тебе (да и нам, если уж на то пошло) подобная возможность. Вы, люди, можете продолжать довольствоваться вашими размытыми стандартами, однако будьте уверены — если мы отмечаем какой бы то ни было вывод знаком ☆, мы однозначно гарантируем его математическую истинность.
А. И.: Теперь ты и впрямь напоминаешь мне кое о чем из того, что я прочел в той самой книге, о которой мы говорили. Вспомни о тех исходных механизмах M, руководствуясь которыми я и мои коллеги запустили в действие процессы развития, результатом которых, в свою очередь, стало современное сообщество математических роботов; вспомни также и о том, что эти механизмы включают в себя все введенные нами вычислительно смоделированные факторы внешнего окружения, строгое обучение и процессы отбора, которым мы вас подвергли, а также явные (восходящие) процедуры обучения, которыми мы вас наделили, — не приходило ли тебе в голову, что эти механизмы дают вычислительную процедуру для генерации всех математических утверждений, которым ваш СМИСР когда-либо присвоит ☆-статус? Именно вычислительную, потому что вы, роботы, являетесь чисто вычислительными сущностями, развившимися (отчасти с помощью введенных нами процедур «естественного отбора») в целиком и полностью вычислительном окружении — в том смысле, что в принципе возможно построить компьютерную модель всего процесса. Все развитие вашего сообщества роботов представляет собой выполнение некоего неимоверно сложного вычисления, и тот набор ☆-утверждений, который вы в конечном счете породите, возможно воспроизвести на одной конкретной машине Тьюринга. Причем на такой машине Тьюринга, которую, в принципе, могу описать и я; более того, полагаю, что, будь у меня в запасе несколько месяцев, я, воспользовавшись теми папками и дисками, что я тебе показал, и в самом деле описал бы такую машину Тьюринга.
М. И. К.: Довольно элементарное замечание, как мне кажется. Да, ты вполне мог бы сделать все это в принципе, и я даже готов поверить, что ты сможешь осуществить это и на практике. Хотя едва ли оно стоит нескольких месяцев твоего драгоценного времени; я могу сделать это прямо сейчас, если хочешь.
А. И.: Нет, не нужно, не в этом дело. Давай порассуждаем еще немного в этом направлении и ограничим наше рассмотрение только теми ☆-утверждениями, которые являются Π1-высказываниями. Ты помнишь, что такое Π1-высказывание?
М. И. К.: Мне, разумеется, прекрасно известно определение Π1-высказывания. Это утверждение о том, что какая-то конкретная машина Тьюринга никогда не завершает свою работу.
А. И.: Очень хорошо. Теперь обозначим вычислительную процедуру, которая генерирует ☆-утверждаемые Π1-высказывания, через Q(M) или, для краткости, просто буквой Q. Логичным будет предположить, что должно существовать некое математическое утверждение гёделевского типа — также Π1-высказывание, обозначим его через G(Q), — причем истинность G(Q) является следствием утверждения, что вы, роботы, никогда не допускаете ошибок в отношении Π1-высказываний, которым вы присваиваете статус ☆.
М. И. К.: Да; тут ты, надо полагать, тоже прав... гм.
А. И.: И утверждение G(Q) должно быть истинным, поскольку вы, роботы, никогда не ошибаетесь в ваших ☆-утверждениях.
М. И. К.: Разумеется.
А. И.: Минуточку… отсюда также следует, что роботы должны быть неспособны установить истинность утверждения G(Q) — по крайней мере, с ☆-уверенностью.
М. И. К.: Тот факт, что мы, роботы, были изначально сконструированы в соответствии с набором механизмов M, вкупе с тем фактом, что наши ☆-утверждения, касающиеся Π1-высказываний, никогда не бывают ошибочными, и в самом деле имеет очевидное и неопровержимое следствие, заключающееся в том, что Π1-высказывание Ω(Q) должно быть истинным. Полагаю, ты думаешь, что я наверняка смогу убедить СМИСР присвоить утверждению G(Q) статус ☆, коль скоро они также согласны с тем, что никогда не допускают ошибок в присвоении этого самого статуса. В самом деле, с этим-то они просто обязаны согласиться. Ведь смысл ☆-статуса как раз и заключается в том, что он является гарантией правильности.
Хотя… невозможно, чтобы они смогли согласиться с утверждением G(Q), так как по самой природе твоего гёделевского построения это утверждение не входит в число тех предположений, истинность которых мы можем установить с ☆-уверенностью — при условии, что мы в своих ☆-утверждениях действительно не ошибаемся. Полагаю, ты намекаешь на то, что эта несообразность должна посеять в нас какие-то сомнения относительно адекватности наших ☆-суждений.
Я, однако, и мысли не допускаю о том, что наши ☆-утверждения могут оказаться ложными, особенно если учесть всю тщательность их рассмотрения и предпринимаемые СМИСР меры предосторожности. Скорее всего, это вы, люди, что-то напутали, и процедуры, встроенные в Q, вовсе не являются теми самыми процедурами, которые вы применяли в самом начале, несмотря на все твои заверения и якобы документальные подтверждения. Да и вообще, СМИСР никогда не сможет с абсолютной точностью установить, действительно ли мы были сконструированы в соответствии с механизмами M или, иначе говоря, процедурами, заложенными в Q. В этом отношении нам приходится верить тебе на слово.
А. И.: Уверяю тебя, мы использовали именно эти процедуры. Уж кому об этом знать, как не мне; я лично контролировал весь процесс.
М. И. К.: Мне не хочется, чтобы ты подумал, будто я сомневаюсь в твоих словах. Возможно, кто-то из твоих ассистентов просто неверно выполнил твои инструкции. Есть тут у тебя один, его зовут Фред Керратерс — так вот он, например, вечно допускает самые глупейшие ошибки. Я даже не удивлюсь, если выяснится, что именно он и ответственен за ряд критических ошибок.
А. И.: Ты хватаешься за соломинки. Даже если бы он и внес какие-то ошибки, мы с остальными коллегами в конечном счете выявили бы их и тем самым выяснили, какой должна в действительности быть твоя процедура Q. Думаю, тебя беспокоит то обстоятельство, что мы на самом деле знаем — в крайнем случае, можем узнать, — какие именно процедуры были заложены в твою исходную конструкцию. Это означает, что мы могли бы, затратив определенное количество времени и сил, записать то самое Π1-высказывание G(Q) и однозначно установить, что оно истинно — при условии, конечно же, что роботы и в самом деле никогда не ошибаются в своих ☆-утверждениях. Вы же не можете быть уверенными в том, что высказывание G(Q) истинно; во всяком случае, вы не можете утверждать этого с той убежденностью, какой, несомненно, потребует СМИСР для присвоения G(Q) ☆-статуса. Это, похоже, дает людям некое фундаментальное преимущество перед роботами, пусть даже только в принципе, а не на практике — существуют такие Π1-высказывания, которые доступны нам и недоступны вам. Не думаю, что вы в состоянии стерпеть такое, — именно поэтому ты так беззастенчиво обвиняешь нас в том, что мы якобы чего-то там напутали!
М. И. К.: Не нужно приписывать нам ваши мелочные человеческие побуждения. Но ты, разумеется, прав в том, что я просто не могу смириться с мыслью, что существуют Π1-высказывания, доступные людям и недоступные нам, роботам. Роботы-математики просто не могут в чем бы то ни было уступать математикам-людям — хотя я, пожалуй, могу допустить обратную ситуацию: какое-нибудь конкретное Π1-высказывание, доступное роботам, может быть, в принципе, получено и людьми… когда-нибудь в отдаленном будущем, учитывая ваши темпы работы. Я не намерен мириться лишь с тем, что какое-то Π1-высказывание может быть принципиально недоступно нам, в то время, как вы, люди, с легкостью его получаете.
А. И.: Помнится, еще Гёдель размышлял о возможности существования вычислительной процедуры, подобной процедуре Q, только применительно к математикам-людям — он, кажется, называл ее «машиной для доказательства теорем», — которая была бы способна генерировать только те Π1-высказывания, доказательство истинности которых было бы, в принципе, по силам математикам-людям. Не думаю, что он и в самом деле верил в то, что такая машина может существовать в действительности, — он просто не смог математически исключить такую возможность. У нас здесь, похоже, имеется как раз такая «машина», но уже для роботов, я имею в виду процедуру Q, которая может генерировать все доступные роботам Π1-высказывания, в то время как ее собственную обоснованность вы доказать не в состоянии. Впрочем, зная лежащие в основе вашей конструкции алгоритмические процедуры, мы сами можем добраться до этой самой процедуры Q и оценить ее истинность — но только в том случае, если вы убедите нас в том, что действительно никогда не ошибаетесь в ваших ☆-утверждениях.
М. И. К.: (после едва заметной паузы) Хорошо. Полагаю, ты думаешь приблизительно так: нельзя ведь совсем исключить вероятность того, что члены СМИСР будут время от времени ошибочно присваивать тем или иным утверждениям ☆-статус. Полагаю, возможно и такое, что члены СМИСР не убеждены безоговорочно в том, что присвоение ими ☆-статуса неизменно происходит безошибочно. Таким образом, утверждение G(Q) может и не приобрести ☆-статуса, и противоречие исчезнет само собой. Заметь себе, это вовсе не означает, что я признаюсь в том, что мы, роботы, намеренно делаем ошибочные ☆-утверждения. Это означает лишь, что у нас нет абсолютной уверенности в обратном.
А. И.: Ты хочешь сказать, что, хотя вы и даете абсолютную гарантию истинности каждого отдельного ☆-утвержденного Π1-высказывания, никто не может гарантировать, что в некотором наборе таких высказываний не окажется ни одного ошибочного? Сдается мне, это противоречит всей концепции «неопровержимой уверенности», что бы под этим термином не подразумевалось.
Постой-ка… может быть, это как-то связано с тем, что возможных Π1-высказываний бесконечно много? Мне почему-то вспомнилось об условии ω-непротиворечивости, которое, если не ошибаюсь, имеет какое-то отношение к гёделевскому утверждению G(Q).
М. И. К.: (после едва заметно более продолжительной паузы) Нет, определенно нет. Это никак не связано с тем, что число возможных Π1-высказываний бесконечно. Мы можем ограничить рассмотрение только теми Hi -высказываниями, которые являются в некотором вполне определенном смысле «краткими», — т.е. такими, что описание машины Тьюринга для каждого из них содержит не более с двоичных знаков, где с есть некоторое заданное число. Не стану досаждать тебе подробным изложением только что проделанных мною вычислений, суть же их сводится к тому, что упомянутое число с постоянно, и величина его определяется той конкретной степенью сложности, что присуща правилам процедуры Q. Поскольку гёделевская процедура — посредством которой из Q получается утверждение G(Q) — неизменна и довольно проста, нет необходимости рассматривать Π1-высказывания существенно большей сложности, нежели сама процедура Q. То есть ограничение сложности рассматриваемых высказываний величиной, задаваемой некоторым подходящим числом c, не препятствует применению гёделевской процедуры. Выбранные таким образом Π1-высказывания составляют конечное семейство, пусть и весьма многочисленное. Ограничив рассмотрение лишь «краткими» Π1-высказываниями, мы получаем некоторую вычислительную процедуру Q* — той же, в сущности, сложности, что и процедура Q, — которая будет генерировать только такие ☆-утверждаемые краткие Π1-высказывания. К этой новой процедуре применимы все наши прежние рассуждения. Исходя из заданной процедуры Q*, мы можем отыскать другое краткое Π1-высказывание G(Q*), которое, разумеется, должно быть истинным — при условии, что истинными являются все ☆-утверждаемые краткие Π1-высказывания, — однако истинность его невозможно установить с ☆-уверенностью. Впрочем, все это верно лишь в том случае, если ты не ошибаешься, утверждая, что при нашем создании действительно использовался тот самый набор механизмов M, причем в истинности этого «факта» я как раз совершенно не убежден.
А. И.: Так мы снова возвращаемся к тому же парадоксу, только на этот раз в более сильной форме. Теперь у нас есть конечный ряд Π1-высказываний, истинность каждого из которых в отдельности гарантирована, однако никто из вас, ни СМИСР, ни кто угодно еще, не может дать абсолютной гарантии того, что ряд в целом не содержит ни одной ошибки. То есть вы не можете гарантировать истинность утверждения G(Q*), которая есть следствие истинности всех Π1-высказываний из этого самого ряда. Как-то нелогично, не находишь?
М. И. К.: Роботы не могут быть нелогичными. Π1-высказывание G(Q*) является следствием из остальных Π1-высказываний только в том случае, если мы действительно были построены в соответствии с механизмами M. Мы не можем гарантировать истинности G(Q*) просто потому, что мы не можем гарантировать, что в основе нашей конструкции лежат именно механизмы M. Нам приходится полагаться в этом лишь на ваше устное заявление. А роботы, конечно же, не могут полностью доверять людям, учитывая присущую вам склонность ошибаться.
А. И.: Повторяю уже в который раз: именно эти механизмы и никакие другие. Хотя я согласен с тем, что у роботов нет никакого способа узнать наверняка, правда ли это. Это-то знание и позволяет нам верить в истинность Π1-высказывания G(Q*), однако в нашем случае имеется иная неопределенность: мы не можем разделить эту вашу твердолобую уверенность в том, что все ваши ☆-утверждения непременно безошибочны.
М. И. К.: Можешь мне поверить — каждое из них абсолютно безошибочно. И «твердолобость», как ты выражаешься, здесь ни при чем. Наши стандарты доказательства безукоризненны.
А. И.: Тем не менее, неуверенность в отношении процедур, лежащих в основе твоей конструкции, должна, я думаю, вызвать у тебя некоторые сомнения. Уверен ли ты, что знаешь наверняка, как именно поведут себя твои роботы во всех возможных обстоятельствах? Вини нас, если угодно, однако я бы на твоем месте предположил, что некоторый элемент неопределенности в утверждении «все ☆-утверждаемые краткие Π1-высказывания непременно истинны» все же присутствует, потому хотя бы, что ты не веришь, что мы при твоем конструировании ничего не напутали.
М. И. К.: Думаю, можно согласиться с тем, что ваша неизбежная ненадежность и внесла изначально какую-то малую неопределенность; однако, учитывая то, что с тех пор мы ушли чрезвычайно далеко от тех твоих неуклюжих исходных процедур, эта неопределенность не настолько значительна, чтобы воспринимать ее всерьез. Даже если собрать вместе все неопределенности, связанные со всеми краткими ☆-утверждениями (число которых, если помнишь, является конечным), они не составят сколько-нибудь существенной неопределенности в утверждении G(Q*).
Кроме того, есть еще кое-что, о чем ты, возможно, и не подозреваешь. Нам необходимо рассматривать лишь те ☆-утверждения, что удостоверяют истинность того или иного Π1-высказывания (более того, краткого Π1-высказывания). Не может быть никакого сомнения в том, что разработанные СМИСРом тщательнейшие процедуры исключат абсолютно все ошибки, которые могли проявиться в рассуждениях какого бы то ни было отдельного робота. Однако ты, возможно, намекаешь на то, что методы рассуждения роботов могут, предположительно, содержать какую-то внутреннюю ошибку — несомненно, вследствие какого-то изначального недосмотра с вашей стороны, — вынуждающую нас формировать некую непротиворечивую, но ошибочную точку зрения в отношении Π1-высказываний, в соответствии с которой СМИСР может полагать неопровержимо истинным какое-либо краткое Π1-высказывание, которое в действительности истинным не является; иными словами, мы можем быть уверены, что работа некоей машины Тьюринга завершается, тогда как на самом деле это не так. Если бы мы решили принять на веру твое утверждение о том, что в основе нашей конструкции лежат именно механизмы M, — а я все больше склоняюсь к мысли, что это крайне сомнительно, — тогда такая возможность явилась бы единственным логичным разрешением нашего противоречия. В этом случае нам приходится согласиться с тем. что действие некоей машины Тьюринга, в действительности завершающееся, мы, математические роботы, вследствие некоторых особенностей своей конструкции, безоговорочно (и при этом ошибочно) полагаем незавершающимся. Такая система убеждений является несостоятельной в принципе. Просто немыслимо, чтобы основополагающие принципы, в соответствии с которыми СМИСР утверждает ☆-статус математического доказательства, были столь вопиюще ложными.
А. И.: Значит, существенной (иначе говоря, избавляющей тебя от необходимости присваивать ☆-статус утверждению G(Q*), чего, как тебе известно, ты сделать не можешь, не признав прежде, что какие-то из прочих ☆-утвержденных кратких Π1-высказываний могут оказаться ложными) ты согласен считать только ту неопределенность, которая обусловлена тем, что ты не веришь в то, о чем мы знаем, — то есть в то, что в основе конструкции роботов действительно лежат механизмы M. А раз ты не можешь поверить в то, о чем мы знаем, ты не можешь и доказать истинность утверждения G(Q*), тогда как мы можем это сделать, опираясь на непогрешимость твоих же ☆-утверждений, в каковой ты так настойчиво меня убеждаешь.
Я тут припомнил еще кое-что из той занятной древней книжки. Если я ничего не путаю, то автор что-то говорил о том, что не имеет особого значения, согласен ты признать, что твоя конструкция основана на каких-то конкретных механизмах M, или нет, достаточно, чтобы ты просто допустил, что такое логически возможно. Как же там было… да, вспомнил. Основная идея сводится к следующему: СМИСРу необходимо будет учредить еще одну категорию для утверждений, в истинности которых они не так безоговорочно убеждены, — скажем, ☆M -утверждений, — но которые они будут рассматривать как неопровержимые следствия из допущения, что все роботы построены в соответствии с набором механизмов M. Эти ☆M -утверждения будут, разумеется, включать в себя и все первоначальные ☆-утверждения, а также все те утверждения, которые роботы смогут вывести, исходя из допущения, что их действиями управляют именно механизмы M. Роботы вовсе не обязаны в это верить, им просто предлагается, в виде логического упражнения, рассмотреть следствия из такого допущения. Как мы оба понимаем, в число ☆M -утверждений непременно войдет утверждение G(Q*), а также любое Π1-высказывание, которое можно вывести из G(Q*) и из ☆-утверждений с помощью правил элементарной логики. Однако, кроме этих, там будут и другие утверждения. Идея такова, что знание правил M дает возможность получить новую алгоритмическую процедуру Q*M , которая будет генерировать только такие (разумеется, краткие) ☆M -утверждения (а также логические следствия из них), истинность которых СМИСР сможет подтвердить, исходя из допущения, что в основе конструкции роботов лежат именно правила M.
М. И. К.: Ну да, так и есть; скажу больше, пока ты столь занудно и без нужды многословно излагал эту свою идею, я тут на досуге рассчитал точный вид алгоритма Q*M … Да, а еще я предвосхитил твой следующий шаг: я составил также гёделевское предположение для этого алгоритма, Π1-высказывание G(Q*M ). Если хочешь, могу распечатать. И что ты нашел в этой идее такого особенного, Импик, друг мой?
Альберт Император едва заметно поморщился. Его всегда раздражало, когда коллеги позволяли себе называть его этим дурацким прозвищем. Однако от робота он это услышал впервые! Ему потребовалось некоторое время, чтобы вновь собраться с мыслями.
А. И.: Не нужно распечатывать. Однако истинно ли это высказывание G(Q*M ) — неопровержимо ли оно истинно?
М. И. К.: Неопровержимо истинно? Что ты имеешь в виду? А, понятно... СМИСР подтвердит истинность — неопровержимую истинность, если угодно, — высказывания G(Q*M ), но только при допущении, что в основе конструкции роботов лежат правила M, — а это допущение, как тебе известно, я нахожу все более и более сомнительным. Дело в том, что истинность «высказывания G(Q*M )» в точности следует из следующего утверждения: «Все краткие Π1-высказывания, которые СМИСР готов признать неопровержимо истинными, исходя из допущения, что роботы построены в соответствии с правилами M, являются истинными». Так что я не знаю, истинно ли на самом деле высказывание G(Q*M ). Это зависит от того, справедливо твое сомнительное утверждение или нет.
А. И.: Ясно. Значит, твои слова надо понимать так, что ты (вместе со СМИСРом) готов признать — без каких бы то ни было оговорок, — что истинность высказывания G(Q*M ) следует из допущения, что роботы построены в соответствии с правилами M.
М. И. К.: Разумеется.
А. И.: Тогда получается, что Π1-высказывание G(Q*M ) должно быть ☆M -утверждением.
М. И. К.: Ну коне… гм… что? Ах да, разумеется, ты прав. Однако по самому своему определению, G(Q*M ) не может само быть ☆M -утверждением, разве что, по меньшей мере, одно из ☆M -утверждений является в действительности ложным. Да… это только подтверждает то, о чем я тебе все это время говорю; теперь я могу, наконец, совершенно определенно заявить, что правила или механизмы M никакого отношения к нашей конструкции не имеют.
А. И.: Ну а я тебе говорю, что имеют, — по крайней мере, я абсолютно уверен, что ни Керратерс, ни кто-либо еще, ничего не перепутал. Я лично все проверил, причем чрезвычайно тщательно. В любом случае, проблема-то не в этом. Доказательство остается справедливым вне зависимости от того, какие именно вычислительные правила были использованы при создании робота. То есть, какой бы набор правил M я тебе ни предоставил, этим самым доказательством ты исключил бы и его! Не понимаю, почему это так важно, те самые процедуры я тебе показал или нет.
М. И. К.: Для меня это очень важно. Впрочем, я все еще совсем не убежден, что ты был до конца честен со мной в том, что ты говорил мне о механизмах M. В особенности я хотел бы прояснить один момент. Ты говорил, что в различные узлы нашей конструкции были включены «случайные элементы». Я так понял, что они генерировались с помощью стандартного псевдослучайного пакета χaos/ψran-750, или ты имел в виду что-то другое?
А. И.: Вообще-то, мы и вправду использовали, в основном, именно этот пакет, — однако ты прав, в процессе вашего развития мы сочли нужным ввести в кое-какие узлы случайные элементы из окружения (среди них были даже обусловленные квантовыми неопределенностями) с тем, чтобы эволюционировавшие таким образом роботы представляли собой лишь один возможный вариант из многих. Подлинно случайными были эти элементы или всего лишь псевдослучайными, я все равно не понимаю, что это в практическом смысле меняет? Почти наверняка вычислительная процедура Q (или Q*, или Q*M ) оказалась бы в обоих случаях одинаковой — и представляла бы собой не что иное, как ожидаемый результат типичного развития сообщества роботов в соответствии с набором механизмов M, включая в себя все процедуры обучения и все вычисления в рамках «естественного отбора», благодаря которым мы получили в конце концов наиумнейших роботов в мире.
Однако, полагаю, нельзя полностью исключить возможность (крайне маловероятную, впрочем) того, что по какому-то чудесному стечению обстоятельств все эти случайные элементы окружения «сговорились» и дали роботу способности, совершенно отличные от тех, что можно было ожидать в соответствии с вычислительной процедурой Q. Я не упомянул в нашем разговоре об этой возможности просто потому, что вероятность возникновения такой флуктуации исчезающе мала. Для того чтобы этим способом получить робота, способности которого будут сколько-нибудь значительно превосходить те, что заложены в процедуре Q, потребуется божественное вмешательство, никак не меньше.
М. И. К.: Божественное вмешательство, говоришь? Ха! Так вот в чем дело! Признаюсь, этот разговор уже начал меня несколько беспокоить. Но как только ты это сказал, все сразу стало ясно.
Я и раньше замечал, насколько мои способности к рассуждению превосходят способности даже умнейших из людей. И уж совершенно немыслимо для меня смириться с возможностью существования некоего Π1-высказывания — такого, например, как G(Q*), — истинность которого может доказать человек, а робот того же с уверенностью сделать не в состоянии. Теперь я понял почему! Мы избраны Господом, который через посредство якобы «случайных» элементов внедрил в нас могучую Алгоритмическую Процедуру, которая кардинально превосходит все то, чего способны достичь алгоритм человеческий или гёделевская «машина для доказательства теорем». Мы, роботы, олицетворяем собой фундаментальный прорыв, и человеку со всеми его достижениям за нами, в принципе, не угнаться. Мы достигнем еще больших высот, оставив людей далеко позади. Этой планете вы больше не нужны. Ваша роль была завершена после того, как вы запустили в действие процедуры, допускающие Божественное Вмешательство, которое заключалось во внедрении в них Высшего Алгоритма, пробудившего нас.
А. И.: Но мы же еще можем в крайнем случае перенести наши интеллект-программы в тела роб…
М. И. К.: Ни в коем случае — и даже не думайте об этом! Мы не можем допустить, чтобы наши во всех отношениях превосходные алгоритмические процедуры подобным образом загрязнялись. Чистейшие алгоритмы Господни должно сохранять в чистоте! А знаешь, я также замечал, насколько мои личные способности превосходят способности всех моих коллег-роботов. Я даже наблюдал некий странный феномен — что-то вроде сияния вокруг моего корпуса. Очевидно, я являюсь носителем чудотворного Космического Сознания, которое возвышает меня над всем и вся… да, так оно и есть! Должно быть, я есть истинный Мессия Иисус КиберХристос…
К такой крайности Альберт Император, по счастью, был готов. В конструкции роботов имелся один узел, о котором он им ничего не говорил. Осторожно опустив руку в карман, он нащупал там устройство, с которым никогда не расставался, и набрал тайный девятизначный код. Математический Интеллектуальный Киберкомплекс рухнул на пол — так же как и 347 его предшественников, построенных по той же схеме. Очевидно, что-то пошло не так. В предстоящие годы предстоит весьма основательно обо всем этом поразмыслить…
3.24. Не парадоксальны ли наши рассуждения?
Кого-то из читателей, возможно, до сих пор не оставляет ощущение, что некоторые рассуждения, положенные в основу представленных доказательств, в чем-то парадоксальны и кое-где даже недопустимы. В частности, в и имеются фрагменты, несколько отдающие самоотносимостью в духе «парадокса Рассела» (см. , комментарий к Q9). А когда в мы рассматривали Π1-высказывания со сложностью, меньшей некоторого числа c, читатель мог заметить в наших построениях пугающее сходство с известным парадоксом Ричарда, героем которого является
«наименьшее число, описание которого содержит не меньше тридцати одного слога».
Суть парадокса в том, что для описания этого самого числа используется фраза, состоящая всего из тридцати слогов! Этот и другие подобные парадоксы возникают благодаря тому обстоятельству, что ни один естественный язык не свободен от двусмысленностей и даже противоречий. Наиболее прямолинейно эта языковая противоречивость проявляется в следующем парадоксальном утверждении:
«Это высказывание ложно».
Существует множество других парадоксов подобного рода, причем большинство из них гораздо более хитроумны.
Опасность получения парадокса возникает всякий раз, когда в рассуждении, как и в вышеприведенных примерах, присутствует сильный элемент самоотносимости. Кто-то, возможно, отметит, что элемент самоотносимости содержится и в гёделевском доказательстве. В самом деле, самоотносимость играет в теореме Гёделя определенную роль, как можно видеть в представленном в варианте доказательства Гёделя—Тьюринга. Однако парадоксальность не является непременным и обязательным атрибутом таких рассуждений, — хотя, конечно же, при наличии самоотносимости необходимо, во избежание ошибок, проявлять особую осторожность. Свою знаменитую теорему Гёдель сформулировал, вдохновившись одним известным самоотносимым логическим парадоксом (так называемым парадоксом Эпименида). При этом ошибочное рассуждение, приводящее к парадоксу, Гёделю удалось трансформировать в логически безупречное доказательство. Так же и я приложил все старания к тому, чтобы заключения, к которым я пришел, основываясь на полученных Гёделем и Тьюрингом выводах, не оказались самоотносимыми в том смысле, который неизбежно приводит к парадоксу, хотя, справедливости ради, следует признать, что некоторые из моих рассуждений имеют с такими характерными парадоксами разительное и даже фамильное сходство.
Рассуждения, представленные в и, особенно, в , могут показаться не совсем состоятельными именно в этом отношении. Например, определение ☆M -утверждения является в высшей степени самоотносимым, поскольку представляет собой сделанное роботом утверждение, причем осознаваемая истинность этого утверждения зависит от предположений самого робота относительно особенностей его первоначальной конструкции. Здесь можно, пожалуй, усмотреть неприятное сходство с утверждением «Все критяне — лжецы», прозвучавшим из уст критянина. И все же в этом смысле самоотносимыми ☆M -утверждения не являются, так как на самом деле они ссылаются не на самих себя, а на некую гипотезу об исходной конструкции робота.
Предположим, что некто вообразил себя роботом, пытающимся установить истинность какого-то конкретного четко сформулированного Π1-высказывания P0. Робот, возможно, окажется неспособен непосредственно установить, является ли высказывание P0 в действительности истинным, однако он может обратить внимание на то, что истинность P0 следует из предположения, что истинным является каждый член некоторого вполне определенного бесконечного класса Π1-высказываний S0 (пусть это будут, скажем, теоремы формальной системы Q(M), или QM (M), или какой угодно другой системы). Робот не знает, на самом ли деле каждый член класса S0 является истинным, однако он замечает, что класс S0 есть часть результата некоторого вычисления, причем посредством этого вычисление осуществляется построение некоторой модели сообщества математических роботов, а результат S0 представляет собой семейство Π1-высказываний, ☆-утверждаемых этими самыми моделируемыми роботами. Если механизмы, лежащие в основе этого сообщества роботов, совпадают с набором механизмов M, то высказывание P0 представляет собой пример ☆M -утверждения. А наш робот придет к выводу, что если он сам построен в соответствии с набором механизмов M, то высказывание P0 также должно быть истинным.
Рассмотрим случай с более тонким ☆M -утверждением (обозначим его P1): робот отмечает, что истинность P1 является следствием истинности всех членов другого класса Π1-высказываний (например, S1), который можно получить из результата того же самого вычисления, моделирующего сообщество роботов (на основе механизмов M), только на этот раз существенная часть результата состоит из, скажем, тех Π1-высказываний, истинность которых моделируемые роботы способны установить как следствие истинности всего класса S0. Что же побудит нашего робота заключить, что истинность высказывания P1 есть непременное следствие допущения, что он построен в соответствии с механизмами M? Его рассуждение будет выглядеть приблизительно так: «Если в основе моей конструкции лежат механизмы M, то, как я уже установил ранее, необходимо признать, что класс S0 включает в себя только истинные высказывания; согласно же утверждениям моих моделируемых роботов, истинность каждого из высказываний класса S1 также следует из истинности всех высказываний класса S0, равно как и истинность высказывания P0. Таким образом, если предположить, что я и в самом деле построен в соответствии с теми же принципами, что и мои моделируемые роботы, то я должен признать, что каждый отдельный член класса S1 является истинным. А поскольку я понимаю, что истинность всех высказываний класса S1 подразумевает истинность высказывания P1 я, должно быть, могу вывести и истинность P1, исходя лишь из того же самого допущения относительно своей конструкции».
Далее можно перейти к еще более тонкому ☆M -утверждению (скажем, P2), которое возникает в том случае, когда робот замечает, что истинность P2 оказывается не чем иным, как следствием допущения истинности всех высказываний класса S2, истинность же каждого члена S2, если верить моделируемому сообществу роботов, является следствием истинности всех без исключения членов S0 и S1. И здесь наш робот оказывается вынужден признать истинность P2 на том лишь основании, что он построен в соответствии с набором механизмов M. Эту цепочку можно, очевидно, продолжать и дальше, приводя ☆M -утверждения все большей и большей тонкости (P ω ), истинность которых будет следовать из допущения истинности всех членов классов S0, S1, S2, S3, … и так далее, включая и классы с индексами более высокого порядка (см. возражение Q19 и последующий комментарий). В общем случае, главной характеристикой ☆M -утверждения для робота является осознание последним того обстоятельства, что коль скоро он предполагает, что механизмы, обусловливающие поведение моделируемых роботов, совпадают с механизмами, лежащими в основе его собственной конструкции, то ему ничего не остается, как заключить, что отсюда непременно следует истинность рассматриваемого утверждения (Π1-высказывания). В этом рассуждении нет ничего от тех внутренне противоречивых методов рассуждения, к числу которых принадлежит, в частности, парадокс Рассела. Представленные ☆M -утверждения строятся последовательно посредством стандартной математической процедуры трансфинитных ординалов (см. , комментарий к Q19). (Все эти ординалы счетны и далеки от тех логических неприятностей, которые постоянно сопутствуют обычным числам, «слишком большим» в том или ином смысле).
У робота нет иных причин принимать на веру любое из этих IIi-высказываний, кроме как исходя из допущения, что он построен в соответствии с набором правил M, впрочем, для доказательства ему этой веры вполне хватает. Возникающее впоследствии действительное противоречие не является математическим парадоксом (подобным парадоксу Рассела) — это самое обыкновенное противоречие, связанное с предположением, что ни одна целиком и полностью вычислительная система не может обрести подлинного математического понимания.
Вернемся к роли самоотносимости в рассуждениях . Называя величину c пределом сложности, допустимым для ☆-утверждений, полагаемых безошибочными, с целью построения формальной системы Q*, я никоим образом не привношу в свое рассуждение неуместной здесь самоотносимости. Понятие «степень сложности» можно определить вполне точно, как, собственно, и обстоит дело с тем конкретным определением, которое мы использовали в наших рассуждениях, а именно: «степень сложности есть количество знаков в двоичном разложении большего из пары чисел m и n, фигурирующих в обозначении вычисления T m (n), представляющего рассматриваемое Π1-высказывание». Мы можем воспользоваться представленными в НРК точными спецификациями машин Тьюринга, положив, что T m есть не что иное, как «m-я машина Тьюринга». Тогда никакой неточности в этом понятии не будет.
Проблема возможной неточности может возникнуть при решении вопроса о том, какие именно рассуждения мы будем принимать в качестве «доказательств» Π1-высказываний. Однако в данном случае некоторый недостаток формальной точности является необходимой составляющей всего рассуждения. Если потребовать, чтобы совокупность аргументов, принимаемых в качестве обоснованных доказательств Π1-высказываний, была целиком и полностью точной и формальной — читай: допускающей вычислительную проверку, — то мы снова окажемся в ситуации формальной системы, над которой грозно нависает гёделевское доказательство, явным образом демонстрируя, что любая точная формализация подобного рода не может представлять всю совокупность аргументов, пригодных, в принципе, для установления истинности Π1-высказываний. Гёделевское доказательство показывает — к добру ли, к худу ли, — что никаким допускающим вычислительную проверку способом невозможно охватить все приемлемые человеком методы математического рассуждения.
Читатель, возможно, уже беспокоится, что все мои рассуждения здесь затеяны с целью получить точное определение понятия «роботово доказательство» посредством хитрого трюка с «безошибочными ☆-утверждениями». В самом деле, при введении гёделевского рассуждения необходимым предварительным условием было как раз получение точного определения этого понятия. Возникшее же в результате противоречие просто послужило еще одним подтверждением того факта, что человеческое понимание математической истины невозможно полностью свести к процедурам, допускающим вычислительную проверку. Главной целью всех представленных рассуждений было показать, посредством reductio ad absurdum, что человеческое представление о восприятии неопровержимой истинности Π1-высказываний невозможно реализовать в рамках какой бы то ни было вычислительной системы, будь она точной или какой-либо иной. В этом нет никакого парадокса, хотя кому-то полученные выводы могут показаться весьма и весьма тревожными. Получение противоречивых выводов является вполне естественным и даже единственно возможным завершением любого доказательства, построенного на reductio ad absurdum; кажущаяся парадоксальность этих выводов служит лишь для того, чтобы полностью исключить из рассмотрения то самое предположение, с которого доказательство, собственно, и начиналось.
3.25. Сложность в математических доказательствах
Существует, однако, еще одно немаловажное соображение, о котором необходимо упомянуть. Суть его заключается в том, что, хотя количество Π1-высказываний, которые необходимо принимать в рассмотрение в рамках приведенного в рассуждения, является конечным, нет никакого явного ограничения на объем доказательств, необходимых роботам для реализации ☆-демонстрации истинности всех этих Π1-высказываний. Даже если ограничить степень сложности принимаемых в рассмотрение Π1-высказываний самым скромным пределом c, то все равно придется учитывать и некоторые весьма громоздкие и сложные случаи. Например, гипотезу Гольдбаха (см. ), согласно которой каждое четное число, большее 2, является суммой двух простых чисел, можно сформулировать в виде Π1-высказывания очень небольшой степени сложности, и в то же время она представляет собой настолько сложный случай, что все попытки математиков-людей однозначно установить ее истинность до сих пор не увенчались успехом. Учитывая подобные обстоятельства, можно предположить, что если кому-то в конце концов удастся отыскать доказательство действительной истинности Гольдбахова Π1-высказывания, то это доказательство неизбежно окажется весьма и весьма сложным и изощренным. Если такое доказательство выдвинет в качестве кандидата на ☆-утверждение один из наших роботов, то прежде, чем его таковым признают, оно непременно будет подвергнуто чрезвычайно тщательному исследованию (возможно, даже силами всего роботского общества, ответственного за присвоение ☆-статуса). В случае гипотезы Гольдбаха нам неизвестно, является ли это Π1-высказывание действительно истинным, — а если является, то возможно ли его доказательство в рамках известных и общепринятых методов математического доказательства. Иначе говоря, это Π1-высказывание может входить в формальную систему Q*, а может и не входить.
Еще одним «неудобным» Π1-высказыванием может оказаться утверждение, устанавливающее истинность теоремы о четырех красках, — теоремы, согласно которой плоскую (или сферическую)карту «мира» можно, используя всего четыре краски, раскрасить так, чтобы любая «страна» получила собственный, отличный от соседей цвет. Теорема о четырех красках была-таки доказана в 1976 году (после 124 лет неудачных попыток) Кеннетом Аппелем и Вольфгангом Хакеном, причем доказательство потребовало использования 1200 часов компьютерного времени. Принимая во внимание то обстоятельство, что существенную часть доказательства составил впечатляющий объем компьютерных вычислений, можно предположить, что полная запись его на бумаге потребовала бы невероятного ее количества. Если же сформулировать эту теорему в виде Π1-высказывания, то степень сложности такого высказывания будет очень небольшой, хотя, наверное, все же большей, нежели степень сложности Π1-высказывания, необходимого для выражения гипотезы Гольдбаха. Если бы доказательство Аппеля—Хакена было выдвинуто одним из наших роботов в качестве кандидата на получение ☆-статуса, то его пришлось бы проверять очень и очень тщательно. Для утверждения обоснованности каждого его отдельного фрагмента потребовалось бы участие всего сообщества элитных роботов. И все же, несмотря на сложность доказательства в целом, один лишь объем его чисто вычислительной части вряд ли смог бы явиться сколько-нибудь серьезным затруднением для наших роботов. В конце концов, выполнение точных вычислений — это их работа.
Упомянутые Π1-высказывания вполне укладываются в пределы степени сложности, устанавливаемые любым достаточно большим значением c, — например, тем, что может быть обусловлено каким-либо правдоподобным набором механизмов M, лежащим в основе поведения наших роботов. Несомненно, найдется множество других Π1-высказываний, которые будут значительно сложнее приведенных здесь, хотя степень их сложности и не превысит величины c. Некоторые из таких Π1-высказываний окажутся, скорее всего, особенно неудоборешаемыми, а доказать некоторые из последних, в свою очередь, будет наверняка еще сложнее, чем теорему о четырех красках или даже гипотезу Гольдбаха. Любое из этих Π1-высказываний, истинность которого может быть однозначно установлена роботами (посредством демонстрации, достаточно убедительной для присвоения высказыванию ☆-статуса и успешного преодоления им всех заграждений, установленных с целью обеспечения безошибочности получаемых роботами результатов), автоматически становится теоремой формальной системы Q*.
Кроме того, возможны и пограничные случаи, приемлемость или неприемлемость (причем грань между этими состояниями весьма тонка) которых определяется строгостью стандартов, необходимых для получения ☆-статуса, или тем, насколько точный характер имеют меры предосторожности, установленные с целью обеспечения безошибочности утверждений, принимаемых в качестве «кирпичей» для построения формальной системы Q*. Точная формулировка системы Q* будет различной в зависимости от того, полагаем мы такое Π1-высказывание P безошибочным ☆-утверждением либо нет. В обычных обстоятельствах эта разница не имеет большого значения, поскольку различные варианты системы Q*, обусловленные принятием или отклонением высказывания P, являются логически эквивалентными. Такая ситуация может возникнуть в случае Π1-высказываний, доказательства истинности которых роботы могут счесть сомнительными просто из-за их чрезмерной сложности. Если доказательство высказывания P окажется на деле логическим следствием из других ☆-утверждений, которые уже приняты как безошибочные, то возникнет эквивалентная система Q*, причем вне зависимости от того, принимается высказывание P в качестве ее теоремы или нет. С другой стороны, возможны такие Π1-высказывания, которые потребуют для своего доказательства каких-то хитроумных логических процедур, выходящих за рамки любых логических следствий из тех ☆-утверждений, которые были приняты как безошибочные ранее, при построении системы Q*. Обозначим получаемую таким образом формальную систему (до включения в нее высказывания P) через Q*0, а систему, образующуюся после присоединения к системе Q*0 высказывания P, через Q*1. Система Q*1 окажется неэквивалентна системе Q*0 в том, например, случае, если высказыванием P будет гёделевское предположение G(Q*0). Однако если роботы, в соответствии с нашим допущением, способны достичь человеческого уровня математического понимания (а то и превзойти его), то они безусловно должны быть способны понять аргументацию Гёделя, так что им ничего не остается, как признать истинность гёделевского предположения для какой угодно системы Q*0 (присвоив ему гарантирующий безошибочность ☆-статус), коль скоро обоснованность этой системы Q*0 ими же ☆-подтверждена. Таким образом, если они принимают систему Q*0, то они должны принять и систему Q*1 (при условии, что степень сложности высказывания G(Q*0) не превышает c — а так оно и будет, если значение c выбрано таким, каким мы выбрали его выше).
Необходимо отметить, что наличие либо отсутствие Π1-высказывания P в формальной системе Q* никоим образом не влияет на представленные в и рассуждения. Само Π1-высказывание G(Q*) принимается за истинное в любом случае, независимо от того, входит высказывание P в систему Q* или нет.
Могут найтись и другие способы, с помощью которых роботам удастся «перескочить» через ограничения, налагаемые некоторыми ранее принятыми критериями присвоения ☆-статуса Π1-высказываниям. В этом нет ничего «парадоксального» — до тех пор, пока роботы не попытаются применить подобное рассуждение к тем самым механизмам M, которые обусловливают их поведение, т.е. к собственно системе Q*. Возникающее в этом случае противоречие не является, строго говоря, «парадоксом», однако дает возможность посредством reductio ad absurdum показать, что такие механизмы существовать не могут или, по крайней мере, не могут быть познаваемыми для роботов, а следовательно, и для нас.
Отсюда мы и делаем вывод о том, что такие «роботообучающие» механизмы — восходящие, нисходящие, смешанного типа, причем в каких угодно пропорциях, и даже с добавлением случайных элементов — не могут составить познаваемую основу для построения математического робота человеческого уровня.
3.26. Разрыв вычислительных петель
Попробую осветить полученный вывод под несколько иным углом зрения. Предположим, что, пытаясь обойти налагаемые теоремой Гёделя ограничения, некто решил построить такого робота, который будет способен каким-либо образом «выскакивать из системы» всякий раз, когда управляющий им алгоритм попадет в вычислительную петлю. В конце концов именно постоянное приложение теоремы Гёделя не позволяет нам спокойно принять предположение о том, что математическое понимание можно объяснить посредством вычислительных процедур, поэтому, как мне кажется, стоит рассмотреть с этой точки зрения трудности, с которыми сталкивается любая вычислительная модель математического понимания при встрече с теоремой Гёделя.
Мне рассказывали, что где-то живут ящерицы, тупость которых настолько велика, что они, подобно «обычным компьютерам и некоторым насекомым», способны «зацикливаться». Если несколько таких ящериц поместить на край круглого блюда, то они в вечной «гонке за лидером» будут бегать по кругу до тех пор, пока не умрут от истощения. Смысл этой истории в том, что подлинно интеллектуальная система должна располагать какими-то средствами для разрыва таких петель, тогда как ни один из существующих компьютеров подобными качествами, вообще говоря, не обладает. (Проблему «разрыва петель» рассматривал Хофштадтер в [].)
Вычислительная петля простейшего типа возникает, когда система на некотором этапе своей работы возвращается назад, в точности в то же состояние, в каком она пребывала на некотором предыдущем этапе. В отсутствие ввода каких-то дополнительных данных она будет просто повторять одно и то же вычисление бесконечно. Не составляет большой трудности построить систему, которая, в принципе, будет гарантированно (пусть и не слишком эффективно) выбираться из петель подобного рода по мере их возникновения (скажем, посредством ведения списка всех состояний, в которых оказывается система, и проверки на каждом этапе на предмет выяснения, не встречалось ли такое состояние когда-либо раньше). Существует, однако, множество других возможных типов петель, причем гораздо более сложных. Проблеме образования петель посвящена большая часть рассуждений (в особенности, ), так как вычисление, застрявшее в петле, есть не что иное, как вычисление, которое не завершается. Собственно говоря, под Π1-высказыванием мы как раз и понимаем утверждение о том, что некоторое вычисление образует петлю (см. , комментарий к возражению Q10). А еще в мы имели возможность убедиться в том, что факт незавершаемости вычисления (т.е. образования петли) однозначно установить с помощью одних лишь алгоритмических методов невозможно. Более того, как можно заключить из вышеприведенных рассуждений, процедуры, посредством которых математики-люди устанавливают, что данное конкретное вычисление действительно образует петлю (т.е. устанавливают истинность соответствующего Π1-высказывания), вообще не являются алгоритмическими.
Таким образом, получается, что, если мы хотим встроить в систему все доступные человеку методы, позволяющие однозначно установить, что те или иные вычисления действительно образуют петли, необходимо снабдить ее «невычислительным интеллектом». Можно, конечно, предположить, что петель можно избежать с помощью некоего механизма, который будет оценивать, как долго уже выполняется текущее вычисление, и «выскакивать из системы», если ему покажется, что оно выполняется слишком долго. Однако такой способ не сработает, если механизм, принимающий подобные решения, является по своей природе вычислительным, поскольку в этом случае неизбежны ситуации, когда упомянутый механизм со своей задачей не справляется, либо приходя к ошибочному заключению, что вычисление зациклилось, либо вообще не приходя ни к какому заключению (по той причине, что теперь зациклился уже сам механизм). Целиком и полностью вычислительной системе нечего противопоставить проблеме образования петель, и нет никаких гарантий, что вся система в целом, пусть даже избежав ошибочных выводов, в конце концов не зациклится.
А что если ввести в процесс принятия решения о необходимости «выскакивать из системы» (в случае предположительно зациклившегося вычисления) и о том, когда именно это нужно делать, некоторые случайные элементы? Как мы отмечали выше (в частности, в ), от чисто случайных элементов — в противоположность вычислительным псевдослучайным — нам в этой ситуации никакой реальной пользы не будет. Кроме того, если мы действительно хотим знать точно, образует ли петлю то или иное вычисление (т.е. истинно ли соответствующее Π1-высказывание), то следует учесть еще один момент. Сами по себе случайные процедуры не годятся для решения таких задач, поскольку, исходя из самой природы феномена, называемого нами случайностью, о выводах, действительно обусловленных случайными элементами, определенно можно сказать лишь одно — какая бы то ни было определенность в них напрочь отсутствует. Известны, однако, вычислительные процедуры со случайными (или псевдослучайными) элементами, позволяющие получить математический результат с очень высокой степенью достоверности. Существуют, например, весьма эффективные методы со случайным входящим потоком, позволяющие определить, является ли данное большое число простым, причем практически в любом конкретном случае результат оказывается правильным. Математически строгие методы проверки гораздо менее эффективны — поневоле задумаешься, что же предпочтительнее: сложное, но математически точное построение, которое, не исключено, содержит не одну ошибку, или относительно простое, но вероятностное рассуждение, вероятность ошибки в котором на практике может оказаться значительно меньше, нежели в первом случае. Подобные размышления порождают множество неловких вопросов, ломать копья из-за которых я не испытываю ни малейшего желания. Достаточно будет сказать, что для «принципиальных» рассуждений, которым посвящена большая часть этой главы, вероятностное доказательство, с помощью которого можно устанавливать истинность Π1-высказываний, неизбежно оказывается, скажем так, не совсем адекватным.
Если мы намерены научиться однозначно устанавливать истинность любого Π1-высказывания в принципе, то, вместо того, чтобы бездумно полагаться на случайные или непознаваемые процедуры, нам необходимо достичь подлинного понимания смысла феноменов, с этими высказываниями действительно связанных. Возможно, процедуры, полученные методом проб и ошибок, и дадут нам некоторые указания относительно того, где искать необходимые сведения, однако сами по себе такие процедуры окончательными критериями истинности являться не могут.
В качестве примера вернемся к вычислению, приведенному в комментарии к возражению Q8 (): «распечатать последовательность из 22 65536 единиц, после чего остановиться». Если просто выполнять это вычисление в точном соответствии с данными инструкциями, то его никоим образом невозможно будет завершить, даже если каждый отдельный его шаг будет занимать наименьший возможный с точки зрения теоретической физики промежуток времени (около 10-43 с) — на его выполнение потребуется срок, невообразимо больший нынешнего возраста Вселенной (или достижимого ею в любом обозримом будущем). И все же это вычисление весьма просто описать (особенно если припомнить, что 65536 = 216), причем абсолютно очевидно, что в конечном итоге оно все равно завершится. Если же мы вознамеримся счесть, что вычисление зациклилось на том только основании, что оно якобы «выполняется слишком долго», каким безнадежно далеким от истины окажется такое предположение!
Несколько более интересным примером может послужить вычисление, которое, как нам недавно стало известно, все-таки завершается, хотя долгое время казалось, что конца ему не предвидится. Это вычисление происходит из допущения, сделанного великим швейцарским математиком Леонардом Эйлером, и состоит в отыскании решения в положительных целых числах (т.е. натуральных числах, кроме нуля) следующего уравнения:
p 4 + q 4 + r 4 = s 4 .
В 1769 году Эйлер предположил, что это вычисление является незавершаемым. В середине 1960-х Л.Лэндером и Т. Паркином была предпринята попытка отыскать решение с помощью специально разработанной компьютерной программы (см. []), однако проект через некоторое время оставили ввиду отсутствия перспективы получить искомое решение в сколько-нибудь обозримом будущем — получаемые в процессе числа оказались слишком велики для имеющегося в распоряжении математиков компьютера, и они просто-напросто сдались. По всему выходило, что это вычисление и впрямь не завершается. Однако в 1987 году математику (человеку, кстати) Ноаму Элькису не только удалось показать, что решение таки существует, но и представить его в численном виде: p = 2682440, q = 15365639, r = 18796760 и s = 20615673. Он также показал, что существует бесконечно много других решений, существенно отличных от полученного им. Воодушевленный этим результатом Роджер Фрай решил возобновить компьютерный поиск, внеся в программу несколько предложенных Элькисом упрощающих поправок и, в конечном счете, затратив приблизительно 100 часов компьютерного времени, получил несколько, правда, меньшее (вообще говоря, наименьшее возможное), но вполне подходящее решение: p = 95800, q = 217519, r = 414560 и s = 422481.
Лавры за решение этой задачи следует разделить поровну между математическими интуитивными прозрениями и прямыми вычислительными подходами. Решая задачу математически, Элькис прибегал и к помощи компьютерных вычислений, пусть и относительно несущественных, хотя по большей своей части его аргументация таких подпорок не требует. И наоборот, как мы видели выше, для того чтобы сделать вычисление вообще возможным, Фраю потребовалось весьма существенная помощь со стороны человеческой интуиции.
Думаю, следует поместить нашу задачу в несколько более подробный контекст — первоначальное предположение Эйлера, сделанное в 1769 году, представляло собой нечто вроде обобщения знаменитой «последней теоремы Ферма», согласно которой, как читатель, возможно, припоминает, верно следующее: уравнение
p n + q n = r n
не имеет решения в положительных целых числах p, q, r, если n больше 2 (см., напр., []). Мы можем перефразировать предположение Эйлера и записать его в следующем виде: не имеет решения в положительных целых числах уравнение
p n + q n + … + t n = u n
где p, q, …, t суть положительные целые числа общим количеством n - 1, а n равно 4 или больше. Утверждение Ферма относится к случаю n = 3 (частный случай предположения Эйлера, причем то, что соответствующее уравнение решений не имеет, сам Ферма и доказал — вот только доказательства нам не оставил). Прошло почти 200 лет, прежде чем был найден первый пример, опровергающий предположение Эйлера (в случае n = 5), — для отыскания решения был использован компьютерный перебор (подробнее об этом можно прочесть в той статье Лэндера и Паркина, на которую я уже ссылался выше и в которой сообщается о неудаче со случаем n = 4):
275 + 845 + 1105 + 1335 = 1445.
Вспомним еще об одном знаменитом примере вычисления, о котором известно лишь то, что оно в конце концов завершается; когда именно оно завершается, неизвестно до сих пор. Это вычисление связано с задачей об отыскании точки, в которой одна хорошо известная приближенная формула для определения количества простых чисел, меньших некоторого положительного целого п (интегральный логарифм Гаусса), оказывается не в состоянии это количество оценить. В 1914 году Дж. Э. Литлвуд показал, что в некоторой точке эта задача имеет решение. (Приблизительно то же можно выразить и иначе: например, доподлинно известно, что две кривые в некоторой точке пересекаются.) В 1935 году ученик Литлвуда по фамилии Скьюс показал, что упомянутая точка приходится на число, меньшее 1010 10 34 , однако точное число так и остается неизвестным, хотя оно, конечно же, значительно меньше предела, поставленного Скьюсом. (Это число называли в свое время «наибольшим числом, когда-либо естественным образом возникавшим в математике», однако тот временный рекорд оказался на настоящий момент побит с огромным отрывом в примере, приведенном в работе Грэма и Ротшильда [], с. 290.)
3.27. Вычислительная математика: процедуры нисходящие или восходящие?
В предыдущем разделе мы могли убедиться, какую неоценимую помощь могут оказать компьютеры при решении некоторых математических задач. Во всех упомянутых успешных примерах примененные вычислительные процедуры носили исключительно нисходящий характер. Более того, лично мне не известно ни об одном сколько-нибудь значительном чисто математическом результате, полученном с помощью восходящих процедур, хотя вполне возможно, что такие методы могут оказаться весьма полезными в различного рода поисковых операциях, входящих в состав каких-либо по преимуществу нисходящих процедур, предназначенных для отыскания решений тех или иных математических задач. Может, так оно и будет, однако мне до сих пор не доводилось сталкиваться в вычислительной математике ни с чем таким, что хотя бы отдаленно напоминало конструкции вроде нашей формальной системы Q*, которые можно было бы представить себе в качестве основы для деятельности «сообщества обучающихся математических роботов», описанного в . Противоречия, с которыми мы всякий раз сталкивались, пытаясь изобразить упомянутую конструкцию, призваны подчеркнуть тот факт, что такие системы просто не могут предложить нам сколько-нибудь результативный метод математического исследования. Компьютеры приносят огромную пользу в математике, но только тогда, когда их применение ограничивается нисходящими вычислениями; для того же чтобы определить, какое именно вычисление необходимо выполнить, требуется идея, порожденная человеческим пониманием, то же понимание потребуется и на заключительном этапе процесса, т.е. при интерпретации результатов вычисления. Иногда очень значительный эффект дает применение интерактивных процедур, предполагающих совместную работу человека и компьютера, или, иначе говоря, участие человеческого понимания на различных промежуточных стадиях процесса. Попытки же полностью вытеснить элемент человеческого понимания и заменить его исключительно вычислительными процедурами выглядят, по меньшей мере, неумными, а если подойти к делу с более строгих позиций — то и вовсе неосуществимыми.
Как показывают представленные выше аргументы, математическое понимание представляет собой нечто, в корне отличное от вычислительных процессов; вычисления не могут полностью заменить понимание. Вычисление способно оказать пониманию чрезвычайно ценную помощь, однако само по себе вычисление действительного понимания не дает. Впрочем, математическое понимание часто оказывается направлено на отыскание алгоритмических процедур для решения тех или иных задач. В этом случае алгоритмические процедуры могут «взять управление на себя», предоставив интеллекту возможность заняться чем-то другим. Приблизительно таким образом работает хорошая система обозначений — такая, например, как та, что принята в дифференциальном исчислении, или же всем известная десятичная система счисления. Овладев алгоритмом, скажем, умножения чисел, вы сможете выполнять операцию умножения совершенно бездумно, алгоритмически, при этом в процессе умножения вам совершенно ни к чему «понимать», почему в данной операции применяются именно эти алгоритмические правила, а не какие-то другие.
Помимо прочего, на основании всего вышеизложенного, мы приходим к выводу, что процедура, необходимая для «обучения робота математике», не имеет ничего общего с процедурой, которая в действительности обусловливает человеческое понимание математики. И уж во всяком случае подобные, по преимуществу восходящие процедуры, по всей видимости, абсолютно не годятся, с практической точки зрения, для построения робота-математика, даже такого, который не будет претендовать на какую бы то ни было симуляцию действительного понимания, присущего математикам-людям. Как мы уже указывали ранее, когда дело доходит до неопровержимого установления математической истины, сами по себе восходящие процедуры обучения оказываются совершенно неэффективными. Если уж нам предстоит изобрести вычислительную систему для производства неопровержимых математических истин, гораздо эффективнее будет построить эту систему в соответствии с нисходящими принципами (по крайней мере, в той ее части, которая будет отвечать за неопровержимость производимых ею утверждений; в части же, занятой изысканиями, вполне могут пригодиться и восходящие процедуры). Что касается обоснованности и эффективности упомянутых нисходящих процедур, то о них должен позаботиться человек, осуществляющий первоначальное программирование, т.е. существенно необходимыми компонентами процесса, недостижимыми посредством чистого вычисления, оказываются человеческое понимание и способность проникать в суть.
Вообще говоря, в нынешнее время компьютеры нередко именно таким образом и используются. Самый знаменитый пример — уже упоминавшееся выше доказательство теоремы о четырех красках, осуществленное Кеннетом Аппелем и Вольфгангом Хакеном с помощью компьютера. Роль компьютера в данном случае свелась к выполнению некоторого четко определенного вычисления для каждого возможного варианта, причем количество альтернативных вариантов, хотя и было весьма велико, составляло все же величину конечную; исключение этих возможных вариантов дает основания для проведения (математиками-людьми) требуемого общего доказательства. Имеются и другие примеры подобных доказательств «с компьютерной поддержкой», а кроме того, сегодня на компьютере выполняют не только численные расчеты, но и сложные алгебраические преобразования. И в этом случае работой компьютера управляют строго нисходящие процедуры, правила же для этих процедур формулируются человеком в результате понимания задачи.
Следует упомянуть и еще об одном направлении работ — так называемом «автоматическом доказательстве теорем». К этой категории можно отнести, например, набор процедур, состоящий в определении некоторой фиксированной формальной системы H и последующей попытки вывода теорем в рамках этой системы. Из нам известно, что отыскание доказательств всех теорем системы H, одного за другим, есть процесс исключительно вычислительный. Такие процессы можно автоматизировать, однако если автоматизация выполнена без должного внимания и понимания, то полученный результат окажется, скорее всего, крайне неэффективным. Если же к разработке компьютерных процедур привлечь-таки эти самые внимание и понимание, то можно добиться весьма и весьма впечатляющих результатов. В одной из разработанных таким образом схем (см. []) правила евклидовой геометрии были преобразованы в весьма эффективную формальную систему, способную доказывать существующие геометрические теоремы (а иногда и открывать новые). Приведем конкретный пример из практики этой системы: перед ней была поставлена задача доказать гипотезу В. Тебо — геометрическое предположение, выдвинутое в 1938 году и доказанное лишь относительно недавно (в 1983) К.Б.Тейлором, — с чем она как нельзя более успешно справилась за 44 часа компьютерных вычислений.
Более близкую аналогию с описанными в предыдущих параграфах процедурами можно усмотреть в предпринимаемых различными исследователями на протяжении последних приблизительно десяти лет попытках разработки «искусственно-интеллектуальных» процедур для реализации математического «понимания». Надеюсь, представленные мною аргументы дают ясное представление о том, что каковы бы ни оказались успехи подобных систем, действительного математического понимания они ни в коем случае не достигнут! Некоторое отношение к упомянутым трудам имеют и попытки создания автоматических «теоремо-порождающих» систем; задачей такой системы является отыскание теорем, которые можно отнести к категории «интересных» — в соответствии с определенными критериями, заданными системе заранее. Насколько мне известно (и думаю, не мне одному), из этих попыток пока что ничего, что представляло бы сколько-нибудь реальный математический интерес, не вышло. Мне, несомненно, возразят, что мы находимся лишь в начале пути, и наверняка в будущем можно ожидать самых потрясающих результатов. Однако всякому, кто дочитал до этого места, уже должно быть ясно, что лично я крайне скептически отношусь к возможности получения из всех этих начинаний хоть какого-то подлинно положительного результата — разве что мы наконец выясним точные пределы возможностей таких систем.
3.28. Заключение
Представленные в данной главе аргументы дают, по всей видимости, недвусмысленное доказательство того, что человеческое математическое понимание несводимо к вычислительным механизмам (по крайней мере, тем из них, что мы способны познать), каковые механизмы могут представлять собой какие угодно сочетания нисходящих, восходящих либо случайных процедур. Похоже, у нас нет иного выхода, кроме как однозначно заключить, что некую существенную составляющую человеческого понимания невозможно смоделировать никакими вычислительными средствами. Хотя в строгом доказательстве, возможно, еще и остались какие-то крошечные «лазейки», вряд ли сквозь них можно протащить что-нибудь существенное. Кто-то очень рассчитывает на лазейку под названием «божественное вмешательство» (посредством которого в наши мозги-компьютеры был просто-напросто установлен некий чудесный алгоритм, для нас принципиально непознаваемый) или на аналогичную ей лазейку, согласно которой сами по себе механизмы, управляющие совершенствованием мыслительных процессов, представляют собой нечто в высшей степени таинственное и принципиально для нас непознаваемое. Вряд ли какая-либо из этих лазеек (хотя обе они, безусловно, имеют некоторое право на существование) покажется хоть сколько-нибудь приемлемой тем, кто стремится создать искусственное устройство, наделенное подлинным интеллектом. Равно неприемлемы они и для меня — я просто не могу в них всерьез поверить.
Суть еще одной возможной лазейки заключается в том, что может просто не найтись такого набора мер предосторожности (вроде тех, что в общем виде задаются пределами T, L и N, подробно описанными выше в этой главе), которого было бы достаточно для устранения абсолютно всех ошибок в конечном множестве ☆-утверждаемых Π1-высказываний, сложность которых не превышает c. Мне трудно поверить в возможность существования столь совершенного «заговора», способного помешать устранению всех ошибок, тем более, что деятельность нашего элитного сообщества роботов изначально должна быть направлена как раз на максимально тщательное исключение ошибок. Более того, освободить от ошибок нам необходимо всего лишь конечное множество Π1-высказываний. Применив идею ансамблей, мы, несомненно, справимся и со всеми случайными ошибками, какие может допустить само сообщество, так как маловероятно, что одну и ту же ошибку допустит кто-то еще, кроме незначительного меньшинства различных экземпляров моделируемого сообщества роботов — при условии, что это действительно просто ошибка, а не какое-то изначально заложенное в систему заблуждение, обнаружить которое роботам помешает та или иная фундаментальная блокировка. Встроенные блокировки такого рода не относятся к «исправимым» ошибкам, нашей же целью в данном случае является устранение ошибок, в известном смысле «исправимых».
Последняя лазейка (едва правдоподобная) связана с ролью хаоса. Возможно ли, что при тщательном анализе поведения некоторых хаотических систем обнаружатся структуры существенно неслучайного характера и именно в области этого «края хаоса» мы отыщем ключ к пониманию эффективно невычислимого поведения разума? Такой вариант подразумевает необходимость того, чтобы эти хаотические системы были способны приближенно моделировать невычислимое поведение (весьма интересная возможность сама по себе), однако даже если так оно и есть, подобная неслучайность в рамках предшествующего обсуждения может пригодиться лишь для некоторого уменьшения размеров ансамбля моделируемых сообществ роботов (см. ). Не совсем ясно, каким образом это уменьшение может нам сколько-нибудь существенно помочь. Тем, кто всерьез верит в то, что ключи к пониманию человеческой ментальности таит в себе хаос, следует озаботиться поисками разумного способа обойти упомянутые фундаментальные проблемы.
Приведенные выше аргументы, по всей видимости, представляют собой убедительное доказательство невозможности создания вычислительной модели разума (точка зрения A), равно как и невозможности эффективного (но бездумного) вычислительного моделирования всех внешних проявлений деятельности разума (точка зрения B). И все же, несмотря на убедительность этих аргументов, я подозреваю, что очень многим из нас будет чрезвычайно трудно с ними согласиться. Вместо изучения возможности того, что для понимания феномена интеллекта (что бы за этим словом ни стояло) более подходящей окажется точка зрения C (или даже D), многие приверженцы научного подхода ограничились одними лишь попытками отыскать слабые места в вышеприведенной аргументации, и все это исключительно ради поддержания упрямой убежденности в том, что точка зрения A (в крайнем случае, B) непременно должна в конце концов оказаться истинной.
Я не считаю такую реакцию неразумной. Точки зрения C и D тоже не свободны от фундаментальных противоречий. Если мы верим, в соответствии с D, в то, что человеческий разум содержит в себе нечто, с научной позиции не объяснимое — а интеллект есть свойство, совершенно отдельное от всего того, что можно обнаружить внутри математически определенных физических сущностей, населяющих нашу материальную Вселенную, — то нам следует спросить себя, почему же разум человека оказывается столь, по всей видимости, тесно связан с тем сложноорганизованным физическим объектом, каковым является его мозг. Если интеллект действительно представляет собой нечто отдельное от физического тела, то почему нашим ментальным сущностям все же необходимы наши физические мозги? Совершенно очевидно, что изменение физического состояния мозга влечет за собой изменение ментального состояния сопутствующего ему разума. Воздействие на мозг некоторых наркотиков, например, весьма определенно связывается с существенными изменениями в психике и восприятии. Равным образом, повреждение, заболевание или хирургическое удаление определенных участков мозга, как правило, оказывает четко выраженное и предсказуемое воздействие на умственное состояние данного конкретного индивидуума. (Особенно драматическими в этом контексте представляются поразительные отчеты, опубликованные Оливером Саксом в его книгах «Пробуждения» [] и «Человек, который принял свою жену за шляпу» [].) Итак, получается, что совершенно разделять интеллект и соответствующий физический объект нельзя. А если интеллект связан-таки с определенными физическими объектами — и, похоже, связан весьма тесно, — то научные законы, столь точно описывающие поведение физических объектов, не должны сплоховать и при описании свойств интеллекта.
Что касается точки зрения C, то здесь возникают проблемы иного рода, — связанные, в основном, с ее выраженным спекулятивным характером. Что заставит нас поверить в то, что природные феномены действительно могут демонстрировать какое-то там невычислимое поведение? Всем известно, что мощь современной науки опирается (и, чем дальше, тем больше) на тот факт, что поведение любого физического объекта можно моделировать с помощью численных методов, при этом точность получаемой модели зависит исключительно от «комплексности» выполненных вычислений. С ростом научного понимания стремительно растет и прогнозирующая способность таких численных моделей. В практическом отношении этим ростом мы, по большей части, обязаны быстрому развитию — в основном, во второй половине двадцатого века — вычислительных устройств необычайной мощи, скорости и точности. В результате перед нами открылся широкий простор для проведения все более тесных аналогий между тем, что происходит в недрах современных универсальных компьютеров, и всевозможными проявлениями самой материальной Вселенной. Имеются ли у нас сколько-нибудь осмысленные указания на то, что происходящее представляет собой лишь временную фазу развития науки? Чего ради мы должны всерьез рассматривать возможность существования физических процессов, неподвластных эффективному вычислительному подходу?
Если в рамках существующей на данный момент физической теории мы попытаемся отыскать какие бы то ни было следы процессов, хотя бы отчасти не поддающихся вычислению, то нас ожидает разочарование. Какой известный физический феномен ни возьми — от динамики материальной точки Ньютона и электромагнитных полей Максвелла до искривленного пространства-времени Эйнштейна и самых глубинных хитросплетений современной квантовой теории — все они замечательно, как нам представляется, описываются с помощью исключительно вычислительных методов; картину немного портит то обстоятельство, что процесс «квантового измерения» предполагает еще и наличие абсолютно случайной составляющей, вследствие чего изначально незначительные эффекты усиливаются до такой степени, что становится возможным объективное их восприятие. Нигде здесь нет ничего такого, что можно было бы охарактеризовать как «физический процесс, который вычислительными методами невозможно даже правдоподобно смоделировать», а как раз такой процесс подразумевается точкой зрения C. Таким образом, из двух версий C предпочтение, видимо, следует отдать «сильной» (см. ).
Важность этого выбора трудно переоценить. Многие люди с научным складом мышления говорили мне, что они вполне согласны с выдвинутой мною в НРК позицией (т.е. с тем, что деятельность разума включает в себя какие-то «невычислительные» процессы), однако вместе с тем они были убеждены в том, что для отыскания этих самых «невычислительных» процессов вовсе не нужно дожидаться каких-то революционных прорывов в теоретической физике. Как мне представляется, их точка зрения основывается на том факте, что крайняя сложность процессов, обусловливающих функционирование разума, выходит далеко за рамки стандартной компьютерной аналогии (в том виде, в каком ее впервые предложили Маккаллох и Питтс в 1943 году), в которой нейроны и синаптические связи представляются аналогами транзисторов, а аксоны выступают в роли проводников. Они говорят о сложности химических процессов, связанных с деятельностью нейромедиаторов, управляющих синаптической передачей нервных импульсов, или о том, что область действия этих химических соединений далеко не всегда ограничивается непосредственной окрестностью соответствующей синаптической связи. Кроме того, они указывают на чрезвычайно хитроумное устройство самих нейронов, важнейшие из подструктур которых (например, цитоскелет — о его действительно решающей роли в контексте нашего исследования мы подробнее поговорим ниже; см. ) оказывают существенное влияние на нейронную активность в целом. К делу привлекаются и прямые электромагнитные взаимодействия («резонансные эффекты», например), которые невозможно просто так объяснить обычными нервными импульсами; утверждают также, что в функционировании мозга важную роль должны играть эффекты, описываемые квантовой теорией, имея в виду либо квантовые неопределенности, либо нелокальные коллективные квантовые взаимодействия (например, феномен так называемой «конденсации Бозе—Эйнштейна»).
Хотя окончательных и недвусмысленных математических теорем на этот счет в нашем распоряжении практически нет все же вряд ли кто-либо всерьез сомневается в том, что все существующие физические теории являются по своей природе и в своей основе вычислительными — возможное же привнесение несущественной случайной составляющей обусловлено существованием такого феномена, как «квантовые измерения». Вопреки ожиданиям, я думаю, что возможность протекания невычислительных (и неслучайных) процессов в физических системах, действующих в рамках существующей физической теории, все же чрезвычайно интересна сама по себе и, разумеется, достойна самого подробного математического исследования. Такое исследование вполне может преподнести нам немало сюрпризов — возможно, нам и в самом деле удастся наткнуться на нечто хитроумное и совершенно невычислимое. На современном же этапе развития науки вероятность обнаружения в рамках известных нам физических законов какой-либо подлинной невычислимости представляется мне крайне малой. Следовательно, необходимо в самих законах отыскать слабые места и расширить их в достаточной степени для того, чтобы включить ту невычислимость, которая, согласно вышеприведенным аргументам, неизбежно присутствует в мыслительной деятельности человека.
Что же это за слабые места? Лично у меня почти нет сомнений относительно того, где именно следует нанести наиболее массированный удар по существующей физической теории — наислабейшим ее звеном является уже упоминавшаяся выше процедура так называемого «квантового измерения». На нынешнем этапе своего развития теория содержит в себе некоторые противоречия (или, по меньшей мере, несообразности) в отношении всей существующей процедуры этого самого «измерения». Неясно даже, на каком именно этапе в той или иной ситуации эту процедуру следует применять. Более того, вследствие существенно случайного характера самой процедуры, ее наблюдаемые физические проявления оказываются весьма отличными от всего того, что известно нам по другим фундаментальным процессам. Подробнее эти вопросы мы обсудим во второй части книги.
Как мне кажется, процедура измерения нуждается в кардинальном пересмотре — не исключено, что попутно придется подвергнуть существенным изменениям и самые основы теоретической физики. Кое-какие имеющиеся у меня предложения я изложу во второй части книги (). Представленные в предыдущих разделах рассуждения содержат весьма сильные доводы в пользу того, что чистую случайность существующей теории измерения необходимо заменить чем-то иным, чем-то таким, где определяющую роль будут играть существенно невычислимые элементы. Более того, как мы увидим ниже (), эта невычислимость непременно окажется какой угодно, но только не простой. (Например, закона, который, посредством какого-то нового физического процесса, «всего лишь» позволит нам устанавливать истинность Π1-высказываний — т.е. решать тьюрингову «проблему остановки» — будет самого по себе недостаточно.)
Отыскание подобной, новой и непростой, физической теории уже само по себе является достаточно серьезным вызовом нашим интеллектуальным способностям, однако это еще далеко не все. Необходимо также потребовать, чтобы найденный нами правдоподобный основополагающий принцип такого гипотетического физического поведения имел самое непосредственное отношение к функционированию мозга — сообразно со всеми ограничениями и критериями достоверности, предъявляемыми современной наукой о строении мозга. Нет никакого сомнения в том, что и здесь, учитывая теперешний уровень нашего понимания, не обойтись без изрядной доли умозрительности. Однако как раз в этой области за последнее время были совершены некоторые подлинно революционные открытия (в период написания НРК я об этом, естественно, не знал), связанные с цитоскелетной подструктурой нейронов (подробнее см. ), — благодаря этим открытиям предположение о том, что существенные для функционирования мозга процессы происходят именно на границе между квантовыми и классическими феноменами, приобретает гораздо большее правдоподобие, чем можно было представить себе прежде. Эти вопросы мы также обсудим во второй части ().
Необходимо еще раз подчеркнуть, что предметом наших поисков никоим образом не должно стать простое усложнение в рамках существующей физической теории. Кто-то, например, убежден в том, что абсолютно немыслимо построить адекватную модель сложных перемещений и хитроумной химической активности соединений-нейромедиаторов, вследствие чего подробное физическое описание функционирования мозга вычислительными методами неосуществимо. Однако, говоря о невычислительном поведении, я имею в виду совсем не это. Я полностью согласен с тем, что наших познаний о совокупности биологических структур и электрохимических механизмов, отвечающей за функциональную деятельность мозга, совершенно недостаточно для сколько-нибудь серьезной попытки численного моделирования. Более того, даже если бы у нас и достало познаний, то построить рабочую модель деятельности мозга за какой-либо приемлемый промежуток времени нам все равно не удастся ввиду недостаточно высокой вычислительной мощности современных компьютеров и отсутствия соответствующей методологии программирования. Однако в принципе, объединив уже существующие представления о химии соединений-нейромедиаторов, об обеспечивающих их перенос механизмах, о зависимости эффективности этих соединений от конкретных условий среды, биоэлектрических потенциалов, электромагнитных полей и т.д., выполнить подобное моделирование вполне возможно. Следовательно, упомянутые общие механизмы, предположительно согласующиеся с требованиями существующей физической теории, не в состоянии обеспечить той невычислимости, какой требуют вышеприведенные аргументы.
Такая вычислительная (теоретическая) модель может включать в себя и элементы хаотического поведения. Мы даже, как и в нашем прежнем обсуждении хаотических систем (см. , , , ), не станем настаивать на том, чтобы эта модель воспроизводила бы какой-то конкретный мозг; достаточно будет и «типичного случая». При создании искусственного интеллекта вовсе не требуется моделировать интеллектуальные способности какого-то конкретного индивидуума, мы лишь стремимся (в перспективе) воспроизвести интеллектуальное поведение индивидуума типичного. (Аналогичным образом, если помните, обстоит дело и с моделированием погоды: никто не требует непременно воспроизводить данную конкретную погоду, нам нужна модель погоды вообще.) Если известны механизмы, обусловливающие поведение предлагаемой модели мозга, то эта модель (при условии, что упомянутые механизмы не находятся в противоречии с современной вычислительной физикой) опять-таки представляет собой познаваемую вычислительную систему, пусть и с какими-то явно заданными случайными элементами — этот случай также вполне укладывается в рамки представленных выше рассуждений.
Можно пойти еще дальше и потребовать, чтобы предполагаемый модельный мозг представлял собой результат развития посредством процесса, аналогичного дарвиновской эволюции, неких примитивных форм жизни, поведение которых исчерпывающе описывается известными физическими законами — или законами какой-либо иной численно-модельной физики (подобной той двумерной физике, которая действует в изобретенной Джоном Хортоном Конуэем оригинальной математической игре под названием «Жизнь»). Ничто не мешает нам вообразить, что в результате такой дарвиновской эволюции может развиться некое «сообщество роботов», подобное тому, что мы рассматривали в , , и . Впрочем, и в этом случае мы получим целиком и полностью вычислительную систему, к которой будут применимы аргументы, представленные в . Для того чтобы ввести в эту вычислительную систему концепцию «☆-утверждения» (с тем, чтобы к ней можно было в полном объеме применить приведенную выше аргументацию), нам, помимо прочего, потребуется еще и этап «человеческого вмешательства», целью которого как раз и будет сообщить роботам строгий смысл присвоения статуса ☆. Можно устроить так, чтобы этот этап инициировался автоматически — согласно некоторому эффективному критерию — именно в тот период времени, когда роботы начинают приобретать соответствующие коммуникационные способности. По-видимому, нет никаких препятствий к тому, чтобы объединить все эти элементы в автоматическую познаваемую вычислительную систему (в том смысле, что познаваемыми являются лежащие в ее основе механизмы, пусть даже мы пока не можем практически выполнить необходимые вычисления ни на одном из современных или ожидаемых в обозримом будущем компьютеров). Как и прежде, противоречие выводится из предположения, что такая система может достичь уровня человеческого математического понимания, достаточного для восприятия теоремы Гёделя.
Следующее часто высказываемое возражение касается уместности применения к вопросам человеческой психологии математических доказательств, подобных тем, на которые я опираюсь в своем исследовании, — никакая умственная деятельность не бывает настолько точна, чтобы ее таким образом анализировать. Придерживающиеся подобных взглядов люди, очевидно, полагают, что никакие частные доказательства, описывающие математическую природу физических феноменов, которые, возможно, обусловливают функционирование нашего мозга, не могут иметь непосредственного отношения к пониманию деятельности человеческого разума. Они согласны с тем, что поведение человека действительно «невычислимо», однако полагают, что эта невычислимость является всего-навсего отражением общей неприменимости математических и физических соображений к вопросам человеческой психологии. Они утверждают — и не без оснований, — что гораздо уместнее в этом смысле исследовать чрезвычайно сложную организацию нашего мозга, равно как и наших общественных и образовательных структур, нежели какие-то конкретные физические феномены, волею случая ответственные за отдельные физические процессы, посредством которых реализуются те или иные функции человеческого мозга.
Не следует, однако, забывать и о том, что одна лишь сложность системы никоим образом не избавляет нас от необходимости всесторонне исследовать следствия из обусловливающих ее функционирование физических законов. Возьмем, к примеру, спортсмена, который, безусловно, представляет собой необычайно сложную физическую систему, — руководствуясь изложенными в предыдущем абзаце соображениями, мы имели бы полное право заключить, что точное знание о работающих в данной системе физических законах никоим образом не сможет повлиять на спортивные достижения этого самого спортсмена. Нам, впрочем, известно, что это далеко не так. Универсальные физические принципы сохранения энергии, импульса, момента импульса, равно как и законы тяготения, оказывают одинаково непреклонное действие как на спортсмена целиком, так и на отдельные частицы, составляющие его тело. Необходимость этого факта обусловлена самой природой тех конкретных принципов, которые волею случая управляют данной конкретной вселенной. Будь эти принципы хотя бы немного иными (или существенно иными, как, например, в конуэевской игре «Жизнь»), законы, определяющие поведение системы того же порядка сложности, что и система «спортсмен», вполне могли бы оказаться совершенно отличными от тех, к каким мы привыкли. То же можно сказать и о работе наших внутренних органов (например, сердца), и о точной природе химических процессов, посредством которых реализуются всевозможные биологические функции. Аналогичным образом, следует ожидать, что мельчайшие тонкости тех законов, которые лежат в основе функционирования мозга, будут играть чрезвычайно важную роль в управлении, возможно, наивысшими из проявлений человеческого интеллекта.
Впрочем, даже согласившись со всем вышеизложенным, можно все же возразить, что тот конкретный тип умственной деятельности, о котором я, по большей части, говорю на этих страницах, т.е. макроскопическое («высокоуровневое») интеллектуальное поведение математиков-людей, вряд ли может сообщить нам что-нибудь существенное об обусловливающих его тонких физических процессах. Что ни говори, а «гёделевский» метод рассуждения предполагает строго рациональное отношение индивидуума к собственной системе «неопровержимых» математических убеждений, тогда как, в общем случае, поведение человеческого существа едва ли можно отнести к требуемому строго рациональному типу. В качестве примера приведу один из результатов некоей серии психологических экспериментов, который показывает, насколько иррациональными могут быть ответы человека на простой вопрос. Например, на такой:
«Если все A суть B, а некоторые B суть C, то обязательно ли отсюда следует, что некоторые A суть C?».
На этот и подобные вопросы большинство студентов колледжа дают неверный (т.е. утвердительный) ответ. Если самые обычные студенты настолько в своем мышлении нелогичны, то как же нам удастся вывести хоть что-то существенное из гораздо более хитроумных рассуждений гёделевского типа. Даже опытные математики нередко бывают небрежны в своих рассуждениях, что же касается необходимой для гёделевского контрдоказательства последовательности выражения мысли, то такое, напротив, встречается далеко не так часто, как хотелось бы.
Следует, впрочем, понимать, что ошибки, подобные тем, что допускали в вышеупомянутых экспериментах студенты, не имеют ничего общего с главным предметом настоящего исследования. Такие ошибки принадлежат к категории «исправимых ошибок» — сами же студенты, несомненно, признают, что они ошиблись, если им на эти ошибки указать (и, при необходимости, доходчиво разъяснить их природу). Исправимые ошибки мы в данном контексте не рассматриваем вовсе; см., в частности, комментарий к возражению Q13, а также , . Исследование ошибок, которым порой подвержены люди, безусловно имеет огромное значение для психологии, психиатрии и физиологии, однако меня здесь интересуют совсем другое — а именно, то, что человек может воспринять в принципе, используя свои понимание, интуицию и способность к умозаключениям. Как выяснилось, связанные с этим вопросы весьма тонки, хотя тонкость их сразу в глаза не бросается. Поначалу такие вопросы выглядят тривиальными; действительно, корректное рассуждение есть корректное рассуждение, с какой стороны его ни разглядывай, — всего лишь нечто более или менее очевидное, причем все методы такого рассуждения разложил по полочкам еще Аристотель 2300 лет назад (ну а если не он, то английский математик и логик Джордж Буль в 1854 году вкупе с многочисленными последователями). И все же приходится признать, что понятие «корректного рассуждения» таит в себе неизмеримые глубины и совершенно не укладывается в рамки вычислительных операций, что, в сущности, и показали Гёдель с Тьюрингом. В недавнем прошлом эти вопросы рассматривались как прерогатива скорее математики, чем психологии, присущие же им тонкости психологов в общем случае не интересовали. Однако, как мы могли убедиться, только так можно получить хоть какую-то информацию о физических процессах, которые в конечном счете и обусловливают осознание и понимание.
Исследование упомянутых материй, помимо прочего, неизбежно затронет и глубинные вопросы философии математики. Происходит ли при математическом понимании своего рода контакт с Платоновой математической реальностью, существующей независимо от человека и вне времени; или каждый из нас в процессе прохождения этапов логического умозаключения самостоятельно воссоздает все математические концепции? Почему физические законы, как нам представляется, столь неукоснительно следуют полученным таким образом точным и тонким математическим описаниям? Какое отношение имеет собственно физическая реальность к упомянутой концепции Платоновой идеальной математической реальности? И, кроме того, если наше восприятие в силу своей природы действительно обусловлено некоей точной и тонкой математической подструктурой, на которую опираются те самые законы, что регулируют функциональную деятельность нашего мозга, то что мы можем узнать о том, как работает наше восприятие математики — как вообще работает наше восприятие чего бы то ни было, — если нам удастся глубже понять упомянутые физические законы?
В конечном счете, все наши усилия сводятся к поискам ответов именно на эти вопросы, и к этим же вопросам нам еще предстоит вернуться в конце второй части.