В начале 60-х гг. прошлого (теперь уже прошлого!) века доктор биологических наук Альфред Лукьянович Ярбус, тогда еще кандидат, проделал опыты, на которые сегодня ссылаются во всем мире все, кто хоть сколько-нибудь причастен к изучению восприятия форм и пространства.
Классические эти опыты дали начало большой серии различных исследований и значительно углубили понимание того, что значит «смотреть на мир».
На глазном яблоке испытуемого Ярбус укрепил маленькое зеркальце. Отраженный от него световой зайчик стал писать на фотобумаге узор – след движения глаз.
Человек разглядывал картину или рисунок, а узор засвидетельствовал, что «смотреть» вовсе не означает «обводить зрачками контуры предметов» (увы, даже сейчас в фундаментальных книгах, написанных неспециалистами в области зрительного восприятия, приходился читать, будто «глазное яблоко движется в соответствии с контуром»).
Нет, глаза совершают странные скачки, поначалу кажущиеся совершенно хаотическими! Но по мере того как записи отдельных движений наслаиваются друг на друга, выплывают прелюбопытные закономерности.
Первая из них та, что максимумы внимания приходятся на смысловые центры изображения. В частности, человек или животное всегда будет таким центром, даже если картина изображает природу или технику.
Лица людей значат для зрителя больше, чем фигуры, а фигуры – больше, чем детали обстановки. Рассматривая портрет, мы останавливаем взор главным образом на глазах, губах, носе. Эти же элементы – глаза, нос, пасть – наиболее интересны наблюдателю и тогда, когда перед ним морда животного.
#img7A78.png
Рис. 30. Оказывается, так мы смотрим на Нефертити... Впервые эксперимент был поставлен в лаборатории А.Л. Ярбуса в начале 60-х годов ХХ в.
Такая «иерархия ценностей», в общем, понятна. Глаза – «зеркало души», движение губ или подергивание щеки говорят о настроении более чем красноречиво. Подмеченные еще в незапамятные времена «бегающие глаза» субъекта с нечистой совестью не случайны: он концентрирует свое внимание не только на лице собеседника, всегда интересном для занятого разговором человека, но и на руках (вдруг их движение что-то выдаст?), карманах (нет ли там оружия?), лицах окружающих (не ждать ли подвоха с их стороны) – и нам сразу бросается в глаза странность, необычность такого «зрительного общения».
Да, движения глаз отражают работу мысли. Этому найдены убедительные доказательства.
В одном из опытов Ярбус предлагал испытуемым рассматривать картину Репина «Не ждали» с разных «установок», то есть стараясь решить ту или иную логическую задачу. И что же? Когда было необходимо оценить материальное положение семьи, особое внимание взора привлекало убранство комнаты, которое при «свободном» рассматривании практически не замечалось. Пытаясь вычислить возраст персонажей, зритель направлял зрачки исключительно на лица. быстрые перелеты от лиц детей к лицу матери и далее к лицу вошедшего (и немедля обратно, и снова назад по тому же пути) – таково решение задачи «Сколько времени отсутствовал тот, кого не ждали?» Беспорядочно блуждающий взгляд – попытка запомнить расположение людей и предметов в комнате...
Картина «Не ждали» – произведение широко известное. Тем интереснее, что разные люди по-разному ее рассматривают. Узоры линий отмечают: хотя элементы изображенного привлекают внимание разных людей, вообще говоря, одинаково и в явной связи с «установкой», – но каков путь обхода элементов взором, это индивидуально для каждого человека.
сказал за двести лет до опытов Ярбуса Гёте.
Эти присущие данному человеку особенности очень устойчивы. Когда вы посмотрите на картину сейчас, через три дня и неделю спустя, зеркальце скажет, что путь взгляда остался, по сути, тем же самым. «Искусство – зеркало, отражающее того, кто в него смотрится», – эти слова Оскара Уайльда порой воспринимаются как стремление «выразиться поэффектнее». А выходит, они имеют документальное подтверждение...
Несколько другой метод – киносъемку глаз использовал доктор педагогических наук Вениамин Ноевич Пушкин, чтобы понять «технологию» решения шахматных задач: путь взора подсказывает исследователю, как мыслит при этом шахматист.
#imgCF6E.png
Рис. 31. В зависимости от поставленной задачи, шахматист по-разному осматривает доску с фигурами. Киносъемку глаз проводил к.пед.н. В.Н. Пушкин
И что же? Маршрут движения зрачков зависит от задания: найти решение – рисунок один, а вот просто оценить позицию, сказать, чья сильнее, – маршрут иной.
При поисках выигрыша глаз фиксируется в основном на «функционально значимых пунктах» позиции, и потому имеются обширные районы доски, куда взор вообще не заходит. А при оценке позиции точки фиксации глаз распределяются по всей доске.
Глядеть – значит мыслить, мыслить – значит непременно особым образом глядеть.
Шахматист рассматривает каждый фрагмент позиции примерно четверть секунды. Такую же величину фиксации взора во время чтения (прозы или стихов – все равно) отмечают Ярбус и многие другие исследователи, так что доска для гроссмейстеров действительно предстает раскрытой книгой...
Четверть секунды – это время, нужное кратковременной памяти, чтобы сравнить свое содержимое с запасами долговременной. А если этого времени не хватает, потому что текст эмоционально насыщен, и у читателя возникают ответные мысли и ассоциации, взгляд задерживается дольше, но опять-таки на время, кратное четверти секунды. Мы скоро увидим, что за этой цифирью кроется интереснейшая нейрофизиология.
Объем информации, передаваемой за это ничтожное время по зрительному каналу, резко меняется с возрастом. Шестилетний ребенок способен понять за минуту не более 75 слов, двадцатилетний студент проглатывает 340. Почему?
Потому, что малыш для чтения сотни слов останавливает свой взгляд двести сорок раз и пятьдесят пять раз возвращается к прочитанному. Студент же останавливается и возвращается значительно реже.
По мнению многих исследователей, жизненный опыт дает возможность отсеивать второстепенные по значимости признаки, объединять несколько простых признаков в один сложный, комплексный знак. Иными словами, изменяется алфавит, в котором ведется опознавание, – перечень знаков, среди которых требуется обозначить искомый. И потому, хотя время остановки взора, в общем, неизменно у дошкольника и студента, скорость переработки сведений в высших отделах мозга резко возрастает.
Мозг взрослого работает быстрее, чем мозг ребенка, не только вследствие общего развития человека, не только потому, что память взрослого богаче знаниями, но и потому, что внутренняя структура мозга совершенствуется, что способы представления информации, воспринимаемой органами чувств, становятся экономичнее.
Почему так стабилен узор, который чертит свет от зеркальца? После опытов Ярбуса американские физиологи Д. Нотон и Л. Старк стали фиксировать не только общую картину пути, но и последовательность переходов взора от одной точки фиксации к другой. Путь обхода (он связан с контуром, но вовсе не повторяет его!) оказался, как и узоры, совершенно индивидуальным для каждого испытуемого и очень устойчивым.
Экспериментаторы сделали вывод, что при первом знакомстве с предметом человек как бы ощупывает его взглядом, прокладывая путь обхода: в зрительной памяти застревают признаки, характеризующие вещь, а в моторной памяти – сигналы от глазодвигательных мышц. Образуется «кольцо признаков», в котором зрительная и двигательная информации перемежаются. При новом знакомстве «кольцо» помогает опознать изображение.
По мнению других ученых, слова языка, обозначающие детали контура, подчеркивают важность этих фрагментов для опознания контура в целом. Слова «прямолинейность», «вогнутость», «излом», «пересечение» и им подобные характеризуют информативные с точки зрения отличий одного контура от другого) участки. Для более точных и тонких указаний специалисты прибегают к особым терминам. В профессиональном языке архитекторов вы найдете «полувал», «плинт», «соффит», «эхилин» и много других подобных слов, у авиаторов встретитесь с «плосковыпуклым», «S-образным», «ромбическим», «клиновидным» и прочими профилями крыльев, моряки оперируют понятиями «бульбообразного», «ложкообразного», «клиперского» носа судна.
Какие же формальные признаки характерны для точек фиксации взгляда? Что именно принимает зрительный аппарат за информационно важную особенность? Оказывается, участки контура с очень сильным искривлением – то есть «информативные фрагменты».
#img3220.png
Рис. 32. Кошка, которую нарисовал американский исследователь М. Эттнив: наверное, самая знаменитая в мире ученых...
Американский исследователь М. Эттнив предложил испытуемым отметить на рисунке, изображающем лежащую кошку, точки, которые наиболее важны для опознания смысла фигуры. Эти точки оказались, как и можно было ожидать, точками максимальной кривизны данного участка контура. Ученый соединил примерно сорок таких пунктов прямыми линиями – рисунок практически не пострадал, четкость опознания осталась прежней.
Именно эту особенность работы зрительного аппарата бессознательно использовали кубисты, «гранившие» изображаемые предметы. На нее опираются многие приемы стилизации, свойственные народному творчеству, – при вышивке крестом, в ковроткачестве. Резкие изломы не мешают узнавать изображенные мастером плавные в жизни контуры фигур людей и животных.
А как обстоит дело с теми фрагментами, на которых взор не задержался во время рассматривания? Мы их что – не видим? Видим, конечно, но не так отчетливо. Поэтому мозг порой досочиняет их, используя те миллионы картин, которые прошли перед глазами и неосознанно отложились в памяти.
Что это так, свидетельствуют «невозможные фигуры», очень смущающие неподготовленного зрителя. Вот одна из них – треугольник Пенроуза. При беглом взгляде вы не замечаете в нем ничего особенного. Три его угла настраивают на привычную картину: сколоченный из трех брусков объемный треугольник.
Дело, однако, осложняется, едва вы пытаетесь представить его пространственную форму, то есть займетесь реконструкцией трехмерности по плоскому изображению. Мозг отказывается принять реальность этой фигуры. Глаз блуждает по контуру от одной вершины к другой, вертится по кругу все быстрее, быстрее и ни на йоту не приближается к решению загадки. Треугольник остается странным, ирреальным. В чем причина?
Еще триста пятьдесят лет назад Декарт так описывал схему восприятия сложного образа: «Если я нашел путем независимых мыслительных операций отношения между А и В, между В и С, между С и D, наконец, между D и Е, то это еще не позволяет мне понять отношения между А и Е. Истины, усвоенные ранее, не дадут мне точного знания об этом, если я не смогу одновременно припомнить все истины. Чтобы помочь делу, я буду просматривать эти истины время от времени, стимулируя свое воображение таким образом, что, осознав <...> один факт, оно тут же перейдет к следующему. Я буду поступать так, пока не научусь переходить от первого звена к последнему настолько быстро, что ни одна из стадий этого процесса не будет «спрятана» в моей памяти, и я смогу созерцать своим мысленным взором всю картину сразу». Как мы знаем, мозг примерно по этой схеме управляет движением глаз. И вот в случае «невозможной фигуры» такой метод познания подводит...
#img7207.png
Рис. 33. «Невозможная фигура»: треугольник Пенроуза. Его тайна в том, что мы пытаемся зрительно вообразить на плоскости фигуру, которая на самом деле объемна (показана слева)
Давайте посмотрим, почему это случается. Анализ требует терпения, но в конце концов мы будем вознаграждены: откроется тайна не только треугольника Пенроуза, но и других «невозможных» изображений.
Итак, пересекающиеся поверхности 3 и 1 нашего треугольника образуют в точке А пересечение типа «Т» (см. рис. 34). Это значит, что поверхность 1 лежит под поверхностью 3: об этом говорит наш жизненный опыт. Смотрим на точку В – там опять пересечение «Т», образованное плоскостями 3 и 4: поверхность 3 лежит под поверхностью 4. Переходим к точке С – опять такое же пересечение и, значит, поверхность 4 лежит под поверхностью 1. Но ведь мы только что убедились, что 4 не может быть под 1, так как 4 лежит над 3, а 3 – над 1. Следовательно, 4 должна находиться над 1, а тип пересечения (Т) свидетельствует об обратном. Глаз получает две взаимоисключающие информации: созерцание каждого узла говорит, что все три бруска перпендикулярны друг другу, обход же взором отказывается строить на этих условиях объемную фигуру.
#imgAEE1.png
Рис. 34. Всего лишь восемь узлов. Ими исчерпывается всё разнообразие пересечения поверхностей, и наше зрение это очень хорошо знает
Как же выйти из противоречия? Очень просто: выкинуть один из фактов (излишнее знание только мешает). Закройте пальцем верхнюю вершину, и стороны треугольника выскочат из плоскости листа! Псевдоплоская фигура обретает объемность, все три брусочка оказываются перпендикулярны друг другу. Трюки, подобные треугольнику Пенроуза, очень любил рисовать голландский художник Морис Эсхер (или Эшер, как иногда на немецкий лад читают его фамилию). То и дело на его картинах встречаются «струящийся вверх» водопад, таинственной формы строения, направленная все время вниз по замкнутому кольцу лестница...
Странность изображений разгадывается известным нам способом: нужно прикрыть часть картины, построить с треугольником и линейкой точки схода перспективы, и становятся видимыми очень изощренные приемы «игры» мастера. Вопрос только: как ухитрялся он воображать свои невообразимые картины?
Конечно, все сказанное не значит, что зрение и мозг удовлетворяются одними «кусочками изображений». Первое впечатление проверяется иными фрагментами, контуры и объемы уточняются многократными проходами взора по разным путям – так возникает сложный, богатый образ. Чем обширнее кладовые нашего зрительного богатства, тем полнее воспринимается все новое, на что обращается глаз, тем полнее способность видеть:
это слова великого романтика Уолта Уитмена.
Но, оказывается, фрагментарность восприятия, как ее демонстрируют записи движений глаз, – это лишь внешнее выражение глубинных процессов, совершающихся на пути от сетчатки к высшим отделам зрительного аппарата. Попробуем немного продвинуться к ним и для начала поговорим о полях.
Окружающий мир проецируется хрусталиком на сетчатку в виде комбинации светлых и темных пятен. То, что предметы окрашены, вносит, конечно, некоторые особенности, но ведь и краски бывают разной яркости. Соответственно яркости откликаются фоторецепторы, на сетчатке возникает «рельеф возбуждения». (Строго говоря, в темноте фоторецепторы не «молчат», а, наоборот, вырабатывают так называемый «темновой ток», который уменьшается по мере увеличения освещенности: эта непонятная особенность фоторецепторов присуща только позвоночным.)
Вырабатываемый фоторецептором сигнал поступает на биполярную клетку сетчатки и там алгебраически складывается с другим сигналом – от клетки горизонтальной. Это нужно, чтобы учесть среднюю яркость картины и сделать возможным работу зрения и при солнечном, и при лунном свете.
Каждая горизонтальная клетка суммирует возбуждающие и тормозящие сигналы от некоторого количества близко расположенных светочувствительных клеток – нейрофизиологи называют их полем горизонтальной клетки. Поэтому горизонтальная клетка вырабатывает сигнал, учитывающий среднюю освещенность ее поля (это было установлено многими авторами, в том числе членом-корреспондентом АН СССР Алексеем Леонтьевичем Бызовым). А поскольку все горизонтальные клетки связаны между собой, учитывается средняя освещенность сетчатки в целом.
В итоге получается, что после этих сложений и вычитаний ганглиозная клетка, от которой в высшие отделы мозга идет аксон – волоконце зрительного нерва, – передает не абсолютную яркость света, а относительную: плюс или минус от средней энергии светового потока на сетчатке. Так что хотя нейрон зрительной системы способен ответить лишь на стократное изменение входных сигналов, вся она работает при перепадах яркости в сто миллиардов раз, повергая в зависть конструкторов телевизионных систем. Таковы возможности относительных измерений! И не случайно этот принцип – реагировать не на абсолютные, а на относительные изменения – мы видим буквально во всех отделах зрительного аппарата, принцип экономичный, оптимальный по своей сути.
Ведущим для всех уровней зрительной системы является и принцип полей.
Есть, например, поля ганглиозных клеток, которые впервые были обнаружены американским физиологом , впоследствии Нобелевским лауреатом. В 1932 г. он исследовал сетчатку лягушки и с удивлением увидел, что каждое волоконце в ее зрительном нерве несет сигналы не от одного фоторецептора, а от нескольких. Одни «линии связи» передавали сигналы, когда на подключенное к ним поле падал свет. Другие, наоборот, когда освещение сменялось тьмою. Хартлайн так их и назвал: «он»-поле (включено по-английски) и «офф»-поле (выключено). Сейчас эти термины общеприняты.
Двадцать пять лет спустя американские же физиологи И. Леттвин, Г. Матурана, В. Мак-Каллок и В. Питс обнаружили в сетчатке лягушки несколько типов совершенно неизвестных дотоле клеток – детекторов, как их назвали. Эти нейроны срабатывают, воспринимая различие специфические свойства изображений.
Одни детекторы реагируют на границу между светлым и темным участком – на край предмета.
Другие возбуждаются, тогда эта граница в движении, но молчат, когда она неподвижна.
Третьи указывают, что в поле зрения лягушачьего глаза появился маленький темный предмет, который движется: по-видимому, добыча, скорее всего – муха.
#imgD531.png
Рис. 35. Схема сетчатки, как она видна под электронным микроскопом: К – колбочка, П – палочка; в продолговатых члениках этих рецепторов находится множество мембран, к которым прикреплены молекулы веществ, реагирующих на фотоны; Н – ножки фоторецепторов, с которыми вступают в контакт горизонтальные клетки г, а также карликовые биполярные клетки кб, палочковые биполярные клетки пб, плоские биполярные клетки плб. Амакриновые клетки о – следующий после биполярных слой нейронов, обрабатывающих информацию, переданную фоторецепторами. Ганглиозные клетки г – последняя ступень обработки информации в сетчатке и «передаточная станция»: именно от этих клеток начинаются волокна зрительного нерва. В прямоугольнике показано, как диадный синапс (сверху) контактирует с отростками, ганглиозных и амакриновых клеток
Как только «нечто» приблизится, – а измерение расстояний функция еще одного специального детектора, – лягушка немедля атакует «это движущееся».
Кстати, точно такую же муху, но лежащую без признаков жизни на земле, лягушка атаковать не станет. Она с голоду может умереть, если кругом будут вполне съедобные, но неподвижные мухи: такой уж высокоспециализированный и не очень умный аппарат – лягушачий глаз. Он передает в мозг данные о некоторых свойствах предметов и автоматически предписывает действия по принципу: маленькое – охоться, большое – спасайся, и так далее.
Глаз более высокоорганизованных животных, тем более глаз человека, никаких предписаний, в отличие от лягушачьего, не выдает. Он сообщает мозгу сведения о картинке, он приемо-передатчик, но не командир.
Поэтому лягушачий глаз больше поставил вопросов, чем разрешил. От него не удавалось перебросить мостик к млекопитающим. И действительно, первые же опыты показали, что глаз кошки, этого прекрасно ориентирующегося в пространстве хищника, устроен совсем иначе.
#img1E50.png
Рис. 36. Работа простого поля, выделяющего точку с помощью полей on и off
Прежде всего по-иному выглядят поля ганглиозных клеток: не сплошные, а «двухступенчатые». Каждое поле природа сконструировала как кружок с «он»- или «офф»-центром и наружным кольцом (периферией) противоположного действия.
#img61F0.png
Рис. 37. Несколько простых полей, соединенных соответствующим образом, способны выделить, например, линию определенного размера. В зависимости от того, как расположены поля на сетчатке, они выделяют линии разной ориентации и разной формы. Это установили американские физиологи Х. Хартлайн (1932), И. Леттвин, Г. Матурано, В. Мак-Каллок и В. Питс (1957). Нервные импульсы показывают, как поля реагируют на свет и его выключение (правая часть рисунка)
Группы таких полей способны подчеркивать контуры изображений, усиливать контраст между участками, не слишком отличающимися по яркости, это продемонстрировал в 1959 г. тот же Хартлайн. Стало ясно, почему мы видим темные каемки – полосы Маха – на границах между такими участками: их создает зрительный аппарат «из ничего», просто потому что так устроен.
Для живых существ очень важно, что сетчатка умеет выделять контуры. В них содержатся самые существенные сведения о предметах. Однако было бы ошибкой думать, что работой сетчатки все и заканчивается. Нет, дело только начинается, впереди много станций, и первая, как мы уже говорили, – НКТ, наружное коленчатое тело. Оно вносит очень важный вклад в преобразование зрительного сигнала. Но прежде чем начать об этом рассказ – маленькое отступление.
Глаза людей на портретах смотрят задумчиво, строго, весело, лукаво... Мы не замечаем их неподвижности, как не замечаем и того, что наши собственные глаза все время в движении. Я имею в виду не те «обходы», которыми глаз выделяет наиболее информативные части картинки. Есть иные движения, они не подчиняются нашей воле, и управлять ими невозможно. Не удастся их и остановить, как ни старайся уставить взор в одну точку.
Мышцы не в состоянии удерживать глазное яблоко в полном покое. Более того, их задача как раз обратная: обеспечить непрерывные микродвижения.
Во-первых, тремор, при котором глаз подергивается с частотой около 100 герц (100 раз в секунду, но это средняя цифра, а пределы – от 30 до 150). Амплитуда дрожания ничтожная, 20...40 угловых секунд; если глаз видит тонкую линию, она будет перепрыгивать лишь с одного фоторецептора центральной ямки на другой, рядом лежащий, и не далее, а их там на одном квадратном миллиметре собралось около 50 тысяч...
Во-вторых, существует дрейф – медленные плавные смещения взора: в угловых мерах – от трех до тридцати минут.
В-третьих, периоды дрейфа сменяются небольшими скачками – микросаккадами. Взгляд «плывет» – и вдруг рывком перебрасывается чуть в сторону, где опять начинается дрейф. Эти движения также невелики по амплитуде, они того же порядка, что и дрейф, так что точка, спроецированная в центральную ямку сетчатки, даже при самом большом микросаккадическом скачке не выйдет за ее пределы.
#imgA5BF.png
Рис. 38. Наши глаза все время в движении: зигзагообразные линии – дрейф, прямые линии – быстрые саккадические скачки. На их время глаз слепнет!
И наконец, четыре раза в секунду глаз совершает незаметный со стороны большой саккадический прыжок (опять оговорюсь что цифра средняя: промежутки между этими скачками бывают от трех сотых секунды до двух секунд: эмоции и внимание делают свое дело).
Зачем все эти движения? И перед электронным осциллографом усаживаются студенты (любимый испытательный объект всех физиологов). На экране луч чертит прямую линию, а на ней пульсирует острый выброс, словно горная вершина в чистом поле. Ее видят все, кроме «автора». Ученый, проводящий опыт, подключил к мышцам его глаза токоотводящие электроды – наклеил в нужных местах на кожу тонкие проволочки.
Каждое сокращение мышечных волокон, вызывающих саккадическое движение, – это еще и выработанный ими электрический сигнал. Таково свойство всех мышц. Проволочки уловят сигнал, передают на усилитель, и на экране появляется горная вершина. А человек, по чьей милости она появилась, ее не замечает. И убедить его в том, что она существует, нет никакой возможности. «Перестаньте меня разыгрывать!» – сердится он.
Выходит, в момент саккадического движения мы слепы? К чему человеку, да и хотя бы той же кошке, по нескольку раз в секунду слепнуть?
Клетки НКТ дали ответ. Два наружных коленчатых тела – по одному в каждом полушарии – стоят на пути зрительных сигналов от сетчатки к затылочным областям коры больших полушарий. Существовало когда-то мнение, что НКТ – своего рода усилительная станция, наподобие тех, которые взбадривают сигналы в трансокеанских кабелях. Вещь, конечно, вероятная, только почему другие нервные цепи лишены таких станций? Рождается тогда иная гипотеза: НКТ не усиливает, а только регулирует силу сигналов, почему, мол, и работает зрительная система при изменениях освещенности в сто миллионов раз. Но гипотезу выдвинули до того, как стала ясна роль клеток сетчатки, промежуточных между фоторецепторами и ганглиозными клетками, а как только эта роль прояснилась, гипотеза приказала долго жить... И в книге «Переработка информации у человека», которая уже упоминалась, так прямо и написано: таинственна роль упорядоченных структур этой области мозга.
#imgEAD7.png
Рис. 39. С помощью полей, выделяющих границы между перепадами яркостей, и «просеивания» картинки сквозь «сита» НКТ мы за время между саккадическими скачками видим то, что видим
Действительно, когда микроэлектрод, с помощью которого отводят сигналы нейронов, опускается сюда, в НКТ, исследователь видит круглые поля с «он»- и «офф»-центром и противоположно действующей периферией. Такие же, как на выходе ганглиозных клеток. Повторение? Нет, природа такими вещами не занимается...
– Опыты были довольно хитрыми, но главное не в методике, а в результате, – сказал мне в Лаборатории доктор биологических наук Никита Филиппович Подвигин. – А он таков: мы доказали, что переданный по зрительному нерву в НКТ «экран» из круглых «он»- и «офф»-полей превращается там в пульсирующий. Идут эти пульсации с частотой саккадических подергиваний глазного яблока.
Вот как это происходит (на картинке изображена условная интерпретация процесса, результат которого – предстающий взору слон). Сразу же после скачка диаметр каждого поля весьма велик. Потом они начинают уменьшаться, и через 0,04 – 0,07 секунды стягиваются в маленькие точки. Площадь поля сокращается иногда в 250 раз. «Булавочные головки» существуют еще несколько сотых долей секунды и вдруг очень быстро возрастают в диаметре, увеличиваются, увеличиваются, пока границы их не станут расплывчатыми, неопределенно большими. И зрение больше ничего не передает в высшие отделы мозга до следующего скачка.
Поля нейронов НКТ, так же как поля ганглиозных клеток сетчатки, способны выделять контуры или во всяком случае границы между светлыми и темными участками изображения. Следовательно, в первый момент после саккады «экран» НКТ способен передать в высшие отделы только очень грубые сведения, пригодные для опознания самых общих очертаний этих границ.
Потом только, по мере стягивания полей, в образе «прорезаются» детали, которые становятся все более мелкими. А когда из картинки извлечен максимум сведений, восприятие прекращается потому, что поля распадаются, расплываются до следующего саккадического движения. В промежутке между скачками, судя по всему, зрительная кора перерабатывает данные, полученные из НКТ. А затем – новый круг анализа.
Цикличность восприятия вполне аналогична цикличности работы любого компьютера. Чтобы принять новую информацию, старая вычищается из кратковременной памяти при очередном скачке, свежие данные не путаются с предыдущими. Во время скачка смотреть не нужно, чтобы изображение не дергалось, вот глаз и слепнет. Честное слово, не перестаешь восхищаться фантастической продуманностью (если только это слово можно отнести к природе) схемы действия зрительного аппарата!
Чрезвычайно важная подробность: степень стягивания полей «экрана» НКТ зависит от освещенности сетчатки, от общего потока света. При тусклой лампочке в коммунальном коридоре зрение принципиально не в состоянии различить мелкие детали обстановки: поля слишком крупны, и пыль на полу вроде бы и не существует. А если ввернуть поярче?
Часовщики и радиомонтажники стараются доставить себе на стол лампу посильнее. Работник дорожной полиции скажет, что хорошо освещенные дороги – это снижение аварийности. Главный инженер подтвердит: да, в хорошо освещенном цеху реже несчастные случаи. Яркий свет способствует росту производительности труда: «пульсирующие поля» стягиваются сильнее, а раз четче зрение, увереннее действует рука.
Благодаря полям НКТ в зрительную кору поступает изображение, как бы просеянное через множество сит: в одном задерживаются только крупные «камни» – большие фрагменты картинки, в следующем помельче и так далее, пока не дойдет до самого мелкого «песка». Что из этого следует? О, весьма многое! Но чтобы это ясно увидеть, займемся ненадолго одной задачей.
Смотрите: на столе сотня фотографий, мужские и женские лица. Нужно их рассортировать. Две минуты, и задача решена. В левой стопке мужчины, в правой женщины. И теперь спросим себя: по какому критерию производилось деление? Какие приметы являются признаком женского лица и какие мужского? Основание для разбивки было, а способны мы дать ему определение? Нет, не сию минуту – завтра, через неделю?..
Искренне советую, не беритесь за это безнадежное дело. На нем споткнулись уже тысячи отменных специалистов по вычислительной технике. Оно и понятно. Потому что дать словесное определение обобщенному образу «мужчина», «женщина», «стул», «стол» и прочим такого же рода невозможно, ибо эти образы – зрительные абстракции. А с абстракциями нужно обходиться корректно. Кушать вишни и сливы мы можем, но не в состоянии есть абстрактный плод. Так что когда в наш век компьютеризации программисты попытались вбить в электронные мозги логические определения зрительных абстракций, фиаско выглядело вполне закономерным.
Несколько лучше обстоит дело со словесными описаниями конкретных человеческих лиц, но пользоваться такими определениями (и составлять их) умеют опять-таки не машины, а только люди. Еще в конце прошлого века французский криминалист Альфонс Бертильон, начальник Бюро судебной идентификации Парижской префектуры, разработал принципы «словесного портрета», к которому охотно прибегают и сегодня.
«Разрабатывая словесный портрет Янаки, я допросил большую группу свидетелей... Выяснил все его мельчайшие приметы и разработал словесный портрет, из которого явствовало, что Янаки имеет средний рост, телосложение полное, лицо овальное, лоб низкий и скошенный, брови дугообразные, сросшиеся, рыжеватые. Нос у него был длинный, с горбинкой и опущенным основанием, рот средний с толстыми губами, причем нижняя отвисала, а углы губ были опущены. Подбородок у Янаки тупой раздвоенный, слегка оттопыренные большие уши имели треугольную форму, чуть запухшие глаза были зеленоватыми, а волосы – рыжими», – вспоминал следователь уголовного розыска.
Не правда ли, как выпукло предстает перед нами образ человека в этих простых, точных профессиональных терминах! Пусть «точность» подобных определений далека от показаний измерительных приборов, вы прекрасно сможете нарисовать, если обладаете талантом художника, портрет Янаки. Конечно, длинный нос для одного лица станет вполне обыкновенным или даже коротким для другого, так что составление словесных портретов – искусство. В этом деле криминалисты тренируются, как тренируются геологи в распознавании своих индигово-синих, кошенильно-красных, томпаково-коричневых и медово-желтых минералов...
Как же, однако, быть, если свидетель не знает специальных терминов (а так чаще всего и случается), если видел преступника только мельком, в испуге, если сохранились лишь самые общие впечатления? В таком случае прибегают к портрету-роботу. В криминалистической компьютерной программе хранится сотни и тысячи разнообразнейших форм носов, ушей, бровей, глаз, бород, овалов лица, причесок... Из них «лепят» портрет, а свидетель подсказывает:
– Нет, лицо как будто шире... Нет, еще шире... Вот сейчас в самую точку. А волосы не такие длинные...
Конечно, нет уверенности, что робот будет во всех деталях похож на разыскиваемого, но путеводную нить он все-таки дает. И вот еще вопрос: может быть, наблюдая за изготовлением подобного портрета, удастся вскрыть критерии, которыми человек пользуется, узнавая лица?
Американский физиолог Леон Хармон провел серию экспериментов. Опытный художник-криминалист рисовал портрет «разыскиваемого» по указаниям хорошо знавших его «свидетелей». Затем художник сравнивал получившийся портрет с фотографией «беглеца» и записывал бросившиеся ему в глаза различия: «Губы должны быть чуть толще, уши прижатее, а овал лица – круглее...» Взяв портрет и словесную корректировку, новый художник-криминалист, до того не участвовавший в опыте, набрасывал еще один портрет-робот. А потом устраивался вернисаж.
К своему огромному удивлению, «свидетели» вдруг осознали, что созданный по их словам облик далек от реальности. Подавляющим большинством он был признан совершенно непохожим: язык еще раз доказал свою приблизительность, расплывчатость.
Зато в оценке отклонений речь куда более точна: второй портрет все одобрили как близкий к оригиналу.
И все-таки самым лучшим, гарантирующим точность опознания выше 90 процентов, оказался портрет, нарисованный художником с фотографической карточки. «Лучше один раз увидеть, чем сто раз услышать...»
Тогда исследователь подошел к проблеме по-иному. Почему нет возможности добиться ничего путного от рисунков, опрашивая их «напрямую»? Может быть, в них чересчур много деталей, и они слишком выразительны, эти второстепенные подробности, так что целостный облик предстает искаженным? Может быть, стилизованное изображение, этакая крупноблочная мозаика, сконцентрирует внимание зрителя на самых существенных, самых информативных подробностях? Чтобы докопаться до правды, решили создать портрет, нарисованный как бы донельзя грубой малярной кистью.
Роль маляра поручили компьютеру. Ведь что такое компьютерный портрет? Набор точек различной яркости. Каждая яркость и цвет определяется числом. Скажем, самая светлая – 100, а самая черная – 0. У каждой точки есть и адрес: расстояние от краев, бокового и верхнего. Портрет выглядит длинным столбцом цифр, который превращается на экране в картинку.
#img479D.png
Рис. 40. Путем квантования яркостей картинка преобразуется зрительной системой в скопище точек – «блок-портрет»
А затем на портрет этой пары наложили сетку из 400 квадратиков (матрицу из 20 строк и стольких же столбцов) и приказали: «Все точки, которые попадают в границы каждого квадрата – адреса их, уважаемый компьютер, вам известны, – приведите к общему знаменателю. То есть выведите среднюю яркость для данного квадрата – его условную яркость. А затем покажите на экране, что получилось».
Так возникли крупноблочные элементы и сложилась мозаика. На экране высветился... Нет, не портрет, какая-то мешанина темных и светлых пятен! И все-таки почти половина испытуемых увидели в этом хаосе облик человека и отыскали его портрет среди фотографий, разложенных на столе, хотя лицо его видели впервые. Если бы они выбирали наугад, вероятность успеха не превысила бы четырех шансов на миллион, следовательно, случайность исключена.
Выходит, зрение умеет превращать мозаику грубых блоков в нечто тонкое и изящное, свойственное хорошей фотографии? Или, наоборот, в нашей памяти тонкие черты лиц запоминаются в виде блок-портретов? Или?..
Но как бы то ни было, если взглянуть на блок-портрет с расстояния в пару шагов или чуть прищурившись, возникает что-то похожее на обычную фотографию. В чем причина метаморфозы? Чтобы рассказать об этом, придется вспомнить о рядах Фурье.
В 20-х годах XIX века французский математик Жан Батист Жозеф Фурье напечатал работу, обессмертившую его имя: «Аналитическая теория тепла». Паровые машины уверенно завоевывали позиции в промышленности, инженеры нуждались в теории теплопередачи, она и была создана. А в дальнейшем оказалось, что сшитый Фурье математический костюм впору и электрикам, и радиоинженерам, и строителям самолетов – представителям тысяч профессий, включая психологов и физиологов.
Универсальность формул не случайна. Тепловое движение – один из частных случаев движения вообще. Математический аппарат одинаково точно описывает и колебание струны, и распространение тепла по трубопроводу, и прыжки кузова автобуса на рессорах, и качку супертанкера на морских волнах, и беззвучное путешествие Луны среди звезд, и биение пульса...
#img76FA.png
Рис. 41. Так сложное («неправильное») колебание – в нашем случае резкий скачок яркости – разлагается в ряд «правильных» колебаний – в ряд Фурье
Колебания маятника зафиксируются на графике в виде плавной кривой – синусоиды. Прихотливое дрожание осинового листа – это сумма множества простых колебаний, сложение массы разных синусоид, отличающихся частотами и амплитудами. Фурье доказал, что любое сложное колебание, каким бы странным ни был его записанный на бумаге график, можно превратить в ряд простых синусоид. И наоборот, из некоторого количества подобранных по формулам Фурье простых колебаний не составит труда сотворить сложное колебание – то, которое нам требуется.
Методами этими широко пользуются ученые наших дней. Николай Александрович Бернштейн первым в мире продемонстрировал, что движения рук и ног человека (а каждая конечность – это многозвенный шарнир!) можно изложить Фурье-языком. Развивая его взгляды, швед Иохансон, сотрудник Упсальского университета, выяснил, что формулами Фурье выражаются танцы: чем длиннее ряд, на который разлагаются движения, тем больше в рисунке танца деталей, придающих ему специфику и неповторимость...
А теперь взглянем на блок-портрет. Что можно сказать о яркости квадратиков мозаики в любом из рядов? Что она подвержена каким-то колебаниям. То есть и тут можно применить формулы рядов Фурье. Только измерять мы будем частоты не в герцах, как принято у электриков и радиотехников, а в циклах на градус, так, как считают физиологи. Эта их единица значит вот что. Когда глаз смотрит на блок-портрет с такого расстояния, что строка блоков занимает в поле зрения один угловой градус (вспомните геометрию), то при двадцати циклах «темное – светлое» пространственная частота 10 цикл/град, а при десяти циклах – 5 цикл/град. Самая низкая пространственная частота блок-портрета, понятно, ноль – отсутствие каких бы то ни было изменений яркости.
В описанном блок-портрете из 400 квадратиков максимальная полезная пространственная частота равна 10 цикл/град. Полезная! А кроме нее присутствует очень много вредных частот, их называют шумом.
Они возникают «сами собой» из-за резких перепадов яркости между квадратиками. Любой такой перепад, говорит Фурье-анализ, состоит из суммы бесконечно большого количества пространственных частот. Однако бесконечность сугубо теоретична: частота растет, а размах колебания, его амплитуда, становится все меньше. На десятой частоте размах становится таким крохотным, что этой частотой обычно пренебрегают.
Пространственные частоты шума глушат, забивают полезную информацию. Так бывает, когда зверь спрячется в густом кустарнике: дробное чередование ветвей и листьев прячет своими высокочастотными сигналами информацию о его туловище, которую дают низкие пространственные частоты.
Тут пора вспомнить об экране НКТ. Ведь он как раз занимается тем, чем занимался в нашем примере компьютер! Пульсирующие поля НКТ превращают картинку в целый набор изображений – результат прохождения через сита, о которых мы уже говорили. И конечно же, мы не увидим спрятавшегося зверя, если низкочастотные составляющие сигнала малы, зашумлены.
#imgB943.png
Рис. 42. Частотный анализ
На этом принципе основана вся военная маскировка, при которой «высокочастотная» окраска разноцветными пятнами делает контуры военной техники или каких-либо сооружений неузнаваемыми, по той же причине пятнисты комбинезоны десантников.
Ясно теперь, почему блок-портрет становится более узнаваемым с большого расстояния. Сетчатка в этом случае не способна передать высокие пространственные частоты: фоторецепторы хоть и малы, а имеют свою величину, рецептивные поля еще крупнее, так что перепад «темное – светлое», пришедшийся целиком на такое поле, воспринимается как участок какой-то средней яркости. Шумы уменьшились – полезная информация выступила явственнее.
А с прищуриванием – тут действует иной механизм. Прищуренные ресницы играют роль диафрагмы, уменьшают количество проходящего к сетчатке света. Поэтому поля НКТ стягиваются не до конца, что также выглядит для высших отделов зрительной системы как срезание высоких пространственных частот, уменьшение зашумленности. Сито НКТ анализирует картинку с помощью сравнительно грубых ячеек, и высокочастотные перепады яркости просто не воспринимаются зрением, а раз шума нет, видимость улучшается.
И вот еще один факт для размышлений. Мы говорили, что глаз, осматривая картинку, задерживается чаще всего на изломах контура и участках большой кривизны – информативных фрагментах. Специалисты по теории связи сразу скажут: в этих фрагментах много высоких пространственных частот, и чем излом круче, тем длиннее набор, тем выраженнее в нем высокочастотные составляющие.
Не потому ли и зрачок дольше смотрит на это место, что зрительная система ждет, пока через сито НКТ пройдут самые высокие члены разложения в ряд Фурье? И не поможем ли мы взору немедля обратить внимание на такие фрагменты, если каким-то образом вырежем из пространственно-частотного винегрета только интересные нам частоты и представим их зрению?
Оптики пользуются для этого фильтрами Фурье: разного рода регулярными структурами. Это и решетки, и «шахматные доски», и концентрические круги, и многие иные формы, лишь бы обеспечивалось чередование прозрачных и непрозрачных участков. Чем выше нужная пространственная частота, тем элементы фильтра деликатнее.
Когда в руках такой фильтр, нетрудно выяснить, есть ли в изображении соответствующие пространственные частоты: достаточно взглянуть через него. Все частоты, кроме той, на которую фильтр настроен, ослабятся, а «его» пройдет свободно. Упоминание о такой возможности было в статье, рассказывавшей о работах Лаборатории в Колтушах и помещенной в журнале «Знание – сила». Месяца через два пришло письмо из города Омсукчана Магаданской области:
«Уважаемая редакция!
В 11-м номере за 1974 г. вашего журнала была помещена корреспонденция В. Демидова «Глаз и образ». В ней, в частности, упомянуто о фильтрах Фурье. Отмечено, что оптики издавна пользуются фильтрами-решетками. Это натолкнуло меня на мысль о применении решетчатых фильтров в геологическом дешифрировании аэрофотоснимков. Ведь снимок всегда несет ряд случайных колебаний фототона, маскирующих границы раздела разнородных участков земной поверхности. Фильтры Фурье как раз и позволят снять эти случайные колебания, выровнять однородные и более контрастно выделить неоднородные поверхности. Мною были изготовлены несколько примитивных фильтров (на прозрачную целлулоидную пластинку нанесена черной тушью решетка). Определенный эффект достигается. Неясные контуры структур становятся более отчетливыми, легче выделяются...»
Большая статья о применении различного рода фильтров (растров) помещена в сборнике «Исследование природной среды космическими средствами». Он был издан Академией наук СССР к совещанию советско-американской рабочей группы, занимавшейся проблемой поиска природных богатств с самолетов и из космоса. Авторы отмечают плодотворность идеи анализа аэрофотографий через растр, говорят, что качество изображений улучшается.
Фильтры Фурье против шума... Но ведь шумом можно считать не только помехи, а и всякого рода изменения (вариации) изображений, например размера или форм букв при письме. Зрительный аппарат человека ухитряется схватить нечто общее, присущее этим вариациям, не обращая внимания на второстепенные особенности. Не происходит ли в зрительной системе фильтрация Фурье? И не вытекает ли эта уникальная возможность зрительной системы из деятельностью НКТ, из процеживания картинок через сита пульсирующих полей? Судя по всему, это так.
И правда, инженеры кое-чему научились у живых организмов: компьютерные программы сегодня распознают с высокой точностью типографские шрифты, а после недолгого обучения – даже рукописные и изысканно стилизованные, например готику. А компьютерная полицейская программа сравнивает фотографию на паспорте с портретом в своей памяти, и загорается красная надпись: преступник!
Конечно, стопроцентной гарантии от ошибок достичь не удается. Ряд Фурье простирается в бесконечность, и в всегда найдется такая крошечная деталь, которой будут отличаться картинки, похожие по всем остальным показателям. Но тут уж ничего не поделаешь. Проблему «похож – не похож» приходится всегда решать с какой-то разумной степенью точности.
Но что самое главное, такой подход – через фильтры Фурье – позволяет взглянуть на проблему опознания с голографических позиций.
Голография... Ее материальную основу – волновой процесс – наука осознала еще в VII в. Знаний, чтобы воплотить ее в реальность, хватило бы у таких замечательных исследователей, как Юнг, Френель, Фраунгофер, много и плодотворно занимавшихся волновой природой света и взаимодействием его волн. И все-таки она не появилась, хотя Кирхгоф, Рэлей, Аббе и многие другие физики второй половины XIX – начала XX в. вплотную подходили к ее принципам.
А изобретя ее, наконец, в 1947 г., Деннис Габор, венгерский физик, работавший в Англии, не смог найти ей практического применения и с годами почти позабыл о придуманном способе получения необычных фотографических изображений.
#imgFEA8.png
Рис. 43. Создаются голограммы методом Эммета Лейта и Юриса Упатниекса (сверху) или более общим методом Ю.Н. Денисюка (снизу)
Иную, чем у Габора, обобщенную схему получения голограмм предложил в 1962 г. ленинградский инженер Юрий Николаевич Денисюк. Из нее вытекали и все остальные методы голографирования. Увы, тогдашние советские ученые-эксперты, к которым попала на рассмотрение заявка на открытие (примерно 100 страниц формул и описаний экспериментов), отнеслись к ней по-барски презрительно. Рецензия состояла из одной строчки: «Заявитель явно не знает курса физики для десятого класса средней школы». Этот отзыв сочинил некий кандидат наук, а подписал всемирно известный физик, директор Института физических проблем П.Л. Капица (и на старуху бывает проруха...). В результате Денисюк лет на восемь забросил свои занятия голографией, хотя уже получил практические результаты и защитил кандидатскую диссертацию по этой проблеме.
Единственный человек, который вполне оценил его теорию, был почтенный физик, академик Иван Николаевич Обреимов, присутствовавший на защите. Он сказал: «Тут говорили о физической невозможности процесса, предложенного диссертантом. Пусть так. Но ведь математическая сторона работы безупречна, не правда ли? Так давайте за физику поставим ему ноль, а за математику пятерку». С ним все согласились, и защита состоялась.
#img4AD4.png
Рис. 44. Чтобы увидеть сголографированное изображение, голограмму нужно осветить, например, солнечным светом или лучом лазера
Обреимов рекомендовал статью Денисюка в «Вестник Академии Наук». Она вышла в свет за месяц или два до появления в «Журнале американского оптического общества» статьи американских радиофизиков Эммета Лейта и Юриса Упатниекса, предложивших еще одну схему получения голографических изображений. Так что приоритет остался за Денисюком. И пришло письмо от крупного американского физика П. Дж. ван Хирдена: «Мое незнание Ваших работ тем более непростительно, что, как я только что обнаружил, Ваша статья 1962 года давно уже переведена на английский...».
После всего этого кандидата физико-математических наук Денисюка выбрали членом-корреспондентом Академии наук СССР, хотя он не имел степени доктора, случай беспримерный в истории академии. И, конечно же, выдали диплом на открытие. А доктором наук он стал позже, но не по голографии...
Голография в ее наиболее известном виде – это особое фотографирование, без привычной фотокамеры, на пластинку, которую ставят между лазером и голографируемым предметом (левый рисунок). Отраженный от предмета лазерный луч – предметный – и идущий сквозь пластинку опорный луч взаимодействуют друг с другом, как положено двум потокам волн. Сплетение горбов и впадин создает на пластинке узор из темных и светлых пятнышек, каждое из которых – размером с четверть световой волны. Если теперь (после проявления, закрепления и еще одной операции, которой в обычном фотографическом процессе нет, – отбеливания) выставить пластинку на свет, мы вдруг увидим, как «из ничего» возникнет объемное изображение, скажем, сростка кристаллов горного хрусталя.
Как это происходит? Предельно бегло – дело обстоит так, как если бы каждое получившееся пятнышко стало самостоятельным источником света. Его электромагнитные волны взаимодействуют в пространстве, усиливая и ослабляя друг друга, и из световых лучей оказывается соткан видимый образ – предмет, подвергшийся голографированию. По сути этот образ не что иное, как память о тех электромагнитных волнах, которые отражались от него во время съемки.
«Я бы хотел указать на философский аспект таких удивительных явлений, как <...> сходство голографической регистрации с памятью человека», – заметил Габор. И действительно, на одной голограмме можно уместить сотни тысяч изображений, в одном квадратном сантиметре ее находит пристанище до 100 миллионов бит (единиц измерения информации).
Голограмма любого предмета – идеальный фильтр, выделяющий его изображение среди тысяч других. Скажем, множество ключей с хитрыми бородками разбросаны в беспорядке на столе: попробуйте отыскать нужный. Сколько минут вы потратили? А достаточно взглянуть на освещенный лазером хаос через голограмму данного ключа, – и там, где он лежит, вспыхнет яркая точка. Скорость работы голографических опознающих систем в миллион раз превосходит быстроту самых лучших установок, решающих задачу традиционными методами. Таковы, например, голографические узнаватели, которым предъявляют для сравнения фотографии, отпечатки пальцев, буквы рукописей и т.п. Как не заметить тут сходства со зрением, опознающим за сотые доли секунды знакомое лицо среди множества других!
Где же складываются и вычитаются пространственные частоты, с которыми оперирует глаз и к которым имеет, по-видимому, прямое отношение НКТ? Разнообразные опыты, проводившиеся в лабораториях многих стран, убедили исследователей, что делается это в высших областях зрительной системы.