Задолго до того как Освальд Эвери привлек всеобщее внимание к экспериментам над ДНК в контексте «принципа трансформации генетической информации», генетики попросту пытались понять, как наследственный материал – что бы то ни было – может влиять на свойства конкретного организма. Каким образом «факторы» Менделя влияют на форму гороха, причем так, что горошины получаются либо гладкими, либо морщинистыми?

Первая подсказка появилась уже на рубеже XIX и XX веков, сразу же после того как были заново открыты работы Менделя. Английский врач Арчибальд Гаррод сделал карьеру исследователя, а не терапевта, поскольку с трудом осваивал дисциплины медицинского вуза, а также совершенно не умел тактично общаться с пациентами. Поэтому он не столько врачевал в госпитале Святого Варфоломея, сколько занимался изучением некоторых редких болезней, характерным общим симптомом которых был странный оттенок мочи. Одно из таких заболеваний, алкаптонурия, также называется «синдром черных пеленок», поскольку у страдающих этим заболеванием детей моча на воздухе темнеет. Несмотря на этот тревожный симптом, болезнь, как правило, не смертельна, хотя в зрелом возрасте и может вызывать нарушения опорно-двигательного аппарата, наподобие артрита, поскольку темные пигменты, окрашивающие мочу, накапливаются в суставах и позвоночнике. По версии медиков того времени, наличие темного пигмента было связано с бактериальной обсемененностью кишечными бактериями, но Арчибальд Гаррод настаивал на том, что черная моча появляется уже у новорожденных, пока не имеющих сформировавшуюся микрофлору, и, соответственно, эти вещества есть продукт нарушения метаболизма в организме. Гаррод предположил, что все дело в биохимическом сбое, «ошибке метаболизма», как он сам выражался. Он полагал, что здесь могут существовать критические изъяны в реализации биохимических путей.

Трехмерное изображение рибосомы, «клеточной фабрики белков». Вот она, рибосома во всей красе. В каждой клетке – миллионы рибосом. Именно в рибосомах идет сборка белков на основе информации, считываемой из ДНК, а белки – основные персонажи «биохимической драмы». Рибосома состоит из двух субъединиц, основу каждой из которых составляет молекула РНК, окруженная примерно шестьюдесятью белками. Здесь изображена рибосомальная 30S-субъединица бактериального происхождения. Атомы конкретных элементов в рибосомальной РНК окрашены в разные цвета: фосфор оранжевый, углерод серый, кислород красный, азот голубой. Транспортная РНК (тРНК), переносящая аминокислоты на рибосому, изображена в виде трубочек и окрашена в радужные оттенки (последовательно от красного и далее до оранжевого, желтого, зеленого, голубого, синего и фиолетового, от начала к концу молекулы). Матричная РНК (мРНК) также изображена в виде трубочек и окрашена в темно-синий цвет

В дальнейшем Гаррод заметил, что алкаптонурия, которая редко встречается в масштабах большой популяции, чаще поражает детей, рожденных в близкородственных браках. В 1902 году он смог объяснить этот феномен в контексте заново открытых законов Менделя. Здесь прослеживалась закономерность, характерная для наследования рецессивного гена. Допустим, двоюродные брат и сестра получают одинаковый ген алкаптонурии от общего дедушки, и возникает вероятность 1 к 4, что от их брака родится ребенок, у которого этот ген будет гомозиготным (то есть ребенок получит две копии рецессивного гена). В таком случае этот ребенок заболеет алкаптонурией. Совместив результаты биохимических и генетических анализов, Гаррод заключил, что алкаптонурия – это «врожденная ошибка метаболизма». Хотя на тот момент никто по-настоящему не понял этого вывода, Гаррод первым вывел причинно-следственную связь между генами и их физиологическими проявлениями. По его мнению, гены каким-то образом управляют обменом веществ, и генетическая ошибка, мутация, может привести к повреждению метаболического пути.

Следующий серьезный шаг на этом пути был сделан лишь в 1941 году, когда Джордж Бидл и Эд Тейтем опубликовали свое исследование об индуцированных мутациях у нейроспоры густой (хлебной плесени). Джордж Бидл вырос близ города Уаху в штате Небраска и унаследовал бы родительскую ферму, если бы общение со школьным учителем естествознания не заставило его задуматься об иной карьере. В течение 1930-х годов Бидл работал сначала в Калифорнийском технологическом институте с Морганом, прославившимся исследованием дрозофил, а затем в Институте физико-химической биологии в Париже. Бидл без остатка посвятил себя генетическим исследованиям, пытаясь, к примеру, выяснить, как работает «магический механизм» генов при изменении цвета глазок у дрозофил. Прибыв в 1937 году в Стэнфордский университет, он заручился помощью Тейтема, который присоединился к Бидлу вопреки мнению своих научных консультантов. Эд Тейтем одновременно оканчивал Университет Висконсина и там же учился в аспирантуре, исследуя бактерии, живущие в молоке; поскольку Висконсин также называют «Сырный штат», то молоко и молочные продукты были там в избытке. Несмотря на то что сотрудничество с Бидлом обещало быть занимательным и интеллектуальным, висконсинские преподаватели Тейтема убеждали его сделать карьеру в молочной промышленности, чтобы впоследствии не испытывать финансовых затруднений. К счастью для всей науки, Тейтем предпочел Бидла сливочному маслу.

Вскоре Бидл и Тейтем осознали, что дрозофила – слишком сложный организм и не подходит для интересующих их исследований. Искать конкретную мутацию у такого животного, как дрозофила, – все равно что искать иголку в стоге сена. Вместо этого они решили работать с абсолютно примитивным видом – нейроспорой густой (Neurospora crassa), красно-оранжевой хлебной плесенью, встречающейся в тропиках. Их план был предельно прост: облучать плесень рентгеновским излучением, вызывая в ней мутации, – так Меллер поступал с дрозофилами – и пытаться выяснить, как возникающие мутации влияют на Neurospora crassa. Отслеживать эффект мутаций они пытались следующим образом. Было известно, что обычная (не мутировавшая) нейроспора выживает в так называемой минимальной питательной среде. Оставаясь на таком «голодном пайке», микроорганизмы, очевидно, могли самостоятельно синтезировать все сравнительно крупные молекулы, необходимые им для жизни, собирая их из более простых молекул питательной среды. Бидл и Тейтем рассудили, что если возникнет мутация, которая исключит все эти синтетические пути, то получившаяся облученная культура плесени не сможет расти в минимальной питательной среде; тем не менее та же культура должна формировать колонии в «полноценной» питательной среде, где есть все необходимые для жизни молекулы, в частности аминокислоты и витамины. Иными словами, мутация, блокирующая синтез основного питательного вещества, окажется безвредной, если это питательное вещество можно будет брать непосредственно из питательной среды.

Бидл и Тейтем облучили около пяти тысяч плесневых культур и стали проверять их одну за другой на предмет, выживут ли они в минимальной питательной среде. Первая… вторая… третья… и только тогда, когда они добрались до 299-й культуры, выяснилось, что она действительно гибнет в минимальной питательной среде, а в полноценной выживает. Культура номер 299 оказалась первой из множества мутантных культур, которые им предстояло проанализировать. Далее требовалось выяснить, какое именно свойство утратили мутанты. Может быть, культура 299 не могла синтезировать незаменимые аминокислоты? Бидл и Тейтем попытались добавлять в минимальную питательную среду аминокислоты, но 299-я все равно не росла. Как насчет витаминов? Они добавили в минимальную питательную среду чуть-чуть витаминов, и на этот раз 299-я ожила. Теперь предстояло и далее сужать поле поиска, добавляя витамины по отдельности и проверяя, на каком этапе 299-я начнет расти. Ниацин не помог, рибофлавин тоже, но стоило им добавить витамин B6, и культура стала выживать в минимальной питательной среде. Мутация, возникшая при облучении и присущая культуре 299, каким-то образом вызывала разрушение синтетического пути, который обеспечивает производство B6. Но каким был механизм? Зная, что биохимический синтез такого рода управляется белковыми ферментами, обеспечивающими цепочку химических реакций биохимического пути, Бидл и Тейтем предположили, что каждая из открытых ими мутаций блокирует конкретный фермент. При этом, поскольку мутации происходят в генах, по-видимому, именно гены отвечают за синтез ферментов. Когда в 1941 году это исследование было опубликовано, появился слоган, отражающий наше представление о работе генов: «Один ген – один фермент».

Поскольку в тот период времени считалось, что все ферменты – это белки, вскоре встал вопрос: а кодируются ли в генах и те многочисленные клеточные белки, которые не являются ферментами? Что гены могут предоставлять информацию по всем белкам, впервые предположили в лаборатории Лайнуса Полинга в Калифорнийском технологическом институте. Полинг и его студент Харви Итано изучали гемоглобин, белок эритроцитов, основная функция которого состояла в доставке кислорода из легких к метаболически активным тканям, в частности к мышцам. Особенно их заинтересовал гемоглобин людей, страдающих серповидноклеточной болезнью, также именуемой серповидноклеточной анемией. Это генетическое расстройство, характерное для негроидов, а соответственно, и для афроамериканцев. Эритроциты у человека, страдающего серповидноклеточной анемией, деформируются и поэтому под микроскопом имеют выраженно серповидную форму. Эритроциты такой формы могут закупоривать капилляры, что вызывает ужасную боль и может даже привести к смерти. Дальнейшие исследования позволили объяснить преобладание такой болезни именно среди африканцев с эволюционной точки зрения: поскольку часть жизненного цикла у малярийного плазмодия протекает в эритроцитах, люди с серповидными эритроцитами легче переносят малярию. По-видимому, эволюция пошла на своеобразную сделку с дьяволом, подкинув такой «бонус» некоторым жителям тропиков: действительно, серповидноклеточная анемия обеспечивает какую-никакую защиту от вспышек малярии.

Итано и Полинг сравнили гемоглобин пациентов, страдающих серповидноклеточной анемией, с гемоглобином обычных людей и обнаружили, что у двух вариантов молекул гемоглобина различается электрический заряд. Примерно в тот же период, в конце 1940-х годов, генетики выяснили, что серповидноклеточная анемия передается как классический менделевский рецессивный фактор. Таким образом, заключили Итано и Полинг, серповидноклеточная анемия должна быть обусловлена мутацией в гене гемоглобина, которая влияет на химический состав получающегося гемоглобинового белка. Именно так Л. Полингу удалось уточнить версию Гаррода о врожденных ошибках метаболизма, охарактеризовав некоторые из них как «молекулярные болезни». Как раз такой молекулярной болезнью была серповидноклеточная анемия.

В 1956 году история о серповидноклеточной анемии, обусловленной мутацией гена гемоглобина, получила дальнейшее развитие благодаря Вернону Ингрэму, работавшему в той самой Кавендишской лаборатории, где мы с Френсисом Криком открыли двойную спираль. Вооружившись разработанными незадолго до того методами идентификации конкретных аминокислот в молекулярной цепочке, образующей белок, Ингрэм смог выявить именно те молекулярные различия, которые, по наблюдениям Итано и Полинга, влияли на общий заряд молекулы. Оказалось, что проблема состояла всего в одной аминокислоте.

Ингрэм определил, что глутаминовая кислота, идущая шестой в нормальной белковой цепочке, в гемоглобине больных серповидноклеточной анемией заменяется на валин. Так появилось убедительное доказательство, что генетические мутации – различия в последовательностях А, Ц, Г и Т в ДНК-коде конкретного гена – можно напрямую соотнести с различиями в аминокислотных последовательностях белков. Белки, являясь активными биомолекулами, синтезируют ферменты, катализирующие биохимические реакции, из белков образуются основные структурные составляющие организма, например кератин – ткань, из которой состоят кожа, волосы и ногти. Вот как ДНК, словно по волшебству, управляет клетками, их развитием, жизнью как таковой.

Влияние мутации. При изменении единственного основания в последовательности ДНК (речь идет о гене бета-глобина человека) в белок встраивается не глутаминовая кислота, а аминокислота валин. Из-за этого единственного различия возникает серповидноклеточная анемия, при которой форма эритроцитов искажается, они приобретают характерную серповидную форму

Однако как информация, зашифрованная в ДНК – молекуле, состоящей из последовательности нуклеотидов (А, Т, Г и Ц), – позволяет собрать белок, то есть нить аминокислот?

Вскоре после того как мы с Френсисом Криком опубликовали нашу работу о двойной спирали ДНК, с нами вышел на связь знаменитый физик-теоретик Георгий Гамов, родившийся в России. Его неизменно рукописные послания, испещренные карикатурами и разными загогулинами – некоторые из них были достаточно важны, а другие не очень, – всегда были подписаны «Geo» (как нам предстояло узнать, это произносилось просто «Джо»). Он заинтересовался ДНК еще до того, как Ингрэм убедительно продемонстрировал взаимосвязь между последовательностью оснований этой молекулы и тем, какие белки синтезируются на основе ДНК. Чувствуя, что биология наконец-то превращается в точную науку, Гамов предвидел эпоху, когда организм можно будет генетически описать очень длинным числом, в котором будут присутствовать лишь цифры 1, 2, 3 и 4, каждая из которых соответствует основанию: А, Ц, Г или Т. Сначала мы приняли его за шутника и на его первое письмо не отреагировали. Через несколько месяцев Крик повстречал его в Нью-Йорке и сразу осознал, насколько это талантливый человек. Тогда мы незамедлительно пригласили Гамова в команду серьезных дээнкашников – он стал одним из нас.

Гамов переехал в США в 1934 году, спасаясь от сталинских репрессий. В 1948 году он написал статью, в которой объяснил распространенность различных химических элементов во Вселенной результатом термоядерных реакций, протекавших на ранних этапах Большого взрыва. Исследования, выполненные Гамовым и его аспирантом Ральфом Альфером, вышли бы под авторством «Альфер и Гамов», если бы Гамов не решил также указать и своего друга Ганса Бете – несомненно, в высшей степени талантливого физика, который, однако, не принимал ни малейшего участия в этих исследованиях. Просто неисправимому шутнику и любителю розыгрышей Гамову показалось забавным, что статья выйдет под фамилиями «Альфер, Бете, Гамов», да к тому же еще и 1 апреля. С тех пор космологи называют ее «αβγ» (по инициалам Альфера, Бете и Гамова).

Когда мне впервые довелось встретиться с Гамовым (в 1954 году), он уже разработал формальный метод для обозначения конкретных аминокислот перекрывающимися триплетами оснований ДНК. Он предположил схему реализации генетического кода: сборка белка происходит непосредственно на молекуле ДНК, причем каждая аминокислота помещается в ромбической выемке между четырьмя нуклеотидами, по два от каждой из комплементарных цепей. Эта схема, получившая название «бубнового кода», предполагает корреляцию между последовательными аминокислотными остатками, так как два нуклеотида всегда входят в два соседних ромба (перекрывающийся код). Я сказал Гамову, что мне эта идея не совсем нравится: ДНК не могла быть обычным шаблоном, по которому аминокислоты укладывались бы в триплеты. Я полагал, что, будучи физиком, Гамов не читал статей, опровергающих версию о синтезе белков в клеточном ядре – а ДНК расположена именно там. Действительно, если удалить из клетки ядро, это не сказывается на темпах синтеза белков. Сегодня известно, что на самом деле сборка белков из аминокислот происходит в рибосомах, мелких клеточных органеллах, где содержится иная нуклеиновая кислота – РНК.

На тот момент было неизвестно, какую именно роль играет РНК в биохимических процессах. Казалось, что у некоторых вирусов, например у вируса табачной мозаики, она ведет себя подобно ДНК, кодируя конкретные белки, специфичные для данного организма. В клетках РНК участвует в синтезе белков, поскольку в клетках, продуцирующих белки, всегда много РНК. Еще до того как мы обнаружили двойную спираль, я полагал, что генетическая информация в хромосомной ДНК, вероятно, может использоваться при сборке цепочек РНК, состоящих из комплементарных последовательностей. В таком случае РНК являлась бы промежуточным звеном между ДНК и белками. Впоследствии Френсис Крик назвал такое преобразование ДНК → РНК → белок «центральной догмой». Такая схема получила подтверждение в связи с открытием в 1959 году фермента РНК-полимеразы. Практически во всех клетках этот фермент катализирует сборку однонитчатых цепочек РНК по двунитчатому шаблону ДНК.

Оказалось, что необходимый ключ к пониманию процесса синтеза белков появится в ходе дальнейшего изучения РНК, а не ДНК. Чтобы продвинуть работу по «взлому кода» – дешифровке взаимосвязи между последовательностью оснований ДНК и аминокислотными последовательностями белков, мы с Гамовым организовали «Клуб галстуков РНК». В него допускалось всего двадцать членов – по числу аминокислот. Гамов придумал клубный галстук и даже заказал эксклюзивные галстучные булавки, каждая из которых соответствовала своей аминокислоте. У нас были служебные бейджики, каждый со стандартизированной трехбуквенной аббревиатурой аминокислоты, которую было поручено изучать обладателю этого бейджика. У меня была аббревиатура PRO (пролин), а у Гамова – ALA (аланин). В те времена было модно писать на галстучной булавке собственные инициалы, и Гамову нравилось таким образом путать окружающих. Однажды эта шутка ему аукнулась: остроглазый гостиничный клерк отказался принять у него чек, заметив, что фамилия на чеке не соответствует инициалам на булавке.

На тот момент большинство ученых, интересовавшихся расшифровкой ДНК, вполне умещались в закрытом клубе на двадцать человек – представьте, как узок был тогда мир ДНК-РНК. Гамов легко нашел в нем место для товарища-небиолога Эдварда Теллера (LEU – лейцин), а я пригласил в нашу компанию Ричарда Фейнмана (GLY – глицин), невероятно талантливого физика из Калифорнийского технологического института. Когда Фейнману наскучивало исследовать внутриатомные силы, он частенько наведывался ко мне в биологический корпус.

Один из элементов схемы Гамова, предложенной в 1954 году, обладал важным достоинством: его можно было проверить. Поскольку речь шла о перекрывающихся триплетах в составе ДНК, такая схема означала, что многие аминокислоты никогда не будут располагаться в белках бок о бок друг с другом. Поэтому Гамов с нетерпением ожидал результатов секвенирования все новых и новых белков. По мере того как обнаруживались все новые и новые пары смежных аминокислот, теория Гамова разваливалась на глазах. Окончательный крах гамовских «шифров» наступил в 1956 году, когда Сидней Бреннер (VAL – валин) проанализировал все известные на тот момент последовательности аминокислот.

Сидней Бреннер вырос в деревне близ южноафриканского города Йоханнесбурга. Семья жила в двухкомнатной пристройке к отцовской сапожной мастерской. Хотя Бреннер-старший, эмигрант из Литвы, был неграмотен, его сын-вундеркинд пристрастился к чтению уже в четырехлетнем возрасте и благодаря этому увлечению познакомился с биологией, прочитав книгу The Science of Life. Будучи взрослым, он признался, что однажды просто украл эту книгу в публичной библиотеке. Ни воровство, ни бедность не могли помешать развитию Сиднея Бреннера: в возрасте четырнадцати лет он поступил на медицинский факультет Университета Витватерсранда, а затем отправился в Оксфорд писать докторскую диссертацию. Именно в оксфордский период он наведался в Кембридж, через месяц после того как мы открыли двойную спираль ДНК. Вот как он вспоминал о своих первых впечатлениях от нашей модели: «Когда я ее увидел, мне сразу стало ясно – да, это она. И я мигом понял, насколько она фундаментальна».

Гамов был не единственным, чьи теории оказались нежизнеспособными: мне тоже довелось погоревать. Сразу же после открытия двойной спирали я отправился в Калифорнийский технологический институт: там я собирался изучить структуру РНК. Каково же было мое разочарование, когда мы с Александром Ричем (ARG – аргинин) выяснили, что при рентгеновской дифракции РНК-снимки получаются неразборчивыми: очевидно, структура молекулы была далеко не такой красивой и правильной, как у ДНК. Френсис Крик (TYR – тирозин), разочарованный не меньше нас, в начале 1955 года уведомил всех членов Клуба галстуков РНК, что структура РНК (как я и полагал) не откроет тайны превращения ДНК в белки. Напротив, Крик полагал, что аминокислоты могут доставляться к месту фактического синтеза белков так называемыми «адапторными молекулами», причем для каждой аминокислоты должна существовать «своя» молекула такого рода. Он думал, эти «адапторы» могут быть очень мелкими молекулами РНК. Два года я с ним не соглашался. А затем было сделано крайне неожиданное биохимическое открытие, показавшее, что Крик попал в самую точку.

Клуб галстуков РНК; характерный росчерк Гамова; Гамов собственной персоной; встреча членов Клуба в 1955 году (Френсис Крик, Алекс Рич, Лесли Оргел и я) – на фотографии хорошо видны галстуки

Новость пришла из Массачусетской больницы общего профиля (Бостон), где Пол Замечник уже несколько лет разрабатывал бесклеточные системы для изучения белкового синтеза. Клетка состоит из множества мелких компартментов, и Замечник верно предположил, что необходимо изучить происходящие в них процессы без таких помех, которые возникают из-за многочисленных мембран. В процессе работы с веществами, выделенными из печеночной паренхимы, ему вместе с коллегами удалось воссоздать в пробирке упрощенный вариант внутриклеточной среды, где далее они смогли пометить аминокислоты радиоактивными изотопами и отслеживать, как из них компонуются белки. Именно таким образом Пол Замечник выяснил, что синтез белков происходит в рибосомах, тогда как Георгий Гамов поначалу этого не признавал.

Вскоре Замечник и его коллега Малон Хогланд сделали еще более неожиданное открытие: оказалось, что аминокислоты перед встраиванием в полипептидные цепочки связываются с мелкими молекулами РНК. Результат их озадачивал, пока я не рассказал им об адапторной теории Крика. Впоследствии они подтвердили версию Крика о существовании специальных малых адапторных РНК и специальных ферментов, ковалентно присоединяющих аминокислотные остатки к этим РНК. Согласно гипотезе Крика, каждой аминокислоте соответствует свой вид адапторной РНК и свой фермент, присоединяющий только данную аминокислоту к данному адаптеру. С другой стороны, адапторная РНК имеет нуклеотидный триплет (впоследствии названный антикодоном), комплементарный соответствующему кодону матричной РНК. Таким образом, узнавание кодона аминокислотой не является непосредственным, а осуществляется через систему «адапторная РНК – фермент». Специфический фермент узнает одновременно аминокислоту и определенную адапторную молекулу, так что они оказываются соединенными, в свою очередь, адаптер (с навешенной аминокислотой) узнает определенный кодон матричной РНК, так что присоединенная аминокислота становится приписанной именно данному кодону.

До открытия транспортной РНК считалось, что вся клеточная РНК служит матрицей для ДНК, но, несмотря на значительные различия нуклеотидного состава ДНК, размер и нуклеотидный состав РНК в рибосомах различных бактерий оказались весьма близкими. Кроме того, к этому времени стало ясно, что перенос информации осуществляется при помощи относительно нестабильной, короткоживущей формы РНК, тогда как рибосомная РНК оказалась очень стабильной. Эксперименты, проводившиеся в Институте Пастера в Париже, позволяли предположить, что большинство матриц для сборки бактериальных белков на самом деле недолговечны. Тем более странным оказалось то, что последовательности оснований в двух цепочках рибосомальной РНК никак не соответствовали последовательностям оснований на соответствующих участках хромосомной ДНК.

Разобраться с этими парадоксами удалось в 1960-е годы, когда была открыта третья форма РНК – матричная. Оказалось, что она и есть настоящий шаблон для сборки белков. Эксперименты, проведенные в моей гарвардской лаборатории, а также выполненные в Кембридже и Калифорнийском технологическом институте Мэттом Мезельсоном, Франсуа Жакобом и Сиднеем Бреннером, показали, что рибосомы – это, в сущности, молекулярные фабрики. Матричная РНК напоминает перфокарту из компьютера первого поколения и является программой для синтеза белка. Эта РНК переносится из ядра в цитоплазму клетки, где она связывается с рибосомами, настоящими молекулярными «машинами» для синтеза белка. Белок синтезируется из активированных аминокислот, присоединенных к особым транспортным РНК, причем каждая из аминокислот присоединена к своей специфической транспортной РНК, благодаря которой аминокислота фиксируется в каталитическом центре рибосомы, где она «пришивается» к синтезируемой белковой цепи таким образом, что аминокислоты сначала выстраиваются в правильном порядке, а уже затем химически связываются в полипептидные цепочки.

К тому моменту генетический код еще не был расшифрован, оставались вопросы механизмов, по которым последовательность нуклеиновых кислот транслируется в упорядоченную полипептидную цепочку. В 1956 году Сидней Бреннер изложил соответствующие теоретические проблемы в рукописи «Клуб галстуков РНК». В сущности, они сводились к следующему: как можно закодировать, какая именно из двадцати аминокислот должна быть установлена на конкретном участке белковой цепочки, если алфавит ДНК состоит всего из четырех «букв» – А, Т, Г и Ц? Разумеется, отдельно взятого нуклеотида, который мог бы иметь одну из четырех ипостасей, и даже двух нуклеотидов было бы недостаточно. В таком случае просто не мог бы работать механизм, допускающий 16 вариантов преобразований (4 × 4). Чтобы закодировать отдельно взятую аминокислоту, требуется минимум три нуклеотида (триплет). Но триплет обеспечивает поразительную избыточность – допускает 64 варианта преобразований. Поскольку код требует всего 20 аминокислотных остатков, означает ли это, что большинство аминокислот можно закодировать несколькими вариантами триплетов? Если так, то совершенно реалистичным мог бы оказаться и «квадруплетный» код (4 × 4 × 4 × 4), допускающий 256 преобразований и подразумевающий еще более значительную избыточность.

В 1961 году Крик и Бреннер поставили в Кембридже решающий эксперимент, показавший, что в основе генетического кода лежат именно триплеты. Искусно применив вещества с мутагенным действием, они научились встраивать в ДНК или удалять из нее пары оснований. Они обнаружили, что, когда они встраивали или удаляли единственную пару оснований, происходил патологический «сдвиг рамки» и искажался весь код, следующий за точкой мутации. Представьте себе код из трехбуквенных слов, например: JIM ATE THE FAT CAT (Джим съел жирного кота). Допустим, мы удалим первую букву «T». Если мы хотим сохранить в предложении аналогичную структуру из трехбуквенных слов, то получим: JIM AET HEF ATC AT – после удаления первой «T» начинается непроизносимая игра букв. То же самое происходит, если вставляются или удаляются две пары оснований. Удалив первую «T» и первую «E», получим: JIM ATH EFA TCA T – еще более неразборчивое сочетание букв. Что же произойдет, если мы удалим (или вставим) три буквы? Удалив первые «A», «T» и «E», мы тем не менее сохраняем в осмысленном виде остальные слова во фразе. Даже если операция удаления накрывает несколько слов – скажем, мы удаляем первую «T», первую «E» и вторую «T» – мы все равно теряем всего два слова и вполне можем восстановить скрывающееся за ними предложение: JIM AHE FAT CAT. Аналогичная ситуация прослеживается и в ДНК: однократное удаление или встраивание вносит хаос во всю структуру белка, что связано с эффектом сдвига рамки считывания и появления мутации в последовательности ДНК, для которой характерна вставка или делеция нуклеотидов, в количестве, не кратном трем. В связи с триплетным характером генетического кода вставка или делеция числа нуклеотидов, не кратных трем, приводит к сильному искажению информации в транскрибируемой мРНК. Также в результате может появиться стоп-кодон, что приводит к преждевременной терминации синтеза белка. При вставке или удалении триплета в молекуле ДНК мы далеко не обязательно получим катастрофический эффект: если при этом добавится или удалится всего одна аминокислота, то белок вполне может остаться функциональным с биологической точки зрения. (Исключение – муковисцидоз. Ниже мы убедимся, что удаление единственной аминокислоты в белке муковисцидоза – это наиболее распространенная мутация, связанная с данной болезнью.)

Как-то раз Крик и его коллега Лесли Барнетт поздно вечером пришли в лабораторию, чтобы проверить результат опыта с удалением триплета.

Крик сразу осознал всю важность этого эксперимента и сказал Барнетту: «Лишь мы с тобой знаем код триплетов!» В компании со мной Крик впервые познал секрет жизни, свернутый в двойную спираль; теперь он одним из первых узнал, что этот секрет записан словами из трех букв.

Итак, выяснилось, что код записывается триплетами-тройками, а РНК опосредует связь между ДНК и белком. Тем не менее код по-прежнему оставался не взломан. Какая пара аминокислот зашифрована в отрезке ДНК, который кодируется, скажем, последовательностью АТА ТАТ или ГГТ ЦАТ? Первый намек на решение этой загадки прозвучал в лекции Маршалла Ниренберга на Международном биохимическом конгрессе, состоявшемся в Москве в 1961 году.

Генетический код, демонстрирующий последовательности триплетов в матричной РНК. Важное различие между ДНК и РНК заключается в том, что в ДНК содержится тимин, а в РНК – урацил. Оба этих основания комплементарны аденину. Функция стоп-кодонов понятна из их названия – они отмечают конец кодирующей части гена

Узнав об открытии матричной РНК, Ниренберг, работавший тогда в Национальном институте здравоохранения США, заинтересовался, будет ли РНК, синтезированная in vitro, функционировать точно так же, как и естественная матричная форма при синтезе белков во внеклеточных системах. Чтобы узнать ответ на этот вопрос, он воспользовался РНК, специально модифицированной в соответствии с процедурами, которые шестью годами ранее были разработаны в Нью-Йоркском университете французским биохимиком Марианной Грюнберг-Манаго. Она открыла фермент РНК-полимеразу, позволявшую собирать последовательности вида АААААА или ГГГГГГ. А поскольку основное химическое отличие РНК от ДНК заключается в том, что в РНК на месте тимина (Т) стоит урацил (У), этот фермент также позволяет собирать урациловые цепочки – УУУУ, на жаргоне биохимиков «поли-У». Маршалл Ниренберг и его немецкий коллега Генрих Маттеи 22 мая добавили во внеклеточную систему именно поли-У. Результат был поразителен: рибосомы стали синтезировать простые белки, молекула которых представляла собой цепочку, состоящую из единственной аминокислоты – фенилаланина. Так они открыли, что поли-У кодирует фенилаланин. Следовательно, фенилаланин в генетическом коде должен обозначаться триплетом УУУ.

На Московском международном конгрессе, состоявшемся летом 1961 года, собрались все ключевые специалисты по молекулярной биологии. Маршалл Ниренберг в ту пору был молодым и никому не известным ученым. Ему отвели на выступление всего десять минут, и едва ли кто-то из специалистов по молекулярной биологии слышал его выступление. Но когда стали распространяться новости о его прорывном открытии, Крик подсуетился и выкроил ему время на выступление в один из следующих дней той же конференции, чтобы Ниренберг мог рассказать о своем открытии в аудитории, способной вместить всех заинтересованных. Это был исключительно важный момент. Спокойный, скромный и никому не известный молодой человек, выступая перед элитой молекулярной биологии, рассказал, что нужно сделать, чтобы полностью расшифровать генетический код.

Фактически Ниренберг и Маттеи решили всего лишь 1/64 часть задачи: определили, что УУУ кодирует фенилаланин. Оставалось расшифровать еще шестьдесят три трехбуквенных триплета (кодона), и последующие годы были отмечены многочисленными исследованиями, в ходе которых мы тщательно выясняли, какие аминокислоты кодируются другими кодонами. Оказалось, что самое сложное – синтезировать различные варианты РНК. Получить поли-У было относительно просто, а что насчет АГГ? Эти задачи решались при помощи различных хитроумных химических уловок, и многие из этих экспериментов были выполнены Гобиндом Хораной в Университете Висконсина. К 1966 году удалось выяснить значения всех шестидесяти четырех кодонов (иными словами, выстроить весь генетический код). В 1968 году Хорана и Ниренберг (совместно с Робертом Холли) получили Нобелевскую премию по физиологии и медицине.

Френсис Крик (в центре) с Гобиндом Хораной и Марианной Грюнберг-Манаго. После первого прорывного открытия, совершенного Маршаллом Ниренбергом, Гобинд Хорана открыл значительную часть генетического кода, опираясь на первопроходческие исследования Грюнберг-Манаго

Теперь давайте восстановим весь сюжет и рассмотрим, как синтезируется конкретный белок – гемоглобин.

Эритроциты специализируются на доставке кислорода из легких к тем тканям, где он требуется. Эритроциты образуются в костном мозге благодаря работе стволовых клеток – около 2,5 миллиона эритроцитов в секунду.

Когда возникает потребность в гемоглобине, расплетается соответствующий сегмент ДНК костного мозга – ген гемоглобина. Процесс в точности напоминает раздвоение ДНК при репликации. Но на этот раз копируются не две нити, а всего одна (по-научному «транскрибируется»), и в результате получается не новая нить ДНК, а новая нить матричной РНК, причем за синтез этой нити отвечает фермент РНК-полимераза. Этот сегмент матричной РНК соответствует гену гемоглобина. ДНК, с которой была скопирована эта РНК, вновь смыкается.

Матричная РНК выводится из ядра и доставляется в рибосому, которая сама состоит из РНК и белков. В рибосоме информация о последовательности нуклеотидов в матричной РНК используется для сборки новой белковой молекулы. Этот процесс называется «трансляция». Аминокислоты прибывают на место событий, прикрепленные к транспортной РНК. На одном кончике транспортной РНК расположен конкретный триплет (на приведенной здесь схеме это ЦАА), распознающий комплементарный ему противоположный триплет в матричной РНК, ГУУ. За другой кончик транспортной РНК прицеплена соответствующая аминокислота (в данном случае валин), буксируемая этой молекулой. На следующем триплете вдоль матричной РНК у нас становится транспортная РНК лизина, поскольку соответствующая последовательность в ДНК – это ТТЦ (кодирующая лизин). Теперь остается попросту биохимически склеить две аминокислоты. Сотня таких операций – и вот у нас есть белковая цепь длиной сто аминокислот. Порядок следования аминокислот зависит от порядка нуклеотидов А, Т, Г и Ц на том отрезке ДНК, по которому собирается матричная РНК. В молекуле гемоглобина две цепочки: в одной 141 аминокислота, в другой – 146.

Правда, белки – это не просто линейные цепочки аминокислот. После того как будет собрана такая цепочка, белки свертываются, образуя причудливые конфигурации. Иногда белок делает это сам, в других случаях – при помощи молекул, именуемых шаперонами. Белок становится биологически активным лишь после того, как приобретет нужную конфигурацию. Так, гемоглобин свертывается в четыре цепочки, причем цепочки в первой паре немного отличаются от цепочек во второй. Только после этого молекула приступает к делу. В центре каждой из этих цепочек расположен ключевой элемент, обеспечивающий транспортировку кислорода, – атом железа.

Сегодня удалось воспользоваться современными приемами молекулярной биологии, чтобы вернуться к некоторым классическим примерам из ранней истории генетики и переосмыслить их. Тот механизм, из-за которого одни горошины получались гладкими, а другие – морщинистыми, для Менделя оставался тайной; он считал, что есть лишь определенные признаки, подчиняющиеся законам наследования, которые он же и вывел. Однако теперь мы понимаем эту разницу в деталях на молекулярном уровне.

В 1990 году английские ученые обнаружили, что у гороха с морщинистыми зернами отсутствует один фермент, участвующий в переработке крахмала – углевода, запасаемого в семенах. Оказывается, что у гороха с морщинистыми семенами ген этого фермента не работает из-за мутации (в данном случае из-за интрузии ненужного фрагмента ДНК в середине гена). Поскольку в результате этой мутации морщинистые горошины содержат меньше крахмала и больше сахара, они быстрее теряют воду при созревании. Однако внешняя оболочка семени не сжимается при такой потере воды (и сокращении объема самого семени). Поэтому семя покрывается характерными морщинами – оно становится слишком маленьким для своей оболочки.