Я с нетерпением ждал завершения секвенирования человеческого генома, чтобы узнать, насколько полученное количество пар оснований в геноме будет близким к числу 72 415 генов. Почему именно эта цифра так магически привлекала и манила меня? Происходило это в связи с событиями и сюрпризами, которые были ранее на проекте «Геном человека». В декабре 1999 года выяснилось, что между двумя важнейшими «вехами» геномной последовательности – отметками «миллиард» и «два миллиарда» пар оснований – находятся результаты анализа первой целиком отсеквенированной хромосомы – под номером 22. Хотя по размерам эта хромосома совсем маленькая – на ее долю приходится всего 1,1 % генома, в ней все равно 33,4 миллиона пар оснований. Детально проанализировав 22-ю хромосому, мы впервые попытались предположить, как может выглядеть весь геном в целом. В журнале Nature был опубликован отклик на это событие. Автор отклика написал, что мы словно «впервые взглянули на поверхность или ландшафт другой планеты». Интересным фактом стала установленная плотность расположения генов в хромосоме. Мы были уверены, что 22-я хромосома позволит нам судить обо всем человеческом геноме – в ее последовательности мы ожидали найти примерно 1,1 % всех человеческих генов. Таким образом, если отталкиваться от стандартной «академической» оценки, согласно которой, у человека около 100 тысяч генов, логично было предположить, что в 22-й хромосоме их обнаружится примерно 1100. В действительности оказалось, что 22-я хромосома содержит вдвое меньше генов: 545. Это был первый «важный звоночек» молекулярным генетикам: человеческий геном далеко не так богат генами, как нам ранее казалось.

Вопрос о количестве генов у человека стал особенно актуальным в связи с определенными событиями. На конференции о геноме человека, состоявшейся в мае 2000 года в лаборатории Колд-Спринг-Харбор, Юэн Бирни (тогда возглавлявший в Сенгеровском институте центр по компьютерномуанализу геномной последовательности) организовал конкурс, который назвал GeneSweep. Это была лотерея, выигрыш в которой зависел от правильного определения числа генов, а результат предполагалось озвучить, когда секвенирование генома будет закончено, то есть в 2003 году или ранее, как получится. Победителем было решено объявить того, чей прогноз окажется ближе всего к фактическому результату. Очевидно, что именно Бирни стал неофициальным букмекером проекта «Геном человека», ведь числа – его стихия. Закончив высшую школу в Итоне, он целый год занимался количественными исследованиями в области биологии и в это время жил в моем доме на Лонг-Айленде, весьма далеко от троп Гималаев и шикарных баров Рио, двух наиболее вероятных мест, где молодой британец предпочел бы провести свободный год перед поступлением в университет. Результатом работы Бирни в Колд-Спринг-Харборе стала публикация двух важных исследовательских работ.

Возвращаемся к нашему научному тотализатору. Исходно Бирни брал доллар за версию, но цена «участия» повышалась после опубликования каждой новой оценки, приближавшей нас к конечному результату. Я оказался в первых рядах, поставив доллар на 72 415. Я выбрал такое число специально, пытаясь попасть в промежуток между «академической» цифрой в 100 тысяч и наиболее точной текущей оценкой генома в 50 тысяч, которая была выведена по итогам секвенирования 22-й хромосомы на тот момент времени. С тех пор минуло уже более 10 лет, а генетики до сих пор спорят о точном количестве генов, но уже совершенно очевидно, что моя оценка получилась крайне завышенной. Так я потерял на угадывании генома доллар.

Пожалуй, не менее важным был вопрос, вызывавший бурю спекулятивных дискуссий и тем для разговоров намного больше, чем просто подсчет числа генов. Вопрос заключался в следующем: чьи именно гены мы секвенируем? Хотя эта информация была конфиденциальной, поскольку в данном случае от заказчиков передачи денег из рук в руки не предполагалось, тем не менее этот вопрос интересовал многих. В рамках публичного проекта все было ясно. Отсеквенированная нами выборка ДНК была получена от множества произвольно выбранных доноров-добровольцев, проживающих в районе города Буффало, штат Нью-Йорк; именно в этом районе происходила и вся обработка материалов: извлечение ДНК, внедрение ее в искусственные бактериальные хромосомы, картирование и секвенирование. Изначально компания Celera заявляла, что ее биоматериал также получен от шести анонимных доноров, представителей разных культур. Однако в 2002 году Крейг Вентер не удержался и поведал всему миру через средства массовой информации, что для секвенирования был использован и его собственный геном. На сегодняшний день эта информация – все, что связывает Вентера с компанией Celera. Руководители этой компании были так обеспокоены, что секвенирование геномов при всей своей гламурности и инновационности в перспективе может оказаться убыточным бизнесом, что переформатировали организацию в фармацевтическую компанию и в 2002 году распрощались со своим основателем. Что до Крейга Вентера, то он основал в Сан-Диего новый институт имени себя, а также еще две амбициозные компании: одна пыталась использовать бактериальные геномы для поиска свежих источников возобновляемой энергии, а вторая, подражая Celera, занимается высокопроизводительным секвенированием отдельных геномов в поисках таких вариантов, которые обеспечивают здоровье и долголетие. Как уже упоминалось ранее, Вентер заявил, что его компания Human Longevity отсеквенирует один миллион человеческих геномов к 2020 году.

Гены хромосомы человека 2: 243 миллиона пар оснований

Теперь, располагая полной последовательностью человеческого генома, мы понимаем, что плотность распределения генов в 22-й хромосоме нисколько не атипична. Если уж на то пошло, 22-я хромосома с ее 545 генами оказалась при своем маленьком размере, скорее, даже насыщена генами, а не бедна ими. В 21-й хромосоме – примерно такого же размера – удалось выделить всего 236 генов. В настоящее время всего известно около 21 тысячи генов в полном наборе человеческих хромосом (22 + X + Y). Пока остается смириться и признать, что мы по-прежнему не знаем, сколько именно генов в человеческом геноме, хотя проект «Геном человека» завершился уже более десяти лет назад. Несколько международных групп, в том числе Национальный центр биотехнологической информации при Национальных институтах здравоохранения, организация Ensembl в Англии и международный консорциум под названием GENCODE, постоянно анализируют и уточняют реестр генов. Последние прогнозы о числе генов, кодирующих белки, варьируют от 19 800 до 22 700 – в среднем получается 21 035. Кроме того, есть еще от 35 тысяч до 40 тысяч генов, кодирующих транскрипты РНК, но не кодирующих сами белки. Ясно одно: окончательное число явно не дотягивает до отметки 50 тысяч, не говоря уж о 100 тысячах генов.

Насколько не дотягивает – покажет время. Поиск генов – нетривиальная задача; области, кодирующие белки, – это просто последовательности А, Г, Т и Ц, «встроенные» в геном посреди других А, Г, Т и Ц; они ничем особо не выделяются. Как вы помните, всего около 2 % генов в геноме человека кодируют белки; все остальное, пренебрежительно именуемое в учебниках «мусорная ДНК», до недавнего времени казалось набором явно нефункциональных отрезков различной длины, многие из которых встречаются неоднократно. Мнение об этом принципиально изменилось в свете данных, полученных в проекте ENCODE (об этом было рассказано в главе 7). Такой «мусор» бывает рассеян даже в самих генах; гены, нашпигованные некодирующими сегментами (интронами), могут занимать обширные участки ДНК, и кодирующие элементы напоминают отдельные городки, расположенные вдоль пустынной молекулярной автомагистрали. Некоторое время самым длинным человеческим геном считался дистрофин (мутации в этом гене вызывают мышечную дистрофию), который простирается более чем на 2,4 миллиона пар оснований. Всего 11 055 из них (0,5 гена) кодируют сам белок; остальная часть гена приходится на 78 интронов (человеческий ген содержит в среднем восемь интронов). Именно из-за такого несуразного устройства генома идентифицировать гены настолько сложно. Но потрясающая воображение длина дистрофина меркнет по сравнению с длиной коннектина (титина), основного белка эластичной решетки цитоскелета и третьего по распространенности мышечного белка. Этот сократительный белок поперечно-полосатых мышц состоит примерно из 33 тысяч аминокислот, и длина его достигает 1 микрометра. Ген, кодирующий титин, расположен во 2-й хромосоме; он простирается почти на 300 тысяч оснований и содержит 363 экзона.

В последние годы поиск человеческих генов значительно упростился, поскольку значительно лучше, чем раньше, изучены геномы мыши, шимпанзе и многих других млекопитающих. Многое стало понятным благодаря знанию процессов эволюции: функциональные части человеческого и мышиного генома весьма схожи (как и геномы всех млекопитающих), за миллионы лет с тех пор, как жил последний общий предок всех видов, они недалеко отошли друг от друга. Напротив, некодирующие области ДНК были «диким полем» эволюции: поскольку они не подпадали под естественный отбор, накопление мутаций в них ничем не сдерживалось (в отличие от кодирующих сегментов). Поэтому мутации накопились там в изобилии, и именно в некодирующих регионах геномы человека и мыши существенно различаются. Поэтому, отыскивая схожие участки в генетических последовательностях у человека и у других млекопитающих, можно эффективно обнаруживать функциональные области, то есть гены.

Идентификация человеческих генов еще более упростилась после того, как был подготовлен черновой вариант генома рыбы-иглобрюха. Ценителям японской кухни эта рыба более известна под названием фугу, в ее организме содержится сильный яд тетродотоксин. Умелый шеф-повар удаляет у рыбы ядовитые органы, так что, пообедав ею, вы можете ощутить лишь небольшое онемение во рту. Тем не менее около 80 человек в год умирают от плохо приготовленной рыбы фугу, а представителям японской императорской семьи законодательно запрещено лакомиться этим деликатесом. В конце 1980-х годов мой давний друг, нобелевский лауреат Сидней Бреннер, всерьез увлекся иглобрюхими, по меньшей мере в качестве генетического материала. Геном фугу в десять раз меньше человеческого, и там гораздо меньше «мусорной» ДНК, чем у нас с вами; приблизительно треть всех имеющихся генов кодирует белки. Под руководством Бреннера примерный вариант генома рыбы фугу удалось выполнить за 12 миллионов долларов – просто находка по меркам секвенирования геномов, бытовавшим в начале 2000-х годов. Число генов, то есть участков генома, кодирующих белки, у фугу составляет 19 200 – примерно столько же, сколькои у человека. Однако интересно, что, хотя число интронов в геноме фугу примерно такое же, как в геноме человека и геноме мыши, сами интроны фугу обычно гораздо короче.

Сравнение ДНК человека и мыши в одном и том же гене. В частности, показан интрон (некодирующая последовательность внутри гена, ограниченная рамкой считывания) и участки двух экзонов (областей, кодирующих белок, синтезируемый геном). В двух последовательностях выделены те основания, которые не изменились в ходе эволюции. Дефис означает утрату основания у человека или у мыши. Общее сходство генетических последовательностей у человека и у мыши демонстрирует, что естественный отбор исключительно эффективно отбраковывает мутации. В интронах, где мутации, как правило, несущественны, разница заметнее, чем в экзонах; ведь экзоны могут влиять на функцию белка

Даже при оценке в 21 тысячу генов или около того создается немного преувеличенное представление о том, насколько сложно устроен человек с генетической точки зрения. Правда, в ходе эволюции некоторые гены породили общности из родственных генов, так получились группы схожих генов, лишь слегка различающихся с функциональной точки зрения. Так называемые совокупности родственных генов возникают случайно, когда при образовании сперматозоида или яйцеклетки фрагмент с хромосомой случайно дублируется и в хромосоме оказывается два экземпляра одного и того же гена. Если одна из копий является функциональной, то вторая копия не отсеивается в ходе естественного отбора и может развиваться в любом направлении, в том числе накапливая мутации. Иногда в результате мутаций ген приобретает новую функцию, как правило тесно связанную с функцией исходного гена. Действительно, многие гены человека являются вариацией на относительно немногочисленные генетические темы. Так, например, геном человека содержит около пятисот генов протеинкиназ, которые составляют около 2 % всех генов. В клетке протеинкиназы регулируют метаболические пути, а также пути сигнальной трансдукции и передачи сигналов внутри клетки. Кроме того, у человека имеется около тысячи генов, отвечающих за обоняние; кодируемые ими белки – это рецепторы запахов, каждый из которых распознает свою пахучую молекулу или свой класс молекул. У мыши также примерно тысяча генов отвечает за запах, но по сравнению с человеком есть различия: мыши адаптировались к преимущественно ночному образу жизни, поэтому сильнее полагаются на обоняние. Естественный отбор среди мышей благоприятствовал самым лучшим «нюхачам», и большинство генов, отвечающих за запах, остались в рабочем состоянии. У человека примерно 60 % этих генов в процессе эволюции успешно деградировали, такие генетические реликты называются «псевдогенами». Возможно, это произошло потому, что мы в большей степени полагались на зрение и нам требовалось меньше обонятельных рецепторов. Вот поэтому естественный отбор и не отсеивал тех мутаций, из-за которых многие из наших обонятельных генов вышли из строя. В результате человек оказался относительно неумелым «нюхачом» по сравнению с другими теплокровными.

Много ли у нас генов по сравнению с другими организмами?

Итак, по набору кодирующих генов мы не дотягиваем даже до обычного травянистого растения. Еще более удручает сравнение с нематодой – это существо состоит всего из 959 клеток (против примерно 30 триллионов клеток у нас), 302 из которых – нервные, образующие изрядно примитивный «мозг» червя (наш мозг состоит из 100 миллиардов нервных клеток). Структурная сложность у человека и у нематоды различается на порядки, однако и у нас, и у этого червячка примерно одинаковое число генов. Как объяснить такое удручающее для человека несоответствие? В действительности же расстраиваться здесь совершенно ни к чему: просто контроль у человека работает гораздо эффективнее.

Готов предположить, что существует корреляция между высоким уровнем интеллекта и немногочисленностью генов. Полагаю, что смышленость – обладание внушительным нервным центром, таким как у нас или даже у плодовой мушки, – обеспечивает сложное поведение, даже если генов сравнительно немного (если число 21 тысяча можно охарактеризовать с точки зрения геномного анализа как «немного»). Человеческий мозг обеспечивает нам огромные сенсорные и нервно-двигательные способности по сравнению с теми, которые доступны безглазой медлительной нематоде, и, следовательно, гораздо более разнообразные варианты поведенческих реакций. У укоренившегося растения возможностей еще меньше: ему требуется иметь «на борту» полный комплект генетических ресурсов для реагирования на любые проявления со стороны факторов окружающей среды. Напротив, организм, обладающий развитым мозгом, может справиться, скажем, с резким похолоданием, воспользовавшись нервными клетками и попытавшись отыскать более приемлемые условия (теплая норка – вполне подходящее место).

Сложной организации позвоночных также могли поспособствовать гены, которые детерминируют процессы роста и дифференцировки и которые довольно часто называют генами-регуляторами (переключателями). Теперь, когда секвенирование генома завершено, можно подробно проанализировать эти регуляторные участки, в которых регуляторные белки связываются с ДНК, включая или выключая прилегающие к ним гены. По-видимому, позвоночные обладают гораздо более многогранными переключающими механизмами, нежели более примитивные организмы. Именно эта гибкая и сложная система генетической координации обеспечивает сложную жизнедеятельность позвоночных. Более того, любой конкретный ген может отвечать за синтез различных белков, и вот почему: либо функционально сочетаются разные экзоны, продуцирующие слегка различающиеся белки, в данном случае мы имеем вариант сплайсинга матричных РНК, который получил название «альтернативный сплайсинг» (белки, получаемые трансляцией таких мРНК, в результате имеют разные аминокислотные последовательности; таким образом, при альтернативном сплайсинге один транскрипт обеспечивает синтез сразу нескольких белков), либо в уже синтезированных белках происходят биохимические изменения.

Когда вскрылась столь неожиданная для исследователей малочисленность человеческих генов, несколько серьезных авторов, которых можно назвать колумнистами, немедленно изложили свои размышления на тему: а так ли важно число генов? Рассуждения были выдержаны в едином ключе. Стивен Джей Гулд (страстный оратор, который, к сожалению, рано ушел из жизни) опубликовал в New York Times статью, где торжествующе объявлял, что немногочисленность генов – «последний гвоздь в гроб редукционизма», хотя редукционизм сейчас – это сложившаяся доктрина, буквально доминирующая во всех биологических дисциплинах. Согласно редукционизму, сложные явления в биологии могут быть полностью объяснены с помощью законов, свойственных явлениям более простым. Иными словами, для того чтобы понять процессы, происходящие на уровне со сложной организацией, сначала требуется уяснить, как устроена система на более простых уровнях, и проследить динамику процессов в восходящем направлении. Таким образом, поняв устройство генома, мы в конце концов узнаем, как происходит «сборка» на организменном уровне. Гулд и его последователи апеллировали к факту об удивительно малом числе генов у человека как к подтверждению того, что восходящий подход не только неработоспособен, но и несостоятелен. Антиредукционисты наоборот настаивали, что уж если в свете такой неожиданной генетической простоты человеческий организм вполне жизнеспособен, то ни в коем случае нельзя подходить к пониманию человека как к совокупности простых процессов. С их точки зрения, малочисленность генов подразумевает, что именно условия развития, а не наследственность максимально влияют на каждого из нас. Короче говоря, это была «декларация независимости против мнимой деспотии наших генов».

Как и Джей Гулд, я вполне признаю, что условия развития и внешней среды существенно влияют на каждого из нас. Однако его взгляд на проблемы наследственности абсолютно неверен: немногочисленность генов у человека никоим образом не отменяет редукционистского подхода к биологическим системам, равно как и не оправдывает логического вывода о том, что гены не играют для нас определяющей роли. Из оплодотворенной яйцеклетки, содержащей геном шимпанзе, как ни крути, обязательно родится шимпанзе, а из оплодотворенной яйцеклетки с геномом человека – человек. Сколько бы мы при этом ни показывали шимпанзе, например по телевизору, концертов классической музыки или сцен насилия, человеком она не станет. Конечно, нам еще предстоит долго разбираться, каким образом информация этих двух очень схожих геномов реализуется в развитие столь непохожих друг на друга организмов, но факт остается фактом: сущность любого организма в большей степени строго запрограммирована в геноме. Я действительно считаю, что открытие малочисленности человеческих генов – 21 тысяча против расчетных 100 тысяч – порадует сторонников биологического редукционизма; ведь гораздо проще классифицировать эффекты 21 тысячи генов, нежели оценивать действие 100 тысяч генов.

Пусть человек и не обладает колоссальным числом генов, тем не менее наш геном действительно большой и запутанный – вспомните хотя бы огромный ген титина. Вернусь к сравнению с червем: по числу генов мы не обходим нематоду даже вдвое, но физически наш геном в тридцать три раза крупнее. Откуда такое несоответствие? Специалисты, занятые поиском генов, описывают человеческий геном как пустыню, по которой рассеяны редкие оазисы генов. Половина нашего генома приходится на повторяющиеся «мусороподобные» последовательности, не выполняющие конкретных функций; 10 % нашего генома состоит из миллиона разбросанных включений одной и той же последовательности, так называемого «элемента Alu»:

Alu-повтор был открыт при обработке ДНК человека рестриктазой Alu, отсюда и название. Запишите этот повтор миллион раз – и тогда сможете оценить масштаб присутствия элементов Alu в нашей ДНК. На самом деле степень повторяемости некоторых последовательностей даже выше, чем может показаться на первый взгляд: последовательности, которые когда-то однозначно идентифицировались как повторы, за многие поколения с накоплением мутаций изменились до неузнаваемости, став элементами того или иного класса повторяющихся последовательностей ДНК. Рассмотрим набор из трех коротких повторов: ATTГ ATTГ ATTГ. Со временем они изменятся под действием мутаций, но если изменения начались недавно, то исходные последовательности еще узнаваемы и выглядят так: AЦTГ ATГГ ГTTГ. Через определенный, но длительный период исходный рисунок будет совершенно утрачен в мешанине мутаций: AЦЦT CГГГ ГTЦГ. Процентное соотношение повторяющихся последовательностей ДНК у многих других видов гораздо ниже, чем у человека: 11 % у горчицы, 7 % у нематоды и всего 3 % у дрозофилы. Наш геном такой крупный во многом из-за того, что в нем накопилось гораздо больше «мусора», чем у многих других видов.

Такие различия в количестве «мусорной ДНК» объясняют застарелый эволюционный парадокс. Тема о количестве мусора в нашей ДНК – одна из самых «горячих» тем в научном сообществе. Вокруг этого вопроса среди ученых разгораются настоящие словесные баталии. В целом считается, что сравнительно сложные организмы должны обладать более крупными геномами, чем относительно примитивные, поскольку первым требуется закодировать больше информации, чем вторым. Действительно, существует корреляция между размером генома и уровнем сложности существа; геном дрожжей больше, чем геном E. coli, но меньше, чем наш. Однако степень таких корреляционных связей очень слабая.