К 2008 году команда 454 проделала 147 запусков по девяти библиотекам, приготовленным из образцов Vi-33.16. Так что было в результате получено 39 миллионов отсеквенированных фрагментов. Цифра внушительная, без сомнения, но я надеялся, что к этому времени у меня уже будет больший объем отсеквенированной ДНК. С таким набором данных мы и думать не могли подступиться к составлению генома. Тем не менее очень хотелось отработать сам алгоритм картирования. Поэтому мы затеяли гораздо менее масштабное предприятие по реконструированию митохондриального генома. Ведь чем мы, да и другие тоже, располагали до того момента? Всего 800 нуклеотидов одного из вариабельных участков неандертальского мт-генома. А нам хотелось иметь его целиком, все 16 500 нуклеотидов.

Эд Грин принялся просеивать 39 миллионов прочтенных фрагментов ДНК; он решил сложить вместе кусочки, напоминавшие последовательности мт-генома современных людей. Затем нужно было сравнить их и, обнаружив перекрывающиеся участки, наложить друг на друга. И так шаг за шагом выстраивалась неандертальская последовательность.

Затем он снова прошерстил 39 миллионов фрагментов, но уже ориентируясь на проступающую неандертальскую цепочку. Этот новый поиск выявил фрагменты, упущенные на первом этапе. Ему удалось идентифицировать 8341 митохондриальный фрагмент неандертальца, в среднем длиной в 69 нуклеотидов. Из них получилась полная цепочка молекулы мтДНК в 16 565 нуклеотидов – самая длинная из когда бы то ни было реконструированных мтДНК.

Глядя на результат, совершенно конкретный, осязаемый, я испытывал чувство удовлетворения, пусть даже анализ этого генома не открыл ничего нового о неандертальцах. Зато мы поняли кое-что существенное о технических особенностях методик. Например, число фрагментов, относящихся к определенным участкам генома, неодинаково. Как выяснил Эд, оно зависит от относительного количества Г и Ц по сравнению с А и Т. Иными словами, те фрагменты, где Г и Ц больше, сохраняются в кости лучше, чем те, где превалируют А и Т. Или, возможно, не в кости, а у нас в экстрактах. Но самое прекрасное, что никакие части мт-генома не потерялись. У меня появилось ощущение, что нам теперь подвластны технические трудности анализа древней ДНК. Мы также выявили 133 позиции, по которым мт-ДНК неандертальцев отличалась от мтДНК современных людей[59]. До того нам были известны лишь три такие позиции, приходящиеся на те короткие фрагменты, которые мы реконструировали в 1997 году. А ведь с этими 133 отличиями мы могли бы по-настоящему надежно оценить уровень загрязнений в наших новых данных. Получилось 0,5 процента. Мы даже вернулись к старым данным эксперимента 2006 года из Nature и к дополнительным экспериментам по этой статье (к тем, что мы проделали, пока статья лежала на рецензии). Из 75 митохондриальных фрагментов 67 соответствовали неандертальским вариантам. Так что получилось 11 процентов загрязнений в наших библиотеках: мы рассчитывали на меньший процент, но ведь это и не те 70–80, которые пророчили Уолл и Ким. Мы собрали всю эту информацию и включили ее в статью для журнала Cell, где в 1997 году опубликовали наши первые результаты по неандертальским генам. И снова мы подчеркнули, что прямое тестирование на загрязнения в ядерных генах послужило бы лучше. На пятничных собраниях эта тема – как тестировать ядерные загрязнения – стала звучать все настойчивее.

Когда сбор данных для этой статьи был закончен, на первый план снова вышли проблемы с секвенированием неандертальского материала. “Не слишком ли мы медлительны?” – беспокоился я. Шел уже второй год проекта, и от публикации предварительных результатов – тех самых 3 миллиардов нуклеотидов, которые мы так громко пообещали, – нас отделяло всего несколько месяцев. Из-за этого наши пятничные собрания проходили очень напряженно. Я стал громогласным и язвительным (о чем очень потом сожалел), раздражался из-за некоторых бессодержательных споров или из-за не слишком лаконичного изложения текущего положения лабораторных дел. Но в действительности под всем этим лежало мое внутреннее ощущение, что двигаемся мы чересчур медленно.

Частично наша медлительность объяснялась низким содержанием неандертальской ДНК в полученных библиотеках, но также, со всей очевидностью, и невысокой производительностью 454. В марте 2007 года компания 454 была продана фармацевтическому гиганту Roche. И хотя Майкл Эгхольм оставался целиком и полностью в нашем проекте, но те, кто занимался непосредственно секвенированием наших образцов, к осени уволились. Я подозревал, что Эгхольму и его коллегам непросто отдавать все внимание неандертальским делам. У меня впервые появился соблазн обратиться к конкурентам 454.

Одним из таких конкурентов был Дэвид Бентли, очень грамотный генетик, специалист по человеческому геному. Я встречался с ним на конференции в Колд-Спринг-Харбор в мае 2007 года. В 2005- м он перешел из Института Сэнгера под эгидой Wellcome Trust в компанию Solexa, недавно образованную на базе химического факультета Кембриджского университета. В Solexa он заведовал отделом разработки секвенаторов, представлявших серьезную конкуренцию даже ротберговской 454. В Solexa тоже прикрепляли к концам молекул адаптеры и эти фрагменты с адаптерами использовали для изготовления библиотек, амплификации и секвенирования. Но в отличие от 454 в Solexa амплификация производилась не внутри жировых капелек, а на стеклянных шариках: к их поверхности и прикреплялись адаптеры с цепочками ДНК. И получалось, что каждая молекула, осевшая на стеклянной поверхности, умножалась и вокруг нее образовывалось пятно, или кластер, с миллионом ее копий. Эти кластеры затем секвенировались с помощью добавления праймеров, ДНК-полимеразы и четырех нуклеотидов в достаточном количестве; каждый из четырех типов нуклеотидов метился своей флуоресцентной краской.

Первые пробные секвенаторы этого типа поступили в технологические центры в 2006 году. С их помощью можно было отсеквенировать фрагменты длиной в 25 нуклеотидов, а кроме того, как я слышал, они все время ломались. Но в принципе их потенциал был исключительно высок, потому что они обещали одновременное чтение не сотен или тысяч отдельных нитей, как в 454, а сразу нескольких миллионов. А в перспективе, когда технология будет отлажена, даже больше. Вскоре длина читаемых фрагментов увеличилась до 30 нуклеотидов, и пошли разговоры о некоем усовершенствовании, которое позволит читать нить сразу с двух сторон, так что общая длина может достигнуть 60 нуклеотидов. Это уже звучало интереснее для нас, исследователей древних ДНК. И другие стали обращать внимание на эти секвенаторы. В ноябре 2006- го биотехнологическая компания Illumina с базой в США перекупила Solexa, и Дэвид Бентли стал в этой обновленной компании заведующим по науке и вице-президентом.

На конференции в Колд-Спринг-Харбор я обсуждал с Дэвидом наш проект. Мы договорились, что я пошлю ему наши материалы с мамонтовыми или неандертальскими ДНК и он на них протестирует работу машин Illumina. Вообще-то мы даже уже начали потихоньку такое тестирование. В феврале 2007 года мы послали один из лучших экстрактов мамонтовой ДНК Джейн Роджерс в Институт Сэнгера, в Кембридж, а она как раз отвечала там за секвенаторы Solexa. Но к тому моменту она еще не откликнулась, поэтому, вернувшись с конференции, я принялся нетерпеливо забрасывать коллег из Сэнгера запросами. И вот в начале июня пришли результаты, которые нас несколько разочаровали. Эти технологии явно генерировали много ошибок. Компания изо всех сил работала над усовершенствованием технологий, но, кроме того, я понял, что большое число ошибок можно скомпенсировать огромным числом прочтенных фрагментов. В принципе можно попросту каждый фрагмент из библиотеки прочитать много раз, и тогда ошибки секвенирования будут хорошо видны, и их можно будет не учитывать при интерпретации. У Illumina, к сожалению, не было своего центра по секвенированию, поэтому нам пришлось покупать собственную машину. Из-за высокой востребованности этой технологии мы смогли получить ее только полгода спустя. Теперь машина могла читать уже 70 нуклеотидов, правда, все с тем же количеством ошибок. Их число возрастало по мере удлинения читаемой последовательности. В 2008 году новые поколения машин позволяли секвенировать с обоих концов цепочки каждый фрагмент из наших библиотек.

Считая, что в древней ДНК фрагменты состоят примерно из 55 нуклеотидов, каждый фрагмент можно прочесть дважды, с одной и с другой стороны. А значит, практически для каждого фрагмента мы получим надежную последовательность.

В эту работу включился Мартин Кирхер, пришедший в 2007 году еще студентом-дипломником в группу биоинформатиков Дженет Келсо. Ему предстояло проанализировать данные, выданные Illumina. Его обманчиво широкая мальчишеская улыбка скрывала, как я чувствовал, излишнюю самоуверенность, граничащую с высокомерием, – наверное, с легкой руки его негласного наставника Удо. Сначала меня это ужасно раздражало, но потом я мало-помалу стал понимать, что парень часто оказывается прав. Я научился уважать его способность мгновенно ухватывать суть технической проблемы и организовывать непрерывный поток данных от секвенаторов к компьютерам, превращая решения в четко поставленные технические задания лаборантам. Да и работал он невероятно много. Мы все, и я, и Дженет, все больше и больше полагались на его хозяйское отношение к Illumina и на организованную им компьютерную обработку иллюминовских данных.

К 2008 году стало ясно, что если мы хотим закончить проект в обозримые сроки, то с технологией 454 нужно прощаться. Сильной стороной 454 считалась возможность считывать длинные фрагменты, но так как в наших материалах таких не было, это преимущество не играло на нас. Нам требовалось, наоборот, прочитать много коротких фрагментов, и как можно быстрее. В этом случае у Illumina было решительное преимущество перед 454. Но так сразу уйти от 454 мы не могли, потому что все наши программы, разработанные Эдом Грином и остальными, были адаптированы для обработки данных по 454. Нужны были существенные преобразования в процедуре обработки данных и возможность слияния различных наборов отсеквенированных прочтений. Ведь все эти технологии едва появились, так что просто взять и загрузить готовый софт было неоткуда. Все приходилось разрабатывать самим.

Приближалось лето 2008-  го, и голова была забита всеми этими насущными проблемами. В середине июля как раз минет два года с той пресс-конференции. Ко времени мы, очевидно, не успеваем. Но журналисты начнут задавать вопросы – а когда? – и я должен хотя бы представлять новые сроки. У нас теперь имеются и кости, и наготовленные экстракты, и их хватит для получения 3 миллиардов нуклеотидов, но чтобы достичь цели, нужно перебросить секвенирование на Illumina. И тогда я решил взять деньги, отложенные для секвенирования на 454, и использовать их для покупки четырех новых машин Illumina. Если у нас будет одновременно работать пять машин, то мы справимся, а если машины доставят в срок, то даже успеем доделать геном к концу года. И снова приходилось обрывать сотрудничество. Я встретился с Майклом Эгхольмом на совещании в Дании. К счастью, он понял мои объяснения, но предсказал, что потом мы пожалеем, когда придется разбираться с этими “записками с описками”, как он пренебрежительно называл короткие прочтения Illumina.

Посреди всех эмоциональных взлетов и разочарований неандертальских дел я выкроил время для счастья. Первого июля мы с Линдой отправились на Гавайи, в Каилуа-Кона.

Официально (как я объяснил в лаборатории свою отлучку) я поехал туда по приглашению Академии достижений на ежегодный съезд знаменитостей – музыкантов, политиков, ученых, писателей, – где можно в свободной обстановке поговорить, поделиться идеями и опытом друг с другом и сотней студентов со всего мира.

Меня, естественно, приятно будоражила перспектива провести несколько дней в компании знаменитых и мудрых людей, но не в этом главное. А в том, что мы с Линдой решили заодно и пожениться. Мы все откладывали свадьбу, в основном из-за меня: мне она казалась старомодной формальностью. Теперь же вот решились, отчасти из практических соображений (нужно было оформить пенсию в Германии на случай, если я отойду в мир иной раньше Линды), но хотели провести этот день вдвоем и отметить его каким-нибудь маленьким сумасбродством. Мы организовали церемонию со служительницей культа нью-эйдж на берегу моря – романтичнее не придумаешь. Жрица взывала к гавайским духам, дудела в раковину на четыре стороны света, извлекая из нее низкое гудение… Мы дали друг другу обет верности, и она объявила нас мужем и женой. Несмотря на практические цели женитьбы, я чувствовал, что церемония должным образом отразила связывавшую нас взаимную преданность. С Линдой моя жизнь стала насыщеннее, богаче, особенно после рождения Руне в 2005- м – не сравнить с моим прежним монашеским существованием мюнхенского профессора.

После церемонии на пляже мы отправились в поход. Линда отыскала такой район на Большом острове, где вокруг была красотища и ни души. Мы шагали с тяжелыми рюкзаками под палящим солнцем по лунным пейзажам из застывшей лавы, пока не достигли моря. На побережье мы провели четыре дня: валялись голышом на безлюдном пляже, плавали с рыбками и черепахами, любили друг друга на песке под пальмами. И когда я засыпал под рокот океанских волн и шелест пальмовых листьев, холодная неандертальская степь уходила куда-то в неизбывное далеко. Вот такая восхитительная передышка случилась у меня в тот крайне напряженный период.

Гавайский перерыв был недолог. Через неделю после возвращения я уже выступал на Мировом конгрессе генетиков в Берлине. В докладе я рассказал о технических и методических продвижениях в прочтении генома, а также о митохондриальных результатах. До смерти хотелось рассказать о чем-то более существенном, но было нечего.

Еще с докладом выступал Эрик Лэндер, одна из главных фигур, стоящих за общими работами по прочтению человеческого генома. Как по мне, так его ум и проницательность даже пугали немножко. Мы и раньше встречались с ним и в Колд-Спринг-Харбор, и в Бостоне, где он возглавлял Институт Брода (весьма авторитетный исследовательский институт, посвященный геномике), и я частенько выигрывал от его советов. После конгресса он приехал в Лейпциг, в нашу лабораторию. Новые четыре аппарата Illumina все никак не могли доставить, а с нашим одним мы ничего не успевали, потому что на один цикл требовались две недели и еще какое-то время на компьютерную обработку. А у Эрика в его институте таких аппаратов стояло несколько – он был активным поборником этой технологии. И он предложил помощь. До конца моего персонального дедлайна оставалось всего несколько дней, поэтому я без колебаний поймал его на слове. К нашему собственному сроку мы, конечно, не успевали, но могли бы успеть к концу 2008 года, как было объявлено.

Двухлетний срок подходил к концу, и по мере его приближения Nature и Scienceначали вовсю обхаживать нас, предлагая подать статью к ним. Я бы, конечно, поступил так же, как в 1996- м, когда публиковал первые данные по неандертальским генам, – отправил бы статью в Cell, самый серьезный журнал по молекулярной биологии. Но и в публикации в двух самых престижных журналах были свои плюсы. Многие мои студенты и аспиранты хотели бы видеть свои имена среди авторов Nature и Science, это сулило, как им казалось, хорошие карьерные перспективы. В июне к нам приехала Лора Зан, редактор Science, она хотела обсудить статью про неандертальский геном. Science издается Американским обществом передовых научных достижений (AAAS), и вскоре после визита Лоры я получил приглашение сделать доклад по работе над неандертальцем на ежегодном пленарном заседании AAAS в Чикаго, в середине февраля 2009 года. Это давало нам четкие сроки окончания работы, в которые я непременно рассчитывал уложиться. Так что приглашение я принял. И это означало, что публиковаться мы будем, скорее всего, в Science.

Как это часто бывает, процесс затянулся. До конца октября мы готовили библиотеки для Illumina, где ДНК были помечены специальными неандертальскими метками. Мы секвенировали небольшую порцию библиотек на нашей Illumina и определяли количество молекул – насчитали около миллиарда фрагментов. Вполне досточно, чтобы прочитать весь геном. Затем образцы посылались в Институт Брода для секвенирования. Полученные результаты поступали к Мартину Кирхеру, а его программы могли выстраивать последовательности с меньшим числом погрешностей, чем коммерческие программы Illumina. Его программы работали с таким колоссальным объемом информации, что перегонять данные по интернету фактически не было никакой возможности. Поэтому мы организовали пересылку жестких дисков с большим объемом памяти из Бостона в Лейпциг.

В середине января 2009 года мы получили из Бостона два диска с результатами нескольких первых запусков. И тогда проявилась вся польза специальных неандертальских меток.

Мартин обнаружил, что все последовательности одного из запусков бродовской Illumina не имели таких меток. Все! Очевидно, что-то произошло с образцами уже в институте.

Ситуация немного нас напугала. Я было решил вернуть все назад и начать секвенировать у нас в лаборатории, благо четыре Illumina уже доставили и отладили. Но результаты с двух других твердых дисков из Бостона выглядели вполне прилично, и мы остались с командой Эрика. Наконец 6 февраля мы получили от Эрика быстрой почтой 18 жестких дисков. Не сказать чтобы не вовремя. Через шесть дней, 12 февраля, начиналась конференция AAAS.

Мартин, Эд и Удо занялись данными из Института Брода. Распределение специфических меток, распределение по размерам фрагментов было таким же, как и при прогонах на нашей Illumina. То же получилось, когда Удо выстроил все последовательности в порядке друг относительно друга – опять-таки схожи с нашей Illumina. Вот радость-то! AAAS настаивала на пресс-конференции вдобавок к моему докладу, и я все боялся, что мне нечего будет на ней сказать. А теперь я мог объявить, что у нас имеются все составляющие полного генома, хоть и с однократным покрытием. И как самое первое заявление по проекту мне хотелось сделать именно в Лейпциге, городе, все еще не стряхнувшем до конца свое социалистическое прошлое, точно так же и пресс-конференцию AAAS хотелось устроить здесь. К тому же я хотел провести ее совместно с компанией 454 Life Sciences в знак признательности за поддержку проекта на первых порах. AAAS была не против, и мы вместе с 454 организовали пресс-конференцию в Лейпциге с видеотрансляцией в Чикаго, чтобы и оттуда участники заседания и журналисты могли задавать вопросы. А потом я полечу в Чикаго читать свой доклад, запланированный на 15 февраля.

На все приготовления у нас оставалось шесть дней. Я сосредоточился на своей речи для пресс-конференции и докладе в Чикаго – говорить я собирался в основном о технических трудностях, которые нам пришлось преодолеть на пути к первому геному вымершего человека. Я описал, как Томи Маричич метил радиоактивными метками наши вытяжки и как он потом определил и усовершенствовал методические приемы на тех этапах, где потеря ДНК оказалась максимальной; как мы придумали специфические метки, которые присоединялись к фрагментам ДНК в условиях “чистых комнат” и как это помогло устранить из последовательности фрагменты с загрязнениями, исказившими результаты пилотного эксперимента; как тщательный анализ Эдриана Бриггса и Филипа Джонсона выявил картину ошибок в последовательностях ДНК; и как потом Эд Грин и Удо Штенцель разработали программы для построения самой последовательности генома, обойдя множество подводных камней.

И еще я хотел сказать кое-что о самом неандертальце. У нас не было времени выстроить всю последовательность, еще меньше времени оставалось на анализ миллиарда фрагментов. Но к счастью, за прошедшие полгода Удо вместе с коллегами работал с данными, полученными по 454. А это все же больше ста миллионов фрагментов. И на их основе уже можно было немножко “пощупать” нашего неандертальца. Эд разобрал две гипотезы касательно якобы эволюционного наследия неандертальцев: некоторые ученые считали, что два определенных варианта генов могли появиться в современном человеческом геноме в результате генетического потока от неандертальцев. Один из этих генов занимает довольно большую область на 17- й хромосоме, его размер около 900 тысяч нуклеотидов, и у многих европейцев он перевернут (или развернут в обратном направлении, инверсирован). Полная генеалогическая летопись исландцев дает превосходное доказательство, что эта инверсия немного повышает плодовитость у женщин. Возможно ли, что она берет начало от неандертальского генома, как считают некоторые исследователи? Эд проверил этот участок на наших последовательностях, и ни у одного из трех неандертальских особей не нашлось ничего подобного. Естественно, из этого не следует, что у неандертальцев не было этой инверсии, но вероятность ее неандертальского происхождения все же несколько снизилась. Кроме того, исследовали еще один ген на 8- й хромосоме. Мутации в этом гене – а их известно несколько вариантов у современных людей – резко уменьшают размер мозга. Существовало предположение, что тот вариант мутантного гена, который встречается в Европе и Азии, достался нам от неандертальцев. Но и в этом случае Эд не нашел искомого варианта в наших неандертальских выборках. Так что, присмотревшись к деталям, мы заключили, что нет ни намека на неандертальский генетический вклад в геном современных европейцев. Меня этот вывод удовлетворил, он вполне соответствовал митохондриальным данным, которые мы получили десять лет назад. Но нас еще ждали удивительные открытия в самый последний момент.