ДНК-генеалогия от А до Т

Клёсов Анатолий Алексеевич

Введение

 

 

О мировоззрении и желании изучать историю мира, историю своего народа, историю своего рода и своей ДНК-линии

Огромное количество людей хотят изучать историю мира, народа, рода, свою родословную. Когда-то я имел отношение к проведению опроса людей, которые прошли тест на ДНК, и узнали свои гаплотип и гаплогруппу. Основной вопрос был такой – изменило ли это вашу жизнь? Из многих десятков людей ни один не ответил, что остался безразличным к результатам тестирования. Все ответили, что в определенной степени (иногда в большой) это их жизнь изменило. Большинство продолжили анализ своей ДНК на более глубоком уровне, и расширили изучение истории мира, своего народа, своей родословной.

Результаты ДНК-тестирования мужчин в рамках ДНК-генеалогии сводятся к двум основным показателям. Это – гаплотип и гаплогруппа. Гаплотип – это набор чисел, который является «личным номером ДНК-паспорта» любого мужчины, без исключения. А гаплогруппа, фигурально говоря, это обложка паспорта. Это – не индивидуальная, а групповая характеристика. Гаплогруппа определяет носителя гаплотипа в определенный род, или историческое племя. У любой гаплогруппы, как у любого рода или племени, был один общий предок, патриарх. Поэтому как номер паспорта при наличии обложки является уникальным «определителем» человека, так и гаплотип в совокупности с гаплогруппой являются не менее уникальным определителем человека, при условии, что номер (гаплотип) является достаточно протяженным. Примеры даны ниже в этой книге.

Если у человека такого номера и паспорта нет, то это не мужчина, а женщина. Именно к такой методологии сейчас нередко приходят археологи, которые именно так наиболее надежно определяют пол скелетного остатка в древнем захоронении. Нет в ДНК Y-хромосомы, нет мужского гаплотипа и мужской гаплогруппы – значит, женщина. У последних – свой ДНК-паспорт, под названием «митохондриальная ДНК», который они передают своим детям, как девочкам, так и мальчикам. А отец передает исключительно Y-хромосому, и только, разумеется, сыновьям.

У каждого мужчины в Y-хромосоме своя картина мутаций. У близких родственников картина мутаций похожа, потому что они, родственники, сравнительно недавно произошли от одного общего предка, и дополнительные мутации в их Y-хромосомах еще не успели образоваться. Если общий предок жил тысячелетия назад, то картина мутаций у разных потомков разная. Как эту картину отображают?

Отображают картину мутаций в виде так называемых гаплотипов, упомянутых выше как «личный номер паспорта» каждого мужчины, а именно в виде определенных последовательностей чисел, характерных для каждого человека. Чем эта последовательность длиннее, тем уникальнее гаплотип. Например, у автора этих строк гаплотип Y-хромосомы, состоящий из 111 чисел, записывается в следующем виде:

13 24 16 11 11 15 12 12 10 13 11 17 – 16 9 10 11 11

24 14 20 34 15 15 16 16 – 11 11 19 23 15 16 17 21

36 41 12 11 – 11 9 17 17 8 11 10 8 10 10 12 22 22 15

10 12 12 13 8 15 23 21 12 13 11 13 11 11 12 13 – 31

15 9 15 12 25 27 19 12 12 12 12 10 9 12 11 10 11 12

30 12 14 25 13 9 10 18 15 20 12 24 15 12 15 24 12 23

19 11 15 179 11 11

Это – так называемый 111 – маркерный гаплотип. Здесь первое число показывает, что в одном из маркеров, или локусов Y-хромосомы определенная последовательность нуклеотидов (в данном случае квадруплет AGAT, то есть аденин-гуанин-аденин-тимин) повторяется 13 раз. В другом маркере, который здесь показан как следующий, блок нуклеотидов (TCTG, то есть тимин-цитозин-тимин-гуанин) повторяется 24 раза, и так далее. У каждого маркера – своя комбинация нуклеотидов.

В академических публикациях по популяционной генетике, впрочем, пока продолжают использовать гаплотипы от 8– до 17-маркерных. В ДНК-генеалогии обычным является использование 67-и 111-маркерных гаплотипов.

В итоге многолетних наблюдений я пришел к выводу, что изучение своей родословной, особенно с привлечением ДНК-генеалогии, безусловно, влияет на наш современный уровень жизни, благосостояние, самооценку, достоинство. Более того, знание и ощущение своего прошлого и прошлого страны, прошлого своего народа каким-то удивительным образом связано с личным миропониманием и мироощущением, и через него – с уровнем личного достоинства и уровнем жизни семьи и всего сообщества.

Откуда подучают те числа, которые показаны в гаплотипах? Всё это на самом деле четко определено и зафиксировано. В первом маркере (под названием DYS393) повторяется четверка нуклеотидов AGAT, то есть аденин-гуанин-аденин-тимин

GTGGTCTTCTACTTGTGTCAATAC/AGAT/

AGAT/AGAT/AGAT/AGAT/AGAT/

AGAT/AGAT/AGAT/AGAT/AGAT/AGAT/

AGAT/AGAT/ATGTATGTCTTTTCT

ATGAGACATACCTCATTTTTTGGACTTGAGT

TC,

и повторы обрамляются уже неупорядоченными последовательностями нуклеотидов в ДНК, так называемыми фланкирующими, как показано выше. Этот участок в ДНК и есть локус, он же маркер DYS393. Во втором маркере, под названием DYS390, повторяется уже другая четверка – TCTG, то есть тимин-цитозин-тимин-гуанин, которая переходит в четверку ТСТА, то есть тимин-цитозин-тимин-аденин, и число повторов складывается:

TATATTTTACACATTTTTGGGCCCTGCATTT

TGGTACCCCATAATATATTCTATCTA/

TCTG/TCTG/TCTG/TCTG/TCTG/TCTG/

TCTG/TCTA/TCTA/TCTA/TCTA/TCTA/TCTA/

TCTA/TCTA/TCTA/TCTA/TCTA/TCTA/TCTG/

TCTA/TCTA/TCTA/TCATCTATCTATCTTT

CCTTGTTTCTGAGTATACACATTGCAATGTT

TTCATTTTACTGTCAC.

Перечисленные четыре нуклеотида – это язык ДНК, который состоит из четырех букв при сокращенной записи. Эти нуклеотиды комбинируются парами, их так и называют – «пары оснований». Они фактически держат двойную спираль ДНК. Нам эти четверки (а также тройки нуклеотидов, и другие типы повторов) в маркерах ДНК в дальнейшем не понадобятся, это описание мы даем только для того, чтобы показать, что за числами в гаплотипах стоят масштабные исследования, которыми занимаются в мире сотни и тысячи человек.

Приведу свой личный пример. Полтора десятка лет назад я довольно случайно узнал о возможности определить свои гаплогрупп и гаплогруппу. Причем узнал от весьма малоаппетитной личности, с которым имел немало коллизий в сетевых дискуссиях, узнал, когда тот похвалялся, что анализ ДНК показал, что он – «чистый русский». Меня заинтересовало, как ДНК это может показать, и что такое «чистый русский». Как и оказалось, та похвальба была, как обычно у него, пустой. Никакой гаплотип или гаплогруппа не показывают, что некто есть «чистый русский», «чистый украинец», или «чистый еврей». Это вообще «перпендикулярные» понятия, так сказать. Но гаплотип и гаплогруппа показывают род, показывают (в совокупности с другими гаплотипами или гаплогруппами), откуда род ведет свои корни, когда и где (при наличии дополнительных исследований) жили предки рода, пути и времена древних миграций, связь с древними археологическими культурами.

Естественно, чем протяженнее гаплотип, тем выше вероятность того, что в нем произойдет мутация. Мутация в гаплотипах – это результат ошибки в копировании блоков нуклеотидов, тех самых «коротких тандемных повторов», биологической системой копирования ДНК в клетке. Каждый нуклеотид мутирует, то есть копирующая система ошибается при копировании протяженных гаплотипов, со средней частотой примерно 0.00178 раз в поколение при протяженности поколения 25 лет, то есть раз в 560 поколений, или раз в 14 тысяч лет. Величина поколения в 25 лет в ДНК-генеалогии называется условным поколением, она – сугубо математическая величина. Если кому-то больше нравится брать 30 лет за поколение, то вероятность мутации за 30 лет составит примерно 0.00214, или раз в 468 поколений (по 30 лет), или раз в 14 тысяч лет. Как видим, конечный результат получается точно такой же.

Итак, у любого человека можно выявлять гаплотип с разным разрешением, это будет один и тот же «ДНК-генеалогический паспорт», только разрешение, естественно, тем больше, чем более протяженный гаплотип. Надо сказать, что наука не остановилась на 111-маркерном гаплотипе, и, например, у того же автора определен уже 431 – маркерный гаплотип:

13 24 16 11 11 15 12 12 10 13 11 30 16 9 10 11 11 24

14 20 34 15 15 16 16 11 11 19 23 15 16 17 21 36 41

12 11 11 9 17 17 8 11 10 8 10 10 12 22 22 15 10 12 12

13 8 15 23 21 12 13 11 13 11 11 12 13–31 15 9 15

12 25 27 19 12 12 12 12 10 9 12 11 10 11 12 30 12 14

25 13 9 10 18 15 20 12 24 15 12 15 24 12 23 19 11 15

17 9 11 11–10 12 15 15 10 10 8 8 9 13 7 8 10 10 13

14 14 15 31 32 11 10 9 9 8 24 8 8 8 16 22 22 24 21 23

14 16 25 28 15 15 6 11 14 15 8 14 11 12 10 11 10 10

11 11 18 10 12 10 7 10 5 8 9 5 5 11 15 8 29 6 7 10 13

11 6 7 7 7 16 10 11 16 22 23 11 12 12 10 7 12 12 13 7

3 20 18 11 11 8 9 13 13 10 11 22 12 16 13 14 11 11 12

10 12 9 13 9 12 11 12 16 7 14 12 10 9 10 4 7 7 13 13

12 11 9 11 10 11 14 8 4 8 6 11 11 16 9 11 13 19 12 12

9 10 9 9 11 11 9 9 14 14 15 9 7 10 12 14 13 14 14 12

6 32 10 11 16 8 7 17 17 11 11 6 13 12 13 11 10 7 13

12 7 – 12 12 7 14 17 17 11 25 8 8 12 8 8 1113 11 12

10 8 13 8 13 14 10 11 9 20 17 15 36 9 13 14 39 33 36

9 10 10 12 18 19 13 9 14 44 10 8 14 9 8 20 11 11 11

11 10 9 9 9 8 8 8 8 9 11 9 23 11 9 16 31 8 20 8 13 12 8

16 10 9 33 27 23 22 10 8 12 10 8 14 8 8 32 55 7 7 5 9

6 11 11 11 13 9 39 33 7 8 27 7 5 13 7 15 28 25 60 42

12 31 22 20 12 3 4

Таких гаплотипов в мире определено пока всего несколько десятков, так что практическая польза от них пока невелика, за исключением нескольких специальных случаев, которые будут пояснены ниже.

Поскольку «коротких тандемных повторов» в Y-хросомоме многие тысячи (выше показано 431 таких повторов, и это только среди 10 миллионов нуклеотидов Y-хромосомы, этот размер определяется методологией исследования; всего же в Y-хромосоме примерно 58 миллионов нуклеотидов, или, точнее, нуклеотидных пар, но не будем здесь вдаваться в излишние подробности). Отсюда можно заключить, что таких «тандемных повторов» в Y-хромосоме может быть примерно 2500, и это, видимо, максимально возможный размер гаплотипа.

Как читатель видит, я не делаю из своего гаплотипа (см. врезку) какой-то секрет, и другим не советую. В нашем мире глобальной информации, где о каждом из нас в сети имеется масса сведений, значительно более потенциально вредоносных, раскрытие гаплотипа вообще никакой опасности не представляет. Гены не имеют к нему никакого отношения, никаких сведений о здоровье или медицинской диагностики в гаплотипе нет, именно потому, что там нет генов. Байки о том, что якобы на гаплотип можно нацелить некое биологическое оружие, не только безосновательны, но и глупы. Такое «биологическое оружие» нацеленное, например, на гаплотип группы R1a, которая есть у половины русских, положило бы почти половину литовцев и латышей, половину украинцев и поляков, треть немцев и шведов с норвежцами, и не менее 20 % жителей США и Канады. Поэтому уже сотни тысяч человек, в основном из стран Запада, заносят свои гаплотипы в общедоступные базы данных, и никаких опасений по этому поводу не испытывают.

Гаплотипы выбирают так, чтобы в них маркеров было как можно больше (но все-таки чтобы оставаться в рамках практичности), и в ранних академических работах использовались 6-маркерные гаплотипы, затем 12-маркерные, 17-и 19-маркерные, затем 25– и 37-маркерные, а сейчас работа рутинно ведется с 67– и 111 – маркерными гаплотипами (правда, в академических публикациях это обычно от 8 до 17 маркерных гаплотипов). В 111-маркерных гаплотипах одна мутация происходит в среднем за 5 поколений, поэтому у 111 – маркерных гаплотипов разрешение лучше других. Но их определять дороже, чем более короткие, поэтому в академических исследованиях, при постоянной нехватке денежных средств, приходится работать с более короткими гаплотипами. Протяженные гаплотипы определяют в коммерческих компаниях, обычно персонально, по индивидуальному заказу, и передают в общественные базы данных, если носитель гаплотипа не возражает. Правда, у возражений практически никогда нет оснований, это всегда «нутряное» «как бы чего не вышло». Сейчас в общественных базах данных – сотни тысяч гаплотипов, и базы прирастают многими гаплотипами ежедневно.

Как мы покажем ниже, эти гаплотипы, а именно числа в них, напрямую связаны с хронологией древних миграций людей, переходами людей на новые места, событиями прошлого – войнами, климатическими катаклизмами, эпидемиями, в общем, со всем тем, что так или иначе влияло на численность популяций человека в определенные времена и на определенных территориях. Например, расчеты могут показать когда носители гаплогруппы N были на Урале, когда они появились в Прибалтике, когда древние арии появились на Русской равнине, когда они появились в Индии, Иране, на Ближнем Востоке – потому что эти события приводили к появлению на этих территориях и в те времена общих предков популяций, потомки которых увеличивались в числе вплоть до нашего времени, образуя «кусты» гаплотипов со всеми мутациями в них, то есть изменениями чисел в маркерах.

Я заказал определение своих гаплотипа и гаплогруппы в соответствующей компании, и вскоре получил ответ. Ответ меня заинтриговал, и я отправился в архивы, военные и региональные, искать своих предков. Пошла обильная информация, о которой я не имел ранее никакого понятия. Оказалось, что мои прямые предки – из детей боярских, древнего военно-боевого дворянского сословия, что десятки моих прямых и близких родственников охраняли границы Руси, что мой предок ходил с Петром Первым брать Азов, и оттуда участвовал в Казикерменском походе, о котором я ничего не знал, а сейчас знаю много, и оказалось, что у нас в Курской области есть фамильная деревня, земля для которой была выделена моему прямому предку Ивану Клёсову в 1639 году царским указом за боевую службу.

Я отправился в ту деревню Клёсово, взял у жителей той деревни образцы ДНК, отправил на анализ, и увидел, что это на самом деле мои гаплотип и гаплогруппа, и всего несколько мутаций в гаплотипах показали, что наш общий предок жил в конце 16-го века, о чем и рассказали до того архивы. Дальнейшие исследования, еще более глубокие, показали, что мой гаплотип и субклад – выходцы из восточнокарпатской ветви гаплогруппы R1a, общий предок которой жил в I тыс до н. э., во времена зарождения славянства в том виде, в каком его понимают историки. Но анализ моей Y-хромосомы прошел дальше – мои предки жили в археологической фатьяновской культуре, которая располагалась в центральном европейском регионе современной Российской Федерации примерно 4500–3500 лет назад, и вполне может быть названа древнерусской археологической культурой. В свою очередь ее предки – археологическая культура боевых топоров, начиная примерно с 5200 лет назад. Ископаемые ДНК последней, с археологической датировкой 4600 лет назад – имеют гаплотип, практически такой же, какой у меня. Мои корни, как и корни любого мужчины на планете, описаны в этой книге, в ее разных главах, только я могу примерить всю эту информацию на себя, а те, кто не знают своих гаплотипа-гаплогруппы, не могут. В этом – большая разница в мироощущении между нами.

Обратимся к гаплогруппам, тем самым «обложкам паспорта», групповым характеристикам. Большое число мутаций и, соответственно, большое временное расстояние между гаплотипами разных гаплогрупп (десятки тысячелетий) вызвано тем, что они относятся к разным родам человека, а относительно умеренное расстояние между двумя гаплотипами одной гаплогруппы (и к тому же одного субклада), часто всего несколько тысяч лет, и вызвано тем, что они фактически родственники, в рамках понятий ДНК-генеалогии. В целом понятия гаплогруппы и субклада часто взаимозаменяемы, и определяются контекстом изложения. И гаплогруппы, и субклады определяются необратимыми мутациями в Y-хромосоме, снип-мутациями, в отличие от обратимых мутаций, стир-мутаций, в гаплотипах (тех самых повторов, что описаны выше, которые в научной литературе называют STR, от Short Tandem Repeats). Эти снип-мутации (от сокращения SNP, Single Nucleotide Polymorphism), стараются подобрать такие (для идентификации гаплогрупп и субкладов), которые были бы стабильными за все время существования человечества. Поэтому гаплогруппы и субклады стабильны, не меняются во времени.

Всего в мире насчитывают 20 основных гаплогрупп, которые обозначают буквами латинского алфавита, от А до Т, хотя систему порой нарушают. В последнее время в классификацию добавили гаплогруппы А0 и А00, хотя их носителей обнаружили считанные единицы, все они живут в Африке. Но они настолько отстоят по снип-мутациям от всех остальных людей на Земле (тестированных на мутации в ДНК), что их пришлось выделить в отдельный род-гаплогруппу. Помимо этого, были идентифицированы промежуточные, сводные гаплогруппы, такие, как СТ, DE, GHIJK и другие (см. диаграмму ниже), так что минимальный состав генеалогического дерева мужской половины человечества включает уже 39 основных гаплогрупп, то есть главных уровней Y-хромосомного генеалогической структуры. С подгруппами это составляет уже много сотен.

Поскольку мы все еще во Введении, то расскажем об основных родах, или гаплогруппах, мужчин планеты. Хотя мы в этой книге время от времени обращаемся к женским линиям, мтДНК, но речь далее пойдет в основном о мужских линиях. И к этому есть серьезные причины. Женские линии митохондриальной ДНК передаются от матери к дочери непрерывной цепочкой на протяжении всего времени существования человечества и его предков миллионы лет назад, а также боковых ДНК-линий человеческой эволюции. мтДНК также передаются от матери сыну, но на последнем обрываются, потому что со сперматозоидами мтДНК от отца к матери не передаются, а если в редких случаях передаются, то это вызывает острые патологии и нередкую смерть плода или ребенка. Но не в этом причина, почему в ДНК-генеалогии мужские линии, передаваемые с Y-хромосомой, обычно более предпочтительны для рассмотрения. мтДНК дают картину гораздо более «крупными мазками», опуская множество важных деталей, на которых зачастую строится ДНК-генеалогия. Эти «крупные мазки» порой дают исключительно ценную информацию, но, как показывает опыт, только в отдельных случаях, намного удаленных во времени.

Например, в книге «Ваша ДНК-генеалогия» мы видели, как по «разнообразию» мтДНК оказалось возможным оценить, какая популяция древнее – денисовца, неандертальца или предков современного человечества, выяснить, что неандертальцы и денисовцы весьма удалены от современных людей, чтобы считать их одним видом с человеком разумным. Вот это и есть «крупные мазки», при всей их важности.

Но чем ближе к нашему времени, тем более хаотичной становится информация, полученная из мтДНК. «Грубые мазки» начинают накладываться, пересекаться, разрешение картины падает. Если мужские рода зачастую показывают, и довольно четко, направления и времена древних миграций, особенно при сочетании данных по ископаемым и современным Y-хромосомам, то женские рода часто «размазываются» по материкам и континентам, и максимум, что можно из такой информации извлечь – это записать и свести в таблицы, где какие мтДНК обнаружены. Собственно, такими описаниями и занимается популяционная генетика.

Приведу простой, но показательный пример. В нашей фамильной деревне Клёсово, о которой уже сообщалось выше, в Курской области, доля R1a составляет практически 100 %, а мтДНК – самые разнообразные. Объяснение здесь совсем простое. В 1639 году земля царским указом была выдана сыну боярскому Ивану Клёсову за воинскую службу, и не просто кусочек земли, а размером в 180 футбольных полей – это для тех, кто в делах землемерных не слишком ориентируется. Деревня была основана, и основатель ее имел гаплогруппу R1a. А всё остальное определил социальный, сословный статус основателя и патриархальный уклад того времени. Деревня была сословным статусом замкнута, изолирована, земля была выслужена, предками завещана, и чужих (в том числе с другими гаплогруппами, о чем, конечно, тогда не знали) туда не пускали. А мужские потомки имели, разумеется, только гаплогруппу R1a. В деревню приходили только женщины «со стороны», как невесты и жены, и из деревни уходили в окружающие деревни только невесты и жены. Так что мтДНК крутили свою карусель через деревню столетиями, а Y-ДНК (то есть Y-хромосома, а с ними соответствующие гаплотип и гаплогруппа) оставалась той же, исходной. Вот так и имеем в деревне 100 % R1a, и множество разных мтДНК, и всё это в одной деревне, в одном регионе.

Еще пример – из гарема выходила одна Y-хромосомная гаплогруппа, и множество разных мтДНК. Чем больше гарем, тем больше разных мтДНК выходило. В других случаях, жена традиционно уходила в селение к мужу, и тем самым мтДНК опять расходились по большим территориям, жен и наложниц привозили из дальних походов («Дывысь, Мыкола, сосед турчанку из похода привез»).

Еще пример – в ямной археологической культуре с датировками 4700–5300 лет назад все найденные двенадцать ископаемых мужских костных остатков, имели одну и ту же гаплогруппу R1b, все четырнадцать (с добавлением двух женских образцов) только в четырех случаях имели одинаковые гаплогруппы (Usa), но с тремя разными более глубокими субкладами, остальные были H2b, Н6а, H13a, T2c, две T2a, U4, U4a, W6, W3a. Понятно, что никакого вопроса о выявлении направлений и времен древних миграций мтДНК в такой ситуации просто не стоит. Более того, миграции с мтДНК не связывают, за исключением разве что наличия относительно обособленных мтДНК в Америке, Евразии и Юго-Восточной Азии.

Это вовсе не означает, что мтДНК не дают никакой информации, и их измерять и изучать бесполезно. Это не так, просто надо четко формулировать вопросы, на которые могут быть получены ответы с момощью мтДНК, и надо понимать, какого характера будут эти ответы. Обычно вопросы такие – какие мтДНК есть в таком-то регионе? И ответ, например, такой: «В деревне Сараево Переславского района Ярославской области выявлены следующие гаплогруппы: Н, W, I, Н, V2, Н, Н, U, X, Т*, Т*, W, Н, Н, W, T1». Понятно, что никакой ДНК-генеалогии здесь нет, и самой постановкой эксперимента не ожидалось.

 

Древнее ДНК– (Y-хромосомное) генеалогическое дерево человечества

ДНК-генеалогия выстраивает четкую генеалогическую линию предков и потомков, как людей, принадлежащих к определенному роду. Поскольку гаплогруппа – это совокупность родственных субкладов, происходящих по цепочке от еще более древних общих предков, а субклад – это совокупность носителей одних и тех же снипов, то ясно, что все их носители, то есть в данном случае мужчины, произошли от одного общего предка, патриарха, в ДНК которого этот снип впервые образовался. Фактически это есть общепринятое определение рода, что есть совокупность всех поколений людей, происходящих от одного предка.

Можно сказать и по-другому: гаплогруппа – совокупность гаплотипов, объединённая «групповой» необратимой мутацией, присущей определённому человеческому роду, то есть потомкам одного «патриарха», как правило, тысячелетия назад. Понятие «гаплогруппа» эквивалентно понятию «род» в ДНК-генеалогии. Эти мутации («снипы») выбирают по определённым критериям. Гаплогруппой также называют сам род в таких выражениях, как «гаплогруппа мигрировала шесть тысяч лет назад на восток», понимая, естественно, что мигрировали носители данной гаплогруппы. В настоящее время классификация включает 20 основных гаплогрупп (плюс А0 и А00), от А до Т в алфавитном порядке, и тысячи «нисходящих» гаплогрупп и субкладов.

Гаплогруппы не просто соответствуют своим родам, но образуют определённую последовательность, лестницу гаплогрупп, показывающих их иерархию – последовательный, ступенчатый переход от точки расхождения африканских и неафриканских популяций (примерно 160 тыс. лет назад) до самой недавней гаплогруппы R, образовавшейся примерно 30 тыс. лет назад. Эта лестница называется филогенетическим деревом гаплогрупп и их снипов. Все гаплогруппы и субклады на дереве должны включать снипы «вышестоящих» гаплогрупп и субкладов. То есть принцип «лесенки» должен выполняться. Преемственность узловых родов человечества должна соблюдаться.

На рисунке приведено дерево всех гаплогрупп человечества. Первый индекс – это индекс гаплогруппы или субклада, эти понятия применяются довольно произвольно, в зависимости от смысла, который в это вкладывается. Например, потомки Ивана Клесова, который родился в 1575 году, они же мои предки – это наш род. В то же время, наш род – это гаплогруппа R1a, которая образовалась (путем соответствующей мутации в Y-хромосоме) примерно 20 тысяч лет назад. Наш род – это также субклад R1a-Y2902, он же восточно-карпатская ветвь гаплогруппы R1a, этот субклад образовал-с я примерно 4300 лет назад. Как видим, понятия рода и субклада не являются жесткими по смыслу, более того, гаплогруппа R1a является субкладом гаплогруппы R1, a R1 является субкладом гаплогруппы R. По аналогии – все матрешки, вложенные одна в другую, являются матрешками, хотя и различаются размерами.

Всего в мире насчитывают 20 основных гаплогрупп, которые обозначают буквами латинского алфавита, от А до Т, хотя систему порой нарушают. В последнее время в классификацию добавили гаплогруппы A0 и A00, хотя их носителей обнаружили в количестве считанных единиц, все они живут в Африке. Но они настолько отстоят по снип-мутациям от всех остальных людей на Земле (тестированных на мутации в ДНК), что их пришлось выделить в отдельный род-гаплогруппу. Помимо этого, были идентифицированы промежуточные, сводные гаплогруппы, такие, как CT, DE, GHIJK и другие, так что минимальный состав генеалогического дерева мужской половины человечества включает уже 39 основных гаплогрупп, то есть главных уровней Y-хромосомной генеалогической структуры. С подгруппами это составляет уже много сотен.

Если же считать все уровни генеалогического дерева (уровень в этом случае – это субклад), то гаплогруппа R1a, основная гаплогруппа (род) этнических русских, уже насчитывает 74 субкладов, гаплогруппа R1b – 871 субкладов, и это при том, что на диаграмме ниже они обе входят в сводную гаплогруппу R, которой примерно 30 тысяч лет со времени образования. Образовалась гаплогруппа R при появлении необратимой мутации в виде спонтанного превращения одного нуклеотида в другой в ДНК (Y-хромосоме) патриарха, или его выжившего потомка, в свою очередь потомки которого дожили до настоящего времени в количестве более миллиарда человек. Если точнее, то у него, патриарха гаплогруппы R, по сравнению с ДНК его отца (относящегося к гаплогруппе Р) произошло спонтанное превращение аденина в гуанин, и это произошло в участке Y-хромосомы под номером 15 миллионов 581 тысяч 983. Всего же в Y-хромосоме мужчин насчитывается, как сообщалось выше, примерно 58 миллионов нуклеотидов.

Y-хромосомное дерево человечества, показывающее основные гаплогруппы

Всё это делает филогенетическое дерево гаплогрупп достаточно прочной и обоснованной структурой. У него есть, впрочем, слабое место – его филогения не показывает, на каком континенте зародилось человечество, откуда пошли гаплогруппы, начиная с первых, на общем стволе, идущими от нашего общего предка с современным шимпанзе. Говоря языком филогении, дерево гаплогрупп не «укоренено». Укоренение дерева – результат интерпретаций, наблюдений и доступных экспериментальных данных.

Результаты недавних исследований о происхождении человечества методами ДНК-генеалогии представлены на следующем рисунке, на котором также показаны времена появления основных Y-хромосомных ветвей человечества.

Естественно, эволюционное дерево уходит от альфа-гаплогруппы вниз, где расхождение гаплогруппы A0-Т на A0 и A1 и соответствует, видимо, расхождению двух ветвей, африканской (не по происхождению, которое неизвестно, а по факту прибытия в Африку) A0 и неафриканской A1. Датировка этого расхождения по гаплотипам дает примерно 160 тысяч лет назад.

Диаграмма эволюции гаплогрупп современного человечества. На горизонтальной оси – основные гаплогруппы Y-хромосомы человечества, на вертикальной – абсолютная шкала времени. Общий предок альфа-гаплогруппы жил примерно 160 тысяч лет назад, общий предок бета-гаплогруппы (или гаплогрупп от В до Т) – 64 ± 6 тысяч лет назад.

Примерно 64 тысячи лет назад предки современных неафриканцев прошли «бутылочное горлышко популяции», и именно к этому времени сходятся все изученные до настоящего времени ДНК-линии гаплогрупп от В до Т. Видимо, наиболее обоснованной гипотезой об основной причине обрыва генетических линий неафриканцев 64 тыс лет назад является катаклизм планетарного масштаба, вызванной падением метеора в Тихий океан в указанное время. Он привел к тому, что древние африканские гаплогруппы тоже вымерли и сейчас не обнаруживаются. Поэтому ровно никаких генетических оснований для утверждения, что современное человечество вышло из Африки нет, это просто фантазийная (а скорее, совершенно натянутая) схема. Фактически, она полностью строится на положении, что «африканцы более разнобразны» по Y-хромосомам, чем неафриканцы, но диаграмма выше показывает причины этого более высокого разнообразия. Вторая причина более высокого разнообразия в Африке – что в течение десятков тысяч лет в Африку мигрировали носители практически всех гаплогрупп человечества (например, в Камеруне и Чаде сейчас живут многие носители гаплогруппы R1b, пришедшие туда тысячелетия назад), которые, естественно, увеличивали «разнообразие», смешиваясь с африканцами. В южной Африке, среди местного населения, говорящего на консайнских языках и банту, были найдены самые разные гаплогруппы – A1b1, B2a, B2b, G, I, O, R1, Т. Подобные же диаграммы построены и для митохондриальных ДНК, присущих в первую очередь женщинам. Вывод один – предки современных не-африканцев из Африки не выходили, напротив, они прибывали в Африку и увеличивали африканское генетическое разнообразие.

Мутации в гапдотипах потомков расходятся от предкового гапдотипа как круги по воде, число мутаций легко рассчитывается, и они подчиняются довольно простым количественным закономерностям. Для кругов на воде, расходящихся от места, куда был брошен камень, легко рассчитать, когда был брошен камень, если знать скорость распространения волны и место нахождения круговой волны в данный момент времени. Чем больше прошло времени – тем дальше круги ушли, тем больше они разошлись. Так и в гаплотипах – чем больше время, прошедшее от общего предка, тем больше мутаций накопилось в гаплотипах его потомков. Число этих мутаций связано с временем, прошедшим от общего предка, с числом гаплотипов в серии, и с константой скорости мутации в гаплотипах, и выражается простой формулой: n/N = kt, где и – число мутаций в серии из N гаплотипов, к – константа скорости мутации (в числе мутаций на гаплотип за условное поколение, равное 25 лет), t – число условных поколений, с табличной поправкой на возвратные мутации.

На многих тысячах примеров показано, что эта формула работает при любом числе гаплотипов и мутаций в них, и при любом времени, прошедшем от общего предка рассматриваемых гаплотипов. Однако при очень больших временах, более 10–20 тысяч лет, и особенно более 100 тысяч лет, нужно использовать гаплотипы с «медленными» маркерами, то есть с малыми константами скоростей мутаций, и тем самым снижать число мутаций и число возвратных мутаций. По аналогии, вряд ли целесообразно изучать скорости радиоактивного распада элементов со временами полураспада в тысячелетия, используя секундомер. Или пытаться изучать круги на воде за километры от места, куда был брошен камень, для этого нужно значительно более мощное воздействие. Как всегда, нужен конкретный анализ в конкретной ситуации, единых подходов на все случае жизни не бывает. Варианты конкретного анализа в конкретных ситуациях и рассматривает ДНК-генеалогия. Некоторые ситуации и расчеты мы расмотрим ниже.

Мутации в ДНК-генеалогии – это не только единичные необратимые снип-мутации, описанные выше, которые определяют гаплогруппы и субклады, но и обратимые мутации, меняющие числа повторов, или аллели, в гаплотипах. В русскоязычной литературе их называют просто «мутации», с пониманием, что это не те мутации (в генах), которые обычно возникают под действием радиации. Переход числа повторов в маркере Y-хромосомы от 25 к 24 или 26 (или наоборот) имеет совершенно другую природу, чем «поломка» гена. Такой переход является следствием спонтанной, случайной ошибки ДНК-копирующей «биологической машины», это процесс первого порядка с точки зрения физико-химической или биологической кинетики, он не зависит от внешних воздействий.

Что важно отметить – в большинстве случаев результаты расчетов почти не зависят от размера выборки (при числе гаплотипов больше двух-трех десятков), то есть они достаточно устойчивы к статистическим вариациям. Размер выборки увеличивает точность, и то только до определенных пределов. Это относится к довольно большим популяциям, которые перемешались за тысячелетия, но именно с такими обычно и работают.

Снип-мутации в Y-хромосоме

Снип-мутации – это практически необратимые мутации в ДНК (от английского сокращения SNP, что означает «однонуклеотидные вариации»). Однажды образовавшись, они «застревают» в ДНК навсегда, за крайне редким исключением, когда в том же нуклеотиде, который ранее мутировал, прошла еще одна мутация – либо в другой нуклеотид, либо возвращение в исходный. В книге «Ваша ДНК-генеалогия» был приведен пример, что один определенный нуклеотид Y-хромосомы у всех современных гоминидов (кроме макаки, которая относится к семейству мартышковых, хотя отряд тот же – приматы), выбранный для той иллюстрации, является тимином, и только у орангутана там цитозин. Иначе говоря, у большинства этих особей тимин сидит в том месте Y-хромосомы не менее 15–20 миллионов лет, и за это время из пяти «образцов» изменился лишь однажды. Скептик скажет, что он мог измениться в орангутанге за это время и сотню раз, и цитозин – просто последний в той серии изменений, но так не бывает. Уже накоплен большой массив экспериментальных данных, что мутации в ДНК происходят неупорядоченно, статистически, равновероятно по всем последовательностям, за исключением крайне редких случаев, когда отпадают или перестраиваются большие фрагменты ДНК, но здесь явно не тот случай.

Большая серия экспериментальных данных, полученная и перекрестно проверенная разными коллективами исследователей, привела к средней величине константы скорости мутации в Y-хромосоме 0.82·10-9 на нуклеотид в год (более правильно – на пару нуклеотидных оснований в год). При такой скорости мутации за 5 миллионов лет, то есть до времени жизни общего предка шимпанзе и человека, в Y-хромосоме с ее 58 миллионов пар оснований набежит 0.82·10-9 × 10·106 × 58·106 = 476 тысяч мутаций, что составит всего 0.8 % от 58 миллионов нуклеотидов. Здесь в расчетах положено 10 миллионов лет, потому что 5 миллионов лет прошло от общего предка до современного человека, и столько же – до современного шимпанзе, то есть современники удалены друг от друга суммарно на 10 миллионов лет.

Используя эту константу скорости мутаций можно рассчитывать, сколько времени потребуется для прохождения определенного количества мутаций во фрагменте Y-хромосомы определенного размера. Например, мутация во фрагменте Y-хромосомы размером 8.47 миллионов нуклеотидов происходит в среднем раз в 144 года. Поскольку среднее число снип-мутаций в таком фрагменте Y-хромосомы от образования гаплогруппы R1a до настоящего времени равно 151, то R1a образовалась 151 × 144 = 21744 лет назад, или округленно 22 тысячи лет назад.

Эти расчеты здесь приведены, чтобы наглядно показать, насколько редки снип-мутации в Y-хромосоме, и как ведутся подобные расчеты. А такие расчеты – мощный современный инструмент ДНК-генеалогии, они позволяют выяснить, когда жили общие предки для популяций, очень удаленных во времени. Мы будет проводить подобные расчеты в настоящей книге довольно часто, и получать уникальную информацию об истории человечества.

Стир-мутации в гаплотппах Y-хромосомы

Помимо практически необратимых снип-мутаций, которые затрагивают, как правило, один нуклеотид (намного реже сразу два-три нуклеотида, блоком), в ДНК происходят более сложные и намного более частые мутации, которые мы будем называть стир-мутации (от английского сокращения STR, что означает «короткие тандемные повторы»), по аналогии со снип-мутациями. «Тандемные повторы» нуклеотидов называют так потому, что еще давно было обнаружено, что в Y-хромосоме некоторые нуклеотидные блоки, состоящие обычно из трех или четырех нуклеотидов, многократно повторяются («тандемом»), обычно от 7 до 45 раз подряд. Эти блоки повторов, достигающие в длину многих десятков, а порой и сотен нуклеотидов, очень стабильны, и в точности копируются при передаче Y-хромосомы от отца сыну, хотя в них происходят редкие мутации, в среднем раз в 12 тысяч лет. Но это в среднем, а в отдельных случаях мутации, те самые стир-мутации, случаются или относительно часто, например, раз в 3400 лет (в сегменте Y-хромосомы под названием DYS710), или очень редко, например, раз в 3 миллиона лет (DYS472).