Если мы хотим понять, что такое эпигенетика, то сначала нам придется получить некоторое представление о генетике и генах. Главным кодом подавляющего большинства жизненных форм на земле, от бактерий и до слонов, от травы японского гореца и до человека, является ДНК (дезоксирибонуклеиновая кислота). Буквосочетание ДНК, давно уже успевшее выйти за рамки биологии, постепенно приобретает все новые и более широкие значения. Социологи пользуются термином ДНК применительно к общественным группам или корпорациям, подразумевая под ним некий единый стержень ценностей, вокруг которого складывается общность. Были даже выпущены духи, названные этой аббревиатурой. Образным символом науки в середине XX столетия служило изображение гриба атомного взрыва. Во второй половине того же века на смену ему пришла двойная спираль ДНК.

Ученые не менее склонны к внезапным сменам настроений и следованиям велений моды, чем представители любых других видов деятельности. В науке был такой период, когда в ней безраздельно господствовало ортодоксальное мнение, что единственное, что заслуживает внимания и имеет значение, это сценарий ДНК, наша генетическая наследственность. В главах 1 и 2 мы показали, что это убеждение ошибочно, поскольку один и тот же сценарий может иметь разные прочтения, которые зависят от его клеточного контекста. Однако теперь мы оказываемся под угрозой возможной опасности качнуть маятник своего понимания ситуации слишком далеко в противоположном направлении, если бескомпромиссная эпигенетика сведет к минимуму значение кода ДНК. Истина, разумеется, лежит где-то посередине.

В введении мы характеризовали ДНК как сценарий. В театре, если пьеса откровенно плоха, даже великий режиссер и потрясающая труппа едва ли смогут сделать из нее достойный спектакль. С другой стороны, каждому из нас не раз приходилось видеть ужасающие постановки любимых драматургических произведений. Даже если сценарий идеален, конечный результат может оказаться катастрофическим, если за создание спектакля возьмется слабый постановщик. Подобным же образом генетика и эпигенетика чутко взаимодействуют между собой, работая слаженно и четко для сотворения чудес, к числу которых принадлежим и мы, и весь окружающий нас органический мир.

ДНК является фундаментальным источником информации в наших клетках, их базовой схемой. Сама ДНК пассивна в том смысле, что она не выполняет многие тысячи действий, необходимых для поддержания нашей жизни. Эти функции, главным образом, возложены на белки. Именно белки переносят по нашей кровеносной системе кислород, превращающий чипсы и гамбургеры в сахара и другие питательные вещества, которые всасываются в пищеварительном тракте и используются для питания мозга или для сокращения мышц, что позволяет нам и далее переворачивать страницы этой книги. Но коды всех этих белков находятся как раз в ДНК.

Но если ДНК — код, то значит, он должен состоять из символов, которые можно прочесть. Он должен работать подобно некоему языку. Именно так и действует код ДНК. Если учесть, насколько сложными созданиями являются люди, то очень странным и удивительным нам может показаться то, что наша ДНК представляет собой особый «язык», состоящий всего лишь из четырех букв. Эти буквы называются основаниями, а полные их наименования звучат так: аденин, цитозин, гуанин и тимин. Обычно их принято обозначать как А, Ц, Г и Т. В первую очередь следует запомнить Ц, цитозин, поскольку в эпигенетике это самое важное из всех оснований.

Чтобы представить себе, как выглядит ДНК, вспомним застежку-молнию. Это не идеальная аналогия, но для начала вполне сойдет. Разумеется, первое, что нам совершенно точно известно о молнии, это то, что она состоит из двух полосок, обращенных рабочей частью друг к другу. То же самое мы можем сказать и о ДНК. Четыре основания ДНК являются зубчиками молнии. Основания на каждой стороне молнии могут соединяться друг с другом химически и удерживать обе полоски вместе. Два основания, обращенные друг к другу и соединенные между собой подобно зубчикам молнии, называются парой оснований. Матерчатые полоски, к которым пришиты зубчики на молнии, это основные цепочки ДНК. В ДНК всегда две основные цепочки, повернутые друг к другу, как две полоски ткани с зубчиками на молнии, и по этой причине ДНК принято называть двухцепочечной. Две полоски молнии слегка закручены вокруг своей оси, образуя спиралевидную фигуру — знаменитую двойную спираль. На рисунке 3.1 представлено стилизованное изображение того, как выглядит двойная спираль ДНК.

Рис. 3.1. Схематическое изображение ДНК. Две основные цепочки закручены относительно друг друга, образуя двойную спираль.Спираль удерживается вместе химическими связями между основаниями в центре молекулы

Однако предложенной аналогией мы можем пользоваться только до этого момента, потому что зубчики на молнии ДНК вовсе не одинаковы. Если одним из зубчиков является основание А, то на противоположной цепочке оно может соединиться только с основанием Т. Аналогично, основание Г на одной цепочке может соединиться исключительно с основанием Ц на другой цепочке.

Это называется принципом спаривания оснований. Если А одной цепочки попытается соединиться с Ц противоположной цепочки, то тем самым оно нарушит всю целостность ДНК, поведя себя как сломавшийся зубчик в молнии.

Сохранение чистоты

Принцип спаривания оснований чрезвычайно важен для функционирования ДНК. Во время развития и даже на протяжении большей части нашей взрослой жизни клетки наших организмов продолжают делиться. Делается это, например, для того, чтобы органы увеличивались в размерах в процессе взросления ребенка. Клетки делятся и для того, чтобы заменить те, которые отмирают естественным путем. Примером этого может служить производство костным мозгом белых кровяных телец, вырабатываемых для замены тех, которые постоянно утрачиваются в ходе непрекращающейся борьбы с инфекционными микроорганизмами. Большинство типов клеток воспроизводятся, сначала полностью копируя свою ДНК, а затем разделяя ее поровну между двумя дочерними клетками. Такая возможность копирования ДНК чрезвычайно важна. Без нее дочерние клетки могли бы остаться вообще без ДНК, что в большинстве случаев делало бы их совершенно бесполезными; они были бы подобны компьютеру без программного обеспечения.

Копирование ДНК перед каждым делением клетки наглядно показывает, почему принцип спаривания оснований настолько важен. Сотни ученых целиком посвятили свои жизни исследованию того, каким образом ДНК удается копироваться настолько точно. И вот в чем суть этого процесса. Две цепочки ДНК распадаются, после чего огромное количество белков, участвующих в копировании (так называемый комплекс репликации), принимается за дело.

На рисунке 3.2 в общих чертах показано, что при этом происходит. Комплекс репликации движется вдоль каждой одиночной основной цепочки ДНК и выстраивает обращенную к ней новую цепочку. Комплекс распознает определенное основание — скажем, основание Ц — и на цепочке, которую строит, всегда располагает напротив него основание Г. Вот почему такое огромное значение имеет принцип спаривания оснований. Так как Ц обязано составить пару с Г, а А обязательно должно спариться с Т, клетки могут воспользоваться существующей ДНК как шаблоном для создания новых цепочек. В итоге каждая дочерняя клетка приобретает новую идеальную копию ДНК, в которой одна из цепочек получена из исходной молекулы ДНК, а другая только что синтезирована.

Рис. 3.2. На первой стадии репликации ДНК происходит разделение двойной спирали на две цепочки. Основания каждой отделенной основной цепочки служат шаблоном для создания новой цепочки. Это гарантирует, что две новые двухцепочечные молекулы ДНК будут иметь абсолютно ту же последовательность оснований, что и родительская молекула. Каждая новая двойная спираль ДНК обладает одной основной цепочкой, которая прежде принадлежала родительской молекуле (черная), и одной только что синтезированной основной цепочкой (белая)

Даже в природе, в системе, эволюционировавшей миллиарды лет, нет совершенства, и временами механизм репликации дает сбои. Он может попытаться вставить основание Т туда, где полагается быть основанию Ц. Когда такое случается, ошибка почти всегда мгновенно исправляется другим набором белков, которые могут распознать, что произошло, извлечь неверное основание и заменить его правильным. Это называется механизмом репарации ДНК, и одна из причин, по которым он работает, заключается в том, что, когда пару составляют неподходящие для этого основания, он определяет, что «молния» ДНК не «застегивается» должным образом.

Клетка изо всех сил старается сделать так, чтобы копии ДНК получались абсолютно идентичными своему оригинальному шаблону. Важность этого станет еще более понятной, если мы снова, как уже делали это выше, сравним ДНК со сценарием. Вспомним одну из самых знаменитых строк во всей английской литературе: Ромео, о зачем же ты Ромео?

Если мы изменим всего лишь одну букву, то как бы эмоционально ни была произнесена эта фраза со сцены, смысл ее вряд ли останется тем, который вкладывал в него великий Шекспир: Ромео, о затем же ты Ромео?

Этот не совсем серьезный пример достаточно убедительно иллюстрирует, почему сценарий должен воспроизводиться совершенно точно. То же самое может происходить и с нашими ДНК — одно неуместное изменение (мутация) может привести к катастрофическим результатам. Особенно актуально это в том случае, если мутация присутствует в яйцеклетке или сперматозоиде, поскольку в конечном итоге это может привести к рождению индивидуума, все клетки которого будут поражены мутацией. Некоторые мутации могут вызывать крайне тяжелые клинические последствия. Примерами этого могут быть, например, дети, стареющие настолько стремительно, что в десятилетнем возрасте они практически не отличаются от семидесятилетних мужчин и женщин, или девушки с предрасположенностью к развитию злокачественной опухоли груди, которую сложно диагностировать до достижения ими возраста сорока лет. К счастью, такие виды генетических мутаций относительно редки по сравнению с заболеваниями, которым подвержено большинство людей.

Все 50 000 000 000 000 или около того клеток человеческого организма являются результатом безупречной репликации ДНК, происходящей раз за разом и каждый раз при делении клеток после образования той одноклеточной зиготы, о которой мы узнали в главе 1. Вы будете еще более впечатлены, узнав, в каких объемах ДНК приходится воспроизводиться всякий раз, когда одна клетка образует при делении две дочерние клетки. В каждой нашей клетке содержится шесть миллиардов пар оснований ДНК (половина в свое время была получена нами от отцов и половина — от матерей). Эту последовательность шести миллиардов пар оснований мы называем геномом. Следовательно, деление каждой самостоятельной клетки нашего организма является результатом копирования 6000000000 оснований ДНК. Если мы воспользуемся тем же способом вычислений, к которому прибегали в Главе 1, то есть будем считать по одной паре оснований в секунду, не устраивая перерывов, то нам потребуется каких-то 190 лет, чтобы пересчитать все основания в геноме одной клетки. Учитывая, что ребенок рождается всего лишь через девять месяцев после образования одноклеточной зиготы, мы вынуждены будем согласиться с тем, что наши клетки способны реплицировать ДНК довольно быстро.

Три миллиарда пар оснований, наследуемых нами у каждого из родителей, не вытянуты в одну длинную цепочку ДНК. Они собраны в маленькие узелки, называемые хромосомами. Подробнее мы поговорим о них в главе 9.

Чтение сценария

А пока давайте вернемся к более фундаментальному вопросу о том, что именно делают эти шесть миллиардов пар оснований ДНК и как работает сам сценарий. Или, говоря конкретнее, как может код, состоящий всего из четырех букв (А, Ц, Г и Т), создавать тысячи и тысячи разнообразных белков, находящихся в наших клетках? Ответ на этот вопрос до удивления элегантен. Он может быть описан в терминах модульной парадигмы молекулярной биологии, но, пожалуй, нам будет значительно удобнее рассматривать его на примере конструктора «Лего».

В свое время у «Лего» был мощный рекламный слоган «Каждый день — новая игрушка», и это не было преувеличением. В большой коробке «Лего» помещается ограниченное количество фигурок, преимущественно не слишком различающихся между собой кирпичиков определенных форм, размеров и цветов. Тем не менее, из этих кирпичиков можно сложить самые разнообразные макеты чего угодно, от уточек до домиков и от самолетиков до бегемотиков. Практически то же происходит и с белками. «Кирпичиками» в белках являются довольно маленькие молекулы, которые называются аминокислотами, и в наших клетках содержатся двадцать стандартных аминокислот (различных кирпичиков «Лего»). Но эти двадцать аминокислот могут соединяться между собой в невообразимо огромном разнообразии сочетаний, создавая столь же колоссальное число белков.

Однако мы пока не выяснили, каким образом пусть даже двадцать аминокислот могут быть закодированы всего лишь четырьмя основаниями ДНК. Дело в том, что механизм клетки «считывает» ДНК блоками по три пары оснований за раз. Каждый блок, состоящий из трех пар оснований, называется кодон и может выглядеть как А А А, ГЦГ или любая другая комбинация А, Ц, Г и Т. Из всего лишь четырех оснований можно создать шестьдесят четыре различных кодона, и этого количества будет более чем достаточно для двадцати аминокислот. Некоторые аминокислоты закодированы более чем одним кодоном. Например, аминокислота под названием лизин закодирована кодонами ААА и ААГ. Некоторые кодоны вообще не занимаются кодированием аминокислот. Они служат сигналами, сообщающими механизму клетки о завершении кодирования последовательности белков. Такие кодоны называются терминирующими кодонами или терминаторами.

Как именно ДНК в наших хромосомах выполняет функции сценария для производства белков? Делает она это при помощи белка-посредника, молекулы, которая называется матричной РНК (мРНК). мРНК очень похожа на ДНК, хотя и отличается от нее в некоторых существенных деталях. Ее основная цепочка слегка отлична от ДНК (поэтому она и называется РНК, что означает рибонуклеиновая, а не дезоксирибонуклеиновая, кислота); она является одноцепочечной (так как состоит лишь из одной цепочки); вместо основания Т в ней находится очень похожее, но все же отличающееся от него основание У (сейчас нам нет необходимости вдаваться в подробности, почему это происходит и к чему приводит). Когда «прочитывается» определенный участок ДНК, чтобы на основании этого сценария был произведен некий белок, громадный комплекс белков «отстегивает» нужную часть ДНК и делает копии мРНК. При этом комплекс пользуется принципом спаривания оснований, поэтому сделанные им копии мРНК идеальны. После этого молекулы мРНК используются в качестве временных шаблонов в специализированных структурах клетки, ответственных за производство белков. Они прочитывают трехбуквенный код кодона и связывают вместе требуемые аминокислоты для образования более длинных белковых цепочек. Весь этот процесс, конечно, намного сложнее, но принцип его именно такой.

Возможно, эта механика станет более понятной, если мы в очередной раз воспользуемся аналогиями из нашей повседневной жизни. Процесс поступательного движения от ДНК к мРНК и к белку можно сравнить с обработкой изображения, полученного с помощью цифрового фотоаппарата. Допустим, своей цифровой камерой мы сделали снимок просто невероятно прекрасного пейзажа. Мы хотим, чтобы другие люди имели к нему доступ, но при этом ни в коем случае не могли бы вносить в него какие-либо изменения. Исходный файл на нашей камере — это чертеж ДНК. Мы копируем его в другой формат, который нельзя подвергнуть обработке — пусть это будет, скажем, PDF, — а потом по электронной почте рассылаем тысячи копий этого файла в формате PDF всем, кто только проявит интерес к нашей работе. Файл PDF — это матричная РНК. Любой желающий, будь на то его воля, сможет распечатывать бумажные копии этого файла PDF в каких угодно количествах, и эти бумажные копии являются белками. Так что каждый человек в мире сможет распечатать наш снимок, но файл с его оригиналом — только один.

Но зачем столько сложностей, почему бы ни передавать информацию напрямую? Существуют несколько веских причин, по которым эволюция отдает предпочтение именно такому витиеватому методу. Одна из них заключается в том, чтобы предотвратить порчу сценария, файла с оригинальным изображением. Когда ДНК «расстегивается», она становится относительно уязвимой для изменений, и в процессе эволюции клетки научились защищать ее от этой опасности. Непрямой способ передачи информации, при котором ДНК кодирует белки, минимизирует отрезок времени, когда определенный участок ДНК остается открытым и уязвимым. Другая причина, по которой именно такой способ передачи информации выбран эволюцией, состоит в том, что он позволяет определять необходимые количества конкретных белков, вырабатываемых в ходе этого процесса, что называется пластичностью.

Рассмотрим в качестве примера белок, который называется алкоголь дегидрогеназа (АДГ). Он вырабатывается в печени и расщепляет алкоголь. Если мы принимаем алкоголь в больших количествах, клетки нашей печени увеличивают объемы производимой ею АДГ. Когда же мы перестаем пить спиртное, печень вырабатывает меньшие количества этого белка. В этом и заключается одна из причин, по которой пьющие часто люди реагируют на воздействие алкоголя значительно медленнее пьющих изредка, которые начинают клевать носом уже после пары бокалов легкого вина. Чем чаще мы пьем спиртное, тем больше белка АДГ вырабатывает наша печень (до определенной границы). Но делают это клетки печени, не увеличивая количество копий гена АДГ. Вместо этого они прочитывают ген АДГ более эффективно, то есть производят больше копий мРНК и/или используют эти копии мРНК более эффективно в качестве белковых шаблонов.

Как мы вскоре убедимся, эпигенетика объясняет один из механизмов, с помощью которого клетка способна контролировать синтез производимого ею определенного белка, определяя в первую очередь, сколько копий мРНК должно быть получено с оригинального шаблона.

В нескольких последних абзацах говорилось о том, как гены кодируют белки. А сколько генов у нас в клетках? Вопрос на первый взгляд кажется совсем несложным, но, как это ни странно, в ответах на него нет единства мнений. Это объясняется тем, что ученые до сих пор не могут договориться о том, что считать геном. Раньше все было просто и понятно — геном назывался участок ДНК, кодирующий белок. Теперь мы понимаем, что это был слишком упрощенный подход. Однако абсолютно справедливо говорить, что все белки кодируются генами, даже если не все гены кодируют белки. В нашей ДНК насчитывается от 20 000 до 24 000 кодирующих белки генов, а это значительно меньше, чем цифра в 100 000, которую ученые считали наиболее вероятной всего лишь десять лет назад.

Большинство генов в клетках человека имеют весьма схожее строение. Начинаются они с области, называемой промотор, которая связывает белковые комплексы, копирующие ДНК для формирования мРНК. Затем белковые комплексы движутся вдоль образования, известного как тело гена, создавая в процессе этого длинную цепочку мРНК, чтобы в итоге отделится на конце гена.

Редактирование сценария

Представьте себе тело гена длиной в 3000 пар оснований, что является для него вполне приемлемым размером. Длина мРНК тогда тоже составит 3000 пар оснований. Каждая аминокислота кодируется кодоном, состоящим из трех оснований, следовательно, мы можем предположить, что эта мРНК закодирует белок длиной в 1000 аминокислот. Но — и это довольно неожиданно — в действительности обнаруживается, что белок обычно существенно короче.

Если бы мы напечатали последовательность гена, она бы выглядела как длинная строчка, состоящая из разнообразных сочетаний букв А, Ц, Г и Т. Но если мы проанализируем ее подходящей для этой цели компьютерной программой, окажется, что мы можем разделить эту длинную строку на два типа последовательностей. Первый тип называется экзон (экспрессированная, то есть выраженная, последовательность), и именно экзон способен кодировать аминокислоты. Второй тип называется интрон (инэкспрессированная, то есть невыраженная, последовательность). Эта последовательность не кодирует аминокислоты. Она содержит в себе множество терминирующих кодонов, которые сигнализируют, что синтез данного белка пора завершать.

Первая копия мРНК, полученная с ДНК, содержит в себе весь набор экзонов и интронов. Как только эта длинная молекула РНК будет создана, в дело вступает другое специализированное подразделение белкового комплекса. Оно удаляет все последовательности интронов и соединяет друг с другом экзоны, создавая тем самым мРНК, которая кодирует непрерывный поток аминокислот. Этот процесс редактирования называется сплайсингом.

И эта процедура также выглядит излишне усложненной, но и в данном случае эволюция руководствовалась весьма вескими причинами для выбора такого непростого механизма. Объясняется это тем, что клетка использует относительно небольшое количество генов для создания гораздо большего числа белков. Как действует этот механизм, показано на рисунке 3.3.

Рис. 3.3. В верхней части этой диаграммы показана молекула ДНК. Экзоны, кодирующие участки аминокислот, размещены в темных ячейках. Интроны, не участвующие в кодировании последовательностей аминокислот, представлены светлыми ячейками. Когда ДНК впервые копируется в РНК, что обозначено первой стрелкой, в РНК содержатся как экзоны, так и интроны. После этого клеточный механизм удаляет интроны полностью или частично (этот процесс называется сплайсинг). Получившиеся в результате этого молекулы матричной РНК могут передавать информацию самым разным белкам от одного и того же гена, что отражено на диаграмме различными словами. Для простоты восприятия, все экзоны и интроны имеют на диаграмме одинаковые размеры, однако в действительности они могут различаться в очень широких пределах

Начальная мРНК содержит в себе все экзоны и все интроны. Затем в процессе сплайсинга из нее удаляются интроны. Но во время сплайсинга некоторые экзоны также могут быть удалены. Одни экзоны будут сохранены в окончательной мРНК, тогда как другие будут потеряны. Различные белки, создаваемые в результате этого, могут обладать довольно схожими функциями или радикально отличаться друг от друга. Клетка может экспрессировать разные белки, руководствуясь тем, какие из них ей необходимы в данный момент, или реагируя на получаемые ею различные сигналы. Если мы определяем ген как нечто, кодирующее белок, то этот механизм означает, что всего 20000 или около того генов способны кодировать гораздо большее количество белков, чем 20000. Когда мы рассуждаем о геноме, то обычно используем какую-то уж слишком двухмерную терминологию, как будто речь идет о железнодорожных путях. Лаборатория Питера Фрейзера из Бабрахамского института в Кембридже опубликовала потрясающую работу, в которой утверждается, что истина не имеет ничего общего с этим заблуждением. Питер Фрейзер работает с генами, которые кодируют белки, требующиеся для вырабатывания гемоглобина, пигмента в красных кровяных тельцах, переносящего кислород по всему нашему организму. Для создания конечного пигмента необходимо определенное количество различных белков, а находятся они в разных хромосомах. Доктор Фрейзер обнаружил, что в клетках, производящих гемоглобин в больших количествах, эти хромосомные зоны размягчаются и вытягивают из себя крошечные отростки, от чего становятся похожими на растопыривших щупальца осьминогов. Эти мягкие зоны, собираясь на каком-нибудь маленьком участке клеточного ядра, начинают колебаться из стороны в сторону, пока не найдут себе подобных, после чего смешиваются друг с другом. Тем самым они существенно повышают шансы того, что все белки, требующиеся для создания функционального пигмента гемоглобина, будут экспрессированы одновременно.

В каждой клетке нашего организма содержится 6 000 000 000 пар оснований. Почти 120 000 000 из них кодируют белки. Сто двадцать миллионов — звучит внушительно, но на самом деле это всего лишь около 2 процентов их общего количества. Так что, хотя мы считаем белки самым важным продуктом, который синтезируют клетки, но примерно 98 процентов нашего генома не участвуют в кодировании белков.

До недавнего времени причина, по которой мы обладаем такой огромной ДНК, и при этом настолько ничтожная ее часть отвечает за вырабатывание белков, оставалась тайной за семью печатями.

В последние десять лет мы наконец начали потихоньку разбираться, в чем тут дело, и в очередной раз это явление оказалось связано с регулированием экспрессии генов эпигенетическими механизмами. Настало время перейти к рассмотрению молекулярной биологии эпигенетики.