Мусорная ДНК. Путешествие в темную материю генома

Кэри Несса

Глава 2. Когда темная материя становится совсем темной

 

 

Ученых поразило, что такая огромная доля генома не кодирует никаких белков. Однако больше всего их удивило не само это явление, а его размах. Специалисты уже много лет знали о существовании участков ДНК, не кодирующих белки. Собственно, это стало одним из первых больших сюрпризов после открытия структуры ДНК. Однако тогда вряд ли кто-нибудь представлял, какими важными окажутся эти области ДНК, и вряд ли кто-нибудь ожидал, что они помогут объяснить причины некоторых генетических заболеваний.

Сейчас не помешает чуть подробнее вглядеться в строительные блоки нашего генома. Напомним, ДНК — своего рода алфавит, к тому же весьма простой. В нем всего четыре буквы — А, Г, Т и Ц (аденин, гуанин, тимин и цитозин). Их называют нуклеотидными основаниями. Этот простенький алфавит несет в себе невероятное количество информации. Человек наследует 3 миллиарда оснований, составляющих наш генетический код, от матери, и аналогичный набор оснований от отца. Представьте себе ДНК как веревочную лестницу, где каждая ступенька — нуклеотидное основание, причем между соседними ступеньками 25 сантиметров. Такая лестница протянулась бы на 75 миллионов километров, то есть приблизительно от Земли до Марса (впрочем, тут многое зависит от того, где эти планеты будут располагаться на своих орбитах в тот момент, когда мы протянем эту воображаемую лестницу).

Еще одно сравнение. Полный корпус произведений Шекспира содержит в себе, по уверениям специалистов, 3 миллиона 695 тысяч 990 букв1. Представим себе, что все это собрали в один толстенный том. Мы наследуем от матери текст объемом чуть больше 811 таких книг. И столько же — от отца. Это, прямо скажем, немалый объем информации.

Если продолжать аналогию с алфавитом, можно заметить, что алфавит ДНК кодирует лишь трехбуквенные слова. Каждое такое слово соответствует определенной аминокислоте — строительному блоку, из которых конструируются белки. Ген можно представить себе как предложение из таких трехбуквенных слов. Такая фраза кодирует последовательность аминокислот, из которых слагается тот или иной белок. (См. рис. 2.1.)

Рис. 2.1. Связь между геном и белком. Каждая трехбуквенная последовательность в гене кодирует один строительный блок соответствующего белка.

В каждой клетке обычно содержится по две копии каждого гена. Одну копию мы наследуем от матери, одну — от отца. Но хотя в клетке лишь две копии каждого гена, она способна создавать тысячи и тысячи белковых молекул, кодируемых тем или иным геном.

Как клетке это удается? В процесс экспрессии генов встроено два механизма амплификации (увеличения числа копий). Последовательность нуклеотидных оснований в ДНК не служит непосредственным шаблоном для создания белка. Клетка создает копии гена. Эти копии очень похожи на исходный ген ДНК, однако не идентичны ему. Они слегка отличаются от него по химическому составу. Их называют РНК (рибонуклеиновая кислота, тогда как ДНК — дезоксирибонуклеиновая кислота). Еще одно отличие: у РНК вместо основания Т (тимин) — основание У (урацил). ДНК состоит из двух нитей, соединенных парами оснований. Чем-то это похоже на железнодорожные пути. Рельсы удерживаются вместе благодаря тому, что нуклеотидное основание одного рельса связывается с основанием другого, как если бы основания пожимали друг другу руки. Такие рукопожатия подчиняются определенным правилам. Т пожимает руку только А, а Ц — лишь Г. Благодаря этому распределению связей ученые часто описывают ДНК как совокупность нуклеотидных пар. РНК — однонитевая молекула («монорельс»). Главные отличия между ДНК и РНК показаны на рис. 2.2. Клетка способна быстро сделать тысячи РНК-копий гена ДНК, и это — первая амплификационная стадия экспрессии гена.

Рис. 2.2. Вверху: грубая схема ДНК (молекулы, состоящей из двух нитей). Основания (А, Г, Т и Ц) удерживают две нити вместе, попарно соединяясь. При этом А всегда соединяется только с Т, а Г всегда соединяется только с Ц. Внизу: грубая схема РНК (однонитевой молекулы). Ее «хребет» по химическому составу чуть отличается от ДНК (поэтому полоска закрашена другим цветом). Вместо основания Т у РНК — основание У.

РНК-копии гена уносятся от ДНК в другую часть клетки — цитоплазму. В этой клеточной области молекулы РНК действуют как своего рода шаблоны (матрицы) для аминокислот, которые образуют белок. Каждая молекула РНК может много раз выступать в роли такого шаблона, что и представляет собой вторую стадию амплификации при экспрессии гена. (См. рис. 2.3.)

Можно прибегнуть к аналогии с узором для вязания, которую мы уже использовали в первой главе. Ген ДНК — исходный узор на листе бумаги. Этот узор можно много раз ксерокопировать (сравните с производством РНК). Полученные копии можно послать множеству вязальщиц, каждая из которых может много раз воспроизвести один и тот же узор (сравните с синтезом белка). Простая, но эффективная модель. Такая молекула РНК действует как своего рода посланец. Она несет информацию о генетической последовательности от ДНК к «сборочному цеху», где синтезируются белки. Поэтому она и называется информационной РНК (другое название — матричная РНК).

Рис. 2.3. Единичная копия гена ДНК в ядре клетки используется как шаблон для создания множества копий молекулы информационной РНК. Эти молекулы РНК выводятся за пределы ядра. Затем каждая может играть роль инструкции для производства белка. Каждая молекула информационной РНК способна создавать множество копий одного и того же белка. Таким образом, при создании белка на основе кода ДНК имеют место две стадии амплификации. Для простоты картины здесь показана лишь одна копия данного гена, хотя обычно в клетке их две — по одной от каждого из родителей.

 

Отсекая бессмыслицу

Вам может показаться, что все это — довольно простые процессы. Однако некоторое время назад ученые обнаружили, что здесь есть некая странность. Большинство генов состоит из фрагментов, которые кодируют аминокислоты белков, и каких-то «лишних» кусков, которые ничего такого не кодируют. Эти куски — словно бессмыслица, вклинившаяся в строй понятных слов. Фрагменты бессмысленного генетического текста назвали интронами.

Когда клетка производит РНК, она вначале копирует все ДНК-буквы гена, в том числе и те его куски, которые не кодируют никаких аминокислот. Но затем клетка удаляет эти некодирующие куски, так что в конечном счете получается информационная РНК, представляющая собой удобную инструкцию для синтеза нужного белка. Этот процесс называется сплайсингом («сращиванием»). Он упрощенно показан на рис. 2.4.

Рис. 2.4. Стадия 1: ДНК копируется в РНК. Стадия 2: РНК обрабатывается так, чтобы соединялись вместе лишь участки, кодирующие аминокислоты (обозначены прямоугольниками с буквами). Мешающие «мусорные» участки выбрасываются из зрелой молекулы информационной РНК.

Как показано на рис. 2.4, белок кодируется модульными блоками информации, что дает клетке массу возможностей по-разному обрабатывать РНК (такая обработка называется процессингом РНК). Клетка может по-разному соединять модули, полученные от молекулы информационной РНК, тем самым создавая целый ряд информационных молекул, кодирующих родственные друг другу, но не идентичные белки. Схематически это показано на рис. 2.5.

Куски бессмысленного текста между участками гена, кодирующими аминокислоты, вначале считали просто какой-то чепухой, ненужным хламом. Отсюда и возникло пренебрежительное название «мусорная ДНК». Такие фрагменты обычно отметали как незначащие. Как уже подчеркивалось, мы будем использовать термин «мусорная ДНК» для обозначения любых фрагментов ДНК, не кодирующих белки.

Рис. 2.5. Молекула РНК может обрабатываться различными путями. В результате могут соединяться друг с другом разные участки, кодирующие аминокислоты. Это позволяет синтезировать на основе одного исходного гена ДНК различные версии белковой молекулы.

Однако теперь-то нам известно, что такие фрагменты могут иметь очень большое значение. Атаксия Фридрейха, заболевание, которое мы описывали в главе 1, вызывается ненормально большим количеством повторов последовательности ГАА в одной из «мусорных» областей ДНК, находящейся между двумя фрагментами, честно кодирующими аминокислоты. Отсюда и возник вполне разумный вопрос: если мутация не затрагивает последовательности, отвечающие за синтез аминокислот, почему же люди, у которых наблюдается такая мутация, страдают от столь разрушительных симптомов?

При атаксии Фридрейха мутация определенного гена происходит в мусорной области между двумя участками, кодирующими аминокислоты. (На рис. 2.5 это была бы область между Б и Л.) В нормальном состоянии такой ген содержит от 5 до 30 повторов ГАА, а у мутантного гена от 70 до 1000 повторяющихся мотивов ГАА2. Исследователи показали: когда число повторов так сильно превышает норму, клетка перестает вырабатывать информационную РНК, кодируемую данным геном. А поскольку клетки теряют способность производить информационную РНК, они не могут делать и белок. Если вы не рассылаете вязальщицам узоры, солдаты не получают теплых носков.

Собственно, в таких случаях клетки не производят даже длинную, необработанную РНК-копию гена3. Зона избыточного повтора ГАА действует как своего рода «клейкая» область, которая препятствует нормальному копированию ДНК. Сравните с попыткой ксерокопировать 50-страничный документ, в котором страницы 4-12 склеены вместе. Аппарат просто не сможет нормально обработать эти страницы, и весь процесс копирования документа застопорится. В случае гена атаксии Фридрейха невозможность копирования означает, что не будет РНК, а значит, не будет и белка.

Пока не до конца ясно, почему нехватка белка, кодируемого данным геном, приводит к симптомам данной болезни. Похоже, этот белок участвует в процессах, которые мешают избыточному накоплению железа в частях клетки, вырабатывающих энергию4. Когда клетке не удается синтезировать соответствующий белок, уровень содержания железа повышается до токсичных значений. По-видимому, некоторые типы клеток более чувствительны к уровню содержания железа. К ним относятся и те, которых затрагивает эта болезнь.

Родственный предыдущему, но все же иной механизм лежит в основе синдрома ломкой X-хромосомы — формы неспособности к обучению (умственной отсталости), с которой мы сталкивались в главе 1. Мутация при синдроме ломкой X-хромосомы — увеличение числа повторов последовательности ЦЦГ. Тут многое напоминает мутацию при атаксии Фридрейха: в нормальной хромосоме число копий этой последовательности обычно от 15 до 65. Но у хромосомы, которая несет в себе мутацию, характеризующую синдром ломкой X-хромосомы, число копий — от примерно 200 до нескольких тысяч5,6. Однако при синдроме ломкой X-хромосомы зона увеличенного числа повторов располагается в иной части гена по сравнению с атаксией Фридрейха — перед первым участком, кодирующим аминокислоты: на рис. 2.5 это соответствует мусорной области слева от блока, обозначенного буквой Б. Когда число «мусорных» повторов становится очень большим, информационная РНК не производится, а значит, на основе данного гена не синтезируется белок7.

Функция этого белка состоит в том, чтобы разносить по клетке множество различных молекул РНК. Он доставляет их в нужные места, тем самым влияя на то, как эти РНК будут обрабатываться и как они будут синтезировать белки. Без данного белка другие молекулы РНК не регулируются должным образом. В результате нарушается нормальное функционирование клетки8. По неясным пока причинам нейроны мозга, похоже, особенно чувствительны к такому эффекту. Вот почему при этом заболевании ухудшается обучаемость.

Приведем очередную бытовую аналогию. В Великобритании сравнительно небольшое количество выпавшего снега может парализовать транспортные сети. Снег покрывает шоссе и железнодорожные пути, мешая двигаться автомобилям и поездам. Когда такое происходит, люди не в состоянии вовремя добраться до места работы, что создает всевозможные проблемы. Школы не открываются, товары не доставляются в срок, банки не выдают нужное количество наличности и т.п. Одно исходное событие — снегопад — порождает многообразные последствия, поскольку нарушает работу транспортных систем человеческого общества. Что-то подобное происходит и при синдроме ломкой X-хромосомы. Подобно снегу на автострадах и рельсах, мутация нарушает работу транспортных систем человеческой клетки, что приводит к множеству последствий: наблюдается своего рода «эффект домино».

«Отключение» экспрессии определенного гена — ключевая стадия в патологии атаксии Фридрейха и синдрома ломкой X-хромосомы. Подтверждения этой гипотезы удалось найти, исследуя некоторые крайне редкие проявления обоих заболеваний. У очень небольшого числа пациентов участки мусорных повторов имеют тот же малый размер, что и у большинства здоровых людей. У таких пациентов наблюдаются мутации, меняющие порядок следования участков, кодирующих аминокислоты. Такие изменения аминокислотной последовательности не позволяют клетке вырабатывать белок. Иными словами, неважно, почему белок не экспрессируется, — в любом случае у пациентов наблюдаются симптомы болезни.

 

И как только вы обзавелись красивой теорией...

Может показаться, что у нас вырисовывается удобный и прямой путь для дальнейших исследований. Можно рассуждать так: эти расширения в мусорных областях важны лишь из-за того, что они создают аномальную ДНК. С этой ДНК клетка обращается неправильно. Результат — нехватка определенных важных белков. Можно предположить, что обычно эти мусорные области не играют особой роли в клетке.

Однако этому выводу кое-что противоречит. «Нормальный» диапазон количества повторов в генах синдрома ломкой X-хромосомы и атаксии Фридрейха обнаруживается по всему миру. Более того, он сохраняется на всем протяжении эволюции человека (является «консервативным»). Если эти области не наделены никаким смыслом, следовало бы ожидать, что со временем они будут случайным образом меняться. Однако такого не происходит. Остается предположить, что эти «нормальные» повторы имеют какую-то функцию.

Но подлинная жемчужина в этой генетической раковине связана с миотонической дистрофией, заболеванием, которое мы описывали в главе 1. Количество повторов при миотонической дистрофии растет по мере того, как недуг передается от поколения к поколению. Родительская хромосома может содержать последовательность ЦТГ, повторенную 100 раз подряд. Но в хромосоме ребенка последовательность ЦТГ может повторяться уже 500 раз подряд! По мере увеличения числа повторов последовательности ЦТГ заболевание становится все острее. Такого бы не происходило, если бы вредоносный рост числа повторов просто отключал близлежащий ген. Все клетки страдающего миотонической дистрофией содержат по две копии данного гена. В одной копии нормальное число повторов, в другой — увеличенное. А значит, одна копия гена должна всегда вырабатывать нормальное количество соответствующего белка. Следовательно, общий уровень выработки белка может упасть максимум на 50%.

Можно выдвинуть такую гипотезу. По мере того, как количество повторов увеличивается, все сильнее падает экспрессия мутантной версии гена. Это могло бы привести к постепенному уменьшению общего количества вырабатываемого белка — от падения на 1% для сравнительно небольшого роста числа повторов до 50%-ного (максимального) падения для значительного роста этого числа. Это, в свою очередь, могло бы привести к различным симптомам. Проблема в том, что других наследуемых генетических заболеваний такого же типа в общем-то нет. Мы просто не наблюдаем никаких других болезней, где весьма незначительные изменения экспрессии генов приводят к такому сильному эффекту (все, у кого число повторов превысило критический уровень, демонстрируют симптомы болезни), причем между пациентами наблюдается весьма тонкая градация симптомов (они становятся более серьезными по мере роста числа повторов).

Имеет смысл посмотреть, где именно в гене миотонической дистрофии происходит этот рост числа повторов. Оказывается, на правом краю, за последней областью, кодирующей аминокислоты. На рис. 2.5 это соответствует горизонтальной линии после прямоугольника с буквой Ь. Получается, всю область, кодирующую аминокислоты, можно скопировать в РНК еще до того, как копирующая аппаратура клетки встретится с вредоносной зоной повторов («расширением», «зоной экспансии»).

Теперь уже очевидно, что эта зона повторов сама копируется в РНК. Зона сохраняется, даже когда длинную РНК обрабатывают для создания из нее информационной РНК. При миотонической дистрофии информационная РНК делает нечто необычное. Она связывает множество белковых молекул, которые имеются в клетке. Чем больше повторов, тем больше белковых молекул связывается. Мутантная информационная РНК при миотонической дистрофии действует как губка, собирающая все больше таких белков. Белки, которые связываются с расширением информационной РНК при миотонической дистрофии, обычно участвуют в процессах регуляции многих других информационных РНК. Они влияют на эффективность доставки молекул информационной РНК в нужные места клетки, а также на то, долго ли эти молекулы информационной РНК просуществуют в клетке и насколько эффективно они будут кодировать белки. Но все эти регуляторы связывает расширение информационной РНК, создаваемой на основе гена миотонической дистрофии, так что они уже не могут выполнять свою обычную работу9. Этот процесс схематически показан на рис. 2.6.

Рис. 2.6. Вверху: нормальная ситуация. Специфичные белки (показаны как «шевроны») связываются с зоной повторов триплета ЦТГ в информационной РНК миотонической дистрофии (иными словами, той информационной РНК, которая формируется на основе гена, мутирующего при данном заболевании). Множество молекул этих белков доступно для того, чтобы связываться с другими информационными РНК, регулируя их поведение. Внизу: ЦТГ-последовательность, много раз повторенная в мутантной информационной РНК миотонической дистрофии. Она связывает большое количество специфичных белков, и оставшихся не хватает для того, чтобы регулировать другие информационные РНК. Для простоты здесь показано лишь небольшое число повторов. В серьезных случаях оно может достигать нескольких тысяч.

Вот еще одна аналогия. Представьте себе большой город, где каждый полицейский вынужден подавлять массовые выступления на каком-то участке. Тогда не останется сотрудников охраны правопорядка для выполнения обычных полицейских функций. То-то раздолье взломщикам и угонщикам. Похожая история происходит в клетках тех, кто страдает от мутации гена миотонической дистрофии. В этом гене нарастает количество повторов последовательности ЦТГ, что в конечном счете приводит к неправильной регуляции прочих генов клетки.

Дело в том, что зона повторов, увеличиваясь, связывает все большее количество белков. Поэтому нарушается функционирование все большего количества информационной РНК, что затрагивает все больше функций клетки. В конечном счете это приводит к развитию широкого диапазона симптомов у тех, кто страдает генетической мутацией, характерной для миотонической дистрофии. Вот вам и объяснение того, почему пациенты с большим числом повторов страдают от самых разных и серьезных клинических проблем.

Как мы уже видели в случаях атаксии Фридрейха и синдрома ломкой X-хромосомы, нормальные повторяющиеся последовательности (для гена миотонической дистрофии — последовательности триплета ЦТГ) впечатляющим образом сохранялись на протяжении всей эволюции человека. Это еще одно подтверждение того, что они играют важную роль в поддержании здорового состояния и нормального функционирования организма. Для гена миотонической дистрофии подтверждение еще более убедительное — благодаря тем белкам, которые связываются с зоной повторов в информационной РНК. Эти белки также связываются с зонами повторов меньшего размера — как раз такого, которым характеризуются нормальные гены. Просто в зонах меньшего размера не так много таких связываний, как при увеличенном количестве повторов.

Из примера с миотонической дистрофией ясно, что есть какая-то причина, объясняющая, почему молекулы информационной РНК содержат области, не кодирующие белки. Такие области играют важнейшую роль при регулировании того, каким образом информационные РНК используются клетками. Эти области сами как бы создают еще один уровень контроля, осуществляя тонкую настройку количества белков, которые будут вырабатываться на основе генетической матрицы ДНК. Мутацию, приводящую к миотонической дистрофии, идентифицировали почти за десятилетие до публикации генома человека. Тогда никто не ожидал, какой невероятно сложной и изменчивой окажется эта тонкая настройка.