Клеймо создателя

Филатов Феликс Петрович

Часть третья. Арифметика генетического кодирования

 

 

Глава A.

Аналоговые таблицы генетического кода (XIII)

Первым, кто попытался упорядочить таблицу генетического кода и построить ее на рациональной основе, был наш выдающийся ученый Юрий Борисович Румер. Он был физиком, учеником Макса Борна, хорошо знал Альберта Эйнштейна, Пауля Эренфеста, Эрвина Шредингера, был другом Льва Ландау. Читал лекции в Московском университете, работал в ФИАНе. Само собой, очередная российская власть (большую часть ХХ века – советская) привычно обошлась с крупным ученым, сунув его в 1938г в лагерь, а потом в авиационную шарашку, где он работал с Туполевым, Королевым, Мясищевым, Петляковым, Глушко, Бартини, Карлом Сциллардом, братом упоминавшегося выше Лео; каждый незауряден. Ольга и Сергей Бузиновские показывают целую вереницу выдающихся людей, которая незримо тянется за именем Румера – от Понтекорво до Ферми и Александра Грина, от Флерова до Сент-Экзюпери и Алексея Толстого, от Бартини до Ильфа и Петрова и Булгакова…

…В 1953г Румер был реабилитирован, потом работал в Академгородке под Новосибирском. Как только Ниренберг с соавторами опубликовали в 1965г полный словарь генетического кода, Румер немедленно погрузился в эту тематику. В том же году он писал: «Рассмотрение группы кодонов, относящихся к одной и той же аминокислоте, показывает, что в каждом кодоне (XYZ) целесообразно отделить двухбуквенный корень /XY/ от окончания /Z/. Тогда каждой аминокислоте, в общем случае, будет соответствовать один определенный корень, а вырожденность кода является следствием изменения окончания». Шестнадцать возможных корней он разбил на два октета (с заменой тимина Т на урацил U для РНК):

Идея о разбиении корней кодонов на два октета – «сильные» и «слабые» была совершенно новой и неожиданной для специалистов, работавших в этой области. Оказалось, что анализ многих свойств аминокислот четко подтверждает разбиение всех аминокислот на две группы, соответствующие разбиению корней на два октета. Исследованию разнообразных следствий этой идеи были посвящены несколько работ Румера. В частности, подход Румера к проблеме с однозначностью приводил к следующему порядку букв:

C – очень сильная

G – сильная

U – слабая

A – очень слабая

Этот порядок букв (CGUA) дает возможность сформулировать простые правила, определяющие «силу» корня:

сила корня, содержащего в качестве второй буквы С или А, определяется

силой второй буквы;

сила корня, содержащего в качестве второй буквы G или U, определяется силой первой буквы.

Крик предпочитал другой порядок букв в генетическом алфавите. В письме Румеру он доказывал преимущества порядка UCAG (этот порядок и сейчас используется во всех учебниках), но алфавит Румера позволял, в частности, видеть поразительные симметрии внутри генетического кода. Не вдаваясь в описание румеровской аргументации, мы предлагаем здесь свой порядок: CUAG, основанный не на качественном понятии «сила кодирующего основания», но на простом упорядочивании по нарастанию весьма простого же параметра – молекулярной массы азотистых оснований – и показываем группу наглядных симметрий, что – как и сам принцип такого упорядочивания – представляется нам даже более интересным. Но об этом позже. Что же до Юрия Борисовича Румера, то это фигура чрезвычайно интересная; о нѐм очень много можно прочесть в Интеренете:

…Чутьѐ у Румера было поразительным. То, что увлекало его в молекулярной биологии [много] лет назад, сейчас является передним краем исследований. В последние годы наблюдается явный рост числа публикаций, в которых проблемы генетического кода анализируются с привлечением симметрий и методов теории групп. Предлагаются разные подходы, основанные на разных типах групп, включая квантовые. В основном этим занимаются физики, не слышавшие о работах Юрия Борисовича. Когда они знакомятся-таки с работами Румера, то поражаются их изяществу, глубине и тому, что идеи симметрии уже [много] лет назад играли центральную роль при подходе к проблемам генетического кода…

Любопытно, в частности, что Юрий Борисович инициировал исследования и по поиску корреляций между одномерной и трехмерной структурами белков. Их не удалось довести до конца по причине существенной неполноты экспериментальных данных, отсутствия хороших компьютеров, а в основном, по-видимому, из-за недостатка энтузиазма … у молодых участников проекта. И снова современное: Не люблю я точные науки, Точно сам не знаю, почему…

Он объединил кодоны, третья буква которых может быть любой из четырех, в один набор, а кодоны, не удовлетворяющие этому условию – в другой. Оба набора содержали равное число триплетов – по 32 каждый. При этом число кодирующих дублетов в обоих наборах составляло по восемь в каждом, поэтому наборы были названы октетами. Оба октета оказались связанными между собой простым преобразованием: T↔G, C↔A (ДНК-вариант):

Этот рисунок иллюстрирует румеровское преобразование, переводящее дублеты одного октета в другой. Третье основание кодона неявно присутствует здесь в составе октета II, продукты которого организованы в две строки: верхнюю кодируют триплеты с третьим пиримидином, нижнюю – с третьим пурином.

Идеи Юрия Румера были продолжены и развиты работами Владимира Щербака. Два румеровских октета Щербак преобразовал таким образом, чтобы выделить в них группы вырожденности, пронумеровав их справа налево, а продукты кодирования (аминокислоты) он упорядочил в каждой группе по нарастанию молекулярной массы слева направо; триплеты, соответствующие продуктам кодирования, он записал по вертикали сверху вниз. Тогда первые, вторые и третьи основания кодонов образовывали три строки в каждом кодоне. Вот что у него получилось (цифры под третьими основаниями – характеристики кодируемого продукта):

1. номер октета

2. номер группы вырожденности

3. продукт кодирования (аминокислота или терминирующий сигнал 0)

4. 1-е основание кодона

5. 2-е основание кодона

6. 3-е основание кодона

7. Bulkiness (мера формы или объѐма или «громоздкости» боковой цепи)

8. Объем (рассчитанный по Ван-дер-Ваальсовым радиусам)

9. Полярность (сила электрического поля вокруг молекулы)

10. Изоэлектрическая точка

11. Гидрофобность 1; гидрофильные аминокислоты – выделены темносерым и отрицательными значениями

12. Гидрофобность 2 (другие данные)

13. Поверхность, доступная для воды в развернутом пептиде

14. Доступная воде поверхность, теряемая при свертывании пептида

15. Polar requirement, PR (эмпирические данные по хроматографии водных растворов). Темный> 7.5; светлый <5.6

16. Частота встречаемости аминокислот в белках современных организмов

17. ars-класс

18. неканоническое кодирование ( – нет продукта)

В двух прямоугольных блоках – два румеровских октета (строка 1), упорядоченные по нарастанию номера, каждый из которых разделен на группы вырожденности, помеченные соответствующими римскими цифрами (строка 2) и упорядоченные по убыванию номера. Строка 3 – продукты кодирования, упорядоченные по нарастанию масс в «своих» группах вырожденности (что – как и в первых двух случаях – подчеркивается градиентом насыщенности серого цвета). Символы оснований кодирующих триплетов расположены вертикально – сверху вниз, от 5` до 3` – для удобства сравнения кодонов по первым, вторым и третьим буквам соответственно. Четное содержание продуктов кодирования в октетах позволяет провести посередине вертикаль, которая оказывается осью симметрии по отмеченным ниже характеристикам. R  – пурины (A, G), Y  – пиримидины (С, Т), N  – любое из четырех азотистых оснований. 0 – стоп-кодон. Строки 7—15 – физико-химические свойства аминокислот.

Эта несложная организация приводит к поразительно красивой общей картине: в октете 1 первые основания триплетов (первая строка) оказываются взаимно комплементарными относительно упомянутой вертикали; вторые основания – зеркально симметричны по пуринам и пиримидинам. Симметрия третьих оснований – это симметрия их монотонного ряда. Симметрии подчеркиваются оттенками серого (интенсивность которого нарастает с увеличением молекулярной массы продукта кодирования в составе группы вырожденности).

Симметрия кодирующих триплетов и продуктов кодирования, относящихся к октету 2, в этой таблице немного сложнее, но также вполне наглядна. Она требует двух предварительных пояснений. Первое – это позиция цистеина, С. Универсальный код предписывает дублету TG кодирование цистеина, если третьим основанием кодона является пиримидин Y , а кодирование триптофана, если третья буква кодона – G. Аденин в третьей позиции образует пунктуационный знак – стоп-кодон TGA. То обстоятельство, что при этом нарушается симметрия, ставит определенную проблему, которую Владимир Щербак разрешил, обнаружив, что обозначенная в таблице позиция цистеина принципиально не противоречит Природе, поскольку существуют одноклеточные микроорганизмы (Euplotida, реснитчатые, инфузории), генетический код которых отличается от универсального как раз по кодированию цистеина: триплет TGA у них транслируется как С и не имеет функции «стоп». Второе пояснение относится именно к функции «стоп», которая рассматривается в таблице как «законный» продукт кодирования, не имеющий массы.

Итак, упорядочивание продуктов кодирования октета 2 по нарастанию молекулярной массы так же, как и в случае октета 1, приводит к симметриям первых, вторых и третьих оснований соответствующих кодонов. При этом основной особенностью этого представления является зеркальная симметрия пар кодирующих дублетов пяти краевых позиций и симметрия со сдвигом трех пар внутренних, кодирующих триплетов. Так же, как и в октете 1, осью этой симметрии является вертикаль, которая делит строки точно посередине. Симметрию третьих оснований нечетных групп вырожденности (H|G) Владимир Щербак рассматривал в данном случае как вариант симметрии Y|R.

Как мы упоминали, симметрия описанного представления генетического кода имеет место не только по молекулярной массе аминокислот, но и по другим их параметрам (строки 11—15). Замена в третьей позиции пары симметричных кодонов пурина пиримидином – и наоборот – в определенной мере сохраняет, например, гидрофобность кодируемых продуктов, хотя размер аминокислоты при этом, конечно, основательно меняется. Однако, ни гидрофобность, ни еще одна характеристика – PR (строка 15) – которую Карл Вѐзе и его группа описали, как основу регулярности генетического кода и соответствия кодонов и продуктов кодирования, не могут сравниться по строгости симметрий с молекулярной массой аминокислот, что хорошо демонстрирует приведенная таблица Владимира Щербака. Неканонические ключи кодирования (строка 17) тоже выглядят в этих таблицах довольно беспорядочными и случайными отклонениями.

За весь этот рисунок кооперативной симметрии генетического кода, на основе молекулярных масс его компонентов, за ее красоту и гармонию, не имеющую к тому же сколько-нибудь внятного физического, химического или молекулярно-биологического обоснования, мой друг назвал описанную таблицу каллиграммой (красивой записью). Термин этот принадлежит Гийому Апполинеру, который – в экспериментальном порядке попытался организовать некоторые свои тексты так, чтобы продемонстрировать их симметрию. Их он и называл calligrammes.

В следующей главе мы покажем, что симметрии каллиграммы Щербака имеют неожиданный количественный характер, то есть, по-видимому, даже более сущностны, нежели только что описано. Стоит, однако, отметить, что известные небольшие отклонения от универсального генетического кода могут серьезно нарушать симметрии каллиграммы. Например, генетический код митохондрий позвоночных, который, по одним представлениям, был предшественником универсального, а по другим – сам происходил из него, отличается тем, что у него отсутствуют нечетные группы вырожденности, так что две четные прямо соответствуют двум октетам Румера. При этом дублет TG кодирует цистеин, если в третьей позиции триплета стоит пиримидин, и триптофан, если в третьей позиции – пурин. То же относится и к дублету АТ: ATY =I, ATR =M. И еще одно отличие от универсального: триплет AGR кодирует не аргинин, а сигналы терминации (0). Это означает, что описанная каллиграмма Щербака, сама по себе, как будто, не является обязательным условием организации генетического кодирования (земных?) организмов. Вместе с тем, Андрей Хренников и Сергей Козырев, используя так называемые р-адические числа, показали наличие значительной регулярности и в этой версии генетического кода. Автор не берется комментировать их работу, поскольку ровно ничего не понимает в р-адических числах и в d-адических плоскостях. Однако, она каким-то образом связывает регулярную организацию (в том числе и симметрии) генетического кода с его защищенностью. В своих рассуждениях Хренников и Козырев отталкивались от представления кодирующих триплетов, предложенного Роз-Мари Свансон57 и позднее уточненного Драганом Босняцким58 с соавторами на основе подхода, используемого для решения хорошо известной Проблемы Путешествующего Продавца (ППП). В этом представлении последовательность кодирующих триплетов образует цикл, известный как «код Грея»:

Напомню, что кодом Грея называется любая циклическая последовательность всех наборов из нулей и единиц, в которой два соседних набора отличаются только по одной компоненте (дельта Хемминга). Другими словами, код Грея – это система замкнутой организации числового ряда, в которой два соседних значения различаются только в одном разряде. Вот как выглядит 3-битный двоичный код Грея (каждое трехзначное число представлено здесь вертикально; то есть чтение его сверху вниз соответствует обычному чтению слева направо) в линейном представлении:

Первое и последнее числа (000) совпадают, указывая на замкнутость ряда. Читателю предлагается обратить внимание на то, что числа кода Грея (двоичные в данном случае) расположены в последовательности, не совпадающей с натуральным рядом: преобразованные в десятичные, они дают здесь последовательность 0—1—3—2—6—7—5—4—0.

В представлениях Свансон и Босняцкого кодировка Грея образует последовательность наборов (3-компонентных наборов, то есть, триплетов из 4-х оснований), в которой два соседних набора отличаются только по одному основанию (в одной и той же позиции). В последовательности, организованной по этому правилу, различаются (хотя и не слишком строго) группы, соответствующие размерам аминокислот («большим» и «малым»), а также их позициям в составе белковых молекул («наружным» или «внутренним», то есть, гидрофильным или гидрофобным). Описанное свойство дает генетическому коду дополнительную защищенность. Стоит вспомнить, что – как об этом пишет Википедия – «коды Грея широко используются для упрощения выявления и исправления ошибок в системах связи, а также в формировании сигналов обратной связи в системах управления». Они применяются и в теории генетических алгоритмов для кодирования генетических признаков, представленных целыми числами, поскольку минимизируют эффект ошибок при преобразовании аналоговых сигналов в цифровые.

Часть аминокислот обладает выраженными гидрофильными или гидрофобными свойствами. Молекулы синтезируемого полипептида сворачиваются в фиксированную трехмерную структуру. Основной параметр, определяющий это сворачивание (фолдинг) – гидрофобность или гидрофильность аминокислоты. Код очевидно не мог эволюционировать по размеру кодона; он с самого начала был триплетным, что определялось физикой комплементарных соответствий. Что до функций каждой буквы триплета, то поскольку в современном коде за гидрофобность аминокислоты отвечает центральный нуклеотид, постольку на начальных этапах эволюции кодирования направление считывания кодона, по-видимому, не имело большого значения. А общий паттерн генетического кода потребовал симметрий как условия помехоустойчивости хранения, передачи и приема информации, и соответствующие функции были делегированы краевым основаниям триплета. После установления вектора считывания кодона эти функции были, по преимуществу, отданы первым буквам, в то время, как половина третьих стала просто межкодонными разделителями, а вторая половина – дискриминаторами для продуктов с общим кодирующим дублетом. И в этом случае (то есть в случае вторых кодонных оснований) порядок CTAG выявляет билатеральную симметрию:

То обстоятельство, что позиции гидрофильных и гидрофобных аминокислот выходят за пределы «своей» центральной буквы в обе стороны от оси симметрии (между Т и А в этой таблице, еще раз подчеркивает значение порядка CTAG в организации генетического кода. Так же симметрично в Таблице 4 размещаются и некоторые другие продукты кодирования – например, пунктуационные знаки.

Вернемся, однако, к молекулярной массе как таковой. Автор использовал этот параметр не только для характеристики кодируемых продуктов, но также для характеристики кодирующих оснований. Упорядочивание азотистых оснований по нарастанию массы приводит к ряду C

В новой таблице хорошо разделяются кодоны октетов 1 и 2; последние образуют светлую фигуру «креста», в которой, в свою очередь, хорошо заметно симметричное – относительно центра фигуры – расположение нечетных групп вырожденности и триплетов, дополняющих в октете 2 кодирование аминокислот S, L и R, имеющих свои кодоны в октете 1.

Упорядочивание кодируемых аминокислот по массе неожиданно выявляет еще одну группу симметрий, которые связаны с классом аминоацил-тРНК-синтетаз (АРСаз), присоединяющих аминокислоту к тРНК. АРСазы делятся на два класса на основе структурного сходства и способу аминоацилирования тРНК. АРСазы 1-го класса (АРСазы-1) в большинстве случаев мономеры. 76-й аденозин тРНК они аминоацилируют по 2» -ОН группе. АРСазы-2 – это, как правило, димеры. За исключением фенилаланил-тРНК-синтетазы все они аминоацилируют 76-й аденозин тРНК по 3» -ОН группе. Оба класса АРСаз содержат равное число ферментов – по десять в каждом. Кроме того, АРСазы-1 узнают «свою» тРНК со стороны так называемого «малого желобка» акцепторной миниспирали, а АРСазы-2 – со стороны «большого».

Разделим по аналогии с АРСазами-1 и -2 – соответствующие им аминокислоты также на два класса арс-1 и арс-2. При этом возникает внятная билатеральная симметрия двадцатки аминокислот: ровно половина из них (мы здесь не вдаемся в детали), синтезируется с помощью аминоацил-тРНК-синтетаз (АРСаз) I класса:

Другая половина синтезируется с помощью АРСаз II класса (нижние строки – порядковые номера аминокислот при раздельной – по классам [1—10 и 1—10] и при сплошной [1—20] их нумерации):

В обоих представленных рядах аминокислоты упорядочены по нарастанию молекулярной массы. Любопытно, что в каждый арс-класс попадает по три неполярные алифатические аминокислоты (VLI и GAP), по три полярные незаряженные (CQM и STN), по одной негативно и позитивно заряженных (E-R+ и D-K+) и по две ароматические (YW и HF) аминокислоты. В каждой из строк первых букв кодирующих эти аминокислоты триплетов легко различаются две четверки GTCA и GATC, разделенные в одном случае пиримидинами С* и Т*, в другом – пуринами G*и А*. Поэтому арс-1 мы условно называем пиримидиновыми аминокислотами арс-Y , а арс-2 – пуриновыми, арс-R . Как это может соотноситься с молекулярной биологией процессов, связанных с трансляцией, мы увидим далее.

Описанные симметрии рядов арс-Y и арс-R сохраняются и в двумерном (2D) представлении. Это представление, образно (то есть, не математически) названное Автором базовой матрицей генетического кода, формируется абсциссой, вдоль которой размещаются аминокислоты, упорядоченные по нарастанию молекулярных масс, и ординатой, вдоль которой размещаются первые кодирующие основания, соответствующие этим аминокислотам.

Базовая (без нижней дополнительной строки) матрица является прямоугольником 4х5, содержащим двадцатку канонических аминокислот. В отличие от каллигаммы, матрица не требует специального допущения для кодирования цистеина и, таким образом, полностью соответствует универсальному генетическому коду. Центральные колонки матрицы отчетливо структурированы по гидрофильности аминокислот (в таблице ниже – светлые ячейки заняты гидрофобными аминокислотами, темные – гидрофильными):

Матрица структурирована также по позициям обозначенных выше четверок аминокислот обоих арс-классов, демонстрируя их строгую сдвиговую симметрию:

Отчетливо заметна и симметрия продуктов, маркирующих деление арс-классов аминокислот на «пуриновые» и «пиримидиновые», – относительно центральной колонки матрицы:

Поскольку в каждой строке матрицы не более двух или трех аминокислот одного класса с хорошо различимой массой, то при способности АРСаз узнавать хотя бы первое основание кодона (третье – антикодона) и отличать его от фиксированного по массе реперного соседа, безошибочное узнавание АРСазой «своей» тРНК чрезвычайно упрощается. Таким образом, матрица хорошо иллюстрирует решение парадокса множественного узнавания небольшой молекулы с почти монотонной структурой.

Заканчивая главу, упомянем еще об одной нашей находке, имеющей отношение к кодовым симметриям. Оказывается, продукты кодирования зеркально-симметричными дублетами (типа ABN и BAN) следуют трем простым правилам:

при нарастании массы оснований в дублете кодируемый продукт имеет бо льшую молекулярную массу, при снижении – меньшую;

молекулярная масса продукта, кодируемого гомотриплетом (то есть, ССС, ТТТ, ААА, GGG), больше, если триплет составлен из пиримидинов;

молекулярная масса пары аминокислот, кодируемых гомодублетом (то есть, СС-, ТТ-, АА-, GG-), больше, если он состоит из пиримидинов.

Возникает вопрос, какой смысл – и есть ли он – в кодовых симметриях и соотношениях, описанных в этой главе? Если хиральность биологических молекул и клеточная организация имеют очевидные достоинства и являются необходимыми для возникновения жизни и последующей эволюции, то симметрия (в первую очередь, билатеральная) генетического кодирования, по меньшей мере, озадачивает. Является ли она следствием каких-то не открытых еще физических или информационных законов (например, исходных альтернатив, выбор которых имел селективные преимущества, похоронившие первые версии кода, значительно более разнообразные и не столь регулярные)? Имеет ли она отношение к надмолекулярным симметриям биологических форм? Нужна ли подобная симметрия кода для его невероятной стабильности или для максимальной простоты и надежности его функционирования в биологических системах? Положительные ответы на все эти вопросы весьма соблазнительны, но без весьма основательной проработки – остаются лишь гипотезами, доказательства которых сегодня даже не просматриваются. Альтернативная точка зрения (Френсис Крик) заключается в том, что все эти симметрии совершенно случайны, и генетический код мог быть каким угодно: химического соответствия между аминокислотами и антикодонами нет. И если сегодня – в большинстве случаев – нельзя рассчитывать на то, что после замены антикодона на другой в синтезируемый полипептид войдет аминокислота, соответствующая новому антикодону, то это потому только, что длительная эволюция – опять-таки во многих случаях – оптимизировала соответствие АРСаз и тРНК за счет участков, выходящих за пределы антикодона.

Следующая глава написана для тех читателей, кого обе точки зрения оставляют в состоянии умственного дискомфорта. Но только те из них, кто разделяет черный оптимизм Автора, кто понимает, что если не веришь в Бога, то это не означает автоматическую «веру в Большой Взрыв», и кто не ждет от науки неизбежного разрешения ассонанса в консонанс (не органчик же!), – только они получат удовольствие от того, что ответы на эти вопросы вызывают новые, еще более острые.

…………………

Сразу ясно, что символом А  эта глава названа просто потому, что речь в ней идет об а налоговых представлениях генетического кода. Здесь мы, наконец, оставляем без внимания множество «интересных» чисел, которыми до сих пор докучали терпеливому Читателю, но к которым всѐ же ненадолго вернемся в последующих двух главах, посвященных оцифровке приведенных выше аналоговых представлений.

 

Глава Б.

Барионная оцифровка генетического кода (xiv)

 

Форматы 1D и 2D

Строго говоря, барионным числом называется сохраняемое квантовое число системы. Нам нет необходимости углубляться в эту тему. Может быть, стоит помнить лишь то, что барион – это элементарная частица, состоящая из трех кварков. Все частицы, состоящие из трех кварков, имеют барионное число +1. Наиболее стабильные барионы – это протоны и нейтроны, называемые нуклонами. Из них состоят ядра атомов. Атомы формируют молекулы, в том числе молекулы двух компонентов генетического кода – азотистых оснований и аминокислот. Нуклоны входят в семейство адронов и являются самыми легкими барионами. Именно из барионов построена подавляющая часть наблюдаемого нами вещества. С точки зрения электромагнетизма, определяющего межатомные взаимодействия, протоны и нейтроны, разумеется, различны, но в терминах сильного взаимодействия, которое является основным в масштабах атомного ядра, они различаются только изоспинами и являются, по существу, одной частицей, нуклоном. Все эти пояснения я привожу здесь для того только, чтобы напомнить читателю, что адроны появились в первые десять миллисекунд после Большого Взрыва. Именно адроны (то есть барионы, то есть нуклоны) и являются костяшками тех счет, на которых Автор намерен отстучать бо льшую часть Главы Б , поскольку не может исключить, что этот инструмент был уже использован на Земле 4.5 миллиардов лет назад.

В 1980г Хасегава и Мията предложили целочисленный вариант параметра массы аминокислот – число нуклонов в молекуле; позднее Владимир Щербак (см. Примечания к Главе 111) использовал его для демонстрации арифметического содержания генетического кода. Термин нуклонная масса и будет использован далее. Термин барионное число не применяется к молекулам, иначе он бы только запутал дело (хотя математически он точно соответствует нуклонной массе). Он фигурирует только в названии этой главы, да и то – для того только, чтобы пояснить ее символ.

«Новый параметр» и объекты его приложения позволили выявить удивительную картину. Чтобы ее оценить, надо иметь в виду два обстоятельства. Во-первых, основу целочисленности составляют наиболее распространенные и стабильные изотопы атомов молекул 20 аминокислот. Второе обстоятельство требует отдельного уточнения. Дело в том, что молекулы аминокислот сконструированы по общему правилу. Все они являются альфа-аминокислотами, то есть их аминогруппа максимально приближена к карбоксилу; именно такие аминокислоты способны обеспечить необходимую прочность и устойчивость молекулам полимеров (полипептидов):

Различие в структуре аминокислот обеспечивается вариантами радикала (R), а константную часть молекулы составляют показанные здесь два атома углерода, два – кислорода, один – азота и четыре – водорода. Их целочисленная нуклонная масса, то есть масса их нуклонов – 74 в свободном состоянии и 56 – в составе полипептида. Вариабельная нуклонная масса относится к радикалу и составляет от 1 (водородный протон) у глицина G до 130 у триптофана W.

Единственное исключение из общей структуры аминокислот представляет собой пролин Р. Он содержит боковую цепь с двумя связями – и на один атом водорода меньше в константной части. Однако, воображаемая передача одного нуклона из боковой цепи – константной возвращает последней стандартную массу: 73+1=74, в то время, как боковая цепь остается без протона: 42—1=41. Одновременно пролину возвращается «стандартная» структура аминокислоты, состоящая из константной и вариабельной частей.

Остается отметить, что пунктуационный знак «стоп», не кодирующий аминокислоты (в отличие от знака «старт», ассоциированного с метионином М), принимается в оцифровке генетического кода за ноль. Примем также во внимание и то, что пять позиций:

оцифровка генетического кода сама по себе,

разделение молекулы аминокислоты на константную и вариабельную части для наглядности такой оцифровки,

знак «0», которым в арифметике (особенно там, где речь идет о представлении числа в той или иной системе счисления), помечают не столько «пустоту», сколько «пробел»,

«нормирование» молекулы пролина, показанное выше,

кодирование цистеина триплетами TGH в таблице универсального кода —

все это – действия совершенно искусственные, работа ума, артефакт, не имеющий, на первый взгляд, никаких «естественных» аналогов. Но именно на них основана оцифровка генетического кода, о которой пойдет здесь речь. Ее результаты заставляют думать, что перед нами либо следствие физических законов необычной природы, либо случайные совпадения, либо конструкция, собранная по принципам, для демонстрации которых такая оцифровка адекватна.

Попробуем это проиллюстрировать на примере, который Владимир Щербак назвал каллиграммой (Глава А ). Представим эту каллиграмму чуть иначе, чем прежде, а именно «уравняем в правах» первый и второй октеты, то есть, придадим им одинаковый размер, для чего третьи основания кодонов в строке октета 1 представим как Y или R , а не как N . Одновременно впишем в дополнительные ячейки таблицы значения нуклонных масс продуктов кодирования, а также их константных и вариабельных частей, после чего просуммируем каждые (по горизонтали).

Результаты суммирования (как минимум!) озадачивают. Их можно свести к четырем пунктам.

В первом октете полученные числа формируют соотношение сторон так называемого «священного египетского треугольника» – [666 +1184 =1850 ], где 666=32х74, 1184=42х74, а 1850=52х74, то есть соотношение [32 +42 =52 ], или соотношение длин катетов и гипотенузы прямоугольного треугольника, соответствующих трем смежным числам, соседям по непрерывному натуральному ряду 3 , 4 , 5 . (т. н. «Священный Египетский Треугольник»).

Во втором октете эти результаты формируют символ равенства или количественной симметрии: 1110 =1110 . При этом в строке var (нуклонные суммы вариабельных частей аминокислот) октета 2 показанный здесь результат достигается только тогда, когда пунктуационному знаку терминации трансляции (стоп-сигналу) соответствует пробел, ноль, 0, пустое место, о чем мы говорили выше.

Соотношение сумм строк var октетов 1 и 2 имеет вид 3 : 5  (666 : 1110 ), то есть двух смежных чисел ряда Фибоначчи, то есть, золотого сечения.

Наконец, все отмеченные суммации и соотношения выражены десятичными числами вида n111 , либо обладают способностью делиться без остатка на простое число 37  (половине сомножителя 74, упомянутого в первом пункте и равного нуклонной сумме константного блока аминокислоты), которое соответствует делению 111 : 3  и является наибольшим простым делителем числа 111 .

Первые три пункта представляют собой соотношения, а в природе – особенно в живой – встречаются удивительные соотношения. Автор, правда, никогда не слышал о природном соотношении, которое описывают первый пункт и теорема Пифагора. Тем не менее, если, например, «золотое сечение» и ряды Фибоначчи, реализуемые филотаксисом, различные фракталы, циклы, симметрии, спирали, ритмы и прочее – могут быть и природными соотношениями, то четвертый пункт из вышеперечисленных демонстрирует метку этих соотношений, выраженную весьма специфическим знаковым рядом. Этот ряд представляет собой совокупность гомогенных цифровых триплетов (гомотриплетов, как мы их здесь называем), которые базируются на десятичной системе счисления с поразрядным представлением числа. Ничего подобного в природе не встречается. Ни один физический закон не требует для своей формулировки (включая ее математическое выражение) поразрядного представления числа. Этого нет даже в одном из наиболее упорядоченных и поразительных формальных представлений природных объектов – в периодической системе элементов. Что до поразрядного представления числа, то оно было в свое время предложено с единственной целью – для упрощения арифметических расчетов. Но в случае генетического кода понятие вычислительной мощи (которую оптимизирует именно система счисления) может быть использовано только в том случае, когда к функциям генома – или кода – добавляется также необходимость каких-то вычислений. В противном случае перед нами просто знак, метка, клеймо, тавро, опечаток какой-то очевидно интеллектуальной деятельности – или что-то в этом роде. Стоит помнить при этом, что предлагаемое учебниками табличное представление генетического кода – в отличие от последовательностей генома – представляет собой именно интеллектуальную, а не реальную структуру.

Здесь стоит вернуться к Главе 111  и вспомнить, что мы – согласившись с автомобилистами – назвали число 111 «красивым» и «привлекающим внимание». Число 37 внешне привлекает пусть и меньшее внимание, однако, оно не менее «интересно» и уникально в том, что пермутация любого трехзначного числа, способного делиться на 37, дает в результате три числа, также обладающие подобным свойством: 259→592→925 или 185→851→518 и т. п. Между прочим, итерация «вглубь нуклонов» напоминает, что 37 этих элементарных частиц собраны из 111 кварков. Мы также отметили, что повторяемость подобных чисел придает им свойство, называемое у программистов информационной сигнатурой. Но о каких «информационных сигнатурах» может идти речь в том, что создано природой? Кого и о чем надо при этом «информировать», и кому пришло в голову заниматься передачей такой информации – да еще в те далекие годы, когда формировался генетический код? О каких предпочтительных в природе системах счисления можно вообще говорить? Ответ, который напрашивается первым, вызывает только одну реакцию: вздор! совпадения! нумерология! Да и можно ли назвать «повторяемостью» три случайных числа в двух октетных строчках? Так что давайте успокоимся и убедимся, что таких чисел нет больше ни в каких представлениях генетического кода, и они действительно случайны. Тем более, что Автор – человек эмоциональный и должен себя сдерживать. Ведь на него сильное – и описанное выше в связи со знаменитой лекцией – впечатление произвела каллиграмма Щербака уже в аналоговом формате, описанном в Главе А .

Несколько других представлений генетического кода основаны на гораздо более изощренной и не всегда очевидной логике и не будут представлены здесь, поскольку это может перегрузить ум Читателя, который – при желании – самостоятельно проанализирует их в публикациях Щербака. Одно из них (в самом общем виде) подразделяет триплеты с идентичными и уникальными основаниями на две группы в соответствии с преобразованием Румера, после чего в этих группах подсчитывается суммарная нуклонная масса боковых цепей – с одной стороны, и общая нуклонная сумма полных аминокислот – с другой. Таким же образом суммируются нуклоны боковых цепей и целых молекул аминокислот, кодируемых триплетами с двумя идентичными пуринами или пиримидинами. Результатом постоянно оказываются значения вида n111 .

Еще одно представление, которое предлагает Щербак для демонстрации n111 -символики генетического кода, подчеркивает «общий виртуальный баланс кода». В этом представлении все продукты кодирования классифицируются по наличию того или иного азотистого основания в кодирующих их триплетах. Всех оснований в коде 192 (48С, 48Т, 48А и 48G). Предлагается разделить эти продукты по наличию в их кодонах основания Т – с одной стороны, и трех других (С, А и G) – с другой. В этом случае возникает баланс между нуклонными массами боковых цепей и стандартных блоков аминокислот, который выражается как 222+999х10 = 222+999х10.

Рассмотрим подробнее еще одну таблицу кода60 61, основанную на совершенно иных принципах. Щербаком она приводится в виде кольца и иллюстрирует «общий естественный баланс универсального генетического кода». Мы, однако, представляем эту таблицу в виде линейной последовательности, поскольку «кольцевой пептид» – да еще такой длины в природе не встречается. Между тем, для нас важно выделить направление пептида, сохраняя и «конец», и «начало» внутри цепи. Константные части свободных аминокислот имеют массу 74, в то время, как в составе полипептида эта масса за счет поликонденсации снижается до 56. Вот почему мы представляем воображаемый минимальный полный пептид (МПП) генетического кода лишь как фрагмент некоего белка. Последовательность первых нуклеотидов является пермутацией упорядоченной по массе четверки (CTAG) – AGCT, сохраняющей исходную симметрию по комплементарности. Последовательность вторых нуклеотидов комплементарна (зеркально симметрична) последовательности первых: TCGA. Последовательность третьих нуклеотидов – пермутация последовательности вторых, но начинающаяся с пуринов (GATC) – в случае первых пуринов, и начинающаяся с пиримидинов (TCGA) – в случае первых пиримидинов. Именно такой порядок кодирующих МПП оснований соответствует реальному направлению кодирования – от стартового до терминирующего кодона:

В составе МПП пролин (выделен светло-серым) имеет реальные нуклонные массы своих частей – константной и вариабельной. Кроме того, в ней – как это имеет место в реальной клетке – полностью ионизированы аспарагиновая и глютаминовая кислоты и полностью протонированы аргинин и лизин. Что до гистидина, он в условиях клетки протонируется далеко не полностью, и его нуклонная масса остается в ней неизменной – 81.

Самой яркой чертой описываемого олигопептида является количественное равновесие нуклонных масс консервативных и вариабельных (боковых) частей составляющих его аминокислот: 3412 =3412 . Между прочим, это равновесие – с небольшими отклонениями – воспроизводится практически для всех природных белков. В то же время для случайного набора аминокислот масса боковых цепочек превышает массу «хребта» из константных частей примерно на 12%.

Может показаться, что эти числа, которыми выражаются общие и равные друг другу нуклонные массы боковых частей и стандартных блоков МПП (то есть результат оцифровки продуктов кодирования), ничем не примечательны. Во всяком случае, они не имеют вида n111 , который до сих пор привлекал наше внимание. Однако, номера нуклеотидов упорядоченных по нарастанию молекулярных масс C

Рациональная организация кодирующей последовательности может, таким образом, указывать на ведущую роль первых триплетных оснований в симметриях кода. Снова и снова указывает она и на базовую роль молекулярных масс в организации не только кодирующих правил, но также и кодируемого продукта. Кроме того, она показывает возможность оцифровки не только кодируемых (как у Щербака), но и кодирующих элементов – и не только в терминах нуклонных масс, но также используя простую нумерацию.

 

Форматы 2D и 3D

Удивительная организация генетического кода дает пищу великому множеству теоретиков и любителей для конструирования не только различного рода таблиц, но и объемных моделей. Большое количество разнообразных моделей кода можно отыскать в специальной и в не слишком специальной литературе. Автор не берется даже за краткий обзор результатов этой деятельности. Некоторые из них, на его вкус, как минимум, не интересны – например, попытка проводить параллели между организацией генетического кодирования и смысловым содержанием гексаграмм китайской Книги Перемен. В других он ничего не понимает – например, в топологической модели Владимира Карасева или в волновых моделях Петра Гаряева. В свое время Автор и сам оказался под некоторым впечатлением от трехмерной модели Трейнора и сотрудников – правда, потому только, что она представляла собой тетраэдр. Но модель строилась на основе кодирующих триплетов, а поскольку число их – 64 (не-тетраэдрическое), такой многогранник можно было построить только по определенным, не слишком логичным правилам. Гексаэдр (куб) годится для этой цели куда больше, поскольку 64=43, но он не так выразителен и опять-таки базируется на организации лишь одного из двух компонентов кода – азотистых оснований; кроме того, он уже практически использован в «обыкновенной» таблице генетического кода 4х4х4.

Некоторые модели остаются в тени или забыты совершенно незаслуженно. Например, объемная модель генетического кода Rafiki, Inc., выполненная в виде игрушки (см. рисунок и развертку), могла бы, как минимум, использоваться на уроках биологии и будила бы воображение молодых людей, подогревая их интерес к этой науке и определяя и их, и ее будущее.

Эта игрушка представляет собой додекаэдр, «кристалл», собранный из 120 тетраэдров (Автор не вдается здесь в детали еѐ построения, их можно найти на сайте http://www.codefun.com/Index.htm). Разумеется, ничего подобного в природе нет, зато модель Рафики хорошо иллюстрирует симметрии кодирования и даже некоторые аспекты укладки белковых молекул.

Между тем число продуктов кодирования (20) дает соблазн собрать именно тетраэдр; надо только сформулировать простой принцип сборки, желательно учитывающий и кодирующие основания, и кодируемые аминокислоты, помня об упомянутом выше ограничении Эйгена: теория может быть корректной или нет; модель имеет третью возможность – оставаясь корректной, совершенно не относиться к делу (a theory has only the alternative of being wrong; a model has a third possibility – it might be right but irrelevant). Зато у модели, как и сказано в Главе 69 , есть и очевидное достоинство: представляя явление в неожиданном ракурсе, она заставляет думать.

Здесь мы, однако, рассказываем не просто о геометрической симметрии генетического кода (о ней уже шла речь в Главе А ), но о моделях, симметрия которых базируется на оцифровке генетического кода, реализуемой по тому или иному принципу. Более того, этот подход привлекает нас, в первую очередь, тогда, когда такой оцифровке подвергаются оба компонента кода, а не только продукты кодирования. В конце предыдущей главы (Глава Б ) мы описали «виртуальный олигопептид», который демонстрировал равновесие совокупных нуклонных масс стандартных и вариабельных частей кодируемых продуктов. Мы обнаружили, что этот «олигопептид» имеет любопытные арифметические свойства в отношении составляющих его кодирующих оснований, которые, неожиданно подчеркивают акцентируемый Щербаком децимализм генетического кода. Параметр, выявляющий обнаруженные свойства, представляет собой простой номер каждого из четырех азотистых оснований в их упорядоченном по изменению молекулярной массы ряду. В данной главе мы попытаемся проанализировать организацию генетического кода, используя оба указанных параметра (нуклонные числа и порядковые номера) обоих компонентов кода. Если эта попытка окажется удачной, и мы найдем, что одна и та же организация кода (модель) характеризуется арифметическими симметриями по каждому из этих параметров, тогда легкомысленная готовность Автора сравнивать десятичное число 3412  и цифровой ряд 3412  по чисто внешнему сходству, может показаться Читателю не такой уж смешной.

Вернемся к матрице генетического кода, «аналоговая» версия которой описана в Главе А . Ее оцифровка в параметрах нуклонных масс («сжатая» версия – без пятой, @-строки) реализуется упорядоченными по массе последовательностями первых кодонных оснований (по вертикали) и соответствующих им продуктов (по горизонтали); слева – аминокислоты в «нейтральной» версии (0), справа – в заряженной (+/-). Под символом каждой аминокислоты – ее нуклонная масса (нуклонная масса боковой цепи ее молекулы).

Организующая матрицу последовательность первых триплетных букв – CTAG – демонстрирует не только симметрию по комплементарности С≡G, A=T (черточки между основаниями символизируют число водородных связей, которые их объединяют), но и совпадающую с ней количественную симметрию цифрового ряда 1234 : 1+4=2+3. Комплементарность оснований позволяет собрать и другой ряд – AGCT, в котором упорядоченность по массе комплементарных пар имеет общее направление. Этому ряду и соответствует цифровая последовательность 3412 , описанная в предыдущей главе.

Теперь, чтобы объединить в общем представлении и аминокислоты, и азотистые основания, надо описать те и другие в общих терминах. В нашем случае это – либо нуклонная масса вариабельных частей молекулы, либо простое перечисление элементов, упорядоченных по массе. Выбор вариабельной части молекул аминокислот очевиден – это их боковая цепь. Вариабельная часть молекулы азотистого основания не представляет собой столь ясно выделяемую структуру. В то же время стандартным блоком, общим для всех оснований, является вполне выраженная структура – гексацикл (шестичленное кольцо из четырех атомов углерода, 2—4—5—6, и двух – азота 1—3):

Мы подошли к выбору нуклонного параметра азотистого основания совершенно формально: все атомы вне упомянутого гексацикла и составляют нуклонное число этого основания. Таким образом, цитидину С соответствует (в полинуклеотидной цепи) нуклонная масса 34, тимину Т – 49, аденину А – 58, а гуанину G – 74. Если сопоставить комплементарные пары GC и АТ четверки нуклеотидов и их нуклонные массы, объединенные водородными связями (то есть общими для обоих членов пары протонами), получим равенство: 34+74—3 = 49+58—2 = 105  = 11 х111 4. Стоит отметить, что все эти рассуждения относятся только к ДНК, потому что урацил U, заменяющий в четверке оснований РНК тимидин Т, имеет нуклонную массу 35, нарушающую описанные равновесия. Смысл этого обстоятельства должен отражать различия в физико-химии РНК и ДНК: возможно, дело в том, что предпочтительная структура ДНК линейна, а ее двойная спираль, уравновешенная также в описанных терминах, стабилизирует предпочтительную (линейную) запись генетической информации. РНК – в отличие от ДНК может приобретать более разнообразную конформацию, включая такую, которая позволяет ей обладать некоторыми свойствами полипептида – например, энзиматическими. В отличие от описанного выше МПП, молекула которого обладает собственным равновесием – за счет равновесия константных и вариабельных частей аминокислот, молекула ДНК приобретает равновесие только за счет объединения в спираль двух комплементарных полимеров. Само же по себе молекулярное равновесие – это характерное свойство – если не естественных биополимеров самих по себе, – то, во всяком случае, организации их генетического кодирования.

Соответствующая (реципрокная, симметричная) операция с аминокислотами, которые уже охарактеризованы в терминах нуклонных масс, – это придание им порядковых номеров в последовательностях, упорядоченных по молекулярной массе. Мы используем два варианта такой нумерации: сплошное (прямое или обратное) перечисление аминокислот в «нейтральной» версии (а) и общее или раздельное их перечисление (также в обоих направлениях) в составе арс-классов – параллельное и антипараллельное (б). Другие варианты Читатель может рассчитать самостоятельно; мы только предупредим его, что результаты в принципе будут однотипными.

В таблице Б темно-серым выделены позиции маркирующих каждый класс аминокислот. В матрице они симметричны относительно центральной вертикальной колонки. Соответствующие пары аминокислот практически симметричны (равновесны) и по нуклонным массам (72+58 ≈ 130+1). Посмотрим, как матрица выглядит с точки зрения описанных параметров:

Общие нуклонные суммы симметричных пар столбцов 1-го и 3-го, 2-го и 4-го в матрице кода близки к равенству – или равны (176+320 = 118+378 = 496), если гистидин Н полностью протонирован (в версии «заряженной» матрицы), то есть имеет нуклонное число 82. Очень вероятно, что все это – не более, чем случайность, игра в цифры, – особенно если принимать во внимание, что 496 – единственное трехзначное (как и всякий кодон) совершенное число; выше мы уже отмечали это. Но продолжая эту игру, мы сталкиваемся с симметриями и соотношениями, которые озадачивают все больше. Зачем все это генетическому коду, «замороженной случайности», как назвал его Крик?

Приняв за случайность сам децимализм кода, на котором настаивает доктор Щербак, обнаруживаем, однако, что таблица кода в значениях нуклонных масс демонстрирует хорошо организованный набор информационных сигнатур 111  в системах счисления 5—9:

Ярко-зеленым в Таблице 11 отмечены ячейки тех аминокислот, нуклонная масса которых принимает значение 111 в той или иной системе счисления (номер системы счисления принято указывать справа и снизу от числа; номер десятичной системы не указывается). Бледно-зеленым отмечены ячейки тех аминокислот, нуклонная масса которых принимает значение 111 при определенных условиях: сложение нуклонных масс гистидина Н (81+) и триптофана W (+130) дает 211=111 14   (других таких смежных пар в матрице нет), нуклонная масса лизина становится 111 8  в зарядовой версии этой аминокислоты, а нуклонная масса глицина – это базовый нумерал (цифровой символ) для подобных чисел. Сумма всех закрашенных ячеек матрицы кода составляет 777 9 .

Если скептически настроенный Читатель готов счесть всѐ это случайностью, обратимся на время к порядковым параметрам кодируемых аминокислот. В их значениях симетрии матрицы генетического кода приобретают такой вид:

Все три таблицы практически одинаковы. В левой матрица состоит из двух блоков – PSTG\RWME и LQHF\NAVD, симметричных относительно центральной колонки (а также относительно границы между первыми кодонными пуринами и пиримидинами) и равновесных по суммам позиционных номеров (81=81), а также двух «внутренних» (неокрашенных) пар с соотношением сумм 1:2. В центральной эти два блока разделены на две симметричные части каждый (PGRE и LHAD; 37=37) и STWM и QFNV (44=44). В правой таблице попарно соединены «угловые» блоки PIDE и GAHR, симметричные по диагоналям – так что каждая четверка характеризуется суммой 37. В принципе все эти значения можно в какой-то мере, рассматривать, как указание на децимализм генетического кода, на который указывают числа 37 (37*3=111 ) и «гомодублеты» 44 и 88. Читатель, возможно, найдет в матрице кода и другие симметрии.

Мы же попытались связать симметрии двумерной матрицы с симметриями трехмерного (объемного) тела, геометрическая симметрия которого задавалась бы по определению: в нашем случае, как мы об этом сказали выше, это простейшее платоново тело, тетраэдр. Нам хотелось найти тетраэдр, в котором формальное равновесие (например, равенство кооперативных нуклонных масс граней) сочеталось бы с равновесием по какой-либо из четко определенных функций, например, по принадлежности к синтетазному классу. Принципиально такая возможность возникает, если принять 20 кодируемых аминокислот с их числовыми параметрами за 20 равновеликих сфер-мономеров. Двадцать мономеров тетраэдра делятся на две структурообразующие группы:

инвариантные мономеры (i ), т. е. мономеры вершин (v) и центров граней (c), взаимозамена которых сохраняет общую нуклонную массу граней, и

пара «внутренних» мономеров (e ) каждого ребра, не входящих в группу (i ).

Мы нашли, что весьма простое условие, а именно – зеркальная симметрия пар мономеров групп i  (v, c) и e относительно оси матрицы, разделяющей первые пурины и пиримидины, при равенстве сумм нуклонных масс v и c и при размещении этих пар во всех четырех столбцах, позволяет сконструировать единственный тетраэдр, который, однако, характеризуется не полной, но билатеральной симметрией (нуклонным равновесием пар) граней при минимальном «размахе» по их нуклонным массам. Числовые значения этого равновесия в десятичной и в пятеричной системах счисления выражаются так:

(626+629 = 627+628)10, или:

(10.001 +10.004 =10.002 +10.003 )5.

Пару i  инвариантных мономеров составляют два мономера v и c, кодируемые одной и той же первой буквой, а пару е составляют внутренние мономеры ребра, также кодируемые одной и той же первой буквой; в обоих случаях используются все четыре основания. Поскольку у тетраэдра шесть пар е , а строк в матрице четыре, то две из этих пар (перекрещивающиеся), хотя и следуют указанному принципу, симметричны лишь в общем, пурин-пиримидиновом, формате – при условии принадлежности S и R к группе вырожденности II: T-R (кодирующие дублеты A C -A G ) и S-E (кодирующие дублеты AG-GA или R G-R A). Поразительно, но этот простой принцип, иллюстрируемый приведенной ниже матрицей:

сводит число возможных версий трехмерной модели кода к единственной:

Правда, равновесную по граням модель можно также построить, заменив ребра QH и VD на QV и НD и сохранив, таким образом, симметричный рисунок реберных мономеров в составе матрицы, однако, эта версия потребует сделать формулировку принципа сборки тетраэдра более свободной, поскольку наш тетраэдр характеризуется также полной симметрией по граням аминокислот двух арс-классов:на каждую его грань приходится равное (по 5) число мономеров-аминокислот каждого класса.

Других столь же простых условий сборки тетраэдра с нуклонным равенством граней не существует. Также (естественно) не удается сформировать подобный тетраэдр, используя значения порядковых номеров этих мономеров в качестве их альтернативных параметров. Количественная симметрия имеет место только в отношении номеров инвариантных мономеров сплошной последовательности аминокислот (независимой от арс-класса): суммы номеров мономеров вершин полученного тетраэдра и центров его граней равны (и в случае нумерации по нарастанию нуклонной массы составляют замечательное – в контексте этой и предыдущей глав – десятичное число 37).

Инвариантные мономеры и сами по себе обладают целой серией собственных симметрий по первым, вторым и третьим основаниям своих кодонов, что является следствием их положения в составе матрицы кода. Читатель может самостоятельно организовать и проанализировать таблицы, необходимые для демонстрации этих симметрий.

В формате позиционных номеров аминокислот, принадлежащих к тому или другому арс-классу, отметим, что значения колоночных и построчных суммаций матрицы генетического кода имеют весьма замечательный вид: линейное нарастание сумм порядковых номеров центральных колонок, выраженное двух– или трехзначными инфрмационными символами, в комбинации со сдвиговой для трехзначных чисел (или зеркальной для двузначных) симметрией цифр в крайних колонках, а также в строках, соответствующих первым комплементарным основаниям кодонов:

Читателю предлагается обратить внимание на следующее:

цифровые гомодублеты, как носители информации о симметрии, имеют здесь не меньшее значение, чем гомотриплеты;

в тех случаях, когда значения линейно нарастающих сумм порядковых номеров центральных колонок в той или иной системе счисления не подчеркнуто гомодублетами 11—22—33 или гомотриплетами 111—222—333, цифровые симметрии сумм крайних колонок «комплементарны», так что сумма двух крайних колонок представляет собой следующий гомодублет (44) или гомотриплет (444);

в тех случаях, когда значения сумм колонок или строк имеют неодинаковое число разрядов в той или другой системе счисления, цифровые симметрии сумм крайних колонок невыразительны;

то обстоятельство, что таблица справа (где арс-классы представлены как самостоятельные группы, то есть члены каждой имеют собственную, а не последовательную, нумерацию) демонстрирует симметрии не только по колонкам, но и по строкам, свидетельствует об определенной независимости классов;

наконец, то обстоятельство, что обе таблицы демонстрируют не только числовые, но и цифровые симметрии, как будто поддерживает логику сравнения числового значения и цифрового порядка, которые – имея общее выражение – характеризуют описанный в предыдущей главе виртуальный олигопептид.

Паттерн этих матричных симметрий в значениях порядковых номеров аминокислот сходен с паттерном симметрий матрицы в значениях их нуклонных масс (см. выше):

…………………

И хватит, пожалуй. Автору не хочется больше надоедать Читателю похожими друг на друга таблицами и «интересными» числами. Пора подумать, что все они означают. Сумбур и брызги негромкого, но явственно различимого ритма Музыки Сфер? Сто лет назад Бернард Шоу (одно время музыкальный критик) – словно предчувствуя расцвет сегодняшней глянцевой «звездятины» – заметил, что музыка – это алкоголь осужденных грешников. Справедливо, конечно, если скорбеть животом в такт второй симфонии Бетховена (http://galicarnax.livejournal.com/25217.html). Но так ли уж нужны стигматы святой Терезе? Так ли они ей желанны?

Однако, ничего не знал Бернард Шоу о генетическом коде, а известный вопрос Уильяма Блейка, странным образом о нем (коде) напоминающем, не мог прийти поэту в голову иначе, как в ассоциации с бенгальским тигром:

What immortal hand or eye, Dare frame thy fearful symmetry?

А нам сегодня – мог, и ничего страшного (fearful) или рокового, судьбоносного (fateful) – достаточно чуть-чуть «буквализировать» великолепный перевод Самуила Маршака:

Кем задуман роковой Соразмерный образ твой?