алфавит ДНК является четырехбуквенным алфавитом. Наиболее успешно ДНК составляет трехбуквенные слова из словаря, ограниченного 64 словами, и каждое слово названо «кодоном». Некоторые из кодонов в словаре синонимичны с другими, поэтому можно сказать, что генетический код является технически «вырожденным» (
Словарь преобразовывает 64 кодовых слова в 21 значение – 20 биологических аминокислот, плюс один универсальный знак препинания. Человеческие языки многочисленны и изменчивы, и их словари содержат десятки тысяч различных слов, но словарь ДНК с 64 словами универсален и неизменен (с очень незначительными вариациями в некоторых редких случаях). Эти 20 аминокислот связаны в последовательности, обычно по нескольку сотен, каждая упорядочивает определенную молекулу белка. Принимая во внимание, что число букв ограничено четырьмя, а число кодонов 64, нет никакого теоретического предела числу белков, которые могут быть записаны различными последовательностями кодонов. Их невозможно подсчитать. «Предложение» из кодонов, определяющих одну молекулу белка, является опознаваемой единицей, часто называемой геном. Гены не отделены от своих соседей (других генов или повторяющейся бессмыслицы) никакими разделителями, не говоря уже о том, что можно прочитать в их последовательности. В этом отношении они напоминают ТЕЛЕГРАММЫ ЗПТ КОТОРЫЕ НЕ ИМЕЮТ ЗНАКОВ ПРЕПИНАНИЯ ИСПОЛЬЗУЮТ ВМЕСТО НИХ СЛОВА ЗПТ ХОТЯ ДАЖЕ ТЕЛЕГРАММЫ ИМЕЮТ ПУСТОЕ МЕСТО МЕЖДУ СЛОВАМИ ЗПТ КОТОРЫХ ДНК НЕТ ТЧК.
ДНК отличается от письменного языка тем, что острова смысла отделены в ней морем бессмыслицы, никогда не транскрибируемой. «Целые» гены собираются в течение транскрибирования из значащих «экзонов», отделенных бессмысленными «интронами», тексты которых просто пропускаются считывающим устройством. И даже значащие отрезки ДНК во многих случаях остаются никогда не прочитанными – по- видимому, они являются упраздненными копиями некогда полезных генов, которые существуют поблизости, как ранние черновики глав на загроможденном жестком диске. Действительно, образ генома как старого жесткого диска, ужасно нуждающегося в генеральной чистке, будет время от времени служить нам в этой книге.
Следует еще раз отметить, что молекулы ДНК давно умерших животных не сохраняются. Информация в ДНК может сохраняться вечно, но только посредством частого копирования. Сюжет «Парка юрского периода», хотя и не глупый, расходится с практическими фактами. Очевидно, в течение короткого времени после бальзамирования в янтаре кровососущее насекомое, возможно, содержало инструкции, необходимые для реконструкции динозавра. Но, к сожалению, после смерти организма ДНК в его теле и в крови, которую он высосал, не сохраняется неповрежденной дольше, чем несколько лет, и всего лишь несколько дней в случае некоторых мягких тканей. Фоссилизация также не сохраняет ДНК.
Даже глубокое замораживание не сохраняет ее очень надолго. Когда я это пишу, ученые выкапывают замороженного мамонта из сибирской вечной мерзлоты в надежде на извлечение достаточного количества ДНК, чтобы вырастить нового мамонта, клонированного в матке современного слона. Я боюсь, что это – тщетная надежда, хотя мамонт всего лишь несколько тысяч лет как мертв. Среди самых старых трупов, из которых была извлечена удобочитаемая ДНК, Неандертальский человек. Вообразите шумиху, если кому-то удалось бы его клонировать. Но, увы, только отдельные фрагменты его 30 000-летней ДНК могут быть восстановлены. Для растений в вечной мерзлоте рекордом является приблизительно 400 000 лет.
Важная особенность ДНК состоит в том, что, пока цепь воспроизводства жизни не прервана, ее закодированная информация копируется в новой молекуле прежде, чем старая молекула будет разрушена. В этом смысле информация ДНК намного переживает свои молекулы. Она возобновима – скопирована, и, поскольку копирование буквально безупречно для большинства ее букв, она теоретически может сохраняться неопределенно долгое время. Большое количество предковой информации ДНК выжило в совершенно неизменном виде, некоторая даже в течение сотен миллионов лет, сохранившись в последовательных поколениях живых тел.
Таким образом, понятно, что летопись ДНК – невероятно богатый подарок историку. Какой историк мог бы осмелиться надеяться на мир, в котором все отдельные особи каждого вида несут в своем теле длинный и детальный текст, письменный документ, передаваемый сквозь время? Кроме того, в нем происходят незначительные случайные изменения, которые бывают достаточно редко, чтобы не испортить запись, но все же достаточно часто, чтобы создать явственные метки. Он еще лучше. Текст не просто произволен. В книге «Расплетая радугу» я высказал дарвинистское соображение, рассматривая ДНК животного как «генетическую Книгу Мертвых»: письменный след предшествующих миров. Из факта дарвиновской эволюции следует, что любое животное или растение, его физическая форма, его наследственное поведение и химия его клеток является закодированным сообщением о мирах, в которых выжили его предки: о той пище, которую они искали; хищниках, от которых они убегали; климате, который они испытывали; партнерах, которых они обманывали. Сообщение, в конечном счете, записано в ДНК, прошедшей через сито естественного отбора. Когда мы научимся читать его должным образом, ДНК дельфина сможет однажды подтвердить то, что мы уже знаем из его анатомии и физиологии: что его предки когда-то жили на суше. Тремястами миллионами лет ранее предки всех сухопутных позвоночных животных, включая сухопутных предков дельфинов, вышли из моря, где они обитали с момента зарождения жизни. Несомненно, в ДНК есть запись этого факта, который мы могли бы прочитать. Все в современном животном, особенно его ДНК, а также его конечности и сердце, его мозг и его цикл размножения может быть расценено как архив, хроника его прошлого, даже если эта хроника – палимпсест, неоднократно записанный на месте стертого текста.
Хроника ДНК может быть подарком историку, но она сложна для чтения и требует интерпретации, основанной на глубоком владении информацией. Она срабатывает более надежно в сочетании с нашим третьим методом исторической реконструкции, триангуляцией. Именно к ней мы теперь возвращаемся, и снова мы начинаем с аналогов в истории человечества, на этот раз с истории языков.
Триангуляция
Лингвисты часто желают проследить историю языков. Там, где сохранились письменные свидетельства, это довольно легко. Историк-лингвист может использовать второй из наших двух методов реконструкции, прослеживая прошлое восстановленных реликтов, в данном случае слов. Современный английский язык берет начало тот древнеанглийского языка, через среднеанглийский, используя непрерывную литературную традицию произведений Шекспира, Чосера и Беовульфа. Но речь, очевидно, возникла прежде, чем была изобретена письменность, во всяком случае, у многих языков нет никакой письменной формы. В изучении ранней истории мертвых языков лингвисты обращаются к версии того, что я называю триангуляцией. Они сравнивают новые языки и группируют их иерархически в семьи в пределах семей. Романские, германские, славянские, кельтские и другие европейские языковые семьи в свою очередь сгруппированы с некоторыми индийскими языковыми семьями в индоевропейский язык. Лингвисты полагают, что «праиндоевропейский» был настоящим языком, на котором говорило конкретное племя приблизительно 6 000 лет назад. Они даже стремятся восстанавливать многие из его деталей, экстраполируя назад различные особенности его потомков. Другие языковые семьи в других частях мира, аналогично ряду индоевропейских языков, были прослежены в прошлое таким же образом, например алтайский, дравидский и урало-юкагирский. Некоторые оптимистичные (и вызывающие полемику) лингвисты полагают, что они могут вернуться еще дальше, объединяя такие главные семьи в еще более всеобъемлющее семейство семей. Таким образом, они убедили себя, что могут восстановить элементы гипотетического языка, который они называют ностратическим, и на котором, как они верят, говорили