Логика случая - страница 17
и глобины, оказались чрезвычайно консервативными даже у дальнородственных животных (Zuckerkandl and Pauling, 1965). Цукеркандль и Полинг также предложили концепцию молекулярных часов: они предсказали, что скорость эволюции определенной последовательности белка будет неизменна (с учетом возможных флуктуаций) в течение длительных временных интервалов в отсутствие функциональных изменений. Здесь необходимо отметить, что то, что последовательности генов, кодирующих «один и тот же белок» (то есть белки с одинаковым действием и сходными свойствами), в различных организмах оказались очень сходными – и, более того, степень схожести этих последовательностей отрицательно коррелировала с филогенетическим расстоянием между данными организмами, – можно рассматривать как наилучшее и исчерпывающее доказательство реальности эволюции.
В течение последующих нескольких лет, в основном благодаря работам Маргарет Дэйхофф и ее коллег, консервативность кодирующих белки последовательностей была продемонстрирована на примерах самых различных форм жизни, от бактерий до млекопитающих (Dayhoff et al., 1983). Учитывая открытие консервативности белок-кодирующих последовательностей и гипотезу молекулярных часов, оказалось естественным перейти к конструированию филогенетических деревьев на основе (не)похожести этих последовательностей, что должно было показать примерное время возникновения расхождений в последовательностях генов (белков) от общего предка. И в самом деле, скоро были изобретены несколько методов измерения расстояний в молекулярной филогенетике, а также введен принцип наибольшей экономии (см. табл. 2–1). Последующее тестирование гипотезы молекулярных часов на все растущей базе последовательностей ДНК показало, что для большинства генов эти часы идут не с одинаковой скоростью; напротив, эти данные оказались значительно диспергированы, то есть отклонения в скорости эволюции значительно превышали среднее отклонение, которое могло быть предсказано распределением Пуассона (Bromham and Penny, 2003). Такая избыточная дисперсия молекулярных часов приводит к особенности молекулярного филогенеза, известной как притяжения длинных ветвей (ПДВ), существенно искажающей результаты молекулярного филогенетического анализа (см. табл. 2–1). Молекулярная филогенетика, таким образом, превратилась в сложную ветвь прикладной математики и статистики в основном для того, чтобы справляться с эффектами ПДВ и им подобными (Felsenstein, 2004). Но, несмотря на все артефакты, молекулярная филогенетика остается краеугольным камнем современной эволюционной биологии и использует в первую очередь методы наибольшего правдоподобия (см. табл. 2–1).
Таблица 2–1. Краткое описание филогенетических методов
Методы, основанные на секвенировании
Требуют многократного сравнения гомологичных нуклеотидов или белковых последовательностей.
Дистанционно-матричные методы
Все эти методы используют матрицы межвидовых расстояний <d>ij> (i, j соответствуют видам), рассчитанные на основе сравнений последовательностей с корректировкой на множественные замещения. Ультраметрические методы (простая иерархическая кластеризация). Достоверны только для стабильных молекулярных часов. В принципе не считаются приемлемыми филогенетическими методами, но могут быть использованы для целей классификации или генерации предварительных филогенетических деревьев.
Метод объединения ближайших соседей (neighbor-joining). Более сложный метод восходящей кластеризации, основанный на минимальном эволюционном критерии (кратчайшая суммарная длина ветвей дерева). Чувствителен к ПДВ и гораздо менее точен, чем метод наибольшего правдоподобия, однако высокоэффективен для вычислений и быстр. Не используется для исчерпывающего филогенетического анализа, но для анализа большого количества последовательностей может быть единственным практически применимым методом.
Метод наименьших квадратов, метод Фитча. Метод измерения расстояний, основанный на минимизации разностей между расстояниями на филогенетическом дереве и в соответствующей матрице расстояний. По точности и эффективности примерно равен