Научная литература
booksshare.net -> Добавить материал -> Биология -> Хедрик Ф. -> "Генетика популяций " -> 166

Генетика популяций - Хедрик Ф.

Хедрик Ф. Генетика популяций — Техносфера, 2003. — 592 c.
ISBN 5-94836-007-5
Скачать (прямая ссылка): genetikapopulyaciy2003.djvu
Предыдущая << 1 .. 160 161 162 163 164 165 < 166 > 167 168 169 170 171 172 .. 223 >> Следующая

Перед рассмотрением методов построения филогенетических деревьев, важно провести дифференциацию между генными деревьями и видовыми деревьями (Pamilo, Nei, 1988; Nei, Kumar, 2000). Генное дерево строится согласно данным о последовательности ДНК данного гена, суммированных из вариантов последовательности внутри вида и вариантов гомологичных последовательностей у разных видов. Видовое (популяционное) дерево представляет историю эволюции группы видов. В видовом дереве расщепление одного вида на два вида обозначает время происхождения видов. Когда генное дерево строится, исходя из гена, выбранного у различных видов, такое дерево может полностью не согласоваться с видовым деревом. Например, если гены полиморфны внутри дивергировавших видов, тогда время дивергенции в генном дереве может быть больше время дивергенции видов. К тому же, картина ветвления в генном дереве может отличаться от ветвления в видовом дереве.
Мы представим три разных метода конструирования филогенетических деревьев. Невзвешенный парно-групповой метод (НПГМ) первоначаль-
но предложили Сокал и Снит (Socal, Sneath, 1963). Он позволяет анализировать морфологические данные. НПГМ легок для понимания, но он предполагает постоянную скорость эволюции во времени для всех линий происхождения. Метод объединения соседей (ОС), разработанный Сейто и Неем (Saitou, Nei, 1987), основан на принципе минимальной эволюции. Оба эти метода называются методами матриц расстояний (дистанционных матриц) и зависят от измерения генетического расстояния между всеми парами изучаемых таксонов. Третий метод использует максимальную пар-симонию (экономию), (пример приведен на рисунке 1.8). Это способ построения деревьев с наименьшим количеством мутаций, необходимых для организации таксона. Другой метод, который мы не обсуждаем, но который широко используется - метод максимального правдоподобия (Felsenstein, 1981), когда правдоподобие наблюдения данной группы последовательностей максимизируется для каждой топологии дерева, и отбирается топология с высшим максимальным правдоподобием.
а. Невзвешенный парно-групповой метод (НПГМ)
НПГМ использует информацию о расстояниях (иногда называемую фе-нетикой), тогда как метод максимальной экономии использует состояния признака (иногда называемые кладистикой). В традиционной таксономии сторонники этих двух подходов часто вели яростные споры. Для молекулярных данных, в основе которых нежат различия нуклеотидного состава наиболее приемлемы подходы, использующие методологию состояний признака. Но поскольку некоторые нуклеотидные сайты неинформативны (см. ниже), они исключаются из состояний признака. Дистанционные подходы объединяют информацию о всех вариабельных сайтах (Saitou, Nei, 1986).
Для построения филогенетического дерева введем ряд операционных таксономических единиц (ОТЕ), обозначенных 1, 2, 3, ..., которые могут быть популяциями, видами или другими биологическими группами. Предположим, что генетическое расстояние между этими группами измерено с учетом аллельных частот, нуклеотидных замен, рестриктных карт геномных последовательностей и других данных, так что доступна матрица попарных генетических расстояний, где D - генетическое расстояние между группами i и j. Допустим, имеется четыре ОТЕ и генетические расстояния, приведенные в таблице 9.10а. Теперь можно организовать эти ОТЕ в виде биологического пути, который отразил бы биологические взаимосвязи на основе величин генетических расстояний.
Используя НПГМ, начнем с кластеризации двух групп, которые имеют наименьшее генетическое расстояние, объединяя их в одну новую ОТЕ. Затем вычислим новые оценки генетических расстояний между этой но-
вой единицей и другими оставшимися единицами, взяв среднее арифметическое их расстояний. Предположим, что существует четыре различных ОТЕ, и что популяции 1 и 2 имеют наименьшее генетическое расстояние из всех сравниваемых единиц. Эти две популяции можно объединить в новую единицу (12). Тогда генетические расстояния между этой единицей и единицами 3 и 4 равны:
D,
_ 1
(А,+Аз)
(9.10)
А
(12)4
= Т(А 4 +D2a)-
ТАБЛИЦА 9.10. Генетическое расстояние между всеми парами из четырех групп (а) и между тремя группами после кластеризации групп 1 и 2 (Ь)
(а)
2
3
4
Я,
?>,
°г
D„
(Ъ)
3
4
(12)
^(12)3
D.....
D,
Мы получили новую матрицу величин расстояний, использующую три оставшиеся ОТЕ, (12), 3 и 4; эта матрица представлена в таблице 9.10Ь. Предположим, что Д4 - наименьшее оставшееся генетическое расстояние, так что формируется второй кластер 3 и 4. Последнее действие в этом простом примере - вычисление среднего расстояния между двумя кластерами, которое равно
А'2)(34) = 4~(Аз + А4 + Аз =
= 2"(А(12)3 -^(12)4 )-
Полезно показать цифровые данные так, чтобы длины ветвей имели конкретные значения, и филогенетическое дерево можно было построить в масштабе. В таблице 9.11 представлены данные о последовательности мтДНК, полученные из работы Нея и Кумара (Nei, Kumar,2000, цитированы результаты из исследования Brown et al., 1982). Эти данные по пяти приматам, включая человека, были получены для определения взаимосвязей между видами. Величины расстояний основаны на пропорции различных сайтов в последовательности длиной 895 п.н. Эта последовательность была преобразована для измерения количества замен между
Предыдущая << 1 .. 160 161 162 163 164 165 < 166 > 167 168 169 170 171 172 .. 223 >> Следующая

Реклама

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed

Есть, чем поделиться? Отправьте
материал
нам
Авторские права © 2009 BooksShare.
Все права защищены.
Rambler's Top100

c1c0fc952cf0704ad12d6af2ad3bf47e03017fed