На главную страницу На страницу четвёртого семестра |
||||||||||||||||||
Филогенетические деревья |
||||||||||||||||||
Занятие 1Отобранные бактерии
Скобочная формула дерева((FINM2,THETN),(((LACDA,LACAC),PEDPA),((BACSU,LISMO),STAES))); Изображение дереваВетви дереваДерево содержит пять нетривиальных ветвей:1) {FINM2, THETN} против {LACDA, LACAC, PEDPA, BACSU, LISMO, STAES} 2) {LACDA, LACAC} против {FINM2, THETN, PEDPA, BACSU, LISMO, STAES} 3) {LACDA, LACAC, PEDPA} против {FINM2, THETN, BACSU, LISMO, STAES} 4) {BACSU, LISMO} против {FINM2, THETN, PEDPA, LACDA, LACAC, STAES} 5) {BACSU, LISMO, STAES} против {FINM2, THETN, PEDPA, LACDA, LACAC} |
Мнемоника | Таксономическое положение |
FINM2 | Clostridia; Clostridiales; Clostridiales incertae sedis; Clostridiales Family XI. Incertae Sedis; Finegoldia |
THETN | Clostridia; Thermoanaerobacterales; Thermoanaerobacteraceae; Caldanaerobacter; Caldanaerobacter subterraneus |
LACDA | Bacilli; Lactobacillales; Lactobacillaceae; Lactobacillus |
LACAC | Bacilli; Lactobacillales; Lactobacillaceae; Lactobacillus |
PEDPA | Bacilli; Lactobacillales; Lactobacillaceae; Pediococcus |
BACSU | Bacilli; Bacillales; Bacillaceae; Bacillus; Bacillus subtilis group |
LISMO | Bacilli; Bacillales; Listeriaceae; Listeria |
STAES | Bacilli; Bacillales; Staphylococcaceae; Staphylococcus |
LACAC LACDA THETN FINM2 PEDPA LISMO BACSU STAES EFTS_LACAC 0.000000 0.386283 0.776085 0.781586 0.726206 0.800296 0.827198 0.722013 EFTS_LACDA 0.386283 0.000000 0.786725 0.809905 0.731823 0.771959 0.743900 0.747216 EFTS_THETN 0.776085 0.786725 0.000000 0.453178 0.736268 0.652888 0.669772 0.667910 EFTS_FINM2 0.781586 0.809905 0.453178 0.000000 0.681274 0.605825 0.626252 0.604511 EFTS_PEDPA 0.726206 0.731823 0.736268 0.681274 0.000000 0.565087 0.622639 0.551479 EFTS_LISMO 0.800296 0.771959 0.652888 0.605825 0.565087 0.000000 0.478520 0.494975 EFTS_BACSU 0.827198 0.743900 0.669772 0.626252 0.622639 0.478520 0.000000 0.429380 EFTS_STAES 0.722013 0.747216 0.667910 0.604511 0.551479 0.494975 0.429380 0.000000
Ультраметричность. Из трёх расстояний между тремя объектами два всегда равны между собой и не меньше третьего.
По условию ультраметричности должно выполняться d (A,B)<=max(d (A,C), d (B,C)), посмотрим насколько отклоняются от аксиомы расстояния в полученной матрице.
Аддитивность. Если есть четыре последовательности
A,B,C,D, то из трёх сумм
1) d(A,B) + d(C,D)
2) d(A,C) + d(B,D)
3) d(A,D) + d(B,C)
две равны между собой и больше третьей.
Дерево fprotpars не учитывает длины ветвей. Оно аналогично Neighbor-Joining.
В результате имеем следующее, деревья полученные с помощью алгоритмов, принимающих на вход матрицу расстояний(пр.fneighbor) и алгоритм, сравнивающий аминокислотные последовательности, с осуществлением метода максимальной экономии (fprotpars), сходны. И в данном случае имеют сходные расхождения с правильным деревом. см. задание 5.
Дерево, полученное методом максимальной экономии нельзя укоренить,так как fprotpars не дает
длины ветвей, необходимые для работы алгоритмов укоренения, не имеет смысла укоренять дерево
UPGMA, так как этот алгоритм уже выдает укорененное дерево.
Как видим, укоренение в среднюю точку произошло по ветви LACDA&LACAC против всех.
Мы получили дерево аналогичное, полученому по UPGMA, укоренение не
подтверждается исходным правильным деревом,в нём укоренение FINM2 и THETN против всех.
Существующие различия уже описывались ранее.
2. Использование внешней группы.
К последовательностям белков семейства EFTS наших бактерий была
добавлена последовательность того же семейства из ECOLI. Сначала
было построено неукоренённое дерево, с помощью программы fprotpars
, затем осуществлено укоренение, в качестве внешней группы использовалась
последовательность из ECOLI. На изображении внешняя группа удалена.
Укоренение в ветвь FINM2&THETN против всех, как в правильном дереве.
2. Бутстрэп.
Для бутстрэп анализа из исходного выравнивания белков сначало было
получено 100 бутстрэп-реплик
программой fseqboot, по ним было постоено сто деревьев (fprotpars).
Единое дерево по принципу "расширенного большинства" получено на выходе прграммы fconsense.
+-------------------------------EFTS PEDPA | | +-------EFTS LACAC | +--100.0-| | | +-------EFTS LACDA | +--42.5-| | | | +-------EFTS THETN | | +--100.0-| +-------| +-------EFTS FINM2 | | +---------------EFTS LISMO +--69.8-| | +-------EFTS BACSU +--72.0-| +-------EFTS STAESДерево такое же, какое было получено программой fprotpars на исходном выравнивании. Лучше оно может быть тем,что в данном представлении, мы видим ещё и вероятности ветвей.
В выходном файле есть ветви не получившие большинства. Обе ветви, которые есть в
правильном дереве, но отсутсвуют в полученном, имеют поддержку.(BACSU&LISMO против всех - 19.33 и LACDA&LACAC&PEDPA против всех - 33.00
)
bel_al.fconsense