((((А:50,В:50):30,С:80):20, D:99):8, (Е:95,F:95):15);
A B C D E F * * . . . . * * * . . . * * * * . . + * . . . . . . * . . . . . . * . . . . . . * . . . . . . * . . . . . . *
Поскольку ветвь, отделяющая один (любой!) лист от всех остальных, есть в любом дереве, описание таких ветвей не несёт полезной информации. Поэтому такие ветви написаны через знак + и на самом деле не обязательны для отображения.
>U35817 U35817.1 Escherichia coli thiol:disulfide interchange protein DsbA mutant PH31/32PP (dsbA) gene, complete cds. atgaaaaagatttggctggcgctggctggtttagttttagcgtttagcgcatcggcggcg cagtatgaagatggtaaacagtacactaccctggaaaaaccggtagctggcgcgccgcaa gtgctggagtttttctctttcttctgcccgccctgttatcagtttgaagaagttctgcat atttctgataatgtgaagaaaaaactgccggaaggcgtgaagatgactaaataccacgtc aacttcatgggtggtgacctgggcaaagatctgactcaggcatgggctgtggcgatggcg ctgggcgtggaagacaaagtgactgttccgctgtttgaaggcgtacagaaaacccagacc attcgttctgcttctgatatccgcgatgtatttatcaacgcaggtattaaaggtgaagag tacgacgcggcgtggaacagcttcgtggtgaaatctctggtcgctcagcaggaaaaagct gcagctgacgtgcaattgcgtggcgttccggcgatgtttgttaacggtaaatatcagctg aatccgcagggtatggataccagcaatatggatgtttttgttcagcagtatgctgataca gtgaaatatctgtccgagaaaaaataaЕго длина - 627 нуклеотидов.
Формула для пересчёта расстояний в число мутаций в моём гене:
(число замен * длину гена)/100
Мутанты гена dsbA были получены с помощью следующего скрипта:
msbar gene.fasta ABCD.fasta -point 4 -count 50 -auto msbar gene.fasta EF.fasta -point 4 -count 94 -auto msbar ABCD.fasta ABC.fasta -point 4 -count 125 -auto msbar ABCD.fasta D.fasta -point 4 -count 621 -auto msbar ABC.fasta C.fasta -point 4 -count 502 -auto msbar ABC.fasta AB.fasta -point 4 -count 188 -auto msbar AB.fasta A.fasta -point 4 -count 314 -auto msbar AB.fasta B.fasta -point 4 -count 314 -auto msbar EF.fasta E.fasta -point 4 -count 596 -auto msbar EF.fasta F.fasta -point 4 -count 596 -auto cat A.fasta >> mutanty.fasta cat B.fasta >> mutanty.fasta cat C.fasta >> mutanty.fasta cat D.fasta >> mutanty.fasta cat E.fasta >> mutanty.fasta cat F.fasta >> mutanty.fasta
fdnaml mutanty.fasta -ttratio 1 -auto
+---------B | | +--------------------F | +-------4 | +-----3 +---------------------E | | | 1-------2 +-------------------------D | | | +------------------C | +------------A
Чтобы реконструировать дерево алгоритмами UPGMA или Neighbor-joining, сначала посчитала попарные расстояния между последовательностями программой fdnadist:
fdnadist mutanty.fasta -ttratio 1 -auto
Чтобы реконструировать дерево алгоритмом Neighbor-joining, запустила программу fneighbor:
fneighbor mutanty.fdnadist -auto
+--------B ! ! +-----------------C 2-------3 ! ! +-------------------------D ! +------4 ! ! +----------------------E ! +---------1 ! +-------------------F ! +-------------A
fneighbor mutanty.fdnadist -treetype u -auto
+----------------------A +--------------1 +-------------2 +----------------------B ! ! +---4 +-------------------------------------C ! ! --5 +---------------------------------------------------D ! ! +------------------------------------------E +------------3 +------------------------------------------F
Надо заметить, что только алгоритм UPGMA из нами рассмотренных отображает возможный корень дерева.
Топология всех трёх деревьев одинакова и совпадает с топологией исходного древа.
Ветвь | Исходное дерево модели |
Максимальное правдоподобие | Neighbor-joining | UPGMA |
ABCDEF | ||||
**.... | + | + | + | + |
***... | + | + | + | + |
....** | + | + | + | + |
fseqboot mutanty.fasta -auto
Далее я подала полученные 100 выравниваний на вход программе fdnaml. В выходном файле (.treefile) оказалось 100 скобочных формул, соответствующих реконструкциям, сделанным по каждому из выравниваний. Затем я запустила программу fconsense. В выходной файл были помещены результаты бутстреп-анализа.
Консенсусное дерево:
+------E +-94.0-| +-84.0-| +------F | | +------| +-------------D | | | | +------A | +--------95.0-| | +------B | +---------------------------C
Консенсусное дерево совпало по топологии с реальным деревом.
Бутстреп-значения внутренних ветвей консенсусного и реального деревьев:
1. C 2. D 3. F 4. E 5. B 6. A ....** 95.00 ..**.. 94.00 .***.. 84.00Это значит, что ветвь АВ была найлена в 95 деревьях их 100, ветвь EF - в 94 и ветвь DEF - в 84.