Построение дерева по нуклеотидным последовательностям
В банке EMBL я нашёл последовательности рРНК малых субъединиц (16S рРНК) отобранных бактерий.
Для построения филогенетического дерева, эти последовательности были выровнены программой
muscle, а полученное выравнивание последовательно обработано программами fdnadist
(для расчёта расстояний) и fneighbor (собственно для создания дерева).
Правильное дерево - изображение.
Построенное дерево:
Данное дерево не совпадает с правильным. Как и в некоторых предыдущих деревьях, отличие от правильного вызвано неверным взаимным расположением организмов ECOLI, ERWCT и ENT38. По таким результатам можно сказать, что качество данной реконструкции сравнимо с реконструкциями по белкам, то есть и не лучше, и не хуже.
Построение и анализ дерева, содержащего паралоги
Файл proteo.fasta на диске P, в котором лежат записи банка UniProt, относящиеся к протеобактериям, я использовал в качестве базы данных поиска. С помощью программы blastall нашёл все гомологи белка FTSH_ECOLI в своих бактериях. После этого выровнял их с помощью muscle и программами fprotdist и fneighbor построил филогенетическое дерево этих белков.
Некоторые имена обрезаны. Обрезала их программа fprotdist. Видимо, она не может работать с длинными именами. Поэтому привожу список с полными именами:
- FTSH_ECOLI
- A4WEY9_ENT38
- Q6D9B8_ERWCT
- Q9HV48_PSEAE
- A1IR46_NEIMA
- Q1BXC9_BURCA
- B2UGP9_RALPJ
- B2UE66_RALPJ
- B2UIS9_RALPJ
- Q1BNJ2_BURCA
- Q9I5R4_PSEAE
- B2U6W7_RALPJ
- HSLU_RALPJ
- HSLU_ENT38
- HSLU_PSEAE
- HSLU_ECOLI