Анализ деревьев, содержащих паралоги.
Особенности работы с нуклеотидными последовательностями

Построение дерева по нуклеотидным последовательностям

В банке EMBL я нашёл последовательности рРНК малых субъединиц (16S рРНК) отобранных бактерий. Для построения филогенетического дерева, эти последовательности были выровнены программой muscle, а полученное выравнивание последовательно обработано программами fdnadist (для расчёта расстояний) и fneighbor (собственно для создания дерева).
Правильное дерево - изображение.

Построенное дерево:

Данное дерево не совпадает с правильным. Как и в некоторых предыдущих деревьях, отличие от правильного вызвано неверным взаимным расположением организмов ECOLI, ERWCT и ENT38. По таким результатам можно сказать, что качество данной реконструкции сравнимо с реконструкциями по белкам, то есть и не лучше, и не хуже.

Построение и анализ дерева, содержащего паралоги

Файл proteo.fasta на диске P, в котором лежат записи банка UniProt, относящиеся к протеобактериям, я использовал в качестве базы данных поиска. С помощью программы blastall нашёл все гомологи белка FTSH_ECOLI в своих бактериях. После этого выровнял их с помощью muscle и программами fprotdist и fneighbor построил филогенетическое дерево этих белков.

Некоторые имена обрезаны. Обрезала их программа fprotdist. Видимо, она не может работать с длинными именами. Поэтому привожу список с полными именами:

  • FTSH_ECOLI
  • A4WEY9_ENT38
  • Q6D9B8_ERWCT
  • Q9HV48_PSEAE
  • A1IR46_NEIMA
  • Q1BXC9_BURCA
  • B2UGP9_RALPJ
  • B2UE66_RALPJ
  • B2UIS9_RALPJ
  • Q1BNJ2_BURCA
  • Q9I5R4_PSEAE
  • B2U6W7_RALPJ
  • HSLU_RALPJ
  • HSLU_ENT38
  • HSLU_PSEAE
  • HSLU_ECOLI
Сразу заметна клада из ортологичных белков: HSLU_RALPJ, HSLU_ENT38, HSLU_PSEAE, HSLU_ECOLI. В качестве примеров паралогов можно указать: B2UGP9_RALPJ и B2UE66_RALPJ; Q1BXC9_BURCA и Q1BNJ2_BURCA; Q9HV48_PSEAE и Q9I5R4_PSEAE.



© Айдарханов Руслан 2008