Филогенетические деревья, продолжение


Оценка достоверности реконструированной топологии с помощью бутстреп-анализа

Для проведения бутстреп-анализа выравнивания мутированных последовательностей, соответствующих листьям моего дерева (см. упр. предыдущего занятия) были использованы следующие программы пакета EMBOSS:
  1. Cоздание 100 бутстреп-реплик выравнивания: fseqboot fdnaml.fasta -auto
  2. Построение деревьев, соответствующих полученным выравниваниям, с помощью алгоритма максимального правдоподобия: fdnaml fdnaml.fseqboot -ttratio 1 -auto
  3. Получение результатов бутстреп-анализа (файл fdnaml.fconsense)- построение консенсусного дерева с помощью программы fconsense:

                       +------F
                +100.0-|
         +100.0-|      +------E
         |      |
  +------|      +-------------D
  |      |
  |      |             +------A
  |      +-------100.0-|
  |                    +------B
  |
  +---------------------------C
   
Бутстреп-значения:

   Set (species in order)     How many times out of 100.00
   .***..                     100.00
   ....**                     100.00
   .**...                     100.00
   
Полученное дерево полностью топологически совпадает с исходным, но является бескорневым. Таким образом, воспользовавшись одним из методов "контроля" в филогенетике - методом бутстреп-анализа, мы получили практически 100% подтверждение достоверности и разумности построенного дерева. Такие высокие бутстреп-значения получились потому, что исследованию подверглись искуственно созданные мутантные последовательности одного и того же гена. Данный метод основан на случайной замене колонок выравнивания поледовательностей (в данном опыте замена была проведена 100 раз), и в итоге получается выравнивание той же длины, но со случайным расположением колонок. Одна и та же колонка может встретиться как несколько раз, так и ни одного раза в полученном выравнивании.
Консенсусное дерево включает в себя внутренние ветви, встречающиеся во всех 100 филогенетических деревьях, построенных по 100 созданным с помощью бутстреп-метода выравниваниям.

Изображение филогенетического дерева в графическом формате с помощью программы fdrawtree

Дерево, построенное по данной скобочной формуле исходного дерева, не отличается от деревьев, построенных во всех предыдущих заданиях по расположению ветвей и листьев, но при этом является бескорневым. Таким образом программа не очень удобна потому, что строит бескорневые деревья.

Дополнительные упражнения

Оценка достоверности полученной топологии с помощью метода jackknife

Консенсусное дерево, построенное с помощью аналогичного алгоритма для бутстреп-анализа, но с добавлением опции "-test j" программы fseqboot:

                +-------------D
         +100.0-|
         |      |      +------F
         |      +100.0-|
  +------|             +------E
  |      |
  |      |             +------A
  |      +-------100.0-|
  |                    +------B
  |
  +---------------------------C
    
Данный метод "контроля" называется jackknife. Принцип его работы состоит в том, что каждое выравнивание делится пополам, выбирается случайным образом половина колонок, но без повторений, а далее проверяется, воспроизводится дерево или нет. Топологически полученное этим методом консенсусное дерево не отличается от дерева, построенного бутсреп-методом. Единственное отличие состоит в положении внутренней ветви, разделяющейся на внешние ветви с листьями D и E, F (внутренняя ветвь разветвляется ближе к ветви с листом D). Но это отличие вероятно не имеет принципиального значения, поскольку полученный файл fdnaml_j.fconsense в остальном абсолютно идентичен аналогичному для бустреп-анализа.

Укоренение дерева в среднюю точку с помощью программы fretree

На вход указанной программе был подан fdnaml_n.treefile, содержащий скобочную формулу дерева, реконструированного с помощью алгоритма Neighbor-joining. Чтобы укоренить дерево в среднюю точку (найти "центр тяжести" дерева), нужно выполнить следующую последовательность действий:
  1. Команда fretree 6 fdnaml_n.treefile.
  2. Однобуквенная команда "M" - Midpoint root the tree, устанавливает среднюю точку.
  3. Однобуквенная команда "W" - Write tree to a file.
  4. Однобуквенная команда "R" - после предложения укоренить дерево: "Enter R if the tree is to be rooted, OR enter U if the tree is to be unrooted:".
Скобочная формула дерева записана в файл fretree.treefile. В итоге получилось следующее дерево:

                                   ,----------------------------------------4:E
  ,-------------------------------10
  !                                `----------------------------------5:F
  !
-11                                          ,-------------------------6:A
  !                        ,-----------------7
  !  ,---------------------8                 `-------------------------1:B
  !  !                     !
  `--9                     `------------------------------------------------2:C
     !
     `---------------------------------------------3:D
 
Дерево изображено в виде прямоугольной филограммы: длины ветвей пропорциональны эволюционным расстояниям (одна из особенностей алгоритма Neighbor-joining).
Вернуться на страничку четвертого семестра

© Головкина Мария Сергеевна