Построение филогенетических деревьев

Четвертый семестр На главную
Филогенетические деревья Филогенетические деревья. Дополнительные задания.

Создание изображения по скобочной формкле

Скобочная формула моего дерева: ((А:85,В:85):15,(((Е:43,F:43):17,D:50):45,С:95):5);
Скобочное изображение:

Описание разбиения ветвей таблицей

Каждую ветвь можно представить как разбиение множества листьев, находящихся по одну и по другую сторону ветви.
Отдельные листья не выделяются в разбиение, т.к. такие разбиения есть в каждом дереве.
В данном случае дерево будем считать бескорневым.
Множество по одну сторону отмечаем "*", а по другую ".".
A B C D E F
. . * * * *
. . . * * *
. . . . * *

Получение мутантных последовательностей

Длина моего гена (V00277): 957 п.н.
Формула для пересчета расстояний: (L/100)*n, где L - заданная длина ветвей дерева, n - длина всей последовательности.
Скрипт для полученя мутантных последовательностей:
msbar V00277.fasta AB.fasta -point 4 -count 143 -auto
msbar V00277.fasta CDEF.fasta -point 4 -count 48 -auto
msbar AB.fasta A.fasta -point 4 -count 813 -auto
msbar AB.fasta B.fasta -point 4 -count 813 -auto
msbar CDEF.fasta C.fasta -point 4 -count 908 -auto
msbar CDEF.fasta DEF.fasta -point 4 -count 430 -auto
msbar DEF.fasta D.fasta -point 4 -count 478 -auto
msbar DEF.fasta EF.fasta -point 4 -count 163 -auto
msbar EF.fasta E.fasta -point 4 -count 411 -auto
msbar EF.fasta F.fasta -point 4 -count 411 -auto

Реконструкция дерева разными алгоритмами

  1. Алгоритм максимального правдаподобия:
    Дерево получено программой fdnaml
      +--------------------MutB      
      |  
      |                     +---------MutF      
      |                 +---4  
      |   +-------------3   +---------MutE      
      |   |             |  
      1---2             +---------MutD      
      |   |  
      |   +-----------------------MutC      
      |  
      +-------------------MutA      
    
    Скобочная формула: (MutB,(((MutF,MutE),MutD),MutC),MutA);

  2. Алгоритм Neighbor-joining:
    Для реконструкции этим методом была построена матрица попарных расстояний программой fdnadist.
    Затем использовалась команда fneighbor ali.fdnadist -auto
      +---------------------MutB      
      ! 
      !    +------------------------MutC      
      1----2 
      !    !             +---------MutD      
      !    +-------------3 
      !                  !   +---------MutE      
      !                  +---4 
      !                      +---------MutF      
      ! 
      +-------------------MutA      
    
    Скобочная формула: (MutB,(MutC,(MutD,(MutE,MutF))),MutA);

  3. Алгоритм UPGMA:
    Команда: fneighbor ali.fdnadist -treetype u -auto
                 +----------------------------------------MutA      
        +--------3 
      +-4        +----------------------------------------MutB      
      ! ! 
      ! +-------------------------------------------------MutC      
    --5 
      !                          +-----------------------MutD      
      +--------------------------2 
                                 !   +-------------------MutE      
                                 +---1 
                                     +-------------------MutF      
    
    Скобочная формула: (((MutA,MutB),MutC),(MutD,(MutE,MutF)));

Сравнение полученных деревьев

Для сравнения деревьев мы сравниваем разбиение их ветвей.
Плюсом отмечены разбиения, присутствующие в соответствующем дереве.
ветви исходное реконструкция реконструкция NJ реконструкция UPGMA
AB-CDEF + + + +
ABC-DEF + + + +
ABCD-EF + + + +

Вывод: алгоритмы правильно реконструировали дерево, т.к. все разбиения присутствуют в каждом дереве.
Алгоритм UPGMA построил укорененное дерево.

Алгоритм Bootstrap

Программа fseqboot создала 100 бутстреп-реплик по выравниванию мутированных последовательностей, соответствующих листьям моего дерева. Результаты программы fseqboot можно посмотреть здесь.
После пропускаия этих бутстреп-реплик через программу dnaml были получены 100 скобочных формул, соответствующие реконструкциям по данным выравниваниям.
Программа fconsense выдает результат бутстреп-анализа - неукорененное консенсусное дерево:
                +-------------MutD
         +-99.0-|
         |      |      +------MutF
         |      +-97.0-|
  +------|             +------MutE
  |      |
  |      |             +------MutB
  |      +--------94.0-|
  |                    +------MutA
  |
  +---------------------------MutC
Вывод: данное консенсусное дерево совпадает с исходным.

Данное неукорененное дерево было получено, визуализацией исходного дерева по скобочной формуле:


©Виктор Соколов