Построение филогенетических деревьев
Создание изображения по скобочной формкле
Скобочная формула моего дерева: ((А:85,В:85):15,(((Е:43,F:43):17,D:50):45,С:95):5);
Скобочное изображение:
Описание разбиения ветвей таблицей
Каждую ветвь можно представить как разбиение множества листьев, находящихся по одну и по другую сторону ветви.
Отдельные листья не выделяются в разбиение, т.к. такие разбиения есть в каждом дереве.
В данном случае дерево будем считать бескорневым.
Множество по одну сторону отмечаем "*", а по другую ".".
A |
B |
C |
D |
E |
F |
. |
. |
* |
* |
* |
* |
. |
. |
. |
* |
* |
* |
. |
. |
. |
. |
* |
* |
Получение мутантных последовательностей
Длина моего гена (V00277): 957 п.н.
Формула для пересчета расстояний: (L/100)*n, где L - заданная длина ветвей дерева, n - длина всей последовательности.
Скрипт для полученя мутантных последовательностей:
msbar V00277.fasta AB.fasta -point 4 -count 143 -auto
msbar V00277.fasta CDEF.fasta -point 4 -count 48 -auto
msbar AB.fasta A.fasta -point 4 -count 813 -auto
msbar AB.fasta B.fasta -point 4 -count 813 -auto
msbar CDEF.fasta C.fasta -point 4 -count 908 -auto
msbar CDEF.fasta DEF.fasta -point 4 -count 430 -auto
msbar DEF.fasta D.fasta -point 4 -count 478 -auto
msbar DEF.fasta EF.fasta -point 4 -count 163 -auto
msbar EF.fasta E.fasta -point 4 -count 411 -auto
msbar EF.fasta F.fasta -point 4 -count 411 -auto
Реконструкция дерева разными алгоритмами
- Алгоритм максимального правдаподобия:
Дерево получено программой fdnaml
+--------------------MutB
|
| +---------MutF
| +---4
| +-------------3 +---------MutE
| | |
1---2 +---------MutD
| |
| +-----------------------MutC
|
+-------------------MutA
Скобочная формула: (MutB,(((MutF,MutE),MutD),MutC),MutA);
- Алгоритм Neighbor-joining:
Для реконструкции этим методом была построена матрица попарных расстояний программой fdnadist.
Затем использовалась команда fneighbor ali.fdnadist -auto
+---------------------MutB
!
! +------------------------MutC
1----2
! ! +---------MutD
! +-------------3
! ! +---------MutE
! +---4
! +---------MutF
!
+-------------------MutA
Скобочная формула: (MutB,(MutC,(MutD,(MutE,MutF))),MutA);
- Алгоритм UPGMA:
Команда: fneighbor ali.fdnadist -treetype u -auto
+----------------------------------------MutA
+--------3
+-4 +----------------------------------------MutB
! !
! +-------------------------------------------------MutC
--5
! +-----------------------MutD
+--------------------------2
! +-------------------MutE
+---1
+-------------------MutF
Скобочная формула: (((MutA,MutB),MutC),(MutD,(MutE,MutF)));
Сравнение полученных деревьев
Для сравнения деревьев мы сравниваем разбиение их ветвей.
Плюсом отмечены разбиения, присутствующие в соответствующем дереве.
ветви |
исходное |
реконструкция |
реконструкция NJ |
реконструкция UPGMA |
AB-CDEF |
+ |
+ |
+ |
+ |
ABC-DEF |
+ |
+ |
+ |
+ |
ABCD-EF |
+ |
+ |
+ |
+ |
Вывод: алгоритмы правильно реконструировали дерево, т.к. все разбиения присутствуют в каждом дереве.
Алгоритм UPGMA построил укорененное дерево.
Алгоритм Bootstrap
Программа fseqboot создала 100 бутстреп-реплик
по выравниванию мутированных последовательностей, соответствующих листьям моего дерева.
Результаты программы fseqboot можно посмотреть здесь.
После пропускаия этих бутстреп-реплик через программу dnaml были получены 100 скобочных формул,
соответствующие реконструкциям по данным выравниваниям.
Программа fconsense выдает результат бутстреп-анализа -
неукорененное консенсусное дерево:
+-------------MutD
+-99.0-|
| | +------MutF
| +-97.0-|
+------| +------MutE
| |
| | +------MutB
| +--------94.0-|
| +------MutA
|
+---------------------------MutC
Вывод: данное консенсусное дерево совпадает с исходным.
Данное неукорененное дерево было получено, визуализацией исходного дерева по скобочной формуле:
©Виктор Соколов