Бутстреп-анализ и визуализация деревьев в пакете PHYLIP
Бутстреп-анализ
Бутстреп-анализ выравнивания мутированных последовательностей, соответствующих листьям рассматриваемого дерева,
был проведен дважды с использованием двух разных способов создания реплик: Jackknife и Bootstrap.
Порядок действий в обоих случаях одинаков:
- Программе seqboot указывается выравнивание в формате PHYLIP, способ создания реплик и их количество.
- На основе результатов предыдущего пункта (реплик) строятся деревья с помощью программы dnaml (Transition/transvertion ratio: 1.0000).
- Полученные 100 деревьев анализируются программой consense, которая выдает конечные результаты бутстреп-анализа.
Реальное дерево и два консенсусных дерева, получившихся в результате анализа, совпадают по топологии.
Реальное дерево:
+--1111
+--4
+--3 +--1110
! !
+--2 +-----110
! !
+--1 +--------10
! !
! +-----------01
!
+--------------00
| Расстояния указаны в количествах нуклеотидных замен на 100 позиций
|
Консенсусное дерево (Bootstrap):
+---------------------------10 Кроме того рассматриваются следующие ветви:
|
| +-------------110 Порядок Ветвь Частота появления
| +-77.0-|
| | | +------1111 1. 1111 .**... 22.00
| | +-57.0-| 2. 110 ...*** 21.00
+------| +------1110 3. 1110 ..**** 21.00
| 4. 10 .**.** 1.00
| +------00 5. 01 .*..** 1.00
+-------100.0-| 6. 00
+------01
Консенсусное дерево (Jackknife):
+-------------10 Кроме того рассматриваются следующие ветви:
+-87.0-|
| | +------00 Порядок Ветвь Частота появления
+-59.0-| +100.0-|
| | +------01 1. 1111 ..**** 29.00
+------| | 2. 110 ..*.** 13.00
| | +--------------------110 3. 1110 .*.*.. 12.00
| | 4. 10
| +---------------------------1110 5. 01
| 6. 00
+----------------------------------1111
Из представленных данных видно следующее:
- Количество появлений ветви (рассматриваются только ветви консенсусного дерева) пропорционально расстоянию по реальному дереву. Это объясняется
просто: при бутстреп-анализе случайным образом "портится выравнивание". Чем больше расстояние, тем меньше вероятность потерять данные о расстоянии.
- В обоих вариантах анализа с достаточно большой частотой (21 и 29) появляется ветвь
..****
- она результат того, что истинное расстояние от
общего узла для 1111 и 1110 до общего узла с следующим листом (110)
весьма мало: 5. Очень велика вероятность потерять данные об этом расстоянии в "испорченном" выравнивании.
Визуализация деревьев в пакете PHYLIP
Мы визуализировали дерево, реконструированное методом Neighbor-Joining по нашей модели эволюции.
Оно было визуализированно в неукорененной форме (программа drawtree):
Кроме того мы его укоренили в среднюю точку (программа retree) и нарисовали его уже в виде филограммы (программа drawgram):
Восстановление последовательности, соответствующей узлу дерева
Мы восстановили последовательность (pre), соответствующую узлу 2 реального
дерева (см. выше) с помощью программы dnaml. Выравнивание ее с истинной (1) производилось с помощью программы
needle (все параметры по умолчанию).
Процент идентичности весьма мал: 71.2%. Видимо, это является результатом большого расстояния (105)
между последовательностями близжайшими к корню.
©
Решетов Денис, 2005