Деревья




Построение дерева по алгоритму UPGMA

Для выполнения этого задания я пользвался выравниванием файла benchmark.msf, посмотреть которое можно -->здесь<-- . Также мною была создана -->матрица попарных совпадений<-- В меню конфигурации программы GeneDoc (кнопки Reports>Configure reports) я оставил галочки против пунктов "Show calculations for Exact matches" и "Show results as percent values". Затем получил матрицу (Reports>Statistics Report). Была создана книга


-->upgma.xls<--

, где была построена матрица "наивных" эволюционных расстояний между последовательностями моего выравнивания По договоренности я считал эволюционным расстоянием (D) величину D = 100 – P, где P — процент идентичности. Матрица попарных совпадений есть также на листе, названном "DISTANCES". Рядом я создал матрицу попарных эволюционных расстояний (формулы видны). Далее я построил дерево. Я скопировал матрицу попарных эволюционных расстояний на новый лист, и назвал лист "UPGMA". Выделил минимальное расстояние в матрице ОРАНЖЕВЫМ цветом. Ниже написал "Шаг 1" и создал новую таблицу, в которой ближайшие последовательности объединены в один кластер, а расстояния от нового кластера до каждой из оставшихся последовательностей — вычислены как среднее расстояние до объединенных последовательностей. Отметил минимальное расстояние и повторял процедуру до конца.

Скобочная структура получилась такая:

((((DAPB2_RHIME:23.5,DAPB1_RHILO:23.5):16.75,DAPB_HELPY:40.25):1.75, G3P_PYRAB:42):2.25,DAPB_CLOTE:44.25);

Сравнение двух изображений дерева, построенных по алгоритму UPGMA.


Рис.1

Рис.2

В итоге я получил два графических файла с помощью программ drawtree и drawgraм. Изначально скобочная запись этих деревьев не отличаеся, однако на первом рисунке мы видим нечто, похожее на солнце, то есть не видно корня. Два ребра, соединяющиеся одним узлом примыкают к третьему ребру с помощью еще одного ребра и узла - всего узлов 3. Есть подписи На втором рисунке информация более структурирована. тут отчетливо видны узлы, ребра и подписи.Отличие состоит в том, что программа drawtree выдает нам своего рода рисунок - а программа drawgram выдает диаграммированную схему. По моему мнению по рисунку 1 легче представлять себе реальнуюю картину, а по второму рисунку легче проследить эволюцию.

Предположительный сценарий эволюции

В данном случае лучше вести описание "снизу". Так, согласно полученным данным, DAPB2_RHIME и DAPB1_RHILO имеют общего предка "A", а этот предок и DAPB_HELPY имеют общего предка "В", который в свою очередь имеет гипотетически общего предка с G3P_PYRAB, который имеет общего предка с DAPB_CLOTE. Однако, не думаю, что это дерево на самом деле укорененное. Скорее оно позволяет смотреть, насколько далеко располагаются последовательности. Не думаю, что во всех случаях это такое дерево реально отражает наличие общих предков и родственные связи белков.

Дерево, построенное по методу ближайших соседей


Программа выдала следующую скобочную структуру:

( ( ( DAPB1_RHILO:0.25520, DAPB2_RHIME:0.20749) :0.14718, DAPB_HELPY:0.40836) :0.05597, DAPB_CLOTE:0.43948, G3P_PYRAB:0.37534);


Рис.3

Рис.4

Есть незначительные отличия в сценариях эволюции. Так предок "В", G3P_PYKAB и DAPB_CLOTE отщепились одновременно. Второй метод показался мне быстрее, так как не пришлось самому делать матрицу расстояний.