Задание 13. Реконструкция филогенетических деревьев

Исходные данные — файл ortho.msf, созданный вами при выполнении упражнения 2 задания 9 (он должен содержать выравнивание 10 ортологов вашего белка).

Нужные вам программы eprotdist и eneighbor представляют собой часть пакета EMBASSY и установлены на сервере kodomo-count.cmm.msu.ru

В отчёте приведите полученные матрицы, текстовые изображения деревьев и их скобочные формулы. Совет: в документах MS-Word используйте для этого шрифт Courier New размера 8 (для матриц) или 9 (для деревьев); в HTML-документах — тэг "<PRE>".

  1. Построение матрицы попарных расстояний

    Программой eprotdist постройте матрицу попарных расстояний ваших последовательностей. Выходной файл назовите ortho.dist; на вопрос о методе ответьте по умолчанию.

  2. Реконcтрукция неукоренённого дерева методом Neighbor-Joining

    Программой eneighbor реконструируйте филогенетическое дерево ваших последовательностей. В качестве входного файла ("Distance matrix") используйте ortho.dist. Выходные файлы рекомендуется назвать ortho.nj ("Output file") и ortho_nj.tre ("Tree file"). На остальные вопросы ответьте по умолчанию (нажатием "Enter").

  3. Реконcтрукция укоренённого ультраметрического дерева методом UPGMA

    Ещё раз запустите программу eneighbor с теми же входными данными, что в предыдущий раз, но на вопрос "Neighbor-joining" ответьте "N" (то есть "нет"; при таком ответе программа использует метод UPGMA). Вариант: запустите eneighbor с опцией –nonj. Выходные файлы можно назвать ortho.upgma и ortho_upgma.tre.

  4. Нахождение предположительного корня неукоренённого дерева

    Сравните полученные двумя методами деревья. Укажите в отчёте ветвь неукоренённого дерева, укоренение в которую дало бы дерево, максимально близкое к дереву, реконтруированному методом UPGMA (ветвь можно указать как "ветвь между узлами X и Y" — воспользуйтесь нумерацией узлов, приведённой на текстовом изображении дерева).

Дополнительные упражнения

  1. Сравнение топологий деревьев

    Укажите различия в топологии двух построенных деревьев.

    Указание. Чтобы сравнивать топологии, необходимо уметь устанавливать тождественность двух ветвей из двух разных деревьев с одинаковым множеством листьев. Для этого каждая ветвь интерпретируется как разделение множества листьев на два непересекающихся подмножества. Например, в дереве

    
               +-----HAEDU
          +----2  
          !    +------PASMU
       +--3  
       !  !             +--ECOLI
    +--4  +-------------1  
    !  !                +--SALTI
    !  !  
    !  +----------SHEON
    !  
    +--------------METAM
    
    ветвь, соединяющая узлы 3 и 4, разделяет листья на подмножества {SHEON,METAM} и {ECOLI,SALTI,HAEDU,PASMU}. В другом дереве, имеющем то же множество листьев, такая ветвь может присутствовать, а может и отсутствовать.

    Проанализируйте два ваших дерева и укажите те ветви в каждом из них, которые отсутствуют в другом.

  2. Графическая визуализация дерева по его скобочной формуле

    Воспользуйтесь сервисом drawtree из Online-версии пакета Phylip:
    http://bioweb.pasteur.fr/seqanal/interfaces/drawtree-simple.html
    Результат (картинка в Postscript-формате) появляется в виде файла plotfile.ps, который можно скопировать на свой компьютер, а затем либо открыть посредством GhostView, либо непосредственно вставить в Word-документ (Insert → Picture → From file).

    Для интересующихся: список всех программ Online-версии Phylip см. здесь.

  3. Реализация алгоритма UPGMA "вручную"

    Выберите из ваших последовательностей произвольные 5. Выделите из матрицы расстояний соответствующую подматрицу. Постройте (пользуясь калькулятором) дерево методом UPGMA, используя эту матрицу как исходный материал. Приведите в отчёте промежуточные матрицы расстояний и окончательное дерево. Совет: обозначайте кластеры (они же узлы дерева) последовательными цифрами.