Занятие 9. Анализ филогенетического дерева

Ваше задача — построить и исследовать филогенетическое дерево белков одного семейства.

  1. Составление выборки аминокислотных последовательностей
  2. С помощью SRS найдите в БД UniProt аминокислотные последовательности, нужные для заданной Вам выборки. .
    Поиск ведите по названию таксона и идентификатору семейства из БД Pfam.
    Профильтруйте результат поиска так, как это указано в задании.
    Аминокислотные последовательности сохраните в формате FASTA2Seq. (файл seq.txt)
    Сохраните результаты поиска в виде текстовых таблиц (опция UniprotView).
    Cоздайте текстовой файл с перечнем организмов выборки (taxon_names.txt). Для этого импортируйте текстовые таблицы в Excel (разделитель - знак табуляции) и скопируйте столбец с названиями организмов в текстовой файл.

    Советы.

    1. Посмотрите в одной из заданных Вам записей для внешней группы, в каком поле стоят идентификаторы Pfam.

    2. Имеет смысл сохранить данные для 3 частей выборки в отдельных файлах.
    3. Как отфильтровать первую часть выборки от фрагментов и вариантов из разных штаммов или подвидов одного вида?
      Используйте меню "Display options":
      Задайте такое число хитов на страницу, чтобы все поместилось на одной странице и просортируйте полученный список по названиям организмов.
      Затем просмотрите список и отметьте выбранные последовательности галочкой .
    4. При создании списка организмов следите, чтобы в конце названия не было точки.

  3. Построение филогенетического дерева
  4. Сохраните выборку последовательностей в формате FASTA в одном файле.Постройте множественное выравнивание последовательностей Вашей выборки с помощью любой программы, создающей выходной файл в формате Clustal (emma, ClustalX, muscle....)
    Реконструируйте филогенетическое дерево по алгоритму ближайших соседей (Neighbour-Joining) с помощью программы eneighbor.

    Для получения приемлемого изображения и редактирования дерева используте программу GeneMaster (GMaster.exe на диске С:/).

    Требования к изображению дерева.

    1. Все видно (подписи вершин не наползают друг на друга, шрифт не слишком мелкий и т.п.)
    2. Сделайте ветви, соответствующие внешней группе, потолще, а соответствующие подписи вершин выделите жирным шрифтом и подчеркните.
    3. Во втором варианте задания надо красным цветом выделить ветви и вершины, соответствующие архейным белкам.

    Где найти подсказки к программе GMaster?
    Запустите программу, в главном меню щелкните по кнопке <Help>, выберите в выпадающем меню <Index>=><Toolbar>, и в описании панели инструментов найдите описание кнопки <Draw Tree>.

    Совет. Не экспериментируйте с программой, не сохранив предыдущую удачную версию дерева (tree.gdt) в своей рабочей директории!!

  5. Построение таксономического дерева
  6. На странице веб-сайта NCBI описан наиболее популярный вариант таксономии живых организмов, Выберите в левом меню пункт "Taxonomy common tree". Задайте Ваш список (файл taxon_names.txt) с помощью кнопок <Browse> и <Add from file>. На экране должно появиться таксономическое дерево.
    Его можно сохранить или в текстовом формате (save as text tree) или в виде скобочной структуры формата phylip (save as phylip tree, не всегда получается) .

    *Скобочную структуру можно с помощью GeneMaster превратить в красивое изображение дерева. Для этого нужно немного подредактировать текст скобочной структуры, соединить названия рода и вида в одно слово с помощью "_" и убрать лишние символы одиночных кавычек. При импорте файла используйте опцию <Show Bootstrap>

  7. Анализ дерева
  8. Ваша задача - найти на дереве и описать в отчете не менее 3 пар наиболее вероятных ортологов и не менее 3-х пар наиболее вероятных паралогов.
    В отчете приведите обоснование своего выбора.
    Выделите на дереве каждую группу ортологов своим цветом.

     

Формат отчета