Четвёртый семестр

Исследование филогенетического дерева глобинов (PF00042) из Caudata и Xenopus

1. Составление выборки аминокислотных последовательностей

Выборка состоит из 3-х частей: Первая часть выборки отфильтрована: не брались фрагменты (менее 90 а.о.) и из двух подвидов выбирался один, в котором больше белков семейства. Аминокислотные последовательности, полученные с помощью SRS, сохранены в формате FASTA2Seq. Создан файл с перечнем организмов выборки.

2. Построение филогенетического дерева

Построено множественное выравнивание последовательностей выборки с помощью программы emma. После этого программой eprotdist с параметрами по умолчанию по множественному выравниванию была создана квадратная матрица попарных расстояний между белковыми последовательностями. Наконец, при помощи программы eneighbor с параметрами, взятыми по умолчанию, по имеющейся матрице попарных расстояний были созданы скобочная формула дерева и его графическое изображение в виде филограммы (алгоритм Neighbour-Joining). Для редактирования дерева использована программа GeneMaster. Подписи вершин, соответствующие внешней группе, выделены жирным шрифтом и подчеркнуты.
Графический файл с изображением филогенетического дерева.

3. Построение таксономического дерева

На странице NCBI описан вариант таксономии живых организмов. Полученное таксономическое дерево сохранено в виде скобочной структуры формата phylip.
Графический файл с изображением таксономического дерева.

4. Анализ дерева

Задача: найти на дереве и описать три пары наиболее вероятных ортологов и три пары наиболее вероятных паралогов.
Ортологи - последовательности, возникшие из одного общего предшественника в процессе видообразования. Ортологи, как правило, имеют одинаковую функцию, поэтому их следует искать среди белков из разных организмов, расположенных близко друг от друга по дереву. На филогенетическом дереве подчеркнуты и выделены следующие группы ортологов: 1) зелёным цветом - цитоглобины Q66IV7 из XENOPUS LAEVIS и Q6DEW1 из XENOPUS TROPICALIS 2) красным цветом - альфа-глобины HBA2 из PLEURODELES WALTLII и HBA2 из TRITURUS CRISTATUS 3) фиолетовым цветом - бета-глобины HBB1 из TRITURUS CRISTATUS и Q33CJ7 из CYNOPS PYRRHOGASTER. При этом перечислены далеко не все ортологи на филогенетическом дереве. При выборе учитывалось также таксономическое дерево. Ортологами также являются белки внешней группы.

Паралоги - последовательности, возникшие из одного общего предшественника в результате дупликации одного гена в одном организме. Паралоги, как правило, имеют разные функции. Их нужно искать среди белков одного организма, но расположенных в разных, иногда достаточно удалённых друг от друга кластерах. На филогенетическом дереве выделены следующие группы паралогов: 1) голубым цветом - гипотетический белок Q6DKM5 (имеет сходство с фрагментом бета-глобина Q91702_XENLA) и фрагмент неуроглобина Q4LAN7 из XENOPUS LAEVIS 2) жёлтым цветом - цепь бета-глобина Q6F3D1 и альфа-глобин HBA из AMBYSTOMA MEXICANUM 3) зелёным цветом - гистоглобин CYGB и фета-глобин HBAT из HOMO SAPIENS.

Четвёртый семестр


© Снегирёв Александр, 2006