1. Составление выборки аминокислотных последовательностей
Выборка состоит из 3-х частей:
- белки семейства глобинов PF00042 из Caudata и Xenopus;
- глобины человека - Q8WWM9, P09105, P02008, P69905, P68871, P02042, P02100, P69891, P69892, Q9NPG2;
- как внешнюю группу - P02144, P02202, Q9DGJ1.
Первая часть выборки отфильтрована: не брались фрагменты (менее 90 а.о.) и из двух подвидов выбирался один, в котором больше белков семейства.
Аминокислотные последовательности, полученные с помощью SRS, сохранены в формате FASTA2Seq.
Создан файл с перечнем организмов выборки.
2. Построение филогенетического дерева
Построено множественное выравнивание последовательностей выборки с помощью программы emma.
После этого программой eprotdist с параметрами по умолчанию по множественному выравниванию была создана квадратная матрица попарных расстояний между белковыми последовательностями.
Наконец, при помощи программы eneighbor с параметрами, взятыми по умолчанию, по имеющейся матрице попарных расстояний были созданы скобочная формула дерева и его графическое изображение в виде филограммы
(алгоритм Neighbour-Joining).
Для редактирования дерева использована программа GeneMaster.
Подписи вершин, соответствующие внешней группе, выделены жирным шрифтом и подчеркнуты.
Графический файл с изображением филогенетического дерева.
3. Построение таксономического дерева
На странице NCBI описан вариант таксономии живых организмов.
Полученное таксономическое дерево сохранено в виде скобочной структуры формата phylip.
Графический файл с изображением таксономического дерева.
4. Анализ дерева
Задача: найти на дереве и описать три пары наиболее вероятных ортологов и три пары наиболее вероятных паралогов.
Ортологи - последовательности, возникшие из одного общего предшественника в процессе видообразования.
Ортологи, как правило, имеют одинаковую функцию, поэтому их следует искать среди белков из разных организмов, расположенных близко друг от друга по дереву.
На филогенетическом дереве подчеркнуты и выделены следующие группы ортологов: 1) зелёным цветом - цитоглобины Q66IV7 из XENOPUS LAEVIS и Q6DEW1 из XENOPUS TROPICALIS 2) красным цветом - альфа-глобины HBA2 из PLEURODELES WALTLII и HBA2 из TRITURUS CRISTATUS 3) фиолетовым цветом - бета-глобины HBB1 из TRITURUS CRISTATUS и Q33CJ7 из CYNOPS PYRRHOGASTER. При этом перечислены далеко не все ортологи на филогенетическом дереве.
При выборе учитывалось также таксономическое дерево.
Ортологами также являются белки внешней группы.
Паралоги - последовательности, возникшие из одного общего предшественника в результате дупликации одного гена в одном организме.
Паралоги, как правило, имеют разные функции. Их нужно искать среди белков одного организма, но расположенных в разных, иногда достаточно удалённых друг от друга кластерах.
На филогенетическом дереве выделены следующие группы паралогов: 1) голубым цветом - гипотетический белок Q6DKM5 (имеет сходство с фрагментом бета-глобина Q91702_XENLA) и фрагмент неуроглобина Q4LAN7 из XENOPUS LAEVIS 2) жёлтым цветом - цепь бета-глобина Q6F3D1 и альфа-глобин HBA из AMBYSTOMA MEXICANUM 3) зелёным цветом - гистоглобин CYGB и фета-глобин HBAT из HOMO SAPIENS.
Четвёртый семестр
©
Снегирёв Александр, 2006