Учебный сайт
Ромащенко Валерии


Множественное выравнивание.

1. Ознакомление с программой Muscle.

C помощью запроса [swissprot-Taxonomy:Deltavirus*] (т.е. поиск должен пойти по банку данных Swiss-Prot и искать совпадения со словом "Deltavirus" в разделе "Taxonomy") было найдено 34 последовательности. Они были сохранениы в fasta-формате в одельном файле. Импортировав последовательности в GenDoc, я попыталась вставить пробелы там, где увидела для них наиболее удачное расположение. Например, поставив гэпы в позициях 20, 22 и 24 (отмечены голубыми овалами на картинке ), получилось выровнять последовательности, начиная с 58 ао. Эти небольшие изменения дали возможность увидеть, что в последовательностях есть много участков, которые совершенно одинаковы между собой в ряду данных последовательностей белков. Скачать файл можно здесь.
Далее с помощью программы Muscle последовательности были грамотно выравнены. Потом я открыла это выравнивание через GenDoc и заметила несколько отличий, а точнее, порядок последовательностей в столбце отличался от изначального, и уже в зависимости от этого, пробелы стояли там, где это было наиболее выгодно: в 24 из 34 последовательностей (отмечено голубым прямоугольником на картинке ). С помощью программы Muscle было найдено гораздо больше гомологичных участков в последовательностях, чем их было замечено изначально, что неудивительно. Один из примеров - это участок последовательностей IKKLE, который находится между 40 и 46 позициями, или PWLGNV, находящийся между 48 и 55 ао.

2. Выравнивание набора гомологов своего белка.

В BLAST были найдены гомологи моего белка YODA_ECOLI, но к сожалению, их оказалось очень немного, а точнее, всего 2 (более подробную информацию о поиске гомологичных последовательностей для моего белка YODA_ECOLI можно найти на странице , посвященной работе с BLASTP в таблице "Результаты поиска гипотетических гомологов белка Yoda_Ecoli.").
Программа Muscle выровняла эти три последовательности. Cразу заметно, что некоторые участки не имеют никакого биологического смысла, например, это большие пропуски в белке YRPE_BACSU (O05410) между 44 и 45 ао, 62 и 63, далее идет небольшой фрагмент, который присутствует в двух других последовательностях (в YODA_ECOLI и ADCA_STRR6), а потом опять очень большой пробел между 69 и 70 ао (все упомянутые промежутки отмечены салатовым прямоугольником). Похожая ситуация наблюдается у белка YODA_ECOLI (P76344), только самые крупные пропуски находятся между 17 и 18 ао, 26 и 27, 33 и 34 ао (синие прямоугольники). Ни одного пропуска нет в последовательности ADCA_STRR6 (Q8CWN2), которая является самой длинной из всех трех и состоит из 501 ао, а YODA_ECOLI и YRPE_BACSU состоят из 216 и 251 ао соответственно. Наиболее консервативным участком оказалась последовательность, начинающаяся с 70 ао у YRPE_BACSU, 34 ао у YODA_ECOLI и 319 ао у ADCA_STRR6 (ао помечены темно-зеленым цветом). Так же надо отметить, что выравнивание YODA_ECOLI и ADCA_STRR6 начинается не с самого начала, так как они немного сдвинуты относительно YRPE_BACSU.
Данное выравнивание в формате "msf" представлено здесь.


Выравнивание, осуществленное с помощью программы Muscle.

3. Другие программы множественного выравнивания.

Здесь я ознакомилась с программами выравнивания mafft и edialign. Выравнивание трех последовательностей с помощью mafft существенно оличается от выравнивания в Muscle: для начала, выравнивание всех последовательностей начинается с первого ао, хотя самый консервативный участок начинается с тех же ао что и в Muscle (отмечены темно-зеленым цветом), и программа mafft изменила порядок расположения последовательностей в столбце.


Выранивание трех последовательностей с помощью mafft.

Выранивание в edialing сильно отличается в расположении консервативного участков в трех последовательностях: у YODA_ECOLI он начинается с 42 ао, у ADCA_STRR6 с 327 ао, у YRPE_BACSU с 78 ао (отмечено темно-зеленым цветом).

Выравнивание трех последовательностей с помощью программы edialing.

На главную


© Ромащенко 2008