Учебный сайт
Главная Семестры Проекты Обо мне

Выравнивание вирусных белков
При помощи поисковой системы SRS были найдены последовательности различных вирусных белков, являющихся дельта-антигенами (они происходят из рода Deltavirus). Затем при помощи программы Muscle было проведено множественное выравнивание этих последовательностей. Здесь можно посмотреть, как соотносились последовательности до выравнивания и после выравнивания.
На этих изображениях видно, что и до, и после выравнивания были колонки со сходными и идентичными остатками, однако после выравнивания, благодаря вставке нескольких гэпов, выравнивание стало содержать гораздо большее число колонок с идентичными или сходными функционально остатками.


Выравнивание набора гомологов белка BCCP_ECOLI
При помощи Blast на сайте NCBI были найдены гомологи белка BCCP_ECOLI (поиск гомологов был по таксону Bacteria, критерием гомологичности был e-value<=0,001, из белков из схожих организмов выбирался 1). Все белки, отобранные по данным критериям: BCCP_HAEIN; BCCP_PSEAE; BCCP_ANASP; BCCP_BACSU; BCCP_CHLTR; BCCP_STRP6; DCOA_SALTI; DCOA_KLEPN; BCCA_MYCLE; GCDC_ACIFE.
При помощи программы Muscle было построено множественное выравнивание последовательностей этих белков и импортировано в Genedoc: посмотреть выравнивание
В данном выравнивании наиболее консервативный участок ограничен позициями 582-621 в координатах выравнивания и 106-155 в координатах аминокислотных остатков BCCP_ECOLI. Рядом с этим участком располагается меньший, на участках 559-568 и 83-92 в координатах выравнивания и белка соответственно. Есть и более мелкие предположительно консервативные участки, однако в них меньше полных колонок с идентичными остатками. С другой стороны, эти маленькие участки (позиции в выравнивании с 115-120, 183-197) окружены гэпами, что может говорить о ненадежности вывода об их консервативности: muscle мог "подогнать" короткие участки друг к другу для получения большего веса выравнивания. Тем не менее нельзя не отметить, что гэпы, окружающие данные участки, появляются из-за последовательностей белков, относящихся не к BCCP, а к DCOA и BCCA, их последовательности сильно отличаются от остальных, хотя в blast они подошли под определение гомологов белка BCCP_ECOLI. В данном выравнивании у всех белков схожи только описанные выше консервативные крупные участки (в то время как между последовательностями белков DCOA_SALTI и DCOA_KLEPN наблюдается очень близкое сходство от начала и до конца). В данном выравнивании интересно отметить столбец 376 в координатах выравнивания: единичные остатки всех последовательностей, окруженные гэпами, стоят в столбце с остатками валина из белков DCOA. Несмотря на то, что столбец не отмечен цветом, это, видимо, было сделано в muscle для увеличения веса выравния, однако такой разрыв последовательностей неправдоподобен.


Программы выравнивания mafft и edialign
Для построения множественного выравнивания белка BCCP_ECOLI с его гомологами дополнительно были использованы программы mafft (посмотреть выравнивание) и edialign (посмотреть выравнивание).
Выравнивания, полученные при помощи всех трех программ (включая muscle) отличаются друг от друга. Все они выделили крупный консервативный участок в конце последовательностей, а также участок, соответствующий промежутку в среднем от 9 до 32 в координатах белка BCCP_ECOLI, однако в начале последовательностей выравнивания отличны друг от друга. В выравниваниях по-разному выделяются короткие колонки сходства, что подтверждает их ненадежность.


Программы обработки множественных выравниваний
При помощи программы plotcon был построен график зависимости велисины сходства последовательностей в выравнивании от позиции выравнивания. Такой график может показать, насколько хорошо выравнивание и в каких участках. Посмотреть график. На графике видно, что в начале последовательностей сходство невелико, оно увеличивается ближе к концу, как и показало выравнивание.
Программа consambig строит общую двусмысленную аминокислотную последовательность на основании множественного выравнивания, сравнивая аминокислотный остаток на каждой позиции с возможными кодами двусмысленности, в искомую последовательность входят остатки с наименьшим кодом. Последовательность
Программа distmat считает эволюционную дистанцию между парами последовательностей во множественном выравнивании на основании степени расхождения последовательностей и строит матрицу на основании этих данных (матрица квадратная и симметрическая, поэтому изображена только ее верхняя половина). Посмотреть матрицу( в данном случае матрица была построена по алгоритму uncorrected distances). Очевидно, что расхождение последовательности с самой собой равно 0. Наибольшее расхождение у белка BCCP_ECOLI с белком BCCA_MYCLE, а наименьшее - с белком BCCP_PSEAE. Помимо 0 в диагонали, наименьшее значение в матрице соответствует паре белков DCOA, что еще раз подтверждвет их большое сходство.

© Яшина 2009