Учебный сайт Шиндяпиной А.В.

Пробные выравнивания



Задача выравнивания последовательностей часто сводится к задаче поиска сходства. Для чего же оно нужно? Ну, несомненно, выравнивание помогает в построении филогенетических деревьев и предсказывает возможность автоматической аннотации геномов, что является главными задачами биоинформатики. Автоматическая аннотация помогает значительно сэкономить время людей, описывающих последовательности, т.к. похожие последовательности имеют похожие структуры и сходные функции.
Выполняя эту работу я пользовалась программой GeneDoc.

1. Определение положения фрагмента в полной последовательности.

Для выравнивания я взяла один короткий фрагмент аминокислотной последовательности и последовательность моего белка PTHP_Ecoli. С помощья простого перемещения короткого фрагмента вдоль последовательности моего белка, нашла участок, где они полностью совпадают. Это и показано на изображении:

Заданный фрагмент соответствует позициям 5-22 в полной последовательности белка PTHP_Ecoli.

2. Построение "наилучшего" выравнивания вручную

Были заданы два коротких фрагмента аминокислотных последовательностей длиной 17 и 18 а.о. Для "наилучшего" выравнивания нужно наибольшее количество совпавших букв вместе с наименьшими пропусками. Это позволит получить наибольший вес выравнивания. Он считается по формуле:
W = M - nG
где M - число совпавших букв, G - штраф за пропуск, равен 2, n - общее число пропусков.
В результате у меня получилось следующее:

Вес выравнивания: 10-0*2=10
Длина выравнивания (количество колонок) 19.
Процент идентичности двух выровненных последовательностей - (10/19)*100% = 52,6 % (отношение числа колонок, в которых стоят одинаковые буквы, к общему числу колонок, включая "гэповые", умноженное на 100).

3.Нахождение первой с N-конца выравнивания "близкородственной" замены а.о.

Для выполения задания воспользовалась матрицей весов замен а.о. BLOSUM62.
Первой (и единственной) близкородственной заменой является пара a.o. I-L на 10 позиции с N-конца. Это изолейцин(I) и лейцин (L).
Вес такой замены 2 (в соответствии с таблицей BLOSUM62).
Вес такой замены положителен, т.к. данные а.о. являются изомерами, а значит и очень близки их физико-химические свойства.

Дополнительные задания

1. Определение % сходства выровненных фрагментов.


Теперь мы учитываем все колонки, имеющие положительный вес. % сходства получился (11/19)*100% = 57,9.

2. Построение иного выравнивания 2-х заданных в пункте 2 фрагментов.


В данном случае, я получила выравнивание с весом 10-1*2=8



©, "ООО Шиндяпина 2008"