Пробные выравнивания



Главная

Назад

Определение положения фрагмента в полной последовательности

Для данной операции используем программу GeneDoc.


Заданный фрагмент соответствует позициям 185–209 в полной последовательности белка PSTS_ECOLI.

Последовательность белка PSTS_ECOLI и фрагмента последовательности белка в fasta-формате.

Построение "наилучшего" выравнивания вручную

Попытаемся выравнять последовательности, чтобы получить наибольший вес выравнивания, для чего необходимо сопоставление максимального числа одинаковых букв при минимальном числе пропусков. Вот, что получилось.



Исходные длины этих фрагментов равны 25 и 28 аминокислотных остатков.
Как видно из представленного рисунка длина выравнивания равна 30.

Будем считать одним пропуском непрерывную последовательность символов "–" любой длины. Для получения "наилучшего" выравнивания будем оценивать его вес как:

W = M – nG,

где M — число совпавших букв, G — штраф за пропуск, равен 2, n — общее число пропусков. Краевые пропуски не штрафуются!! Длина пропуска не имеет значения.

Тогда вес данного выравнивания равен W=16-2*2=12.

Процент идентичности двух выровненных последовательностей (отношение числа колонок, в которых стоят одинаковые буквы, к общему числу колонок, включая "гэповые", умноженное на 100) равен

16/30*100%=53.33%

Данные фрагменты в fasta-формате.

Первая с N-конца близкородственная замена а.о.

Для поиска близкородственной замены а.о. воспользуемся популярной матрицей весов замен а.о. BLOSUM62.
Будем считать близкородственными заменами те, для которых значение элемента матрицы положительно.

Первая и единственная близкородственная замена а.о. при выбранном выравнивании является замена I-V, изолейцин-валин, позиция 21, вес такой замены в соответствии с матрицей равен 3.

Такая замена действительно близкородственная, так как оба аминокислотных остатка гидрофобные и отличаются лишь наличием у изолейцина метильной группы .

Определение % сходства выравненных фрагментов

Процентом сходства будем считать отношение числа колонок со сходными буквами к общему числу, умноженное на 100%. Сходными буквами будем считать такие, для которых значение элемента матрицы BLOSUM62 положительно. Итак, как уже упоминалось близкородственная замена одна, а, значит, число таких колонок равно 17. Тогда процент сходства фрагментов равен

17/30*100%=56,67%.

Построение иного выравнивания двух заданных фрагментов с весом не хуже, чем при первом выравнивании

Данное выравнивание нисколько не хуже по весу, также равно 12, с одним лишь различием, что гэп один, по сравнению с первым выравниванием.

Если сравнивать два этих выравнивания, то, наверное, их нужно поменять местами, потому что последнее выравнивание лучше, так как в нем один гэп, а, как известно, в эволюции более вероятно продолжение гэпа, чем открытие нового.

При этом выравнивании, близкородственных замены а.о. две: I-V, изолейцин-валин и L-V, лейцин-валин, позиции 21 и 18 соответственно.
Вес таких замен равен 3 и 1 соответственно. Очевидно, что эти замены близкородственны, так как аминокислотные остатки имеют схожую структуру, отличающуюся положением метильной группы, также эти остатки гидрофобны. С учетом этого % сходство выравненных таким образом фрагментов равно 53.33% (число колонок равно 16).















© Ксения Лежнина 2008