Пробное выравнивание

1. Определение положения фрагмента в полной последовательности.

Дан фрагмент последовательности белка MOEB_ECOLI:

MAPLIGVIGSLQAMEAIKMLAGYGK

Имеется полная последовательность белка:

MAELSDQEMLRYNRQIILRGFDFDGQEALKDSRVLIVGLGGLGCAASQYLASAGVGNLTL
LDFDTVSLSNLQRQTLHSDATVGQPKVESARDALTRINPHIAITPVNALLDDAELAALIA
EHDLVLDCTDNVAVRNQLNAGCFAAKVPLVSGAAIRMEGQITVFTYQDGEPCYRCLSRLF
GENALTCVEAGVMAPLIGVIGSLQAMEAIKMLAGYGKPASGKIVMYDAMTCQFREMKLMR
NPGCEVCGQ

Импортирую эти две последовательности в программу GeneDoc. Двигаю фрагмент относительно полной последовательности до полного совпадения букв.

Первый аминокислотный остаток заданного фрагмента соответствует 193 позиции в полной последовательности белка, последний - 217 позиции.

Итак, заданный фрагмент соответствует позициям 193-217 в полной последовательности белка MOEB_ECOLI.

Выравнивание сохранено в файл alignment1.msf.

Изображение с выравниванием сохранено в файл aln1.gif.

 

2. Построение "наилучшего" выравнивания вручную.

Даны две короткие последовательности: MAPLIGVIGSLQAMEAIKMLAGYGK и VLAPIVGIVGCIQALEAIKVRLKIGK.

При помощи програмы GeneDoc выполнил их выравнивание, стараясь, чтобы было сопоставлено максимальное число одинаковых букв при минимальном числе пропусков.

Считаем одним пропуском непрерывную последовательность символов "–" любой длины. Для получения "наилучшего" выравнивания оцениваем его вес как:

W = M – nG

где M — число совпавших букв, G — штраф за пропуск (равен 2), n — общее число пропусков. Краевые пропуски не штрафуются. Длина пропуска не имеет значения. Чем больше вес, тем лучше выравнивание.

W = 12 - 0*2 = 12

Выравнивание сохранено в файл alignment2.msf.

Изображение с выравниваниев сохранено в файл aln2.gif.

Исходные длины двух заданных фрагментов - 25 и 26 аминокислотных остатков соответственно. Длина выравнивания равна 26. Вес выравнивания равен 12.

Процент идентичности двух выровненных последовательностей равен (12/26)*100 = 46,15%

 

3. Поиск первой с N-конца выравнивания "близкородственной" замены аминокислотного остатка.

Для выполнения данного задания использовалась наиболее популярная матрица весов замен аминокислотных остатков BLOSUM62. Считаем близкородственными заменами те, для которых значение элемента матрицы положительно.

Первая близкородственная замена наблюдается на второй позиции выравнивания - замена метионина (M) на лейцин (L). В соответствии с использованной матрицей вес такой замены равен 2.

Метионин и лейцин немного схожи по своим физико-химическим свойствам. Они оба гидрофобны и имеют близкий по длине хвост.

 

Дополнительные задания

1. Определить % сходства выровненных фрагментов.

Процентом сходства будем считать отношение числа колонок со сходными буквами к общему числу, умноженное на 100%. Сходными буквами будем считать такие, для которых значение элемента матрицы BLOSUM62 положительно.

Процент сходства равен: (20/26)*100 = 76,92%

 

2. Построить иное выравнивание 2-х заданных фрагментом с весом не хуже, чем получилось в обязательном упр.2.

Выравнивание, которое приведено в задании 2, имеет максимальный вес. Вот вариант выравнивания, не сильно хуже первого:

Вес выравнивания W = 13 - 2*2 = 9.

©2008 Михальченко Алексей