Пробные выравнивания

1

Для определения положения фрагмента в полной последовательности белка был создан файл fullANDpart.fasta. Этот файл был импортирован в GeneDoc.
Заданный фрагмент соответствует позициям 147–164 в полной последовательности белка OTC1_ECOLI.



Файл с выравниванием: alignment1.msf


2

Необходимо вручную выровнять две последовательности:
>seq1
EHLPGKAFNEMTLVYAGD
>seq2
ENFGKLEGITLVYCGDGR
Исходные длины последовательностей - по 18 аминокислотных остатков каждая. Файл с последовательностями в fasta-формате: shortseqs.fasta

В результате получилось выравнивание длиной 20:



Рассчитаем его вес по формуле W = M – nG (M — число совпавших букв, G — штраф за пропуск, равен 2, n — общее число пропусков): W = 8 - 1*2 = 6
Процент идентичности равен 8/20*100% = 40%
Файл с выравниванием: alignment2.msf


3

Найдем близкородственные замены аминокислотных остатков в получившемся выравнивании. Если считать близкородственной замену с положительным весом, то в данном выравнивании близкородственных замен нет. Максимальный вес замен равен нулю. Рассмотрим первую к N-концу замену с таким весом. Это замена гистидин-глутаминовая кислота (вторая позиция в выравнивании). Нулевой вес замены связан с тем, что свойства этих аминокислотных остатков недостаточно близки (оба остатка заряжены, однако имидазол у гистидина заряжается положительно, карбоксил у глутаминовой кислоты отрицательно).


4*

В выравнивании 8 колонок со сходными буквами (сходными буквами считаем такие, для которых значение матрицы замен BLOSUM62 положительно), причем это только совпадающие а.о., положительных замен разных а.о. в выравнивании нет. Всего позиций 20. Таким образом, процент сходства равен 8/20*100% = 40%.


5*
Построить иное выравнивание с весом не хуже, чем получилось в упр.2

Если рассчитывать вес выравнивания по той же формуле, что и в упр. 2, то есть без учета весов замен считать только совпавшие аминокислотные остатки и гэпы, то построить еще одно выравнивание с весом не хуже, чем в упр. 2, не получается. Но можно получить выравнивание с весом, меньшим на 1, передвинув первый а.о. (глутаминовую кислоту) второй последовательности влево (так как добавилось еще одно совпадение букв, но и еще один пропуск):



W = 9 - 2*2 = 5

Теперь будем рассчитывать вес с помощью матрицы замен BLOSUM62, штраф за гэп в этой матрице равен 4. При этом концевые гэпы тоже учитываем. Тогда вес первого выравнивания:
W = - 4 + 0 - 3 - 4 + 6 + 5 - 1 - 3 + 0 - 3 - 4 + 5 + 4 + 4 + 7 + 0 + 6 + 6 - 4 - 4 = 13
А теперь рассчитаем таким же образом вес второго выравнивания, полученного нами выше.
Теперь он будет равен:
W = 5 - 4 - 3 - 4 + 6 + 5 - 1 - 3 + 0 - 3 - 4 + 5 + 4 + 4 + 7 + 0 + 6 + 6 - 4 - 4 = 18
При таком подсчете вес оказался гораздо больше веса первого выравнивания. Прибавка за совпадение глутаминовых кислот в этом выравнивании (равна 5) больше веса замены Н - Е в первом выравнивании (равен 0), поэтому общий вес выравнивания увеличился и стал даже выше веса выравнивания из упр.2.
Мы можем получить третье выравнивание с еще большим весом, если передвинем во второй последовательности группу аминокислотных остатков №6-9 (LEGI) на единицу вправо:



Вес такого выравнивания будет равен:
W = 5 - 4 - 3 - 4 + 6 + 5 - 4 - 0 + 0 - 2 + 1 + 5 + 4 + 4 + 7 + 0 + 6 + 6 - 4 - 4 = 24
Это выравнивание имеет максимальный возможный вес.
Процент идентичности получившихся двух выравниваний равен 9/20*100% = 45% (в первом выравнивании он равнялся 40%).
Процент сходства второго выравнивания: 9/20*100% = 45%
Процент сходства третьего выравнивания: 10/20*100% = 50%


6*

Для быстрого расчета веса выравнивания по матрице BLOSUM62 построена таблица Excel: 6.xls.
В первые две строки (Sequence1, Sequence2) вводим последовательности, на месте пропусков ставим знак "-" (отмечаем и концевые гэпы). В третьей строке (Aln_length) с использованием функций МАКС и ДЛСТР рассчитывается длина выравнивания. В следующей строке (Aln_weight) считается вес всего выравнивания (суммируем весы всех замен из таблицы ниже). Далее в таблице рассчитывается вес каждой замены по матрице BLOSUM62, при этом используются функции ВПР и ПОИСКПОЗ. При необходимости (если выравнивание длиннее 20) таблицу можно продлить.

к проектам

на главную