<<На главную

<<Второй семестр

Глобальное и локальное выравнивания аминокислотных последовательностей

Матрицы переходов

Глобальное выравнивание

  • Матрица переходов строилась для последовательностей SESL (первые 4 аминокислотных остатков белка FMT_ECOLI) и SWDSV (полученной из первой двумя произвольными заменами и вставкой одной аминокислоты);
  • При построении матрицы использовались следующие параметры:

    • цена совпадения аминокислот 2;
    • цена замены -1;
    • цена делеции -2;
  • Вес оптимального пути равен 0;
Оптимальное глобальное выравнивание:
X  SE-SL
   |  |    
Y  SWDSV 
Сдаётся мне, что биологический смысл таких манипуляций (приписывания одинокового веса всем совпадениям, всем заменам и всем делециям) весьма сомнителен, так как значимость той или иной мутации далеко не одинакова для разных аминокислот и зависит от того 1) аминокислота какого типа (из 20-и) меняется на какую аминокислоту (или на пробел); 2) какое место занимает данная аминокислота в последовательности данного конкретного белка (если меняется аминокислота в участке, не несущем большой функциональной нагрузки, то значимость такой замены невелика, если меняется ключевая аминокислота функционального центра - значимость огромна).

Даже расположенные рядом аминокислотные остатки могут очень сильно различаться по значимости для формирования структуры белка и выполнения его функции. Может быть сильно различаются по значимости и первые четыре аминокислотных остатка FMT_ECOLI. Для решения этого вопроса было бы правильно покопаться с PDB-файлом, а ещё правильнее провести эксперименты с белками, содержащими мутации по каждому (отдельно) аминокислотному остатку, но впрочем это не имеет отношения к данному заданию.

Локальное выравнивание

  • Матрица переходов строилась для последовательностей SESLRIIFA (первые 9 аминокислотных остатков белка FMT_ECOLI) и ESIFA (аминокислоты 2, 3, 7, 8, 9 из того же белка);
  • При построении матрицы использовались следующие параметры:

    • цена совпадения аминокислот 2;
    • цена замены -1;
    • цена делеции -2;
  • Вес оптимального пути 6;
Оптимальное локальное выравнивание:
X SESLRIIFA
   ||   |||
Y  ES   IFA    
Локальное выравнивание в принципе можно построить и по-другому, но тогда вес будет несколько меньше (4, 2, 1 или даже 0).

Влияние параметров на глобальное выравнивание

При построении глобального выравнивания программа NEEDLE из програмного пакета EMBOSS учитывает аффинную систему штрафов за делеции в выравниваемых последовательностях. Аффинная система штрафов подразумевает то, что за открытие гэпа и за его продолжение накладывается разный штраф.Это может быть полезно обосновано, так как вполне возможно, что в ряде случаев вероятность возникновения одной крупной делеции чем вероятность возникновения нескольких мелких в одном участке.

Но наверняка существуют случаи, не подходящие под эту модель.Предположим на маленьком участке последовательности располжен один очень важный аминокислотный остаток и несколько не очень важных. В таком случае поэтапная делеция менее значимых аминокислотных остатков более вероятна, чем полная делеция такого в целом значимого участка, которая может обернуться потерей функциональной активности белка.

А если вспомнить про ДНК, то получается ещё более сложная картина: там некоторые фосфодиэфирные связи уязвимее других, наприрмер в сайтах рестрикции. А палиндромы встречаются и вне сайтов рестрикции, например, последовательность CTGCAG кодирует идущие подряд лейцин и глутамин - может быть такие (или какие-нибудь совершенно другие) участки в origin'е более уязвимы для нуклеаз, чем остальная часть гена? Может быть в каких-то участках какого-нибудь гена есть несколько таких участков, идущих через малые промежутки; тогда такой ген может через небольшой эволюционный промежуток заполучить на небольшом своём участке несколько делеций?

Приведенное ниже выравнивание, построенное программой NEEDLE при стандартном параметре цены открытия и цене продолжения гэпа равной 1, отражает тот случай, когда нежелательны и очень длинные, и мелкие единичные делеции. Мы видим внутри выравнивания только одну — длиной в две аминокислоты. Абсолютно аналогичную картину можно увидеть при штрафе за открытие гэпа равном 5 и штрафе за продолжение равном 1.

Выравнивание строилось со следующими параметрами:

  • Штраф за открытие делеции — 10;
  • Штраф за продолжение делеции — 1.

Следующее выравнивание содержит большее число совпадений аминокислот. В нем система штафа за гэп сделана простой, т.е. открытие и продолжение делеции оценивается одинаково и при этом штраф гораздо меньше, чем в предыдущем выравнивании. При этом программа увеличивает число гэпов внутри последовательности, чтобы увеличить число совпадений аминокислот.

Выравнивание строилось со следующими параметрами:

  • Штраф за открытие делеции — 1;
  • Штраф за продолжение делеции — 1.

Сравнивая полученные выравнивания, можно заметить, что ни одно из них не оказалось объективным. Последовательность NEWSEQ получалась склеиванием двух небольших участков последовательности, а не вырезанием из нее мелких фрагментов с образованием небольших и многочисленных делеций; но обоих выравниваниях все равно найден только один реально гомологичный участок, а все остальные совпадения аминокислот случайны.

Очевидно, дело в том, что штраф за продолжение гэпа слишком велик. Его нужно сделать еще меньше, чтобы программа построила выравнивание, отвечающее рельно проделанным с последовательностью преобразованиям. И тогда получится вот такое замечательное выравнивание.

Выравнивание строилось со следующими параметрами:

  • Штраф за открытие делеции — 10;
  • Штраф за продолжение делеции — 0,1.

P.S. Не хочу своими размышлениями-отступлениями обидеть никого из преподавателей. Просто пришли в голову такие мысли. Может, я и неправ.


© LOUKIANOV MIKHAIL, 2005