| |
Оптимальное глобальное выравнивание:
X SE-SL | | Y SWDSV |
Сдаётся мне, что биологический смысл таких манипуляций (приписывания одинокового веса всем
совпадениям, всем заменам и всем делециям) весьма сомнителен, так как значимость той или иной
мутации далеко не одинакова для разных аминокислот и зависит от того 1) аминокислота какого
типа (из 20-и) меняется на какую аминокислоту (или на пробел); 2) какое место занимает данная
аминокислота в последовательности данного конкретного белка (если меняется аминокислота в
участке, не несущем большой функциональной нагрузки, то значимость такой замены невелика,
если меняется ключевая аминокислота функционального центра - значимость огромна).
Даже расположенные рядом аминокислотные остатки могут очень сильно различаться по значимости для формирования структуры белка и выполнения его функции. Может быть сильно различаются по значимости и первые четыре аминокислотных остатка FMT_ECOLI. Для решения этого вопроса было бы правильно покопаться с PDB-файлом, а ещё правильнее провести эксперименты с белками, содержащими мутации по каждому (отдельно) аминокислотному остатку, но впрочем это не имеет отношения к данному заданию. |
|
||
|
Локальное выравнивание в принципе можно построить и по-другому, но тогда вес будет несколько меньше (4, 2, 1 или даже 0). |
При построении глобального выравнивания программа NEEDLE из програмного пакета EMBOSS учитывает аффинную систему штрафов за делеции в выравниваемых последовательностях. Аффинная система штрафов подразумевает то, что за открытие гэпа и за его продолжение накладывается разный штраф.Это может быть полезно обосновано, так как вполне возможно, что в ряде случаев вероятность возникновения одной крупной делеции чем вероятность возникновения нескольких мелких в одном участке.
Но наверняка существуют случаи, не подходящие под эту модель.Предположим на маленьком участке последовательности располжен один очень важный аминокислотный остаток и несколько не очень важных. В таком случае поэтапная делеция менее значимых аминокислотных остатков более вероятна, чем полная делеция такого в целом значимого участка, которая может обернуться потерей функциональной активности белка.
А если вспомнить про ДНК, то получается ещё более сложная картина: там некоторые фосфодиэфирные связи уязвимее других, наприрмер в сайтах рестрикции. А палиндромы встречаются и вне сайтов рестрикции, например, последовательность CTGCAG кодирует идущие подряд лейцин и глутамин - может быть такие (или какие-нибудь совершенно другие) участки в origin'е более уязвимы для нуклеаз, чем остальная часть гена? Может быть в каких-то участках какого-нибудь гена есть несколько таких участков, идущих через малые промежутки; тогда такой ген может через небольшой эволюционный промежуток заполучить на небольшом своём участке несколько делеций?
Приведенное ниже выравнивание, построенное программой NEEDLE при стандартном параметре цены открытия и цене продолжения гэпа равной 1, отражает тот случай, когда нежелательны и очень длинные, и мелкие единичные делеции. Мы видим внутри выравнивания только одну длиной в две аминокислоты. Абсолютно аналогичную картину можно увидеть при штрафе за открытие гэпа равном 5 и штрафе за продолжение равном 1.
Выравнивание строилось со следующими параметрами:
|
Следующее выравнивание содержит большее число совпадений аминокислот. В нем система штафа за гэп сделана простой, т.е. открытие и продолжение делеции оценивается одинаково и при этом штраф гораздо меньше, чем в предыдущем выравнивании. При этом программа увеличивает число гэпов внутри последовательности, чтобы увеличить число совпадений аминокислот.
Выравнивание строилось со следующими параметрами:
|
Сравнивая полученные выравнивания, можно заметить, что ни одно из них не оказалось объективным. Последовательность NEWSEQ получалась склеиванием двух небольших участков последовательности, а не вырезанием из нее мелких фрагментов с образованием небольших и многочисленных делеций; но обоих выравниваниях все равно найден только один реально гомологичный участок, а все остальные совпадения аминокислот случайны.
Очевидно, дело в том, что штраф за продолжение гэпа слишком велик. Его нужно сделать еще меньше, чтобы программа построила выравнивание, отвечающее рельно проделанным с последовательностью преобразованиям. И тогда получится вот такое замечательное выравнивание.
Выравнивание строилось со следующими параметрами:
|
P.S. Не хочу своими размышлениями-отступлениями обидеть никого из преподавателей. Просто пришли в голову такие мысли. Может, я и неправ.
© LOUKIANOV MIKHAIL, 2005