Биологический смысл выравниваний

1

Построение выравнивания аминокислотных последовательностей на основе пространственного наложения структур белков

Даны последовательности двух частей белков в fasta-формате: 23.fasta, 24.fasta
Также дано пространственное наложение этих частей белков:

Как видно из рисунка, полученного в RasMol, имеется только 3 места несовпадения структур.
В соответствии с данным пространственным наложением построим выравнивание наших последовательностей: 23_24.msf. Это выравнивание представлено на рисунке ниже, красным цветом показаны места, соответствующие несовпавшим участкам пространственных структур:



2

Построение аналогичного выравнивания в программе needle

Построим выравнивание этих же последовательностей в программе needle. Сохраним полученное выравнивание в файле 23_24.needle. Также это выравнивание можно посмотреть в формате .msf. Выравнивание выглядит так:

Сравним два выравнивания. Выравнивание, построенное автоматически, довольно сильно отличается от построенного вручную. Наиболее серьезные отличия связаны как раз с местами несовпадения структур (показаны на рисунке). В области 3 программа предпочла замену пролин-треонин замене аспарагиновая кислота-треонин, хотя веса этих замен одинаковы. В области 1 два небольших гэпа были заменены одним большим, т.к. в needle установлен аффинный штраф за гэпы (10 за открытие гэпа и 0,5 за его продолжение) и один большой гэп обходится дешевле. Также есть отличия на участке между областями 1 и 2 (например, вставлен новый гэп, больше родственных замен и т.д.). Впрочем, в двух выравниваниях есть и абсолютно одинаковые участки довольно большой длины (с начала до обл. 3 и от обл. 3 до обл. 2).
Вес выравнивания в needle явно больше веса пространственного выравнивания, но это не значит, что автоматическое выравнивание верное. В целом, поскольку needle стремится построить выравнивание с как можно большим весом, математически второе выравнивание правильнее, но нужно учесть, что даже аминокислотные остатки с нулевым или отрицательным весом замены могут формировать вполне сходную пространственную структуру и образовывать функциональные группы с похожими свойствами. Наиболее верным с биологической точки зрения было бы строить выравнивания именно с учетом конформации полипептидных цепей, но поскольку известно не так много кристаллических структур, это сделать можно далеко не для всех белков. Автоматические же выравнивания, конечно, приблизительно соответствуют пространственным, но, как это видно из нашего примера, полностью на них полагаться нельзя (в нашем случае только примерно половина автоматического выравнивания оказалась биологически верной).

к проектам

на главную