На страницу 3 семестра

Cравнение аминокислотных последовательностей белков и нуклеотидных последовательностей соответствующих генов

Информация о выборке

Белковая последовательностьID находки
1SODF_ECOLI 100%
2SODF_SALTY 94%
3SODF_PSAEAE75%
4SODF_PSEPU 70%
5SODF_COXBU 63%
6SODF_PORGI 52%
7SODF_METTM 40%
   Выборка аминокислотных последовательностей была сделана с помощью программы
BLAST сервера EBI.

Наблюдение элементарных эволюционных событий в ближайших гомологах

   Было проведено исследование белков SODF_ECOLI и SODF_SALTY и их генов. Между генами наблюдается много различий в нуклеотидах (замен), поэтому исследована была лишь часть генов, содержащая все несинонимичные замены.
Номер нуклеотида
в гене
Триплет в
SODF_ECOLI
Триплет в
SODF_SALTY
Аминокислота в
SODF_ECOLI
Аминокислота в
SODF_SALTY
285 GAA GAT Glu Asp
318 GAT GAA Asp Glu
386 AAC AGC Asn Ser
388, 389 AGC GCT Ser Ala
444 ACG ACC Thr Val
517, 518 GGC AAC Gly Asn
В таблице слева отображены все несинонимичные замены (всего 8), причем:
  • Замен в первых позициях триплетов — 2
  • Замен во вторых позициях триплетов — 3
  • Замен в третьих позициях триплетов — 3
   Выравнивания белков и их генов были получены программой из needle пакета EMBOSS. Работа по описанию мутаций проводилась в редакторе Genedoc.

    Гены 2 исследованных белков состоят из 582 нукдеотидов. Производился анализ синонимичных мутаций в 283 – 519 нуклеотидах (в части, где имелись все несинонимичные мутации). Найдено 32 синонимичные мутации, среди которых:

    Таким образом, соотношение синонимичных замен к несинонимичным составляет на исследуемом участке 32/8, т.е. 4. Столь низкое соотношение можно объяснить тем, что рассматривался лишь участок последовательности, содержащий все несинонимичные замены. По всей последовательности это соотношение заметно больше.

Матрица нуклеотидных замен

Нуклеотид A T C G
A 2 4 9
T 2 11 4
C 4 11 7
G 9 4 7
    Эта таблица наглядно демонстрирует, что число транзиций (переходов между пуриновыми и переходов между пиримидиновыми основаниями) больше, чем трансверсий (замен пуринового основаия на пиримидиновое и наоборот). Это биологически осмысленно: трансверсии изменяют расстояние между тяжами ДНК и поэтому вредны.     Примечание: Замены A на T и T на A и т.п. считались одинаковыми.

На графике слева отображена зависимость процентов совпадений нуклеотидных (Gene_Id) и аминокислотных (Prot_Id) последовательностей:
  1. Синим цветом показана связь процентов совпадений последовательностей для белка-предшественника гемагглютинина у разных штаммов вируса гриппа.
  2. Зелёным цветом — для нашей выборки
  3. Красным цветом изображена линия, соединяющая 2 гипотетичечских точки:
    • Две абсолютно идентичные нуклеотидные и соответствующие им аминокислотные последовательности.
    • Две случайные нуклеотидные и соответствующие им аминокислотные последовательности (ясно, что матожидание схожести нуклеотидных последовательностей — 25%, а аминокислотных — 5%).
    Как видно из картинки, в области Prot_Id>65% график зависимости нашей выборки лежит ниже графика зависимости выборки последовательностей белков из вируса гриппа. Причём обе они лежат ниже красной прямой линии. Это можно объяснить тем, что:


© Лев Шагам,2005