Эволюция белков. Домены.
БД Pfam, InterPro

Исследование доменной структуры конкретного белка

Доменная структура белка AMO_ECOLI по данным Pfam

Cхема из Pfam:
Пояснения к схеме
Pfam AC Pfam ID Полное название семейства домена Положение в последовательности белка AMO_ECOLI Клан
1. PF07833 Cu_amine_oxidN1  N-концевой домен медьсодержащей аминооксидазы.
Он имеется не во всех медьсодержащих аминооксидазах.
33-121  
2. PF02727Cu_amine_oxidN2 N2 домен медьсодержащей аминооксидазы.
Является первым или вторым структурным доменом медьсодержащих аминооксидаз, функция неизвестна.
124-210 CuAO_N2_N3(CL0047), содержит 2 семейства: Cu_amine_oxidN2 и Cu_amine_oxidN3
3. PF02728Cu_amine_oxidN3 N3 домен медьсодержащей аминооксидазы.
Является вторым или третьим структурным доменом медьсодержащих аминооксидаз, функция неизвестна.
215-317 CuAO_N2_N3(CL0047), содержит 2 семейства: Cu_amine_oxidN2 и Cu_amine_oxidN3
4. PF01179Cu_amine_oxid Ферментативный домен медьсодержащей аминооксидазы. Катализирует окислительное дезаминирование первичных аминов до соответствующих альдегидов, восстанавливая молекулярный кислород до перекиси. 335-757  

Выравнивание-затравка (seed) для N-концевого домена в формате msf: скачать, картинка.


Сравнение описаний доменных структуры в Pfam с описанием в других БД

При поиске по БД InterPro было найдено множество подписей для заданного белка.
Я выбрал следующую:

InterPro ID: IPR000269
БД: PANTHER (Protein ANalysis THrough Evolutionary Relationships)

Данный пример был выбран потому, что в нём один мотив включает в себя последовательность, которая соответствует двум целым и частично третьему доменам из Pfam.

Сопоставление доменной структуры с 3D структурой заданного белка
Цвета на картинке соответствуют цветам доменов в таблице выше (с учётом несовпадения нумерации)

На мой взгляд, домены из Pfam выделяют отдельные компактные структуры в белке, то есть соответствуют структурным доменам.

Исследование эволюции отдельных доменов

Представленность изучаемых доменов в различных организмах

PFAM ID Количество видов, в белках которых
встречается этот домен
1. Cu_amine_oxidN1 51
2. Cu_amine_oxidN2 104
3. Cu_amine_oxidN3 104
4. Cu_amine_oxid 120

Представленность домена PF02728 (Cu_amine_oxidN3) в организмах разных видов

Таксон
Количество белков с доменом PF02728
Эукариоты Зеленые растения 93
Грибы 119
Животные 40
Остальные эукариоты  
Бактерии 91
Археи 3

Данный домен не свойственнен археям и более распространён у эукариот. Среди эукариот наибольшее его представительство у грибов.

Представленность изучаемых доменов в белках Escherichia coli (strain K12)

PFAM ID Количество белков в Escherichia coli (strain K12)
1. Cu_amine_oxidN1 1
2. Cu_amine_oxidN2 1
3. Cu_amine_oxidN3 1
4. Cu_amine_oxid 1
В Escherichia coli (strain K12) есть только один белок, содержащий данные домены. Видимо, функции, выполняемые этими доменами, очень специфичны. И существует только один белок, сочетающий эти функции.

Приведите не менее 3-х примеров разных доменных перестроек

Как можно заметить по описаниям доменов, они обычно находятся вместе в полипептидной цепи, причём в строго определённой последовательности. Но бывает и другая доменная организация.

Домены PF02727 (Cu_amine_oxidN2), PF02728 (Cu_amine_oxidN3), PF01179 (Cu_amine_oxid)

- Наиболее интересная перестройка, включающая дупликацию сразу нескольких доменов:
ABP1_RAT:
A5BR05_VITVI:

Домен PF01179 (Cu_amine_oxid)

- Может иметь разрыв:
C5JPG4_AJEDE:
C3ZR12_BRAFL:

Домен PF07833 (Cu_amine_oxidN1) (зелёный)

- Может сочетаться с другими доменами или быть единственным:
O83275_TREPA: SPI_BRECH:


- Может сочетаться с другими доменами и быть как N-конецвым, там и C-концевым:
O83275_TREPA: A1HPM2_9FIRM:


- Может быть концевым или окружённым другими доменами:
O83275_TREPA:
B2A2D1_NATTJ:



© Айдарханов Руслан 2008