1. Исследование доменной структуры конкретного белка

1. Доменная структура белка MAA_Ecoli по данным PFam


Cхема из Pfam:
Пояснения к схеме
Pfam AC Pfam ID Полное название семейства домена Положение в последовательности белка MAA_Ecoli Клан
1. PF12464 Mac Ацетилтрансфераза мальтозы; ацетилирует мальтозу в цитоплазме, используя в качестве донора ацетила ацетил-КоА. 5 - 59 Не принадлежит никакому клану
2. PF00132 Hexapep Гексапептид в бактериальных трансферазах; состоит из трех повторов, участвующих в образовании бета-спирали. 93 - 110 Не принадлежит никакому клану
3. PF00132 Hexapep Бактериальная трансфераза гексапептидов; состоит из трех повторов, которые представляют собой левозакрученные параллельные бета-спирали. 135 - 152 Не принадлежит никакому клану

2. Выравнивание-затравка (seed) для N-концевого домена белка MAA_ECOLI

Выравнивание для домена Mac в формате msf: PF12464_seed.msf

3. Сравнение описания доменной структуры в Pfam с описаниями в других БД

Найдем по идентификатору UniProt описание всех подписей, интегрированных в InterPro.
InterPro ID имеют IPR001451, IPR011004 и IPR018357, еще 6 подписей в InterPro не интегрированы.
Наиболее отличается от подписей PFAM подпись Trimer_LpxA_like, охватывающая весь белок кроме первой аминокислоты, в то время как все остальные подписи содержат лишь некоторые его участки.
Также этот домен интересен тем, что он содержит тандемные повторы гексапептидов, присущие доменам Hexapep.
Его InterPro ID: IPR011004, база данных: SuperFamily.
Изображение:

4. Сопоставление доменной структуры с 3D структурой заданного белка

PDB ID: 1OCX.

Зеленым цветом обозначены домены Mac, соответствующие отдельным компактным частям структуры со стопроцентным совпадением.
Крансым цветом представлены домены Hexapep, представляющие собой участки цепей (бета-спирали), не выделяющиеся в отдельные структурные домены.
Фиолетовые и черные шарики - молекулы триметил свинца.

2. Исследование эволюции отдельных доменов

1. Встречаемость доменов заданного белка в разных организмах

Белки с доменом Mac встречаются в организмах 296 видов.
Белки с доменом Hexapep встречаются в организмах 899 видов.

Представленность домена PF12464 (Mac) в организмах разных видов

Таксон
Количество белков с доменом PF12464.
Эукариоты Зеленые растения 3
Грибы 109
Животные 17
Остальные эукариоты -
Бактерии 849
Археи 9

Данный домен широко распространен, особенно среди бактерий и грибов, что коррелирует с важностью его функции.

2. Встречаемость доменов заданного белка в разных белках Escherichia coli K12

Представленность изучаемых доменов в белках Escherichia coli (strain K12)

PFAM ID Количество белков в Escherichia coli (strain K12)
1. Mac 3
2. Hexapep 5

Белки THGA_ECOLI и B8LFD8_ECOLI имеют похожую доменную организацию с MAA_ECOLI, различие заключается в том, что у THGA и B8LFD8 присутствует один домен Hexapep, а у MAA их два. Расположение доменов совпадает.
Белок LPXD_ECOLI имеет домены Lpxd (на месте домена Mac у MAA_ECOLI) и Hexapep, белок LPXA_ECOLI имеет только домен Hexapep.
Можно сделать вывод, что частота встречаемости домена Hexapep в белках E.coli немного больше встречаемости белка Mac.

3. Примеры разных доменных перестроек

Домен Mac (PF12464) чаще всего встречается в совокупности с доменом Hexapep (PF00132), причем домен Hexapep может быть один:
NODL_RHILV
либо их можен быть несколько, до четырех:
Q6CRI4_KLULA
также домен Mac может располагаться на С-конце последовательности:
Q5BDH8_EMENI

Домен Hexapep чаще всего является единственным доменом белка и представлен в единственном числе:
CAT4_AGRT5
может встречаться в совокупности со многими доменами:
A3ILX5_9CHRO
B6KB36_TOXGO
(стоит обратить внимание на NTP_transferase, в первом случае он представлен одной длинной последовательностью, "обрезанной" с обоих концов, во втором случае - двумя короткими последовательностями, причем одна из низ "обрезана" только с одного конца).
Назад