Еще раз про эволюцию белков. Домены. БД Pfam, InterPro.

I. Исследование доменной структуры конкретного белка

1. Опиcание доменной структуры белка по данным Pfam.


Доменная структура белка BIOB_ECOLI по данным Pfam

Cхема из Pfam:
Пояснения к схеме
Pfam AC Pfam ID Полное название семейства домена Положение в последовательности белка хххх_Ecoli Клан
1. PF04055 Radical_SAM Домен Radical_SAM катализирует различные реакции, в том числе: нестандартное метилирование и изомеризацию, внедрение серы, кольцеобразование и радикальное белковое формирование.
(начало) 47 - (конец) 209 ---
2. PF06968 BATS Домен, связанный с синтезом биотина и тиамина.
(Biotin and Thiamin Synthesis associated domain - BATS). Биотин синтетаза (BIOB_ECOLI) катализирует последний этап синтеза биотина.
(начало) 220 - (конец) 321 ---

2.2 Выравнивание-затравка (seed) для N-концевого домена заданного белка в формате msf.

Файл с выравниванием для домена Radical_SAM в формате msf - скачать.

2.2 Выравнивание-затравка (seed) для С-концевого домена заданного белка в формате msf.

Файл с выравниванием для домена BATS в формате msf - скачать.
Так же можно его рассмотреть по этой ссылке.

3. Сравнение описания доменной структуры в Pfam с описанием в других БД.

По белку BIOB_ECOLI в InterPro было надено шесть записей, для которых существует InterPro ID. Две из них принадлежат БД Pfam (так как Pfam находит 2 домена), две записи SMART, TIGRFAMs, Gene3D.
Для рассмотрения я выбрала одну из записей банка SMART (Simple Modular Architecture Research Tool), а именно Elp3, у которой InterPro ID IPR006638 и SMART AC SM00729. C одной стороны SMART без проблем узнал C-концевой домен BATS, но вместо домена Radical_SAM SMART предложил совершенно другой вариант, у которого, более того, отличаются функции. Если функции Elp3 в основном опряделяются как синтез биотина, что, кстати, дублируется доменом BATS, то у Radical_SAM они сильно отличаются (они перечислены в таблице выше). Картинка для домена Elp3 представленна ниже.

Сравнение доменной структуры с 3D структурой заданного белка.

На первом рисунке представлена пространственная cтруктура белка BIOB_ECOLI, а на втором только его A цепь.
1. 2.
Зеленым помечен домен Radical_SAM, а розовым - BATS. А цепь белка целиком предсталена двумя доменами, в свою очередь, В цепь дублирует А цепь. Другими словами, весь белок состоит из повторяющихся доменов, не считая пары альфа-спиралей, которые являются связующим звеном между двумя цепями. Внутри каждого клубка сплетенных между собой доменов находятся четыре различных лиганда, в том числе сульфоорганические и металлорганические соединения.

Каждый из доменов плохо выражен на пространственной структуре данного белка, и их трудно выделить в отдельные структурные домены, даже наоборот - они плотно переплетенны друг с другом, так что без дополнительного анализа соответствия последовательности белка и его отдельных пространственных структур было бы трудно сказать что-то определенное.

II. Исследование эволюции отдельных доменов

1. Частота встречаемости доменов BATS и Radical_SAM в различных организмах.

Домен BATS встречается в 689 видах, а Radical_SAM в 1180, что в 1,7 раз больше встречаемости BATS. Для заполнения задания я выбрала домен BATS.

Представленность домена BATS в организмах разных видов

Таксон
Количество белков с доменом BATS.
Эукариоты Зеленые растения 6
Грибы 54
Животные 1
Остальные эукариоты 21
Бактерии 1637
Археи 20
Наибольшая встречемость домена BATS замечена в царстве Бактерии. Возможно, это связано с его прямой функцией, то есть синтезом витамина В7 или биотина.

2. Встречаемость доменов в белках Escherichia coli K12.

Представленность изучаемых доменов в белках Escherichia coli (strain K12)

PFAM ID Количество белков в Escherichia coli (strain K12)
1. BATS PF06968 Найдено два белка, содержащих домен BATS: THIH_ECOLI и BIOB_ECOLI.
Количество таксонов для Radical_SAM настолько велико, что соответствующее дерево не отображается на сайте.

Судя по распространнености домена BATS среди различных видов бактерий, наличие в одном примитивном организме, двух разных белков с одинаковым доменов - это довольно много.

3. Примеры разных доменных перестроек.

Всего для домена Radical_SAM был выдано 108 различных вариантов перестроек. Из них я выбрала наиболее меня заинтересовавшие:
1) белок B7RX43_9GAMM, длиной в 1060 АО -

2) белок FBIC_STRCO , длиной в 867 АО -

3) белок O13382_EMENI, длиной в 694 AO -

4) белок B8I976_CLOCE, длиной в 2142

Для BATS было выдано только пять различных реорганиций положения доменa. Я выбрала три варианта, которые сильнее всего отличаются от доменной организации в выданном мне белке, хотя при таком небольшом выборе нельзя найти что-то очень оригинальное.

1) белок BIOB_BACFR длиной 748 AO -

2) белок C1DAX1_LARHH длиной 883 AO -

3) белок B2VRN7_PYRTR длиной 767 AO -

Для своего старого белка YODA_ECOLI мне было выдано четыре различных варианта расположения домена YodA в последовательности разных белков. Его основная функция - связывание с ионами кадмия и снижение его токсического эффекта на организм. Сам домен в в белке YODA_ECOLI выглядит так
А для других белков:

1) белок ADCA_STRPN длиной в 501 AO -

2) белок B6FTNO_9CLOTдлиной в 599 AO -