1. Опиcание доменной структуры белка по данным Pfam.
Доменная структура белка BIOB_ECOLI по данным Pfam
Cхема из Pfam:
Пояснения к схеме № Pfam AC Pfam ID Полное название семейства домена Положение в последовательности белка хххх_Ecoli Клан 1. PF04055 Radical_SAM Домен Radical_SAM катализирует различные реакции, в том числе: нестандартное метилирование и изомеризацию, внедрение серы, кольцеобразование и радикальное белковое формирование.
(начало) 47 - (конец) 209 --- 2. PF06968 BATS Домен, связанный с синтезом биотина и тиамина.
(Biotin and Thiamin Synthesis associated domain - BATS). Биотин синтетаза (BIOB_ECOLI) катализирует последний этап синтеза биотина.(начало) 220 - (конец) 321 ---
2.2 Выравнивание-затравка (seed) для N-концевого домена заданного белка в формате msf.
Файл с выравниванием для домена Radical_SAM в формате msf - скачать.
2.2 Выравнивание-затравка (seed) для С-концевого домена заданного белка в формате msf.
Файл с выравниванием для домена BATS в формате msf - скачать.
Так же можно его рассмотреть по этой ссылке.3. Сравнение описания доменной структуры в Pfam с описанием в других БД.
По белку BIOB_ECOLI в InterPro было надено шесть записей, для которых существует InterPro ID. Две из них принадлежат БД Pfam (так как Pfam находит 2 домена), две записи SMART, TIGRFAMs, Gene3D.
Для рассмотрения я выбрала одну из записей банка SMART (Simple Modular Architecture Research Tool), а именно Elp3, у которой InterPro ID IPR006638 и SMART AC SM00729. C одной стороны SMART без проблем узнал C-концевой домен BATS, но вместо домена Radical_SAM SMART предложил совершенно другой вариант, у которого, более того, отличаются функции. Если функции Elp3 в основном опряделяются как синтез биотина, что, кстати, дублируется доменом BATS, то у Radical_SAM они сильно отличаются (они перечислены в таблице выше). Картинка для домена Elp3 представленна ниже.
Сравнение доменной структуры с 3D структурой заданного белка.
На первом рисунке представлена пространственная cтруктура белка BIOB_ECOLI, а на втором только его A цепь.
1. 2.
Зеленым помечен домен Radical_SAM, а розовым - BATS. А цепь белка целиком предсталена двумя доменами, в свою очередь, В цепь дублирует А цепь. Другими словами, весь белок состоит из повторяющихся доменов, не считая пары альфа-спиралей, которые являются связующим звеном между двумя цепями. Внутри каждого клубка сплетенных между собой доменов находятся четыре различных лиганда, в том числе сульфоорганические и металлорганические соединения.Каждый из доменов плохо выражен на пространственной структуре данного белка, и их трудно выделить в отдельные структурные домены, даже наоборот - они плотно переплетенны друг с другом, так что без дополнительного анализа соответствия последовательности белка и его отдельных пространственных структур было бы трудно сказать что-то определенное.
II. Исследование эволюции отдельных доменов
1. Частота встречаемости доменов BATS и Radical_SAM в различных организмах.
Домен BATS встречается в 689 видах, а Radical_SAM в 1180, что в 1,7 раз больше встречаемости BATS. Для заполнения задания я выбрала домен BATS.
Наибольшая встречемость домена BATS замечена в царстве Бактерии. Возможно, это связано с его прямой функцией, то есть синтезом витамина В7 или биотина.
Представленность домена BATS в организмах разных видов
Таксон Количество белков с доменом BATS.Эукариоты Зеленые растения 6 Грибы 54 Животные 1 Остальные эукариоты 21 Бактерии 1637 Археи 20 2. Встречаемость доменов в белках Escherichia coli K12.
Количество таксонов для Radical_SAM настолько велико, что соответствующее дерево не отображается на сайте.
Представленность изучаемых доменов в белках Escherichia coli (strain K12)
№ PFAM ID Количество белков в Escherichia coli (strain K12) 1. BATS PF06968 Найдено два белка, содержащих домен BATS: THIH_ECOLI и BIOB_ECOLI. Судя по распространнености домена BATS среди различных видов бактерий, наличие в одном примитивном организме, двух разных белков с одинаковым доменов - это довольно много.
3. Примеры разных доменных перестроек.
Всего для домена Radical_SAM был выдано 108 различных вариантов перестроек. Из них я выбрала наиболее меня заинтересовавшие:
1) белок B7RX43_9GAMM, длиной в 1060 АО -
2) белок FBIC_STRCO , длиной в 867 АО -
3) белок O13382_EMENI, длиной в 694 AO -
4) белок B8I976_CLOCE, длиной в 2142
Для BATS было выдано только пять различных реорганиций положения доменa. Я выбрала три варианта, которые сильнее всего отличаются от доменной организации в выданном мне белке, хотя при таком небольшом выборе нельзя найти что-то очень оригинальное.
1) белок BIOB_BACFR длиной 748 AO -
2) белок C1DAX1_LARHH длиной 883 AO -
3) белок B2VRN7_PYRTR длиной 767 AO -
Для своего старого белка YODA_ECOLI мне было выдано четыре различных варианта расположения домена YodA в последовательности разных белков. Его основная функция - связывание с ионами кадмия и снижение его токсического эффекта на организм. Сам домен в в белке YODA_ECOLI выглядит так
А для других белков:
1) белок ADCA_STRPN длиной в 501 AO -
2) белок B6FTNO_9CLOTдлиной в 599 AO -