Классификация функций. Коды ферментов

 
     

 

Значение заданного мне кода фермента - 3.1.3.5

Заданный мне код фермента - 3.1.3.5. Для его расшифровки я зашла на сайт IUPAC. Все ферменты в рамках данной классификации подразделяются на оксидоредуктазы, трансферазы, гидролазы, лиазы, изомеразы и лигазы (имеют идентификаторы по классам от EC1 до EC6, соответственно). Первая цифра 3 показывает, что "мой" фермент относится к гидролазам, то есть ферментам, катализирующим гидролиз различных химических связей.
Второе число в идентификаторе указывает на природу связи, на которую направлено действие данного фермента. Для гидролаз приведена следующая классификация:

Идентификатор Характер действия
EC 3.1 на сложноэфирную связь
EC 3.2 гликозилазы
EC 3.3 на диэтилэфирную связь
EC 3.4 пептидазы
EC 3.5 на C-N связи, но не пептидные
EC 3.6 на ангидриды кислот
EC 3.7 на С-С связи
EC 3.8 на галогенидные связи
EC 3.9 на P-N связи
EC 3.10 на S-N связи
EC 3.11 на C-P связи
EC 3.12 на S-S мостики
EC 3.13 на C-S связи

Из таблицы видно, что "мой" фермент воздействует на сложноэфирную связь. В группе ферментов с идентификатором EC 3.1 выделяются подгруппы. На это указывает третье число. Ферменты с EC 3.1.3 катализируют гидролиз моноэфиров фосфорной кислоты. Последнее число дает нам полный идентификатор - EC 3.1.3.5. Это идентификатор 5'-нуклеотидазы.
Данный фермент катализирует следующую реакцию:

5'-рибонуклеотид + H2O = рибонуклеозид + фосфат

Сравнение последовательности ферментов с одинаковым кодом из эволюционно далеких организмов

В задании предложено сравнить сходство последовательностей гомологичных доменов из эволюционно далеких организмов, таких как, например, кишечной палочки Escherichia coli K-12, археи Methanococcus jannaschii и человека Homo sapiens.
С помощью SRS по заданному коду фермента находим в UniProt все ферменты из этих 3х организмов. Ниже указано заполнение полей SRS при поиске.

ECNumber: 3.1.3.5
ID: *_Ecoli|*_Human|*_Metja

В БД SRS был введен следующий запрос:
([uniprot-ECNumber:3.1.3.5*] & (([uniprot-ID:*_HUMAN*] | [uniprot-ID:*_ECOLI*]) | [uniprot-ID:*_METJA*]))

Переключив вариант просмотра результата поиска на SW_InterProMatches, получаем следующую таблицу.

 
UniProt ID
UniProt AC
Имя гена
Первый домен
Второй домен
Идентификатор Pfam
Положение в последовательности
Идентификатор Pfam
Положение в последовательности
1 5NT1A_HUMAN Q9BXI3 Q3SYB9 Q5TG98 Q9BWT8 NT5C1A PF06189 81-354    
2 5NT1B_HUMAN Q96P26 Q8N9W3 Q8NA26 Q96DU5 Q96KE6 Q96M25 Q96SA3 NT5C1B PF06189 337-607    
3 5NT3_HUMAN Q9H0P0 Q6IPZ1 Q6NXS6 Q7L3G6 Q9P0P5 Q9UC42 Q9UC43 Q9UC44 Q9UC45 NT5C3 --- ---    
4 5NTC_HUMAN P49902 NT5C2 PF05761 110-493    
5 5NTD_HUMAN P21589 O75520 NT5E PF00149 29-247 PF02872 338-513
6 I5P1_HUMAN Q14642 Q14640 Q5JSF1 INPP5A PF03372 12-392    
7 INPP_HUMAN P49441 INPP1 PF00459 56-381    
8 PI5PA_HUMAN Q15735 Q32M61 Q6ZTH6 Q8N902 Q9UDT9 PIB5PA PF03372 425-728    
9 SKIP_HUMAN Q9BT40 Q15733 Q9NPJ5 Q9P2R5 SKIP PF03372 16-318    
10 SURE_ECOLI P0A840 P36664 Q2MA85 SURE PF01975 1-185    
11 SURE_METJA Q57979 SURE PF01975 1-201    
12 USHA_ECOLI P07024 P78274 Q2MBU7 USHA PF00149 34-256 PF02872 363-511
13 YFBR_ECOLI P76491 Q2MAM2 YFBR PF01966 30-142    
14 YJJG_ECOLI P0A8Y1 P33999 P76818 Q2M5U4 YJJG PF00702 3-198    
15 Q53Z63_HUMAN Q53Z63 NT5E PF00149 29-247 PF02872 338-513

Стоит отметить особенности доменной организации найденных 5'-нуклеотидаз. Во-первых, большая часть ферментов состоит из одного домена Pfam. Лишь в трех находках присутствует второй домен. И примечательно то, что во всех случаях это С-концевой домен 5'-нуклеотидазы. Что касается первого домена, то здесь надо отметить разнообразие находок. Интересен тот факт, что многие домены встречаются только у одного какого-то организма. Например, лишь у человека найдены домены с идентификаторами PF06189, PF05761, PF03372, PF00459.
Интересно сравнить домены одного белка в разных организмах. Например, SURE_ECOLI и SURE_METJA. В оба белка входит по одному домену PF01975.
Оценим сходство последовательностей аминокислот в гомологичных доменах из эволюционно далеких организмов: кишечной палочки и человека, а также кишечной палочки и археи. Нужно получить из БД последовательности этих белков и вырезать из них участки, соответствующие исследуемым гомологичным доменам. Я выполняла эту задачу через Putty, написав следующий скрипт:

extractseq sw:P21589 5NTD_HUMAN_1.fasta -regions '29-247'
extractseq sw:P21589 5NTD_HUMAN_2.fasta -regions '338-513'
extractseq sw:P07024 USHA_ECOLI_1.fasta -regions '34-256'
extractseq sw:P07024 USHA_ECOLI_2.fasta -regions '363-511' 
extractseq sw:Q53Z63 Q53Z63_HUMAN_1.fasta -regions '29-247'
extractseq sw:Q53Z63 Q53Z63_HUMAN_2.fasta -regions '338-513'
extractseq sw:P0A840 SURE_ECOLI.fasta -regions '1-185'
extractseq sw:Q57979 SURE_METJA.fasta -regions '1-201'

AC Q53Z63 не распознавался, поэтому эту последовательность пришлось отдельно получать через SRS. А потом вручную вырезать участки, соответствующие доменам.
Нужно сравнить последовательности, соответсвующие гомологичным доменам. Для начала я составила список сравниваемых доменов:

Домен PF00149
Сравниваем попарно домены из следующих последовательностей:
5NTD_HUMAN (5NTD_HUMAN_1.fasta)- USHA_ECOLI (USHA_ECOLI_1.fasta)
Q53Z63_HUMAN (Q53Z63_HUMAN_1.fasta) - USHA_ECOLI (USHA_ECOLI_1.fasta)
Домен PF02872
5NTD_HUMAN (5NTD_HUMAN_2.fasta) - USHA_ECOLI (USHA_ECOLI_2.fasta)
Q53Z63_HUMAN (Q53Z63_HUMAN_2.fasta) - USHA_ECOLI (USHA_ECOLI_2.fasta)
Домен PF01975
SURE_METJA (SURE_METJA.fasta)- SURE_ECOLI (SURE_ECOLI.fasta)

Затем написала скрипт, позволяющий с помощью программы needle сделать попарное выравнивнивание гомологичных доменов из эволюционно далеких организмов. Текст скрипта приведен ниже:

needle 5NTD_HUMAN_1.fasta USHA_ECOLI_1.fasta 5ntd_h1-usha_e1.needle -gapopen 10 -gapextend 0.5
needle Q53Z63_HUMAN_1.fasta USHA_ECOLI_1.fasta q53z63_h1-usha_e1.needle -gapopen 10 -gapextend 0.5
needle 5NTD_HUMAN_2.fasta USHA_ECOLI_2.fasta 5ntd_h2-usha_e2.needle -gapopen 10 -gapextend 0.5
needle Q53Z63_HUMAN_2.fasta USHA_ECOLI_2.fasta q53z63_h2-usha_e2.needle -gapopen 10 -gapextend 0.5
needle SURE_METJA.fasta SURE_ECOLI.fasta sure_m-sure_e.needle  -gapopen 10 -gapextend 0.5

Результаты выравниваний в таблице ниже (чтобы увидеть само выравнивание, надо нажать на процент сходства):

Сравниваемые пары 5NTD_HUMAN_1 - USHA_ECOLI_1 Q53Z63_HUMAN_1 - USHA_ECOLI_1 5NTD_HUMAN_2 - USHA_ECOLI_2 Q53Z63_HUMAN_2 - USHA_ECOLI_2 SURE_METJA - SURE_ECOLI
Идентификатор домена Pfam - - - - - -
PF00149 - 30.0% 30.0% - - -
PF02872 - - - 27.0% 19.4% -
PF01975 - - - - - 34.0%

Для доменов PF00149 и PF01975 получены очень хорошие значения identity при выравнивании. Ведь 30% и 34% - это достаточно большие числа, когда речь идет о последовательностях доменов эволюционно далеких организмов.
Мотив металлофосфоэстеразы (домен с идентификатором PF00149) часто встречается в белках, связанных с фосфорилированием, таких как сериновые/треониновые фосфатазы, ДНК-полимеразы, экзонуклеазы и другие. Фосфорилирование белков, в свою очередь, играет большую роль в регуляции клеточных функций, вызывая активацию или ингибирование ферментов, участвующих во множестве различных метаболических путей. Это характерно и для архей, и для прокариотов, и для эукариотов. Следовательно, и сходство доменов достаточно большое.
Домен PF02872 является С-концевым доменом 5'-нуклеотидазы. Этот фермент отвечает за отщепление фосфата на 5'-конце. 5'-нуклеотидаза обнаружена во многих организмах, что неудивительно, учитывая ее важное биологическое значение. То есть высокий процент сходства (27%) и в данном случае вполне объясним. А вот всего 19,4% сходства последовательностей во втором случае - это очень мало, возможно, объясняется, различиями ДНК эукариотов и прокариотов (в данном случае сравнивались домены из белков человека и кишечной палочки).
"Белок выживания" SurE (домен PF01975) имеет достаточно большое значение процента сходства, что вполне согласуется с его названием и объяснимо его предполагаемой важной ролью в развитии ответа клетки на внешние раздражители (на стресс).


©Лозиер Екатерина