Функции, продолжение.
Ферменты и метаболические пути

1. Объясните, что значит код заданного фермента

На сайте БД UniProt была найдена запись заданного белка AMO_ECOLI. В ней указан код фермента для данного белка EС=1.4.3.21.

ПунктЗначение
1OxidoreductasesОксидоредуктазы (ферменты, катализирующие окислительно-восстановительные реакции)
1.4Acting on the CH-NH2 group of donorsДействует на CH-NH2 группу доноров протонов
1.4.3With oxygen as acceptorВ качестве акцептора выступает кислород
1.4.3.21Primary-amine oxidaseОксидаза первичных аминов

Катализируемая реакция: RCH2NH2 + H2O + O2 = RCHO + NH3 + H2O2

Изображение реакции было найдено в БД MetaCyc:

2. Определите, в каких метаболических путях участвует изучаемый фермент

В документе UniProt с описанием заданного белка AMO_ECOLI я нашёл имя локуса его гена: b1386. По нему в БД KEGG была найдена запись с этим геном. В таблице представлено описание метаболических путей в этой записи:

Идентификатор
KEGG
Название
eco00260Glycine, serine and threonine metabolismМетаболизм глицина, серина и треонина
eco00350Tyrosine metabolismМетаболизм тирозина
eco00360Phenylalanine metabolismМетаболизм фенилаланина
eco00410beta-Alanine metabolismМетаболизм бета-аланина
eco01100Metabolic pathwaysМетаболические пути

Изображение первого пути: eco00260.png

3. Найдите в KEGG структурные формулы заданных соединений

На странице оглавления KEGG по ссылке была выбрана база данных химических соединений (KEGG LIGAND). Был произведён поиск заданных соединений L-глутамата и L-аргинина, но на английском языке, то есть L-glutamate и L-arginine.

СоединениеL-глутаматL-аргинин
Английское названиеL-glutamateL-arginine
ИдентификаторC00025C00062
Структурная формула

4. Найдите метаболический путь от одного заданного вещества к другому

Для поиска метаболических путей реактантов, а также ферментов в БД KEGG Pathway используем инструмент "Color objects in pathways". В поле запроса ввели найденные в упр.3 идентификаторы соединений.

Имеется множество различных путей как от L-глутамата к L-аргинину, так и наоборот, причём для обоих направлений кратчайшие пути состоят из 4 реакций.

Выбранная цепочка ферментативных реакций:
путь: метаболизм аргинина и пролина,
цепочка: L-глутамат → L-аргинин.

Первое соединение цепочки раскрасили красным, а последнее - зеленым, промежуточные соединения (кратчайший путь) - желтым.

Раскрашенная карта пути: ko00330.png

5. Сравните метаболические пути у разных организмов

Было определено, возможна ли выбранная в упр.4 цепочка ферментативных реакций у организмов, перечисленных в таблице ниже. Для этого общая карта (Reference map) была переведена в режим, соответствующий выбранному организму.

Возможность выбранной цепочки ферментативных реакций в разных организмах с известными полными геномами.
Организм Возможна ли цепочка реакций
(да/нет/неизвестно)
Обоснование
Escherichia coli K-12 MG1655 нет неизвестен ген фермента, катализирующего 4-ую стадию (EC 3.5.3.6 либо 1.14.13.39)
Archaeoglobus fulgidus нет неизвестны гены ни одной из стадий
Arabidopsis thaliana нет неизвестен ген фермента, катализирующего 2-ую стадию (EC 2.7.2.2 либо 6.3.4.16)
Homo sapiens да
(карта)
присутствуют все ферменты, необходимые для осуществления цепочки реакций

Видимо, такая цепочка реакция осуществима только у более высоко организованных организмов, потому что среди выбранных организмов она возможна только у человека.

6. Сравните ферменты из далеких организмов

С помощью одного запроса к SRS, были найдены ферменты с заданным ЕС кодом (2.7.4.9) у человека и археи Archaeoglobus fulgidus. С помощью отдельного запроса по организму было определено окончание имени белков для археи: _ARCFU. Запрос для заданного EC:

(([uniprot-ID:*_ARCFU] | [uniprot-ID:*_HUMAN]) &  [uniprot-ECNumber:2.7.4.9])
 
Было найдено по одному белку для каждого организма: KTHY_ARCFU (для археи) и KTHY_HUMAN (для человека).

При поиске была снята опция маски (Use wildcards). При её использовании в конец каждого значения запроса добавляется звёздочка, означающая любое количество символов. В данном случае её использование могло стать причиной выдачи ненужных записей, например записей с EC 2.7.4.91, если такие существуют.


Для сравнения доменной организации (по PFAM) найденных белков был использован режим просмотра находок SW_InterProMatches. Оба белка имеют один и тот же единственный домен PF02223.


***

С помощью сервера Pfam были получены последовательности доменов для каждого белка: domains.fasta. Затем эти последовательности были выравненны с помощью программы needle: domains.needle.

Последовательности идентичны на 26.7%.


С помощью инструментов KEGG для человеческого белка искался лучший ортолог из архей, а для архейного –- лучший ортолог у эукариот.
Порядок действий в БД KEGG: на страничке гена переход по кнопке "Ortholog", а в открывшемся окне выбор опции Best-best (bidirectional best hit), указание нужной группы организмов и переход по кнопке "GO".

1. Для человеческого белка KTHY_HUMAN в БД UniProt не был указан локус гена, поэтому в БД KEGG он был найден по имени гена DTYMK.
Лучший ортолог среди архей - ген Nmar_1707 из организма N.maritimus. Длина выравнивания (поле overlap): 182; идентичность: 33%.

2. Для белка археи KTHY_ARCFU в БД UniProt был указан локус гена AF_0061, но в БД KEGG по запросу такого гена нужной записи не выводилось. Ген нашёлся по запросу AF0061.
Лучший ортолог среди эукариот - ген TVAG_315260 из организма T.vaginalis. Длина выравнивания: 195; идентичность: 31.3%.

Стоит сказать, что белки KTHY_ARCFU и KTHY_HUMAN - ключевые в данном упражнении - принадлежат к семейству тимидилат киназ и катализируют реакцию: ATP + dTMP = ADP + dTDP (по данным UniProt). Это реакция метаболизма нуклеотидов, поэтому, вероятно, ортологи этих белков должны быть во всех организмах. Указанные белки имеют один и тот же домен, тем не менее % идентичности последовательностей у ортологов из далёких организмов невысок.



© Айдарханов Руслан 2008