1. Объясните, что значит код заданного фермента
На сайте БД UniProt была найдена запись заданного белка AMO_ECOLI. В ней указан код фермента для данного белка EС=1.4.3.21.
Пункт | Значение | |
1 | Oxidoreductases | Оксидоредуктазы (ферменты, катализирующие окислительно-восстановительные реакции) |
1.4 | Acting on the CH-NH2 group of donors | Действует на CH-NH2 группу доноров протонов |
1.4.3 | With oxygen as acceptor | В качестве акцептора выступает кислород |
1.4.3.21 | Primary-amine oxidase | Оксидаза первичных аминов |
Катализируемая реакция: RCH2NH2 + H2O + O2 = RCHO + NH3 + H2O2
Изображение реакции было найдено в БД MetaCyc:
2. Определите, в каких метаболических путях участвует изучаемый фермент
В документе UniProt с описанием заданного белка AMO_ECOLI я нашёл имя локуса его гена: b1386. По нему в БД KEGG была найдена запись с этим геном. В таблице представлено описание метаболических путей в этой записи:
Идентификатор KEGG | Название | |
eco00260 | Glycine, serine and threonine metabolism | Метаболизм глицина, серина и треонина |
eco00350 | Tyrosine metabolism | Метаболизм тирозина |
eco00360 | Phenylalanine metabolism | Метаболизм фенилаланина |
eco00410 | beta-Alanine metabolism | Метаболизм бета-аланина |
eco01100 | Metabolic pathways | Метаболические пути |
Изображение первого пути: eco00260.png
3. Найдите в KEGG структурные формулы заданных соединений
На странице оглавления KEGG по ссылке была выбрана база данных химических соединений (KEGG LIGAND). Был произведён поиск заданных соединений L-глутамата и L-аргинина, но на английском языке, то есть L-glutamate и L-arginine.
Соединение | L-глутамат | L-аргинин |
---|---|---|
Английское название | L-glutamate | L-arginine |
Идентификатор | C00025 | C00062 |
Структурная формула |
4. Найдите метаболический путь от одного заданного вещества к другому
Для поиска метаболических путей реактантов, а также ферментов в БД KEGG Pathway используем инструмент "Color objects in pathways". В поле запроса ввели найденные в упр.3 идентификаторы соединений.
Имеется множество различных путей как от L-глутамата к L-аргинину, так и наоборот, причём для обоих направлений кратчайшие пути состоят из 4 реакций.
Выбранная цепочка ферментативных реакций:
путь: метаболизм аргинина и пролина,
цепочка: L-глутамат → L-аргинин.
Первое соединение цепочки раскрасили красным, а последнее - зеленым, промежуточные соединения (кратчайший путь) - желтым.
Раскрашенная карта пути: ko00330.png
5. Сравните метаболические пути у разных организмов
Было определено, возможна ли выбранная в упр.4 цепочка ферментативных реакций у организмов, перечисленных в таблице ниже. Для этого общая карта (Reference map) была переведена в режим, соответствующий выбранному организму.
Организм | Возможна ли цепочка реакций (да/нет/неизвестно) |
Обоснование |
Escherichia coli K-12 MG1655 | нет | неизвестен ген фермента, катализирующего 4-ую стадию (EC 3.5.3.6 либо 1.14.13.39) |
Archaeoglobus fulgidus | нет | неизвестны гены ни одной из стадий |
Arabidopsis thaliana | нет | неизвестен ген фермента, катализирующего 2-ую стадию (EC 2.7.2.2 либо 6.3.4.16) |
Homo sapiens | да (карта) |
присутствуют все ферменты, необходимые для осуществления цепочки реакций |
Видимо, такая цепочка реакция осуществима только у более высоко организованных организмов, потому что среди выбранных организмов она возможна только у человека.
6. Сравните ферменты из далеких организмов
С помощью одного запроса к SRS, были найдены ферменты с заданным ЕС кодом (2.7.4.9) у человека и археи Archaeoglobus fulgidus. С помощью отдельного запроса по организму было определено окончание имени белков для археи: _ARCFU. Запрос для заданного EC:
(([uniprot-ID:*_ARCFU] | [uniprot-ID:*_HUMAN]) & [uniprot-ECNumber:2.7.4.9])Было найдено по одному белку для каждого организма: KTHY_ARCFU (для археи) и KTHY_HUMAN (для человека).
При поиске была снята опция маски (Use wildcards). При её использовании в конец каждого значения запроса добавляется звёздочка, означающая любое количество символов. В данном случае её использование могло стать причиной выдачи ненужных записей, например записей с EC 2.7.4.91, если такие существуют.
Для сравнения доменной организации (по PFAM) найденных белков был использован режим просмотра находок SW_InterProMatches. Оба белка имеют один и тот же единственный домен PF02223.
***
С помощью сервера Pfam были получены последовательности доменов для каждого белка: domains.fasta. Затем эти последовательности были выравненны с помощью программы needle: domains.needle.
Последовательности идентичны на 26.7%.
С помощью инструментов KEGG для человеческого белка искался лучший
ортолог из архей, а для архейного –- лучший ортолог у эукариот.
Порядок действий в БД KEGG: на страничке гена переход по кнопке "Ortholog",
а в открывшемся окне выбор опции Best-best
(bidirectional best hit), указание нужной группы организмов и переход по кнопке "GO".
1. Для человеческого белка KTHY_HUMAN в БД UniProt не был указан локус гена,
поэтому в БД KEGG он был найден по имени гена DTYMK.
Лучший ортолог среди архей - ген Nmar_1707 из организма N.maritimus. Длина выравнивания
(поле overlap): 182; идентичность: 33%.
2. Для белка археи KTHY_ARCFU в БД UniProt был указан локус гена AF_0061,
но в БД KEGG по запросу такого гена нужной записи не выводилось. Ген нашёлся по запросу AF0061.
Лучший ортолог среди эукариот - ген TVAG_315260 из организма T.vaginalis. Длина выравнивания:
195; идентичность: 31.3%.
Стоит сказать, что белки KTHY_ARCFU и KTHY_HUMAN - ключевые в данном упражнении - принадлежат к семейству тимидилат киназ и катализируют реакцию: ATP + dTMP = ADP + dTDP (по данным UniProt). Это реакция метаболизма нуклеотидов, поэтому, вероятно, ортологи этих белков должны быть во всех организмах. Указанные белки имеют один и тот же домен, тем не менее % идентичности последовательностей у ортологов из далёких организмов невысок.