Четвёртый семестр

Функции генов и их продуктов.

Часть 1. Общее знакомство со структурой GO

На главном сайте консорциума GO был проведён поиск среди терминов GO ключевого слова Pyridoxine biosynthesis из документа UniProt, соответствующего моему белку пиридоксин-фосфатоксидазе из ECOLI (Pdxh_ECOLI).

Результаты поиска:

биосинтез пиридоксина

Отношение is_a обозначает, что термин является подклассом своего родителя, но не его частным случаем. Например, биосинтез пиридоксина является подклассом биосинтеза витамина B6, а биосинтез витамина B6 является подклассом биосинтеза водорастворимых витаминов. Отношение is_a является транзитивным, то есть биосинтез пиридоксина является также подклассом биосинтеза водорастворимых витаминов.

Part_of означает, что дочерний термин является частью родительского. Употребление связи part_of более сложно. Существует четыре основных случая: в первом наличие или отсутствие данного дочернего термина для родительского или родительского для дочернего не обязательно, во втором дочерний термин обязательно будет частью родительского (например, репликационная вилка является частью хромосомы, в то время как в хромосоме может и не быть репликационных вилок), в третьем для родителя обязательно будет существовать дочерний термин (в ядре всегда есть хромосомы, но хромосомы не обязательно находятся в ядре. Последний случай -- комбинация второго и третьего: например, ядро всегда имеет как часть ядерную мембрану, а ядерная мембрана всегда является частью ядра. Обычно в GO встречается второй случай употребления part_of. Отношение part_of также является транзитивным.

Часть 2. Создание выборок белков с определенными функциями (поиск по идентификаторам GO в БД UniProt с помощью SRS)

Задача — исследовать качество аннотации белков аппарата Гольджи мыши (Mus musculus).

Photo: Courtesy of The Jackson Laboratory

Результаты поиска в UniProt, 13.09.2006 г.:

 Количество белковЗапрос
Всего60411Query "(([uniprot-Organism:Mus*] & [uniprot-Organism:musculus*]) | [uniprot-Organism:Mus musculus*]) "
С идентификаторами всех трёх онтологий GO14754Query "((([uniprot-Organism:Mus*] & [uniprot-Organism:musculus*]) | [uniprot-Organism:Mus musculus*]) & (([uniprot-DBxref_:C:*] & [uniprot-DBxref_:F:*]) & [uniprot-DBxref_:P:*])) "
В том числе из Аппарата Гольджи 316Query "(((([uniprot-Organism:Mus*] & [uniprot-Organism:musculus*]) | [uniprot-Organism:Mus musculus*]) & (([uniprot-DBxref_:C:*] & [uniprot-DBxref_:F:*]) & [uniprot-DBxref_:P:*])) & [uniprot-DBxref_:C:*Golgi*]) "
В том числе только с самыми хорошими доказательствами функции*27Query "(((([uniprot-Organism:Mus] & [uniprot-Organism:musculus]) | [uniprot-Organism:Mus musculus]) & ((([uniprot-DBxref_:C:*] & [uniprot-DBxref_:F:*]) & [uniprot-DBxref_:P:*]) & [uniprot-DBxref_:C:*Golgi*])) & (([uniprot-DBxref_:IDA.] | [uniprot-DBxref_:TAS]) ! ((((((((([uniprot-DBxref_:RCA.] | [uniprot-DBxref_:ISS.]) | [uniprot-DBxref_:IEP.]) | [uniprot-DBxref_:NAS.]) | [uniprot-DBxref_:IEA.]) | [uniprot-DBxref_:IC.]) | [uniprot-DBxref_:ND.]) | [uniprot-DBxref_:IMP.]) | [uniprot-DBxref_:IGI.]) | [uniprot-DBxref_:IPI.]))) "
В том числе только с самыми плохими доказательствами функции*84Query "(((([uniprot-Organism:Mus] & [uniprot-Organism:musculus]) | [uniprot-Organism:Mus musculus]) & ((([uniprot-DBxref_:C:*] & [uniprot-DBxref_:F:*]) & [uniprot-DBxref_:P:*]) & [uniprot-DBxref_:C:*Golgi*])) & ((((((([uniprot-DBxref_:RCA.] | [uniprot-DBxref_:ISS.]) | [uniprot-DBxref_:IEP.]) | [uniprot-DBxref_:NAS.]) | [uniprot-DBxref_:IEA.]) | [uniprot-DBxref_:IC.]) | [uniprot-DBxref_:ND.]) ! (((([uniprot-DBxref_:IMP.] | [uniprot-DBxref_:IGI.]) | [uniprot-DBxref_:IPI.]) | [uniprot-DBxref_:IDA.]) | [uniprot-DBxref_:TAS.]))) "

*Самыми хорошими доказательствами считались коды IDA и TAS, а самыми плохими – RCA, ISS, IEP, NAS, IEA, IC и ND. Расшифровка кодов: http://www.geneontology.org/GO.evidence.shtml

Можно сделать вывод, что белки из аппарата Гольджи мыши изучены достаточно хорошо, поскольку аннотировано много белков, есть уверенные доказательства функции для нескольких. В то же время для некоторых белков нет хороших доказательств, поэтому данный тип белков, вероятно, ещё далёк от полного изучения.

Часть 3. Описание функции белка используя ресурсы EcoCyc

Пиридоксин-5'-фосфат оксидаза/пиридоксамин-5'-фосфат оксидаза в EcoCyc.

Ген pdxH кодирует монофункциональный белок, являющийся флавопротеином. Он может использовать в качестве субстрата пиридоксин-5'-фосфат (PNP) или пиридоксамин-5'-фосфат (PMP), поэтому его также называют PNP/PMP оксидазой. Белок играет ключевую роль в синтезе кофермента пиридоксаль-5'-фосфата, также участвует в "реутилизационном" пути метаболизма пуринов. При окислении PNP и PMP используется молекулярный кислород, однако известен и другой путь при анаэробном росте ECOLI.

Реакция:

 O2 + pyridoxine-5'-phosphate <=> H2O2 + pyridoxal 5'-phosphate