Функции. Онтологии базы данных GO.

I. Знакомство с терминологией GO

1. Описание функции белка с помощью аннотации Gene Ontology.


Описание функции белка Biob_Ecoli в соответствии с GO-аннотацией

  Онтология GO (название словаря) Количество разных ассоциированных терминов GO Функция белка
Зачем, для чего? Biological process 3 Biotin biosynthetic process - биосинтез биотина: химические реакции и каскады, приводящие к образованию биотина.
Молекулярный механизм? Molecular function 8 metal ion binding - связывание и взаимодействие с каким-либо ионом металла.
Специфичность? Molecular function 8 2 iron, 2 sulfur cluster binding - нековалентное селективное взаимодействие двух атомов железа и двух атомов серы, при этом серы расположена между атомами металла и является связующим звеном между ними. Аналогичная ситуация наблюдается для четырех атомов железа и четырех атомов серы.

2. Описание термина GO.

Описание терминов GO

GO ID выбранного термина Список синонимов Список ближайших родительских терминов GO с указанием типа связи Список ближайших дочерних терминов GO с указанием типа связи
GO:0009102 - biotin biosynthetic process biotin anabolism biotin biosynthesis biotin formation biotin synthesis vitamin B7 biosynthesis vitamin B7 biosynthetic process vitamin H biosynthesis vitamin H biosynthetic process GO:0042364 : water-soluble vitamin biosynthetic process (синтез гидрофильных витаминов); связь is_a
GO:0006768 : biotin metabolic process (группа реакций, в которых непосредственно учасивует молекула биотина); связь is_a
GO:0019351 : dethiobiotin biosynthetic process (синтез детиобиотина, предшественника биотина); связь is_part_of
GO:0051536 - iron-sulfur cluster binding (железо-серный связывающий кластер) Fe/S binding
iron sulfur cluster binding
iron sulphur cluster binding
iron-sulphur cluster binding
GO:0051540 : metal cluster binding (металлосвязывающий кластер); связь is_a GO:0051537 : 2 iron, 2 sulfur cluster binding; связь is_a
GO:0046872 : metal ion binding (связывание с ионом металла) heavy metal binding
metal binding
GO:0033265 : choline binding (специфичное звязывание с холином); связь is_a GO:0031420 : alkali metal ion binding (специфичное и нековалентное связывание с ионами щелочных металлов)
Изображение графа родительских, дочерних терминов и терминов-сибсов для GO:0009102 (биосинтез биотина) здесь.
Изображение графа родительских, дочерних терминов и терминов-сибсов для GO:0051536 (железо-серный связывающий кластер) здесь.
Изображение графа родительских, дочерних терминов и терминов-сибсов для GO:0046872 (связывание с ионом металла) здесь.

II. Оценка качества функциональной аннотации белков в UniProt

1. Определение числа реальных и гипотетических белков из таксона Triticum (Пшеница).

Заданный таксон:
Латинское название: Triticum
Английское название: Цheat
Русское название: Пшеница
Ранг: род
Taxonomy ID: 4564

Соотношение между реальными и гипотетическими белками из Triticum (по данным UniProt)

  Количество в UniProt
Существование белка доказано экспериментально 155
Известны только соответствующие транскрипты 2388
Гипотетический белок, предсказан по гомологии 595
Иные предсказанные гипотетические белки 2755
Для Пшеницы в сравнении с известными транскриптами эксперементально доказана малая часть белков.

III. Использование GO для работы с массовыми данными

1. Получение выборки последовательностей белков с заданной функцией

Заданная мне функция - транскрипция или transcription - синтез РНК на матрице ДНК; для нее был выбран индетефикатор GO:0006412. По запросу ([uniprot-NCBI_TaxId:4564*] & [uniprot-DBxref_:GO:0006412*]) было найдено 138 находок. Файл в формате FASTA.

2. пределение главной функции в большом списке белков

Лучшие находки.
GO:0009102 - biotin biosynthesis; синтез биотина; biological process; P-Value 1.06e-12
GO:0006768 - biotin metabolism; метаболизм биотина; biological process; P-Value 1.06e-12
GO:0044272 - sulfur biosynthesis; биологические процессы, приводящие к синтезу соединений, содержащих серу; biological process; P-Value 2.39e-08
GO:0006790 - sulfur metabolism; биологические процессы, в которые вовлечены вещества, содержащие серу; biological process; P-Value 2.51e-07
GO:0032787 - monocarboxylate metabolic process; биологические процессы, в которые вовлечены монокарбоновые кислоты; biological process; P-Value 1.54e-06
GO:0042364 - water-soluble vitamin anabolism; формирование функциональных гидрофильных групп в витаминах; biological process; P-Value 1.06e-05
GO:0009110 - vitamin anabolism; синтез витаминов; biological process; P-Value 1.3e-05
GO:0006767 - water-soluble vitamin metabolism; формирование функциональных гидрофильных групп в витаминах; biological process; P-Value 2.67e-05
GO:0006766 - vitamin metabolism; метаболизм витаминовж biological process; P-Value 3.08e-05
GO:0005886 - bacterial inner membrane; мембрана клетки, состоящая из билипидного слоя и соответствующих белков; cellular component; P-Value 3.08e-05

Это список терминов, под которые попали белки из выданного мне списка белков . Белок BIOB_ECOLI аннотирован под первыми девятью терминами, кроме последнего, потому что этот белок участвует в биологических процессах, связанных с синтезом витамионов их составляющих и не является компонентом клеточной мембраны.