Выберу 3 термина GO, ассоциированных с данным белком, по одному термину из каждого словаря GO. Проведу поиск описаний выбранных терминов на главном сайте консорциума Gene Ontology.
Описание терминов GO
GO ID выбранного термина
Список синонимов
Список ближайших родительских терминов GO с указанием типа связи
Список ближайших дочерних терминов GO с указанием типа связи
Соотношение между реальными и гипотетическими белками из Орангутана (по данным UniProt)
Количество в UniProt
Существование белка доказано экспериментально
(evidence at protein level)
9
Известны только соответствующие транскрипты
(evidence at transcript level)
3776
Гипотетический белок, предсказан по гомологии (inferred from homology)
521
Иные предсказанные гипотетические белки (predicted)
827
Как видно, существование очень малого числа белков доказано экспериментально - примерно 0,17%.
Больше всего белков, известных только по соответствующим транскриптам - примерно
74%.
Гипотетических белков, предсказанных по гомологии оказалось около
10%.
Иных предсказанных гипотетически белков оказалось около 16%.
Определение качества функциональной аннотации в UniProt
Определим с помощью одного запроса к SRS, сколько из реальных белков Орангутана аннотированы по всем трем словарям GO и у которых встречается хотя бы один раз хотя бы один из кодов экспериментального доказательства функции
Под реальными белками будем понимать белки, существование которых подтверждено экспериментально.
Кодов экспериментального доказательства функции существует 6:
1. Inferred from Experiment (EXP) (получено из эксперимента);
2. Inferred from Direct Assay (IDA) (получено из прямого анализа);
3. Inferred from Physical Interaction (IPI) (получено из физического взаимодействия);
4. Inferred from Mutant Phenotype (IMP) (получено из мутантного фенотипа);
5. Inferred from Genetic Interaction (IGI) (получено из генетического взаимодействия);
6. Inferred from Expression Pattern (IEP) (получено из модели экспрессии).
Запрос:
Organism name
Pongo
ProteinExistence
1: evidence at protein level
DBxref_
GO:&P:&F:&C:&(EXP:|IDA:|IPI:|IMP:|IGI:|IEP:)
Не нашлось ни одного белка.
В UniProt экспериментально полученных белков с полностью изученной функцией очень мало.
Функции большинства белков либо не до конца изучены, либо существование этих белков не доказано экспериментально.
Использование GO для работы с массовыми данными
Получение выборки последовательностей белков с заданной функцией
Функция: биосинтез липидов
Перевод названия функции на английский: lipid biosynthesis
Выбранный термин GO:
: lipid biosynthetic process
Данный термин относится к онтологии biological process
Определение главной функции в большом списке белков
Дан файл P0A6T1.txt. В этом файле – список белков, полученный в результате массового эксперимента. Список включает и заданный белок. Необходимо определить – белки с какими функциями доминируют в этом списке. Использовать для этого программу GOstat.
В поле Group IDs был подгружен выданный файл
В поле "Available GO gene-association databases & commonly used gene collections" была выбрана БД goa_uniprot.
Поле "Maximal p-value in GO output list" было установлено в значение 0.01
Значения остальных полей не изменялись.
Был получен список терминов GO в порядке возрастания P-value (чем ниже P-value, тем ниже вероятность, что частота термина GO близка к его частоте в случайной выборке терминов).
После первых 6 терминов GO c самым низким P-value наблюдается заметный скачок значения P-value (с 1.26e-09 до 1.89e-06). Это признак порогового значения. Таким образом, можно доверять 6 терминам GO:
The formation of glucose from noncarbohydrate precursors, such as pyruvate, amino acids and glycerol.
Образование глюкозы из неуглеводных предшественников, таких как пируват, аминокислоты и глицерин.
The chemical reactions and pathways resulting in the formation of monosaccharides, polyhydric alcohols containing either an aldehyde or a keto group and between three to ten or more carbon atoms
Химические реакции и пути, в результате которых образуются моносахариды, многоатомные спирты, содержащие альдегидную или кето-группу и от 3 ло 10 или более углеродных атомов.
The chemical reactions and pathways resulting in the formation of hexose, any monosaccharide with a chain of six carbon atoms in the molecule.
Химические реакции и пути, в результате которых образуются гекозы.
The chemical reactions and pathways resulting in the formation of alcohols, any of a class of compounds containing one or more hydroxyl groups attached to a saturated carbon atom.
Химические реакции и пути, в результате которых образуются спирты.
The membrane surrounding a cell that separates the cell from its external environment. It consists of a phospholipid bilayer and associated proteins.
Мембрана, окружающая клетку, отделяющая её от внешней среды. Состоит из фосфолипидного бислоя и ассоциированных белков.
1.26e-09
В выборке доминируют белки с функциями метаболизма моносахаридов, в частности глюкозы.
Среди наиболее частых функций выборки встретилась только одна из заданного белка: GO:0006094 - Образование глюкозы из неуглеводных предшественников.