Онтология GO (название словаря) | Количество разных ассоциированных терминов GO | Функция белка (краткое описание, близкое к тексту определения термина(ов) GO |
|
---|---|---|---|
Где? | Клеточный компонент | 1 | Цитоплазма |
Зачем, для чего? | Биологический процесс | 4 | 1. клеточный процесс аминокислотного биосинтеза 2. снижение кислотности 3. метаболический процесс 4. процесс биосинтеза ароматического семейства аминокислот |
Молекулярный механизм? | Молекулярные фукнции | 3 | 1. шикимат-5-дегидрогеназная активность - катализ реакции: shikimate + NADP+ = 5-dehydroshikimate + NADPH + H+ 2. каталитическая активность - катализ биохимической реакции при физиологических температурах 3. оксидоредуктазная активность - катализ окислительно-восстановительной реакции (ОВР) |
Специфичность? | Молекулярные фукнции | 3 | 1. НАДФ или НАДФН связывающая активность - селективное или нековалентное взаимодействие с НАДФ(Н) (кофермент участвующий во многих реакциях ОВ и биоситеза) 2.белок связывающая активность - селективное или нековалентное взаимодействие с любым протеином или белком (комплексами) 3. связывание - любое взаимодействие с молекулой, имеющей один и более специфических мест связывания с другой молекулой. |
GO ID выбранного термина | Список синонимов | Список ближайших родительских терминов GO с указанием типа связи | Список ближайших дочерних терминов GO с указанием типа связи | ||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
GO:0005737 |
- |
|
|
||||||||||||||||||||||||||||||||||
GO:0004764 |
|
|
- | ||||||||||||||||||||||||||||||||||
GO:0008652 |
amino acid biosynthetic processcellular amino acid anabolism cellular amino acid biosynthesicellular amino acid formationcellular amino acid synthesis |
|
|
Количество в UniProt | Количество в UniRef100 | |
---|---|---|
Существование белка доказано экспериментально | 1351 | 1361 |
Известны только соответствующие транскрипты | 11846 | 11663 |
Гипотетический белок, предсказан по гомологии | 882 | 952 |
Иные предсказанные гипотетические белки | 1514 | 1353 |
Большинство белков исследовано на соответсвующих транскриптах, следующее большинство доказано экспериментально.
Радует, что нет ни одного белка, существование которого недостоверно и то, что совсем немного из существующих в БД белков основаны на предсказаниях.
Данные в UniProt и UniRef100 отличаются, но не сильно, что возможно объяснить повторением белков.
NCBI_TaxID | 9913 |
ProteinExistence | 1: evidence at protein level|2: evidence at transcript |
DBxref_ | GO:&P:&F:&C:&(EXP:|IDA:|IPI:|IMP:|IGI:|IEP:) |
На этих условиях наход?тся 121 запись. А в UniProt/Swiss-prot всего 1057 белков, существование которых доказано экспериментально. Это говорит о том, что только 121 белок полностью проаннотирован и записи его достоверны. Что составляет только 11% от ??????? в UniProt/Swiss-prot. ?? ???? ????????? ????? ??????? ?????, ??? ????? ???? ????????? ????????? ????????????????? ??????.
русское название функции - перевод его на английский - выбранный GO ID - словарь, к которому он относится - запрос к SRS - количество находок - находки в виде файла с последовательностями в формате FASTA
В отчете приведите самые перепредставленные в выборке термины GO, укажите к каким онтологиям они относятся. В кратком резюме поясните, белки с какими функциями доминируют в выборке.
Для выполнения задания я взял? файл P15770.txt со списком AC различных белков, включающих AROE_Ecoli.
В поле Group IDs был подгружен выданный файл
На GOstat был введёны следующие параметры:
Available GO gene-association databases & commonly used gene collections: goa_uniprot;
Maximal p-value in GO output list: 0.01.
Остальные параметры не менялись.
Был получен список терминов GO в порядке возрастания P-value (чем ниже P-value, тем ниже вероятность, что частота термина GO близка к его частоте в случайной выборке терминов):
|
Из этой таблицы видны резкие скачки между 1-2-3 строчками. Это означает, что термины GO:0050661 и GO:0005515 являются наиболее достоверными. Они имеют следующие параметры: - GO:0050661 - molecular function - NADP or NADPH binding - Селективные и нековалентыне взаимодействия с НАДФ, который явяется коферментом в множестве ОВ и биосинтетических реакциях. - GO:0005515 - molecular function - protein binding - селективное или нековалентное взаимодействия с каким-либо белком или белковым комплексом (причём комплекс может включать не белковые компоненты). |
Понятно, что доминирует функция связывания. Также можно предположить, что связывание для последующей реакции окисления или биосинтеза белков.
© 2010 Borisova Marina