На главную страницу

Качество аннотации функции
ядерных белков Homo sapiens

II. Задача: исследовать качество аннотации функции у ядерных белков Homo sapiens.
Материалы и методы: использовалась БД UniProt.
Результаты и обсуждение:


Протеом Homo sapiens
  Количество белков QUERY
Всего с идентификаторами GO 41156 ((([uniprot-Organism:Homo*] & [uniprot-Organism:sapiens*]) | [uniprot-Organism:Homo sapiens*]) & ([uniprot-DbName:GO*] > parent ))
Всего ядерных белков в протеоме 4619 (((([uniprot-Organism:Homo*] & [uniprot-Organism:sapiens*]) | [uniprot-Organism:Homo sapiens*]) & ([uniprot-DbName:GO*] > parent )) & ([uniprot-DBxref:C:nucleus*] > parent ))
Всего белков только с самыми хорошими доказательствами функции (только TAS/IDA доказательства) в протеоме 4759 (((([uniprot-Organism:Homo*] & [uniprot-Organism:sapiens*]) | [uniprot-Organism:Homo sapiens*]) & [uniprot-DBLink:GO*]) & (((((((([uniprot-DBxref_:TAS.*] | [uniprot-DBxref_:IDA.*]) ! [uniprot-DBxref_:IMP.*]) ! [uniprot-DBxref_:IGI.*]) ! [uniprot-DBxref_:IPI.*]) ! [uniprot-DBxref_:ISS.*]) ! [uniprot-DBxref_:IEP.*]) ! [uniprot-DBxref_:NAS.*]) ! [uniprot-DBxref_:IEA.*]))
Всего белков только с самыми плохими доказательствами функции (только IEA доказательство) в протеоме 30320 (((([uniprot-Organism:Homo*] & [uniprot-Organism:sapiens*]) | [uniprot-Organism:Homo sapiens*]) & [uniprot-DBLink:GO*]) & (((((((([uniprot-DBxref_:IEA.*] ! [uniprot-DBxref_:TAS.*]) ! [uniprot-DBxref_:IDA.*]) ! [uniprot-DBxref_:IMP.*]) ! [uniprot-DBxref_:IGI.*]) ! [uniprot-DBxref_:IPI.*]) ! [uniprot-DBxref_:ISS.*]) ! [uniprot-DBxref_:IEP.*]) ! [uniprot-DBxref_:NAS.*]))
С идентификаторами всех 3-х онтологий GO 18046 (((([uniprot-Organism:Homo*] & [uniprot-Organism:sapiens*]) | [uniprot-Organism:Homo sapiens*]) & ([uniprot-DbName:GO*] > parent )) & ((([uniprot-DBxref:C:*] & [uniprot-DBxref:F:*]) & [uniprot-DBxref:P:*]) > parent ))
В том числе ядерные (с идентификаторами всех 3-х онтологий GO) 2981 (((([uniprot-Organism:Homo*] & [uniprot-Organism:sapiens*]) | [uniprot-Organism:Homo sapiens*]) & (([uniprot-DBxref_:P:*] & [uniprot-DBxref_:F:*]) & [uniprot-DBxref_:C:*])) & [uniprot-DBxref_:C:nucleus*])
В том числе только с самыми хорошими доказательствами функции (только TAS/IDA доказательства) (ядерные с идентификаторами 3-х онтологий GO) 218 ((((([uniprot-Organism:Homo*] & [uniprot-Organism:sapiens*]) | [uniprot-Organism:Homo sapiens*]) & (([uniprot-DBxref_:P:*] & [uniprot-DBxref_:F:*]) & [uniprot-DBxref_:C:*])) & [uniprot-DBxref_:C:nucleus*]) & (((((((([uniprot-DBxref_:TAS.*] | [uniprot-DBxref_:IDA.*]) ! [uniprot-DBxref_:IMP.*]) ! [uniprot-DBxref_:IGI.*]) ! [uniprot-DBxref_:IPI.*]) ! [uniprot-DBxref_:ISS.*]) ! [uniprot-DBxref_:IEP.*]) ! [uniprot-DBxref_:NAS.*]) ! [uniprot-DBxref_:IEA.*]))
В том числе только с самыми плохими доказательствами функции (только IEA доказательство) (ядерные с идентификаторами 3-х онтологий GO) 1971 ((((([uniprot-Organism:Homo*] & [uniprot-Organism:sapiens*]) | [uniprot-Organism:Homo sapiens*]) & (([uniprot-DBxref_:P:*] & [uniprot-DBxref_:F:*]) & [uniprot-DBxref_:C:*])) & [uniprot-DBxref_:C:nucleus*]) & (((((((([uniprot-DBxref_:IEA.*] ! [uniprot-DBxref_:TAS.*]) ! [uniprot-DBxref_:IDA.*]) ! [uniprot-DBxref_:IMP.*]) ! [uniprot-DBxref_:IGI.*]) ! [uniprot-DBxref_:IPI.*]) ! [uniprot-DBxref_:ISS.*]) ! [uniprot-DBxref_:IEP.*]) ! [uniprot-DBxref_:NAS.*]))

Таким образом, примерно 3/4 всех белков Homo sapiens определены «на веру» – то есть, отвратительно, а великолепно – чуть больше 10% (см. таблицу).
Ядерных белков у Homo sapiens известно чуть больше 10% от общего их числа. Из них 65% – со всеми идентификаторами трех онтологий GO. Из этих белков только TAS/IDA (самые лучшие) доказательства присутствуют у 4,7% белков; хуже всего определены (доказательство IEA) 42,7%.

На главную страницу


© Закирзянова Виоланта, 2006