Функции генов и их продуктов. Онтологии, GO

На главную страницу четвётого семестра

  1. Поиск нужного термина в словарях GO
  2. Описание функции конкретного белка с помощью GOA
  3. На главной страничке БД GOA ввёл в поле запроса AC UniProt(P0A6F1) заданного мне белка(CARA_ecoli). Открылась страничка со списком всех терминов GO, ассоциированным с данной записью UniProt. По данным этой странички описал функцию моего белка в таблице ниже:
      Онтология GO (имя) Количество ассоциированных терминов GO Краткий ответ на вопрос
    Где? component 0  
    Зачем, для чего? process  11 Биосинтез пиримидиновых нуклеотидов и аргинина, метаболизм глутамина, веществ содержащих азот.
    Молекулярный механизм? function 10 Активность карбомоил-фосфат синтетазы, связывание белков и АТФ
    Специфичность? function 4 Глутамин;АТФ

  4. Создание больших выборок белков с определенными функциями (поиск по идентификаторам GO в БД UniProt с помощью SRS)

    Оценка, насколько хорошо аннотированы в UniProt функции белков группы Mus musculus nucleosome

    Протеом Mus musculus Результаты поиска в UniProt, 17.03.2007 г.
      Количество записей Запрос
    Всего 64089 (([uniprot-Organism:Mus*] & [uniprot-Organism:musculus*]) | [uniprot-Organism:Mus musculus*])
    С идентификаторами всех 3-х онтологий GO 14177 ((([uniprot-Organism:Mus*] & [uniprot-Organism:musculus*]) | [uniprot-Organism:Mus musculus*]) & ((([uniprot-DBxref_:GO:*] & [uniprot-DBxref_:C:*]) & [uniprot-DBxref_:P:*]) & [uniprot-DBxref_:F:*]))
    В том числе нуклеосомные 78 (((([uniprot-Organism:Mus*] & [uniprot-Organism:musculus*]) | [uniprot-Organism:Mus musculus*]) & ((([uniprot-DBxref_:GO:*] & [uniprot-DBxref_:F:*]) & [uniprot-DBxref_:C:*]) & [uniprot-DBxref_:P:*])) & (([uniprot-DBxref_:GO:*] & [uniprot-DBxref_:C:nucleosome*]) | [uniprot-DBxref_:GO: C:nucleosome*]))
    В том числе только с самыми хорошими доказательствами функции (коды только IDA или TAS) 1216 (((([uniprot-Organism:Mus*] & [uniprot-Organism:musculus*]) | [uniprot-Organism:Mus musculus*]) & (((([uniprot-DBxref_:GO*] & [uniprot-DBxref_:F:*]) & [uniprot-DBxref_:C:*]) & [uniprot-DBxref_:P:*]) | [uniprot-DBxref_:GO F: C: P:*])) & ((((((((((([uniprot-DBxref_:IDA*] | [uniprot-DBxref_:TAS*]) ! [uniprot-DBxref_:IMP*]) ! [uniprot-DBxref_:IGI*]) ! [uniprot-DBxref_:IPI*]) ! [uniprot-DBxref_:RCA*]) ! [uniprot-DBxref_:ISS*]) ! [uniprot-DBxref_:IEP*]) ! [uniprot-DBxref_:NAS*]) ! [uniprot-DBxref_:IEA*]) ! [uniprot-DBxref_:CI*]) ! [uniprot-DBxref_:NR*]))
    В том числе только с самыми хорошими доказательствами функции (коды только IDA или TAS) в нуклеосоме 0 -
    В том числе те, у которых встречается хотя бы один раз самое хорошее доказательство функции (коды только IDA или TAS) в нуклеосоме 19 ((((([uniprot-Organism:Mus*] & [uniprot-Organism:musculus*]) | [uniprot-Organism:Mus musculus*]) & (((([uniprot-DBxref_:GO*] & [uniprot-DBxref_:F:*]) & [uniprot-DBxref_:C:*]) & [uniprot-DBxref_:P:*]) | [uniprot-DBxref_:GO F: C: P:*])) & (([uniprot-DBxref_:GO*] & [uniprot-DBxref_:C:nucleosome*]) | [uniprot-DBxref_:GO C:nucleosome*])) & ([uniprot-DBxref_:IDA*] | [uniprot-DBxref_:TAS*]))

    По сравнению с общим количеством записей, число записей с идентификаторами всех 3-х онтологий GO достаточно мало - около 22%. В нуклеосоме и того меньше - всего 0,5% от этих 22%. Причем ни в одной из этих записей не встречается оба хороших доказательств функции - IDA и TAS(данные по прямому эксперименту), однако с хотя бы одним доказательством встретилось 19 записей. Так же видно, что нуклеосомных записей почти в 15 раз меньше чем записей, имеющих только оба сильных доказательства.


    ©Alexey Dubovenko