Функции генов и их продуктов. Онтологии, GO

На главную страницу четвертого семестра

 


Дополнительные упражнения

  • Описание связей между терминами в онтологиях GO
  • На главной страничке БД GOA был введен в поле запроса AC (P0A6E4) UniProt ASSY_Ecoli. Далее на этой же страничке были отмечены галочкой все термины. После этого нужно было нажать кнопку <View selected terms in context>. GO откроет страничку, на которой связи между терминами иллюстрируются с помощью ориентированного ациклического графа (DAG). Вершинами этого графа служат термины, а ребрами - связи между ними. Имеется два вида связей: "is a" и "is part of". Описание связей каждого типа. Связь "is a". "A is B" означает, что А - частный случай В. Данная связь связывает родительские и дочерние понятия. Данный тип связи встречается часто на графе.
    Но этом фрагменте изображено отношение "ligase activity is catalytic activity"
    Связь "is part of". "A is part of B" означает, что А - часть В, но В не обязательно содержит А. Данный вид связи на графе встречается редко.
    Но этом фрагменте изображено отношение "cell part 
    is part of cell". Данное отношение можно трактовать так: 
    часть (органелла) клетки не способна в природе существовать 
    вне клетки, хотя встречаются клетки без некоторых частей.
    
    Родительский термин, имеющий связи более, чем с 2-мя дочерними терминами.
    Данный вид связи на графе встречается часто.

  • Описание функции белка в БД EcoCyc
  • На главных страничках БД GOA и EcoCyc был введен в поле запроса AC (P0A6E4) UniProt ASSY_Ecoli. По данным страничек былы описаны функции в таблице следующего вида:
      Онтология GO (имя) Количество ассоциированных терминов GO Краткий ответ на вопрос Данные EcoCyc
    Где?  Клеточные компоненты (Component)  0  -  цитоплазма
    Зачем, для чего?  Биологический процесс (Process)  4  биосинтез аргинина, биосинтез аминокислот.  биосинтез аргинина.
    Молекулярный механизм?  Молекулярные функции (Function)  9  нуклеотидное связывание, активность при синтезе аргининосукцината (катализирует следующую реакцию: ATP + L-citrulline + L-aspartate = AMP + diphosphate + (Nw-L-arginino)succinate, лигазная активность, связывание АТФ, связывание белка.  L-aspartate + citrulline + ATP <=> L-arginino-succinate + diphosphate + AMP. Реакция является обратимой.
    Специфичность?  Молекулярные функции (Function)  3 одинаковых записи (из след. источников: UniProt, InterPro, HAMAP)   Специфичность данного белка описывается в поле Function, но указана она только в трех записях. В них указана соответствующая реакция, где ASSY_Ecoli специфично связывается с L-citrulline.  Кофактором является Mg2+.
    
    Страничка, которая была выдана EcoCyc, содержит много полезной информации. 
    Запись о белке представлена очень коротко, но можно узнать более подробную информацию,
    если пойти по ссылкам. На данной страничке имеется информация о гене, о длине
    последовательности, о молекулярной массе белка. 
    Имеется ссылка на последовательность белка.
    Имеются ссылки на GO:
    GO:0006526 - arginine biosynthesis , 
    GO:0005737 - cytoplasm 
    Также имеется ссылки на PDB, Pfam, UniProt.
    Другая информация представлена в таблице. 
         
    

  • Исследование качества аннотации группы белков в UniProt
  • В GO практически любая аннотация имеется информацию доказательства функций. Данная информация имеет 14 различных кодов. Ниже перечислены 8 чисто экспериментальных и компьютерных кодов. Все остальные коды нельзя отнести к данным. IDA: Inferred from Direct Assay (заключения, основанные на прямых экспериментальных данных). IEA: Inferred from Electronic Annotation (заключения, основанные на данных электронной аннотации). IEP: Inferred from Expression Pattern (заключения основанные на информации о том, когда и где экспрессируется ген). IGC: Inferred from Genomic Context (заключения, основанные на информации из анализа геномного окружения гена: например, струтура оперона, анализ пути). IGI: Inferred from Genetic Interaction (заключения, основанные на различных типах взаимодействий между генами). IMP: Inferred from Mutant Phenotype (заключения, основанные на информации о результатах мутации в гене). IPI: Inferred from Physical Interaction (залючения, основанные на информации о физическом взаимодействии между продуктом гена и какой-то молекулой). ISS: Inferred from Sequence or Structural Similarity (залючения, основанные на информации о сходстве последовательностей или структур). С помощью БД UniProt были найдены все белки Plasmodium falciparum, относящиеся к рибосомным. Запрос:((([uniprot-Organism:Plasmodium*] & [uniprot-Organism:falciparum*]) | [uniprot-Organism:Plasmodium falciparum*]) & (((([uniprot-DBxref_:GO:*] & [uniprot-DBxref_:F:*]) & [uniprot-DBxref_:C:ribosome*]) & [uniprot-DBxref_:P:*]) | [uniprot-DBxref_:GO:P:F:C:ribosome*])) В меню запроса также необходимо было указать поле вывода DBxref_ в формате List. Иначе повторяющиеся коды доказательств опускаются. Далее сохранить результат. БД UniProt нашла 104 белка. Задача заключалась в определении доли "чисто компьютерных" аннотаций GO в UniProt для заданной группы белков. Чтобы определить долю "чисто компьютерных" аннотаций GO в UniProt можно воспользоваться программой grep. Сначала определим сколько всего в нашем файле имеется аннотаций GO. grep GO: 1.txt -c Результат: 328 ссылок на GO Теперь узнаем число "чисто компьютерных" аннотаций GO. Для этого необходимо использовать всего 3 ссылки: IGC,IEA,ISS. grep IGC: 1.txt -c Результат: 0 ссылок. grep IEA: 1.txt -c Результат: 328 ссылок. grep ISS: 1.txt -c Результат: 0 ссылок. Вывод: При аннотации рибосомальнах белков протеома Plasmodium falciparum используются главным образом данные, полученные с помощью компьютера (100%); экспериментальных данных пока нет.


    ©Трембицкая Влада