ЧЕТВЕРТЫЙ СЕМЕСТР

на главную страницу


:НАВИГАЦИОННОЕ МЕНЮ





Функции генов и их продуктов. Онтологии, GO

Mus musculus 


1. Поиск нужного термина в словарях GO

Искал сначала по слову membrane, затем, сужая поиск, вводил integral to membrane, затем пришел к выводу, что ключевая фраза - integral to plasma membrane

  • Заданное описание локализации: интегральный белок плазматической мембраны (integral to plasma membrane
  • Идентификатор: GО:0005887
  • Название онтологии GO: cellular component - клеточный компонент
  • Определение термина (англ): Penetrating at least one phospholipid bilayer of a plasma membrane. May also refer to the state of being buried in the bilayer with no exposure outside the bilayer. [source: GOC:go_curators]
  • Определение термина (рус): Проникает через, по крайней мере один фосфолипидный бислой плазматической мембраны.. Может также быть погруженным в бислой, не выпячиваясь из него.[source: GOC:go_curators]  .

2. Описание функции конкретного белка с помощью GOA

На главной странице БД GOA в поле запроса ввел AC UniProt белка DAPB_ECOLI P04036. Был получен результат со списком всех терминов GO, ассоциированным с данной записью UniProt. В соответствии с этими данными была составлена следующая таблица, описывающая функцию белка DAPB_ECOLI:

  Онтология GO (имя) Количество ассоциированных терминов GO Краткий ответ на вопрос
Где? component 1 (1 ссылка) В цитоплазме
Зачем, для чего? process 4 (7 ссылок) биосинтез лизина через диаминопимелат 
Молекулярный механизм? function 2 (5 ссылок) активность дигидродипиколинат редуктазы
Специфичность? function 2 (5 ссылок) Катализ следующей реакции: 2,3,4,5-тетрагидродипиколинат + НАДФ+ = 2,3-дигидродипиколинат + НАДФ(H) + H+.

Быстрая ссылка: http://www.ebi.ac.uk/ego/GSearch?query=P04036&mode=name_syno&ontology=all_ont

В табличке указано 7 процессов и 5 фунцкий, но некоторые встречаются по 2 или 3 раза. Т.е. они имеют одинаковый ID в GO, но разный в InterPro. 

3. Создание больших выборок белков с определенными функциями
(поиск по идентификаторам GO в БД UniProt с помощью SRS).

быстрая ссылка на ресурс:: http://srs.ebi.ac.uk/srsbin/cgi-bin/wgetz?-page+srsq2+-noSession

В задачу входит оценить, насколько хорошо аннотированы в UniProt функции белков конкретной группы интегральных белков плазматической мембраны. 
Протеом Mus musculus - Результаты поиска в UniProt, 20.03.2007 г.

 
  Количество записей Запрос
Всего 65068 (([uniprot-Species:Mus*] & [uniprot-Species:musculus*]) | [uniprot-Species:Mus musculus*])

*** если вместо Species задать Organism name - количество выдаваемых записей не поменяется.
С идентификаторами всех 3-х онтологий GO 14577 ((([uniprot-Species:Mus*] & [uniprot-Species:musculus*]) | [uniprot-Species:Mus musculus*]) & ((([uniprot-DBxref_:GO:*] & [uniprot-DBxref_:F:*]) & [uniprot-DBxref_:C:*]) & [uniprot-DBxref_:P:*])) 
В том числе интегральные белки плазматической мембраны 380 (((([uniprot-Species:Mus*] & [uniprot-Species:musculus*]) | [uniprot-Species:Mus musculus*]) & ((([uniprot-DBxref_:GO:*] & [uniprot-DBxref_:F:*]) & [uniprot-DBxref_:C:*]) & [uniprot-DBxref_:P:*])) & [uniprot-DBxref_:GO:0005887*]) 

 

В том числе только с самыми хорошими доказательствами функции (коды только IDA или TAS) 91 (((([uniprot-Species:Mus*] & [uniprot-Species:musculus*]) | [uniprot-Species:Mus musculus*]) & ((((((((((((((([uniprot-DBxref_:GO:*] & [uniprot-DBxref_:F:*]) & [uniprot-DBxref_:C:*]) & [uniprot-DBxref_:P:*]) & ([uniprot-DBxref_:IDA:*] | [uniprot-DBxref_:TAS:*])) ! [uniprot-DBxref_:IEA:*]) ! [uniprot-DBxref_:IEP:*]) ! [uniprot-DBxref_:IGI:*]) ! [uniprot-DBxref_:NAS:*]) ! [uniprot-DBxref_:ND:*]) ! [uniprot-DBxref_:RCA:*]) ! [uniprot-DBxref_:IMP:*]) ! [uniprot-DBxref_:IPI:*]) ! [uniprot-DBxref_:ISS:*]) ! [uniprot-DBxref_:NR:*]) ! [uniprot-DBxref_:IGC:*])) & [uniprot-DBxref_:GO:0005887*]) 
В том числе те, у которых встречается хотя бы один раз самое хорошее доказательство функции (коды только IDA или TAS) 297 (((([uniprot-Species:Mus*] & [uniprot-Species:musculus*]) | [uniprot-Species:Mus musculus*]) & (((([uniprot-DBxref_:GO:*] & [uniprot-DBxref_:F:*]) & [uniprot-DBxref_:C:*]) & [uniprot-DBxref_:P:*]) & ([uniprot-DBxref_:IDA:*] | [uniprot-DBxref_:TAS:*]))) & [uniprot-DBxref_:GO:0005887*]) 

Пробовал вместо GO:0005887 прописывать нечто вроде plasma membrane (All text) - при этом скажем вместо 91 находки оказывалось 27. то есть меньше. Однако, поскольку plasma membrane - это вообще говоря не индефикатор, по моему мнению, полагаться на столь зыбкий параметр не стоит, а стоит больше доверять подаче GO:0005887.


Идентификаторы GO (function, component и process) (идентификаторы GO записаны в поле DBxref_) есть далеко не у всех, но у весьма большого-таки количества белков (из 65068 находок), а белков плазматической мембраны со всеми идентификаторами среди них описано 380. При этом "хороших" записей (с кодами только IDA или TAS) 91, а те, у которых встречается хотя бы один раз самое хорошее доказательство функции - 297 раз.  Из полученных данных можно сделать вывод о том, что протеом mus musculus достаточно хорошо описан. И, в то же время, потенциал по изучению протеома очень велик.

 

ДОПОЛНИТЕЛЬНЫЕ ЗАДАНИЯ

 


©
Бирюков