gene functions, GO

На главную страницу четвертого семестра

Функции генов и их продуктов. Онтологии, GO

  1. Поиск нужного термина в словарях GO
  2. Описание функции конкретного белка с помощью GOA и EcoCyc
  3. Заданный белок - COAE_ECOLI
    Его AC - P0A6I9. Задав на вход этот AC на главной страничке БД GOA мы получаем страничку со списком всех терминов GO, ассоциированным с данной записью UniProt, по которой заполняем нижеследующую таблицу. Данные по БД EcoCyc получаем аналогичным способом.

      Онтология GO (имя) Количество ассоциированных терминов GO Краткий ответ на вопрос Данные EcoCyc
    Где? клеточный компонент (cellular component) 0 - -
    Зачем, для чего? процесс (process) 1 для процессов биосинтеза кофермента А катализ пятого заключительного этапа биосинтеза кофермента А
    Молекулярный механизм? функция (function) 5
    • связывание нуклеотидов
    • кофермент-А-дефосфокиназная активность
    • связывание АТФ
    • трансферазная активность
    формула катализируемой реакции:
    dephospho-CoA + ATP <=> coenzyme A + ADP
    Специфичность? своей онтологии GO не имеется, но можно найти в поле function 3 связывание с АТФ В растворе фермент обнаруживается как мономер. В кристалле существует в тримерной форме. При последующем изучении выяснилось, что присутствие сульфат-ионов стабилизирует тримерную форму в растворе. Биологический смысл тримерной формы остается невыясненным.


    В целом БД ЕсоСус представляет более подробную и наглядную информацию (включая графические отображения метаболических путей и реакций). Но данные в нем только по одному организму - Escherichia coli, K12.

  4. Создание больших выборок белков с определенными функциями (поиск по идентификаторам GO в БД UniProt с помощью SRS).

  5. Протеом Arabidopsis thaliana.
    Результаты поиска в UniProt, 20.03.2007 г.
      Количество записей Запрос
    Всего 50196 ([uniprot-Organism:Arabidopsis*] & [uniprot-Organism:thaliana*])
    С идентификаторами всех 3-х онтологий GO 5646 (([uniprot-Organism:Arabidopsis*] & [uniprot-Organism:thaliana*]) & (([uniprot-DBxref_:F:*] & [uniprot-DBxref_:C:*]) & [uniprot-DBxref_:P:*]))
    В том числе нуклеосомных 44 (([uniprot-Organism:Arabidopsis*] & [uniprot-Organism:thaliana*]) & ((([uniprot-DBxref_:P:*] & [uniprot-DBxref_:C:*]) & [uniprot-DBxref_:F:*]) & [uniprot-DBxref_:GO:0000786*]))
    В том числе только с самыми хорошими доказательствами функции (коды только IDA и TAS) 0 (([uniprot-Organism:Arabidopsis*] & [uniprot-Organism:thaliana*]) & ((((((((((((((([uniprot-DBxref_:P:*] & [uniprot-DBxref_:C:*]) & [uniprot-DBxref_:F:*]) & [uniprot-DBxref_:GO:0000786*]) ! [uniprot-DBxref_:IC:*]) ! [uniprot-DBxref_:IEA:*]) ! [uniprot-DBxref_:IEP:*]) ! [uniprot-DBxref_:IGC:*]) ! [uniprot-DBxref_:IGI:*]) ! [uniprot-DBxref_:IMP:*]) ! [uniprot-DBxref_:IPI:*]) ! [uniprot-DBxref_:ISS:*]) ! [uniprot-DBxref_:NAS:*]) ! [uniprot-DBxref_:ND:*]) ! [uniprot-DBxref_:RCA:*]) ! [uniprot-DBxref_:NR:*]))
    В том числе те, у которых встречается хотя бы один раз самое хорошее доказательство функции (коды только IDA или TAS) 0 (([uniprot-Organism:Arabidopsis*] & [uniprot-Organism:thaliana*]) & ((([uniprot-DBxref_:P:*] & [uniprot-DBxref_:C:*]) & [uniprot-DBxref_:F:*]) & [uniprot-DBxref_:GO:0005887*]) & ([uniprot-DBxref_:IDA:*] | [uniprot-DBxref_:TAS:*]))

    Как видно из таблицы информации о нуклеосомных белках из Arabidopsis thaliana в банке UniProt, аннотированной с помощью терминов GO содержится очень мало. Из 44 вообще занесенных белков мы не можем ни для одного быть на 100% уверенными о его значении и функциях: хороших доказательств нет ни у одного белка. Скорей всего, детальное исследование данной белковой группы началось сравнительно недавно.


©Куликовский, Алексей