Занятие 4. Функции генов и их продуктов. Онтологии, GO

  1. Общее знакомство со структурой GO
  2. Выберите одно из ключевых слов в документе UniProt, соответствующим Вашему белку. (Ключевое слово может состоять из 2-х слов). Выбирайте наиболее интересные, наиболее подробно описывающие функцию Вашего белка.

    На главном сайте консорциума GO, http://www.geneontology.org, проведите поиск выбранного термина среди терминов GO.
    Результаты опишите на HTML-страничке по следующему плану:

      Результаты упражнения 1
    1. Термин (по-русски и по-английски)
    2. Идентификатор GO как гиперссылка на страничку с результатом
    3. Количество синонимов.
    4. Определение термина (в переводе на русский)
    5. Количество родителей (отдельно указать число связей is_a и part_of)
    6. Количество дочерних терминов (отдельно указать число связей is_a и part_of)

    7. Поясните на конкретных примерах из полученного Вами графа, чем отличаются связи типа is_a и типа part_of , см. подсказку

    При выполнении п.п. 5–6 советуем посмотреть на изображение графа.
    Если число связей явно больше 5, можно их не считать, а указать">5"

  3. Создание выборок белков с определенными функциями
    (поиск по идентификаторам GO в БД UniProt с помощью SRS)
  4. Сначала потренируйтесь в поиске!

    Отработайте структуру запроса — составьте 1 запрос в SRS для того, чтобы получить сразу 3 документа P15650, P70618 и P51650.
    Определите, в каком поле написаны идентификаторы GO. Посмотрите, как в SRS проиндексированы разные онтологии и разные способы аннотации функций.
    Для самопроверки попробуйте найти среди 3-х указанных белков
    1. митохондриальные белки
    2. ядерные белки
    3. белки с самым низким качеством аннотации (все термины присвоены по ISS)

    Если Вы довольны результатами, то приступайте к основному и зачетному заданию.

    Зачетное задание

    Ваша задача — исследовать качество аннотации функции у конкретной группы белков заданного организма.
    Отчет представить в виде таблицы вида (HTML-формат) и краткого комментария (1-2 фразы).

    Протеом .................... Результаты поиска в UniProt, хх.хх.2006 г.
      Количество белков Запрос
    Всего    
    С идентификаторами всех 3-х онтологий GO    
    В том числе (укажите Вашу группу)    
    В том числе только с самыми хорошими доказательствами функции    
    В том числе только с самыми плохими доказательствами функции    

    В этом задании Вы можете руководствоваться общепринятой иерархией кодов доказательств, а можете предложить свою иерархию, но только с обоснованием, см. подробная расшифровка кодов.
    Отчет желательно украсить изображением заданного организма, для этого проведите поиск среди общих описаний геномных проектов на сайте NCBI.

  5. Дополнительно на бонусные баллы

Опишите функцию Вашего белка, используя ресурсы EcoCyc. Не забудьте ответить на главные вопросы: где, для чего, что и с чем делает.