Еще раз про эволюцию белков. Домены. БД Pfam, InterPro.

  1. Исследование доменной структуры конкретного белка
    1. Опишите доменную структуру белка по данным Pfam
    2. Дан белок MOEB_ECOLI. Описание его доменной организации было взято в БД Pfam:

      Доменная структура белка MOEB_Ecoli по данным Pfam

      Cхема из Pfam:
      Пояснения к схеме
      Pfam AC Pfam ID Полное название семейства домена Положение в последовательности белка MOEB_Ecoli Клан
      1. PF00899

      ThiF

      Семейство включает в себя повторяющийся домен убиквитин-активирующего фермента E1 и домены бактериального семейства ThiF/MoeB/HesA.

      30 - 164 NADP_Rossmann (CL0063), состоит из 148 семейств доменов
      2. PF05237 MoeZ_MoeB

      Предполагаемый домен белков MoeZ и MoeB. Имеет 2 CXXC мотива, который только частично консервативны.

      168 - 249 Клан не указан.

    3. Экспортируйте в формате msf выравнивание-затравку (seed) для N-концевого домена заданного белка. Прикрепите полученный файл к отчету
    4. Выравнивание-затравка (seed) для N-концевого домена белка PF00149 (PF00899_seed.msf).

    5. Сравните описание доменной структуры в Pfam с описанием в других БД

      На главной странице БД InterPro по идентификатору MOEB_ECOLI были найдены описания всех подписей (signatures), интегрированных в InterPro, т.е. имеющих InterPro ID.

      Подпись, которая, наиболее отличается от подписей PFAM и может породить иное представление о первичной структуре белка; покрывает весь белок (1-249 а.о.) :


      Название БД:Gene3D
      InterPro ID: IPR016040

    6. Сопоставьте доменную структуру с 3D структурой заданного белка

      Был выбран PDB 1jw9.
      С помощью программы Jmol было получено изображение цепи B белка


      Красным цветом выделен домен ThiF (30 - 164), голубым - домен MoeZ_MoeB (168 - 249)

      Как видно, домены Pfam не соответствуют отдельным компактным частям структуры. Вся структура состоит из нескольких альфа-спиралей и бета-листов, причем домены по отдельности не выделяются в отдельные компактные части.

  2. Исследование эволюции отдельных доменов
    1. Опишите, как часто и в каких организмах встречаются домены заданного белка
    2. Белки с доменом ThiF встречаются в 898 видах, с доменом MoeZ_MoeB - в 747 видах. Выберу домен MoeZ_MoeB для более подробного исследования его встречаемости.

      Таксон
      Количество белков с доменом PF05237.
      Эукариоты Зеленые растения 27
      Грибы 58
      Животные 31
      Остальные эукариоты 41
      Бактерии 1642
      Археи 85

      Как видно из таблицы, большая часть белков с доменом MoeZ_MoeB - белки бактерий. Однако так же стоит отметить встречаемость данного домена в белках эукариот (больше всего в грибах) и архей.

    3. Определите, в скольких разных белках Escherichia coli K12 встречаются домены, представленные в заданном белке
    4. Представленность изучаемых доменов в белках Escherichia coli (strain K12):

      PFAM ID Количество белков в Escherichia coli (strain K12)
      1. PF00899 3
      2. PF05237 2

      Было найден всего один белок с точно такой же доменной организацией, что и MOEB_ECOLI - THIF_ECOLI.

    5. Приведите не менее 3-х примеров разных доменных перестроек
    6. Для каждого из доменов заданного белка рассмотрим примеры доменных перестроек.

      ThiF (PF00899):

      B3JXE3_9DELT: - пример дупликации домена

      B9FV11_ORYSJ: - пример встречаемости трехкратного повторения домена

      Q8PKY4_XANAC: - пример расположения домена между другими доменами

      C2KHC2_LEUMC: - пример расположения домена на С-конце последовательности

      ATG7_YEAST: - пример, когда белок состоит только из одного домена

      MoeZ_MoeB (PF05237):

      Q7X1H8_9BACT: - пример, когда белок состоит только из одного домена

      Q8PKY4_XANAC: - пример расположения домена на С-конце последовательности

      C5KVL6_9ALVE: - пример расположения домена на N-конце последовательности

©2008-2010 Михальченко Алексей