Эволюционные домены. БД Pfam, InterPro

На страничку второго семестра



  1. Задание 1


  2. Доменная структура белка IOLI_BACSU по данным Pfam

    Cхема из Pfam:
    Пояснения к схеме
    Pfam AC Pfam ID Полное название семейства доменов Положение в последовательности белка IOLI_BACSU Клан
    1. PF01261 AP_endonuc_2 ТИМ баррэл, подобная изомеразе ксилозы (Xylose isomerase-like TIM barrel).

    Структура TIM alpha/beta barrel найдена в изомеразе ксилозы (xylose isomerase (P19148)) и в эндонуклеазе IV (endonuclease IV (P12638 EC:3.1.21.2)). Этот домен также найден на N-концах бактериальных белков, участвующих в мио-инозитол катаболических процессах.

    20–225 Клан TIM_barrel (CL0036), содержит 54 семейства, у пяти неизвестна функция (PFAM ID начинается с DUF). Общее число доменов в клане - 89822. Все ферменты этого большого суперсемейства содержат стандартный фосфат-связывающий сайт. Фосфаты найдены во многих кофакторах и лигандов этих ферментах, таких как FMN.


  3. Задание 2. Описание домена PF01261.


  4. В моем белке есть только один домен - PF01261. Белки с этим доменом всречаются в 1487 видах.

    Представленность домена PF01261 в организмах разных видов

    Таксон
    Количество белков с доменом PF01261.
    Эукариоты Зеленые растения 36
    Грибы 160
    Животные 54
    Остальные эукариоты 21
    Бактерии 5367
    Археи 228

    Данный домен характерен для бактериальных клеток, однако он не абсолютно специфичен, так как он встречается и в белках эукариотических клеткок и даже в вирусных белках. В бактериальных клетках часто может иметься несколько белков с таким доменом. Однако практически всегда данный домен присутствует в белке в единственом числе.

  5. Задание 3. Домен PF01261 в белках Bacillus subtilis .


  6. Представленность изучаемых доменов в белках Bacillus subtilis

    Pfam ID Bacillus subtilis
    1. AP_endonuc_2 В протеоме Bacillus subtilis данный домен встречается в 6 белках, в каждом из них единожды.

    В протеоме Bacillus subtilis имеется 5 белков с такой же доменной организацией.
    Домен AP_endonuc_2 довольно частотный для данного вида. Однако есть виды бактерий, в белках которых данный домен встречается до 48 раз (например Solibacter usitatus), а число белков с такой же доменной организацией - 13.

  7. Задание 4. Доменные перестройки.

  8. 1) Домен PF01261(AP_endonuc_2) может находиться как на N-, так и на C-конце последовательности:
    B9QW25_9RHOB:
    Q929L2_LISIN:

    2) Есть только две последовательности, в которых данный домен встречается дважды в одной последовательности. В остальных случаях этот домен имеется в последовательности в единственном числе:
    B9TBV4_RICCO:

    3) Самый частотный вариант - присутствие в последовательности только этого домена (5410 последовательностий). белок IOLI_BACSU так же отностися к данному типу организации:
    3SHD_NEUCR:

    4) Есть и последовательности, в которых на ряду с исследуемым доменом присутствует много других доменов, но таких последовательностей единицы:
    A1D5T9_NEOFI:
    B9XPQ5_9BACT:

    5) Имеются последовательности, в которых концы домена одинаковы и в которых последовательность на концах доменов может несколько варьировать:
    Q9YVX5_MSEPV:
    A6PPL4_9BACT:

    6) Исследуемый домен может располагаться почти вплотную к другим доменам в последовательности, но может и быть далеко разнесен с ними:
    C0TGM9_9PSEU:
    C4JUN2_9EURO:

    7) Нет ни одного случая разрыва данного домена.

  9. Задание 5. Выравнивание-затравка для домена PF01261(AP_endonuc_2).

  10. Выравнивание в формате MSF

  11. Задание 6. Сравните описание мотивов в разных БД.


    1. Самый короткий мотив PF01261 (AP_endonuc_2), описан в Pfam. Как называется тип распознающего правила?
    2. Самый длинный мотив - Xyl_isomerase-like_TIM-brl - описан в двух базах данных. В CATH protein structure classification как G3DSA:3.20.20.150 и в Suerfamily HMM library and genome assignments server как SSF51658.
    3. Структурные подписи, интегрированные в InterPro:

    4. Границы структурных доменов отличаются от границ доменов в Pfam, при этом границы структурных доменов могут и отличаться друг от друга, и совпадать:
      База данных № аминокислотных остатков
      Pfam 20-225
      CATH protein structure classification 1 - 278
      Suerfamily HMM library and genome assignments server 1 - 278
      PANTHER Classification System 1 - 273

© Karavaeva Julia 2009