Занятие 11.

SCOP и CATH

Задание 1.

  1. Классификация доменов записи PDB 1HO5 согласно SCOP

    Определим классификацию доменов записи 1HO5 согласно SCOP.

    Для этой записи было определено 2 домена:

    Первый из них - N-концевой домен белка 5'-нуклеотидазы из E. coli (Protein: 5'-nucleotidase (syn. UDP-sugar hydrolase), N-terminal domain from Escherichia coli), имеется две копии данного домена:

    • Расположен в цепи A белка 1HO5 (и в цепи В), занимая в обеих цепях позиции 26-362.
    • Классификация по SCOP:

      класс - Alpha and beta proteins (a+b);

      укладка - Metallo-dependent phosphatases;

      суперсемейство - Metallo-dependent phosphatases ;

      семейство - 5'-nucleotidase (syn. UDP-sugar hydrolase), N-terminal domain.

    • Сколько семейств содержится в данном суперсемействе? - 12 семейств.
    • Сколько суперсемейств имеет данную укладку? - 1 суперсемейство.

    Второй из них - C-концевой домен белка 5'-нуклеотидазы из E. coli (Protein: 5'-nucleotidase (syn. UDP-sugar hydrolase), C-terminal domain from Escherichia coli), имеется две копии данного домена:

    • Расположен в цепи А белка 1HO5 (и в цепи В), занимая в обеих цепях позиции 363-550.(Белок состоит из двух цепей А и В.)
    • Классификация по SCOP:

      класс - Alpha and beta proteins (a+b) ;

      укладка - 5'-nucleotidase (syn. UDP-sugar hydrolase), C-terminal domain;

      суперсемейство - 5'-nucleotidase (syn. UDP-sugar hydrolase), C-terminal domain;

      семейство - 5'-nucleotidase (syn. UDP-sugar hydrolase), C-terminal domain.

    • Сколько семейств содержится в данном суперсемействе? - 1 семейство.
    • Сколько суперсемейств имеет данную укладку? - 1 суперсемейство.

  2. Классификация доменов записи PDB 1HO5 согласно CATH

    С помощью CATH было найдено 4 домена в записи 1HO5, домены 1ho5A01 и 1ho5B01 это фактически один и тот же домен (но на разных цепях, соответственно, А и В), но CATH распознает их по разному, так как они расположены на разных цепях.

    Поэтому рассмотрими один из них, а именно - 1ho5A01:

    Первый из них - домен 1ho5A01:

    • Расположен в цепи А белка 1HO5, занимает в цепи позиции 26-362.
    • Классификация по CATH:

      3.60.21.10.4.1.1.1.8

    • Класс - Alpha Beta;

      архитектура - 4-Layer Sandwich;

      топология - Purple Acid Phosphatase; chain A, domain 2.

    • Сколько суперсемейств имеет данную топологию? - 2 суперсемейства.
    • Сколько семейств содержится в данном суперсемействе? - 17 семейств.

    Второй из них - домен 1ho5A02:

    • Расположен в цепи А белка 1HO5, занимает в цепи позиции 363-549.
    • Классификация по CATH:

      3.90.780.10.1.1.1.1.7

    • Класс - Alpha Beta;

      архитектура - Alpha-Beta Complex;

      топология - 5'-nucleotidase; domain 2;

      суперсемейство - 5'-nucleotidase; Domain 2.

    • Сколько семейств содержится в данном суперсемействе? - В данном суперсемействе 3.90.780.10 содержится 2 семейства.
    • Сколько суперсемейств имеет данную топологию? - 1 суперсемейство.

  3. Различия между CATH и SCOP в описании доменов записи 1HO5

    Доменная организация белка записи 1HO5 определена в CATH и SCOP одинаково.

    Небольшое отличие в определении доменной организации белка записи 1HO5 заключается в том, что SCOP выделил координаты второго домена записи как 363-550, а CATH - 363-549; но эти отличие несущественно.

    Некоторые домены имеют разную классификацию в CATH и SCOP:

    N-концевой домен белка 1HO5 определен в CATH и SCOP практически одинаково, но в SCOP его укладка называется Metallo-dependent phosphatases (металло-зависимые фосфатазы),

    а в CATH топология называется Purple Acid Phosphatase; chain A, domain 2.(пурпурно-кислотные фосфатазы);

    суперсемейство в SCOP - Metallo-dependent phosphatases, а в CATH суперсемейство не определено;

    семейство в SCOP - 5'-nucleotidase (syn. UDP-sugar hydrolase), N-terminal domain, а в CATH семейство не определено.


    Уровни С-концевого домена белка 1HO5 по CATH и SCOP называются примерно одинаково.

    Укладка этого домена по SCOP - 5'-nucleotidase (syn. UDP-sugar hydrolase), C-terminal domain;

    топология по CATH - 5'-nucleotidase; domain 2.

    Суперсемейство по SCOP - 5'-nucleotidase (syn. UDP-sugar hydrolase), C-terminal domain;

    суперсемейство по CATH - 5'-nucleotidase; Domain 2.

    семейство в SCOP- 5'-nucleotidase (syn. UDP-sugar hydrolase), C-terminal domain, а в CATH семейство не определено.

    Причиной таких различий в доменной классификации может быть разное количество уровней (в СATH 9 уровней, а в SCOP 6), это говорит о различной степень подробности каждого из уровней.

    Одна и та же топология в CATH и укладка в SCOP могут содержать разное количество суперсемейств (в случае N-концевого домена, например, топология в CATH содержит 2 суперсемейство, а укладка в SCOP содержит 1 суперсемейство; в CATH 1 суперсемейство включает 17 семейств, а в SCOP - всего 12).


  4. Выравнивание доменов записей PDB 1TIG и 1DCJ (на примере доменов цепи А)

    Создадим выравнивание двух доменов с одной топологией по CATH, но из разных суперсемейств:

    1tig

    класс - Alpha Beta
    архитектура - 2-Layer Sandwich
    топология - Translation Initiation Factor IF3
    суперсемейство - Translation Initiation Factor If3
    1tigA00 - 3.30.110.10.1.1.1.1.1
    границы домена - 83-170
    

    1dcj

    класс - Alpha Beta
    архитектура - 2-Layer Sandwich
    топология - Translation Initiation Factor IF3
    суперсемейство - SirA-like
    1dcjA00 - 3.30.110.40.1.1.1.1.1
    границы домена - 1-81
    

    Для выравнивания доменов по очереди выделим в PyMOL домены из записей и соорудим выравнивание посредством следующих основных команд:

    (create ob1, 1tig and chain A

    create ob2, 1dcj and chain A

    select set1, ob1 and name ca and resi (номера интересующих остатков)

    select set2, ob2 and name ca and resi (номера интересующих остатков)

    align set1, set2)

    Зеленым выделен домен 1TIG, голубым - домен 1DCJ.

    Полученное RMSD - 6.957

    Конечно, полученное выравнивание - это полное безобразие, одно значение RMSD чего стоит. Выравниванию верить нельзя, оно получилось очень плохо. (Ни альфа-спирали, ни бета-листы не совпали друг с другом). Возможно, так получилось потому, что команда сначала делает выравнивание последовательностей, а затем улучшает его, используя структуры.

    Попробуем теперь применить программу super (ее синтаксис аналогичен программе align):

    Зеленым показан 1TIG, а голубым - 1DCJ.

    Полученное RMSD - 2.244.

    Намного лучше (хотя бы судя по RMSD, который намного меньше 6.957), структуры хоть и неидеально, но все-таки достаточно хорошо наложились друг на друга (альфа-спирали совпали друг с другом, собственно, как и бета-листы). Выравнивание не лишено смысла.