Главная
Класс: Alpha and beta proteins a/b (главным образом параллельные бета-листы (бета-альфа-бета единицы)) Укладка: Periplasmic binding protein-like II (периплазматический связывающий белок типа II) Суперсемейство: Periplasmic binding protein-like II (отличается от суперсемейства типа I по топологии) Семейство: Periplasmic binding protein-like II Белок: фосфат-связывающий белок
Класс: All beta proteins (бета-белки) Укладка: OB-fold (баррель, закрытый или частично открытый n=5, S=10 or S=8; греческий ключ) Суперсемейство: Nucleic acid-binding proteins (белки, связывающие аминокислоты) Семейство: Cold shock DNA-binding domain-like (ДНК-связывающий домен при холодном шоке; баррель, закрытый n=5, S=8) Белок: возможная ГТФаза EngC, N-терминальный домен
Класс: Alpha and beta proteins (a/b) Укладка: P-loop containing nucleoside triphosphate hydrolases Суперсемейство: P-loop containing nucleoside triphosphate hydrolases Семейство: G proteins (G-белки) Белок: возможная ГТФаза EngC, C-терминальный домен
цепь А: 1-77, 230-239, 254-321
Класс: Alpha Beta Архитектура: 3-Layer(aba) Sandwich Топология: D-Maltodextrin-Binding Protein; domain 2 Суперсемейство: Periplasmic binding protein-like II
цепь А: 78-229, 240-253
Класс: Alpha Beta Архитектура: 3-Layer(aba) Sandwich Топология: D-Maltodextrin-Binding Protein; domain 2 Суперсемейство: Periplasmic binding protein-like II
цепь А: -7-65 (2-74 согласно pDomain-CATH)
Класс: Mainly Beta Архитектура: Beta Barrel Топология: OB fold (Dihydrolipoamide Acetyltransferase, E2P) Суперсемейство: Nucleic acid-binding proteins
цепь А: 66-230 (75-239 согласно pDomain-CATH)
Класс: Alpha Beta Архитектура: 3-Layer(aba) Sandwich Топология: Rossmann fold Суперсемейство: P-loop containing nucleotide triphosphate hydrolases
цепь А: 231-298 (240-307 согласно pDomain-CATH)
Класс: Mainly Alpha Архитектура: Orthogonal Bundle Топология: Ribonucleotide Reductase Protein R1; domain 1 Суперсемейство: Probable gtpase engc; domain 3
1A40: количество доменов, которые выделили эти программы различаются, но суперсемейства, в которые входят домены, совпадают. Топология CATH отличается от укладки SCOP. Это, наверное, связано с тем, что CATH использует базу уже выделенных доменов, в частности, здесь это домены записи 1ixh. Почему CATH выделил 2 разных домена? Разделение, вероятно, связано с тем, что в CATH существуют больше нижних уровней классификации с разной степенью сходства выравнивания последовательностей (35%, 60%, 95%, 100%).
1T9H: SCOP выделил 2 домена, CATH - 3; первые домены (1t9hA01) совпадают с точностью до нескольких нуклеотидов и по классификации. Домен 1t9hA02 (CATH) является частью домена 1t9hA02 (SCOP), совпадают по суперсемейству. Что касается домена 1t9hA02, то различие в классификации начинается на верхних уровнях, в классе, что опять же связано с основным принципом работы алгоритма (поиск похожих доменов среди уже выделенных).
Были выбраны цепи А записей 2Q5C и 2HC9 для строения структурного выравнивания двух доменов с одной
топологией по CATH (Rossmann fold), но из разных суперсемейств (PrpR receptor domain-like и Zn-dependent exopeptidases соответственно).
Доменная структура согласно pDomain:
CATH 2Q5CA1 2-77, 168-188 2Q5CA2 78-167 CATH 2HC9A1 2-155 2HC9A2 156-490Программой PDBeFOLD построили выравнивание, подали на вход программе Geometrical core, получили список остатков, принадлежаших геометрическому ядру, затем с помощью команды pair_fit в PyMOL получили изображение на рис.1.
Рисунок 1. Зеленым показана цепь А 2HC9, желтым - 2Q5C, красным - геометрическое ядро. RMSD = 1.223
Как можно было ожидать, остатки геометрического ядра совмещеются хорошо, с низким значением RMSD.
Но, в целом, пространственные структуры белков совместились плохо.
При работе с файлом 2HC9.pdb было обнаружено, что среди остатков, входящих в геометрическое ядро,
есть 2 остатка 345 и 466, имеющих 2 возможные конформации (В этой записи подобных остатков несколько). Изображение на рис.2.
Рисунок 2. Остатки, имеющие альтернативные конформации (в том числе Сα-атома)
Гибкое выравнивание с помощью FATCAT показано на рис.3. Характеристики выравнивания: RMSD = 2.89, 4 изгиба, 5 кластеров.
Как можно видеть, на рисунке 3, совмещение нельзя назвать хорошим для целой структуры, но домены с одной топологией совместились.
Рисунок 3. Желтым показана структура 2HC9, синим - 2Q5C
Таким образом, несмотря на то, что полное совмещение белков даже при гибком выравнивании показало не лучший результат,
наблюдается пространственное совмещение доменов с одной топологией как при жестком, так и при гибком выравнивании.
Интересно, что координаты доменов, найденные pDomain не всегда совпадают с теми, что находят те же SCOP и CATH.