Главная

SCOP и CATH

  1. Классификация доменов согласно SCOP
    1. запись 1A40
      • Цепь А: 1-321
      • Классификация по SCOP (класс, укладка, суперсемейство, семейство):
        	Класс: Alpha and beta proteins a/b (главным образом параллельные бета-листы (бета-альфа-бета единицы))
        	Укладка: Periplasmic binding protein-like II (периплазматический связывающий белок типа II)
        	Суперсемейство: Periplasmic binding protein-like II (отличается от суперсемейства типа I по топологии)
        	Семейство: Periplasmic binding protein-like II
        	Белок: фосфат-связывающий белок	
        
      • В данном суперсемействе содержится 3 семейства:
        • Phosphate binding protein-like
        • Transferrin
        • PG0945 N-terminal domain-like
      • Такую укладку имеет только 1 семейство.
    2. запись 1T9H
        цепь А: 1-67 (10-76 согласно pDomain - SCOP)
        • Классификация
          	Класс: All beta proteins (бета-белки)
          	Укладка: OB-fold (баррель, закрытый или частично открытый n=5, S=10 or S=8; греческий ключ) 
          	Суперсемейство: Nucleic acid-binding proteins (белки, связывающие аминокислоты)
          	Семейство: Cold shock DNA-binding domain-like (ДНК-связывающий домен при холодном шоке; баррель, закрытый n=5, S=8)
          	Белок: возможная ГТФаза EngC, N-терминальный домен 
          
        • В данном суперсемействе содержится 16 семейств(список)
        • Такую укладку имеют 16 суперсемейств(список)
        цепь А: 68-298 (77-307 согласно pDomain - SCOP)
        • Классификация
          	Класс:  Alpha and beta proteins (a/b)
          	Укладка: P-loop containing nucleoside triphosphate hydrolases
          	Суперсемейство: P-loop containing nucleoside triphosphate hydrolases
          	Семейство: G proteins (G-белки)
          	Белок: возможная ГТФаза EngC, C-терминальный домен 
          
        • В данном суперсемействе содержится 24 семейства(список)
        • Такую укладку имеет 1 суперсемейство
  2. Классификация доменов согласно CATH
    1. A140

        цепь А: 1-77, 230-239, 254-321

      • Классификация по CATH: 3.40.190.10.1.1.1.1.4
      • Класс: Alpha Beta	
        Архитектура: 3-Layer(aba) Sandwich	
        Топология: D-Maltodextrin-Binding Protein; domain 2	
        Суперсемейство: Periplasmic binding protein-like II
           
      • В данном суперсемействе содержится 103 семейств
      • Такую топологию содержит 7 суперсемейств

        цепь А: 78-229, 240-253

      • Классификация по CATH: 3.40.190.10.7.1.1.4.1
      • Класс: Alpha Beta	
        Архитектура: 3-Layer(aba) Sandwich	
        Топология: D-Maltodextrin-Binding Protein; domain 2	
        Суперсемейство: Periplasmic binding protein-like II
        
      • В данном суперсемействе содержится 103 семейств
      • Такую топологию содержит 7 суперсемейств
    2. 1T9H

        цепь А: -7-65 (2-74 согласно pDomain-CATH)

      • Классификация по CATH: 2.40.50.140.28.1.1.1.1
        Класс: Mainly Beta	
        Архитектура: Beta Barrel	
        Топология: OB fold (Dihydrolipoamide Acetyltransferase, E2P)	
        Суперсемейство: Nucleic acid-binding proteins
        
      • В данном суперсемействе содержится 89 семейств
      • Такую топологию содержит 19 суперсемейств

        цепь А: 66-230 (75-239 согласно pDomain-CATH)

      • Классификация по CATH: 3.40.50.300.106.1.1.1.1
      • Класс: Alpha Beta	
        Архитектура: 3-Layer(aba) Sandwich	
        Топология: Rossmann fold	
        Суперсемейство: P-loop containing nucleotide triphosphate hydrolases
        
      • В данном суперсемействе содержится 208 семейств
      • Такую топологию содержит 139 суперсемейств

        цепь А: 231-298 (240-307 согласно pDomain-CATH)

      • Классификация по CATH: 1.10.40.50.1.1.1.1.1
      • Класс: Mainly Alpha	
        Архитектура: Orthogonal Bundle	
        Топология: Ribonucleotide Reductase Protein R1; domain 1	
        Суперсемейство: Probable gtpase engc; domain 3
        
      • В данном суперсемействе содержится 2 семейств
      • Такую топологию содержит 5 суперсемейств
  3. Сравнение SCOP и CATH.

    1A40: количество доменов, которые выделили эти программы различаются, но суперсемейства, в которые входят домены, совпадают. Топология CATH отличается от укладки SCOP. Это, наверное, связано с тем, что CATH использует базу уже выделенных доменов, в частности, здесь это домены записи 1ixh. Почему CATH выделил 2 разных домена? Разделение, вероятно, связано с тем, что в CATH существуют больше нижних уровней классификации с разной степенью сходства выравнивания последовательностей (35%, 60%, 95%, 100%).

    1T9H: SCOP выделил 2 домена, CATH - 3; первые домены (1t9hA01) совпадают с точностью до нескольких нуклеотидов и по классификации. Домен 1t9hA02 (CATH) является частью домена 1t9hA02 (SCOP), совпадают по суперсемейству. Что касается домена 1t9hA02, то различие в классификации начинается на верхних уровнях, в классе, что опять же связано с основным принципом работы алгоритма (поиск похожих доменов среди уже выделенных).

  4. Выравнивание доменов, имеющих одну укладку, но состоящих в разных суперсемействах.

    Были выбраны цепи А записей 2Q5C и 2HC9 для строения структурного выравнивания двух доменов с одной топологией по CATH (Rossmann fold), но из разных суперсемейств (PrpR receptor domain-like и Zn-dependent exopeptidases соответственно).
    Доменная структура согласно pDomain:

    	
    		CATH	2Q5CA1	2-77, 168-188
                            2Q5CA2	78-167
    		CATH	2HC9A1	2-155
    			2HC9A2	156-490
    Программой PDBeFOLD построили выравнивание, подали на вход программе Geometrical core, получили список остатков, принадлежаших геометрическому ядру, затем с помощью команды pair_fit в PyMOL получили изображение на рис.1.


    Рисунок 1. Зеленым показана цепь А 2HC9, желтым - 2Q5C, красным - геометрическое ядро. RMSD = 1.223

    Как можно было ожидать, остатки геометрического ядра совмещеются хорошо, с низким значением RMSD.
    Но, в целом, пространственные структуры белков совместились плохо.

    При работе с файлом 2HC9.pdb было обнаружено, что среди остатков, входящих в геометрическое ядро,
    есть 2 остатка 345 и 466, имеющих 2 возможные конформации (В этой записи подобных остатков несколько). Изображение на рис.2.


    Рисунок 2. Остатки, имеющие альтернативные конформации (в том числе Сα-атома)

    Гибкое выравнивание с помощью FATCAT показано на рис.3. Характеристики выравнивания: RMSD = 2.89, 4 изгиба, 5 кластеров.
    Как можно видеть, на рисунке 3, совмещение нельзя назвать хорошим для целой структуры, но домены с одной топологией совместились.


    Рисунок 3. Желтым показана структура 2HC9, синим - 2Q5C

    Таким образом, несмотря на то, что полное совмещение белков даже при гибком выравнивании показало не лучший результат,
    наблюдается пространственное совмещение доменов с одной топологией как при жестком, так и при гибком выравнивании.

    Интересно, что координаты доменов, найденные pDomain не всегда совпадают с теми, что находят те же SCOP и CATH.





© Ксения Лежнина 2008-2010