Учебный сайт
Главная Семестры Проекты Обо мне

Cовмещения структур

Из банка PDB были получены записи 1hy0.pdb и 1i0a.pdb. Затем с помощью сервиса pDomains было получено разделение последовательности на домены (по данным CATH):
1hy0
1HY0A1 	27-123	195-234
1HY0A2 	124-194	235-364	437-463
1HY0A3 	365-436

1i0a
1I0AA1 	27-123	195-234
1I0AA2 	124-194	235-364	437-463
1I0AA3 	365-436
Соответствующие домены были совмещены в PyMOL командой align. Полученные изображения:
a) Домен 1, RMSD = 0,371
На изображении видно, что петли цепей (сверху) не совпадают


б) Домен 2, RMSD = 0,409
На изображении видно, что есть несколько участков, где структуры расходятся (петли, а также концевой участок). Особенно сильное расхождение в верхней петле


в) Домен 3, RMSD = 0,527
Явных расхождений не наблюдается, но RMSD самое низкое среди всех трех доменов: по всей длине наложения последовательности слегка расходятся


В целом, совмещение последовательностей дало очень хорошие результаты: структуры почти везде совпадают.

Структурное выравнивание программой SSM

C помощью программы PDBeFOLD было построено структурное выравнивание цепи A из 1AKH и цепи A из 1W0T. Полученное выравнивание можно посмотреть здесь.
Таблица с выдачей программы:
 Scoring   Rmsd  Nalgn Ng %seq Query Target (PDB entry)
 Q   P   Z  %sse Match %sse Nres Title
0.43 0.9 2.8 2.62 44 2 7 100 1w0t:A 100 52 HTRF1 DNA-BINDING DOMAIN IN COMPLEX WITH TELOMERIC DNA.
Расшифровка обозначений таблицы

По полученному выравниванию c помощью программы Geometrical core было найдено геометрическое ядро. Посмотреть расположение остатков из геометрического ядра относительно выровненных последовательностей можно здесь.

Таблица с остатками, входящими в геометрическое ядро:
Pos. 1AKH_A 1W0T_A
11 ALA83 LYS389
12 PHE84 ASN390
13 LEU85 LEU391
15 GLU87 SER393
28 LYS100 TRP403
29 GLU101 SER404
30 GLU102 LYS405
31 VAL103 ILE406
41 THR110 THR416
42 PRO111 SER417
43 LEU112 VAL418
44 GLN113 MET419
45 VAL114 LEU420
46 ARG115 LYS421
47 VAL116 ASP422
48 TRP117 ARG423
49 PHE118 TRP424
50 ILE119 ARG425
51 ASN120 THR426
52 LYS121 MET427
53 ARG122 LYS428
54 MET123 LYS429
55 ARG124 LEU430

C помощью команды pair_fit в PyMOL по остаткам, указанным в таблице, были совмещены структуры 1AKН и 1W0T.
pair_fit ch1 and (resi 83-85,87,100-103,110-124) and name ca, ch2 and (resi 389-391,393,403-406,416-430) and name ca
Полученное изображение (RMSD=0.865, учитывались 23 атома):


Для сравнения эти структуры были выровнены с помощью команды align.
Полученное изображение для выравнивания остатков(RMSD=1,340, учитывались 69 атомов):

Полученное изображение для выравнивания Ca атомов остатков(RMSD=3,231, учитывались 13 атомов):

Как видно на изображениях, совмещены только концевые спирали, остальные атомы не учитывались. Поэтому, несмотря на то, что RMSD не очень велико (для выравнивания остатков, в то время как для Са атомов rmsd>3 и даже визуально структуры совмещены хуже , чем при выравнивании остатков целиком, это плохой результат), в целом последовательности почти не совмещены в пространстве.
Таким образом, выравнивание геометрических ядер дает гораздо более точные результаты.

Интересно, что команда align в случае структур 1HY0 и 1I0A хорошо совместила их домены, а в случае 1AKН и 1W0T совмещения не произошло, хотя это было возможно, судя по результатам pair_fit.
Сравним последовательности пар этих структур.
Выравнивание (построено с помощью needle) последовательностей 1HY0 и 1I0A:
 Identity:     391/454 (86.1%)
 Similarity:   430/454 (94.7%)
 Gaps:           8/454 ( 1.8%) 

=======================================

1HY0-A             1 -------DPIMQMLSTSISTEQRLSEVDIQASIAYAKALEKAGILTKTEL     43
                            ||||::||:||||||||:|||||||:|||||||||.|||||||
1I0A-A             1 GRFVGSVDPIMEILSSSISTEQRLTEVDIQASMAYAKALEKASILTKTEL     50

1HY0-A            44 EKILSGLEKISEELSKGVIVVTQSDEDIQTANERRLKELIGDIAGKLHTG     93
                     |||||||||||||.||||:|:||||||||||.|||||||||||||||.||
1I0A-A            51 EKILSGLEKISEESSKGVLVMTQSDEDIQTAIERRLKELIGDIAGKLQTG    100

1HY0-A            94 RSRNEQVVTDLKLFMKNSLSIISTHLLQLIKTLVERAAIEIDVILPGYTH    143
                     |||||||||||||.:|:|:|:|||||||||||||||||||||:|:|||||
1I0A-A           101 RSRNEQVVTDLKLLLKSSISVISTHLLQLIKTLVERAAIEIDIIMPGYTH    150

1HY0-A           144 LQKAQPIRWSQFLLSHAVALTRDSERLGEVKKRINVLPLGSGALAGNPLD    193
                     ||||.|||||||||||||||||||||||||||||.|||||||.||||||:
1I0A-A           151 LQKALPIRWSQFLLSHAVALTRDSERLGEVKKRITVLPLGSGVLAGNPLE    200

1HY0-A           194 IDREMLRSELEFASISLNSMDAISERDFVVEFLSVATLLLIHLSKMAEDL    243
                     ||||:|||||:..||:|||:|||||||||||.:||||||:|||||:||||
1I0A-A           201 IDRELLRSELDMTSITLNSIDAISERDFVVELISVATLLMIHLSKLAEDL    250

1HY0-A           244 IIYSTSEFGFLTLSDAFSTGSSLMPQKKNPDSLELIRSKSGRVFGRLASI    293
                     ||:||:||||:|||||:||||||:|||||||||||||||:||||||||:|
1I0A-A           251 IIFSTTEFGFVTLSDAYSTGSSLLPQKKNPDSLELIRSKAGRVFGRLAAI    300

1HY0-A           294 LMVLKGLPSTYNKDLQEDKEAVIDVVDTLTAVLQVATGVISTLQISKENM    343
                     ||||||:|||::||||||||||:||||||||||||||||||||||:||||
1I0A-A           301 LMVLKGIPSTFSKDLQEDKEAVLDVVDTLTAVLQVATGVISTLQINKENM    350

1HY0-A           344 EKALTPEMLATDLALYLVRKGMPFRQAHTASGKAVHLAETKGIAINNLTL    393
                     |||||||:|:|||||||||||||.|||.|||||||||||||||.||||||
1I0A-A           351 EKALTPELLSTDLALYLVRKGMPIRQAQTASGKAVHLAETKGITINNLTL    400

1HY0-A           394 EDLKSISPLFSSDVSQVFNFVNSVEQYTALGGTAKSSVTTQIEQLRELMK    443
                     ||||||||||:|||||||:.|||||||||:|||||||||.||||||||:|
1I0A-A           401 EDLKSISPLFASDVSQVFSVVNSVEQYTAVGGTAKSSVTAQIEQLRELLK    450

1HY0-A           444 KQKE    447
                     ||| 
1I0A-A           451 KQK-    453
Выравнивание (построено с помощью needle) последовательностей 1AKН и 1W0T:
Identity:       5/86 ( 5.8%)
Similarity:     8/86 ( 9.3%)
Gaps:          71/86 (82.6%)

=======================================

1AKH-A             1 ISPQARAFLEEVFRRKQSLNSKEKEEVAKKCGITPLQVRVWFINKRMRS-     49
                                                       ..|..:|..:|.:|| 
1W0T-A             1 ----------------------------------KRQAWLWEEDKNLRSG     16

1AKH-A            49 ------------------------------------     49
                                                         
1W0T-A            17 VRKYGEGNWSKILLHYKFNNRTSVMLKDRWRTMKKL     52
Как хорошо видно, первая пара последовательностей практически идентична. Именно для нее с помощью align было получено хорошее совмещение. Но для второй пары картина другая: выравнивания практически нет, с минимальным сходством и идентичностью выровнены концевые участки. Возможно, именно это и объясняет ситуацию с align (с помощью которой для второй пары также было получено совмещение лишь концевых участков структур). Align, видимо, сначала строит выравнивание последовательностей, а затем по нему выравнивание структур, которое несколькими итерациями (отбрасывая плохо совмещающиеся остатки) улучшает (уменьшая RMSD). Таким образом, хорошо совмещены могут быть только близкие структуры. В случае с отдаленными (как 1AKН и 1W0T: первая находится у дрожжей, а вторая - у человека, их последовательности почти не совпадают) результат работы align будет плохим.

По-другому работает команда super. Она строит независимое от последовательностей выравнивае структур и итеративно его улучшает. Такой подход удобен в случаях, подобных описанному выше для 1AKН и 1W0T.
super ch1, ch2
Полученное изображение для совмещения остатков (RMSD=2.186, учитывалось 192 атома):


super ch1 and name ca, ch2 and name ca
Полученное изображение для совмещения Ca атомов (RMSD=1.970, учитывалось 39 атомов):


RMSD полученных совмещений выше, чем у тех, что были получены с помощью align и pair_fit, однако длина выравнивания намного больше, что явяляется хорошим показателем. Так же, как и по резульататм pair_fit, совмещены альфа-спирали, в то время как петли сильно расходятся.

© Яшина 2009