В этом занятии мы будем пользоваться пакетом Modeller. Мы будем работать с белком лизоцимом из указанного организма.
Используя известную структуру лизоцима форели как образец, нам необходимо построить модель комплекса белка с
лигандом.
1. Построим выравнивание последовательности из структуры ID: 1lmp и LYSC_FUGRU.
Белок LYSC_FUGRU принадлежит такому вот пятнистому глазастому созданию:
Рекомендуемые ресурсы и программы: Clustal и GeneDoc Полученное выравнивание сохраните в формате PIR. align.pir
2. Теперь модифицируем файл выравнивания:
Переименуем последовательность в файле выравнивания, как в примере:
БЫЛО | СТАЛО |
---|---|
>P1;UNIPROT|P37712|LYSC_CAMDR | >P1;SEQ |
>P1;1LMP__|PDBID|CHAIN|SEQUENCE | >P1;1LMP |
После имени последовательности моделируемого белка добавляем строчку:
sequence:ХХХХХ::::::: 0.00: 0.00
эта строчка описывает входные параметры последовательности для modeller.
После имени последовательности белка-образца добавляем:
structureX:1lmp_now.ent:1 :A: 132 :A:undefined:undefined:-1.00:-1.00эта строчка описывает, какой файл содержит структуру белка с этой последовательностью, номера первой и последней аминокислот в структуре, идентификатор цепи и т.д.
/.
Символ "/" означает конец цепи белка. Точка указывает на то, что имеется один лиганд (если бы было два лиганда стояли бы две точки).
Модифицированное выравнивание.
3. Теперь необходимо модифицировать файл со структурой.
Удалили из структуры всю воду, всем атомам лиганда присвоили один и тот же номер "остатка" (130), одно и то же имя "остатка" (NAG), модифицируем имена атомов каждого остатка, добавив в конец буквы A, B и C (чтобы у каждого атома было разное имя). Смысл операции в том, что атомы остатка 130 имели индекс А, атомы остатка 131 имели индекс В и т.д.
Пример:
БЫЛО | СТАЛО |
---|---|
HETATM 1014 O7 NAG 130 | HETATM 1014 O7A NAG 130 |
HETATM 1015 C1 NAG 131 | HETATM 1015 C1B NAG 130 |
Получили файл: 1lmp_now
4. Теперь перейдем к созданию управляющего скрипта
У нас есть следующая заготовка:
from modeller.automodel import * class mymodel(automodel): def special_restraints(self, aln): rsr = self.restraints for ids in (('OD2:115:A', 'O6A:144:B'), ('ND2:74:A', 'O7B:144:B'), ('N:123:A', 'O6C:144:B')): atoms = [self.atoms[i] for i in ids] rsr.add(forms.upper_bound(group=physical.upper_distance, feature=features.distance(*atoms), mean=3.5, stdev=0.1)) env = environ() env.io.hetatm = True a = mymodel(env, alnfile='test1.ali', knowns=('1lmp'), sequence='seq') a.starting_model = 1 a.ending_model = 5 a.make()
В скрипте указано:
В скрипте необходимо отредактировать строчки, в которых указаны, какие водородные связи белка с лигандом должны быть В БУДУЩЕЙ МОДЕЛИ.
Номера остатков и имена нужных атомов определим по выравниванию и тому, какие водородные связи имеются в образце.
Критерий водородной связи: расстояние менее 3.5 ангстрем между азотом или кислородом белка с подходящими атомами лиганда.
Если в моделируемом белке число остатков не совпадает с числом остатков в белке-образце, то номера "остатков" лиганда изменятся.
ВНИМАНИЕ. В скриптовом языке (на основе python ) важно с какого столбца начинается информация. Необходимо соблюдать предложенный в заготовке синтаксис.
Запуск скрипта:
mod9v7 scr.py
Получили пять различных моделей:
SEQ.B99990001.pdb, SEQ.B99990002.pdb, SEQ.B99990003.pdb, SEQ.B99990004.pdb, SEQ.B99990005.pdb
Модели очень похожи. N-конец всех моделей представляет собой длинный хвост. Возник он потому, что в структуре белка-образца не было соответствующих аминокислотных остатков. Следовательно, при моделировании по гомологии данный участок белка никак не структурировался.
Выбор лучшей модели:
Проверим качество моделей. Для этого будем использовать сервис WHATIF.
Structure Z-scores, positive is better than average:
1st generation packing quality : -2.295
2nd generation packing quality : -2.720
Ramachandran plot appearance : 0.388
chi-1/chi-2 rotamer normality : -2.897
Backbone conformation : -1.554
RMS Z-scores, should be close to 1.0:
Bond lengths : 0.930
Bond angles : 1.275
Omega angle restraints : 0.734
Side chain planarity : 0.413 (tight)
Improper dihedral distribution : 1.151
Inside/Outside distribution : 1.049
Structure Z-scores, positive is better than average:
1st generation packing quality : -2.379
2nd generation packing quality : -2.271
Ramachandran plot appearance : 0.285
chi-1/chi-2 rotamer normality : -2.612
Backbone conformation : -1.539
RMS Z-scores, should be close to 1.0:
Bond lengths : 0.926
Bond angles : 1.340
Omega angle restraints : 0.767
Side chain planarity : 0.389 (tight)
Improper dihedral distribution : 1.052
Inside/Outside distribution : 1.040
Structure Z-scores, positive is better than average:
1st generation packing quality : -2.426
2nd generation packing quality : -2.732
Ramachandran plot appearance : -0.253
chi-1/chi-2 rotamer normality : -2.415
Backbone conformation : -1.519
RMS Z-scores, should be close to 1.0:
Bond lengths : 0.941
Bond angles : 1.332
Omega angle restraints : 0.853
Side chain planarity : 0.368 (tight)
Improper dihedral distribution : 1.109
Inside/Outside distribution : 1.061
Structure Z-scores, positive is better than average:
1st generation packing quality : -2.393
2nd generation packing quality : -2.699
Ramachandran plot appearance : -0.226
chi-1/chi-2 rotamer normality : -1.885
Backbone conformation : -1.554
RMS Z-scores, should be close to 1.0:
Bond lengths : 0.932
Bond angles : 1.306
Omega angle restraints : 0.815
Side chain planarity : 0.316 (tight)
Improper dihedral distribution : 1.087
Inside/Outside distribution : 1.044
Structure Z-scores, positive is better than average:
1st generation packing quality : -2.392
2nd generation packing quality : -2.753
Ramachandran plot appearance : 0.102
chi-1/chi-2 rotamer normality : -2.956
Backbone conformation : -1.711
RMS Z-scores, should be close to 1.0:
Bond lengths : 0.937
Bond angles : 1.300
Omega angle restraints : 0.730
Side chain planarity : 0.352 (tight)
Improper dihedral distribution : 1.001
Inside/Outside distribution : 1.055
По результатам оценки RMS Z-scores получаем, что лучшая модель - модель под номером 2.
По результам сравнения данных о карте Рамачандрана лучшей считается модель номер 1.
У первой модели совсем небольшое отличие по RMS Z-scores от второй ( разница в 0,004), поэтому, наверное, лучшей можно считать модель под номером 1.