Гомологичное моделирование комплекса белка с лигандом.

Цель: ознакомится с возможностями гомологичного моделирования комплекса белка с лигандом.

В этом занятии мы будем пользоваться пакетом Modeller. Мы будем работать с белком лизоцимом из указанного организма.

Используя известную структуру лизоцима форели как образец, нам необходимо построить модель комплекса белка с

лигандом.

1. Построим выравнивание последовательности из структуры ID: 1lmp и LYSC_FUGRU.

Белок LYSC_FUGRU принадлежит такому вот пятнистому глазастому созданию:

Рекомендуемые ресурсы и программы: Clustal и GeneDoc Полученное выравнивание сохраните в формате PIR. align.pir

2. Теперь модифицируем файл выравнивания:
Переименуем последовательность в файле выравнивания, как в примере:

БЫЛО	СТАЛО
>P1;UNIPROT\|P37712\|LYSC_CAMDR	>P1;SEQ
>P1;1LMP__\|PDBID\|CHAIN\|SEQUENCE	>P1;1LMP

После имени последовательности моделируемого белка добавляем строчку:

sequence:ХХХХХ::::::: 0.00: 0.00

эта строчка описывает входные параметры последовательности для modeller.

После имени последовательности белка-образца добавляем:

structureX:1lmp_now.ent:1 :A: 132 :A:undefined:undefined:-1.00:-1.00

эта строчка описывает, какой файл содержит структуру белка с этой последовательностью, номера первой и последней аминокислот в структуре, идентификатор цепи и т.д.

В конце каждой последовательности добавляем символы:

/.

Символ "/" означает конец цепи белка. Точка указывает на то, что имеется один лиганд (если бы было два лиганда стояли бы две точки).

Модифицированное выравнивание.

3. Теперь необходимо модифицировать файл со структурой.

Удалили из структуры всю воду, всем атомам лиганда присвоили один и тот же номер "остатка" (130), одно и то же имя "остатка" (NAG), модифицируем имена атомов каждого остатка, добавив в конец буквы A, B и C (чтобы у каждого атома было разное имя). Смысл операции в том, что атомы остатка 130 имели индекс А, атомы остатка 131 имели индекс В и т.д.

Пример:

БЫЛО	СТАЛО
HETATM 1014 O7 NAG 130	HETATM 1014 O7A NAG 130
HETATM 1015 C1 NAG 131	HETATM 1015 C1B NAG 130

Получили файл: 1lmp_now

4. Теперь перейдем к созданию управляющего скрипта
У нас есть следующая заготовка:

from modeller.automodel import *  
class mymodel(automodel):      
    def special_restraints(self, aln):          
    rsr = self.restraints          
        for ids in (('OD2:115:A', 'O6A:144:B'),      
                    ('ND2:74:A', 'O7B:144:B'),
                    ('N:123:A', 'O6C:144:B')):                      
                    atoms = [self.atoms[i] for i in ids]                      
                    rsr.add(forms.upper_bound(group=physical.upper_distance,                        
                      feature=features.distance(*atoms), mean=3.5, stdev=0.1))   
env = environ()  
env.io.hetatm = True  
a = mymodel(env, alnfile='test1.ali', knowns=('1lmp'), sequence='seq')  
a.starting_model = 1  
a.ending_model = 5  
a.make()

В скрипте указано:

что нужно использовать стандартные валентные углы в полипептидной цепи (строчка 4)
что дополнительно нужно сохранять взаимное расположение определенных пар атомов (3.5 ангстрема);
В данном случае трех атомов белка, образующих водородные связи с тремя атомами лиганда - строчки 5-7 с ID пар атомов; параметры взаимного расположения атомов пары описаны в строчке 9-10. 3 точки могут однозначно расположить сложную структуру в пространстве, поэтому мы выбираем водородные связи как источник данных точек.
что ковалентные связи в гетероатомах нужно вычислять по расстояниям между атомами (так же, как это делает Rasmol), строчка 12
что имя файла с выравниванием и имена последовательностей образца и моделируемого белка, строчка 13 (а имя файла со структурой содержится в выравнивании)
что число и номера моделей, которые нужно построить (в данном примере 5 моделей), строки 14-15
что пора строить модель строчка 16

В скрипте необходимо отредактировать строчки, в которых указаны, какие водородные связи белка с лигандом должны быть В БУДУЩЕЙ МОДЕЛИ.

Номера остатков и имена нужных атомов определим по выравниванию и тому, какие водородные связи имеются в образце.

Критерий водородной связи: расстояние менее 3.5 ангстрем между азотом или кислородом белка с подходящими атомами лиганда.

Если в моделируемом белке число остатков не совпадает с числом остатков в белке-образце, то номера "остатков" лиганда изменятся.

ВНИМАНИЕ. В скриптовом языке (на основе python ) важно с какого столбца начинается информация. Необходимо соблюдать предложенный в заготовке синтаксис.

Запуск скрипта:

mod9v7 scr.py

Получили пять различных моделей:

SEQ.B99990001.pdb, SEQ.B99990002.pdb, SEQ.B99990003.pdb, SEQ.B99990004.pdb, SEQ.B99990005.pdb

Модели очень похожи. N-конец всех моделей представляет собой длинный хвост. Возник он потому, что в структуре белка-образца не было соответствующих аминокислотных остатков. Следовательно, при моделировании по гомологии данный участок белка никак не структурировался.

Выбор лучшей модели:

Проверим качество моделей. Для этого будем использовать сервис WHATIF.

Параметры первой модели:

Structure Z-scores, positive is better than average:
1st generation packing quality : -2.295
2nd generation packing quality : -2.720
Ramachandran plot appearance : 0.388
chi-1/chi-2 rotamer normality : -2.897
Backbone conformation : -1.554

RMS Z-scores, should be close to 1.0:
Bond lengths : 0.930
Bond angles : 1.275
Omega angle restraints : 0.734
Side chain planarity : 0.413 (tight)
Improper dihedral distribution : 1.151
Inside/Outside distribution : 1.049

Параметры второй модели:

Structure Z-scores, positive is better than average:
1st generation packing quality : -2.379
2nd generation packing quality : -2.271
Ramachandran plot appearance : 0.285
chi-1/chi-2 rotamer normality : -2.612
Backbone conformation : -1.539

RMS Z-scores, should be close to 1.0:
Bond lengths : 0.926
Bond angles : 1.340
Omega angle restraints : 0.767
Side chain planarity : 0.389 (tight)
Improper dihedral distribution : 1.052
Inside/Outside distribution : 1.040

Параметры третьей модели:

Structure Z-scores, positive is better than average:
1st generation packing quality : -2.426
2nd generation packing quality : -2.732
Ramachandran plot appearance : -0.253
chi-1/chi-2 rotamer normality : -2.415
Backbone conformation : -1.519

RMS Z-scores, should be close to 1.0:
Bond lengths : 0.941
Bond angles : 1.332
Omega angle restraints : 0.853
Side chain planarity : 0.368 (tight)
Improper dihedral distribution : 1.109
Inside/Outside distribution : 1.061

Параметры четвертой модели:

Structure Z-scores, positive is better than average:
1st generation packing quality : -2.393
2nd generation packing quality : -2.699
Ramachandran plot appearance : -0.226
chi-1/chi-2 rotamer normality : -1.885
Backbone conformation : -1.554

RMS Z-scores, should be close to 1.0:
Bond lengths : 0.932
Bond angles : 1.306
Omega angle restraints : 0.815
Side chain planarity : 0.316 (tight)
Improper dihedral distribution : 1.087
Inside/Outside distribution : 1.044

Параметры пятой модели:

Structure Z-scores, positive is better than average:
1st generation packing quality : -2.392
2nd generation packing quality : -2.753
Ramachandran plot appearance : 0.102
chi-1/chi-2 rotamer normality : -2.956
Backbone conformation : -1.711

RMS Z-scores, should be close to 1.0:
Bond lengths : 0.937
Bond angles : 1.300
Omega angle restraints : 0.730
Side chain planarity : 0.352 (tight)
Improper dihedral distribution : 1.001
Inside/Outside distribution : 1.055

По результатам оценки RMS Z-scores получаем, что лучшая модель - модель под номером 2.

По результам сравнения данных о карте Рамачандрана лучшей считается модель номер 1.

У первой модели совсем небольшое отличие по RMS Z-scores от второй ( разница в 0,004), поэтому, наверное, лучшей можно считать модель под номером 1.