Занятие 9. Гомологичное моделирование комплекса белка с лигандом.

Полезные ресурсы:

Цель: ознакомится с возможностями гомологичного моделирования комплекса белка с лигандом.

Будем работать с белком лизоцимом из организма LYSC_COLLI. Будем использовать известную структуру лизоцима форели как образец, нам необходимо построить модель комплекса белка (выбранного) с лигандом.

Будем использовать программу MODELLER для моделирования структуры белков, ей в качестве входных данных нужны: управляющий скрипт, файл pdb со структурой-образцом, файл выравнивания с дополнительной информацией.

  1. Построим выравнивание последовательности из структуры ID: 1lmp и белка LYSC_COLLI. Используем программу Clustal.
    Полученное выравнивание сохраняем в формате PIR.

  2. Теперь модифицируем файл выравнивания:
    Переименуем последовательность в файле выравнивания, как в примере:
    БЫЛО СТАЛО
    >P1;UNIPROT|P37712|LYSC_CAMDR >P1;SEQ
    >P1;1LMP__|PDBID|CHAIN|SEQUENCE >P1;1LMP
    После имени последовательности моделируемого белка добавляем строчку:

    sequence:ХХХХХ::::::: 0.00: 0.00
    эта строчка описывает входные параметры последовательности для modeller.

    После имени последовательности белка-образца добавляем:
    structureX:1lmp_now.ent:1 :A: 132 :A:undefined:undefined:-1.00:-1.00
    эта строчка описывает, какой файл содержит структуру белка с этой последовательностью, номера первой и последней аминокислот в структуре, идентификатор цепи и т.д.

    В конце каждой последовательности добавляем символы:
    /.
    Символ "/" означает конец цепи белка. Точка указывает на то, что имеется один лиганд (если бы было два лиганда стояли бы две точки).

    Модифицированное выравнивание
  3. Теперь необходимо модифицировать файл со структурой. Для этого удалим всю воду из структуры (в текстовом редакторе), всем атомам лиганда присвоим один и тот же номер "остатка" (MODELLER считает, что один лиганд = один остаток) и модифицируем имена атомов каждого остатка, добавив в конец буквы A, B, C. Смысл операции в том, что атомы остатка 130 имели индекс А, атомы остатка 131 имели индекс В и т.д. . После модификации имен атомов измените номера остатков на 130.
    Пример:
    БЫЛО СТАЛО
    HETATM 1014 O7 NAG 130 HETATM 1014 O7A NAG 130
    HETATM 1015 C1 NAG 131 HETATM 1015 C1B NAG 130

    Полученный файл

  4. Теперь перейдем к созданию управляющего скрипта
    У нас есть следующая заготовка:

    from modeller.automodel import *
    class mymodel(automodel):
        def special_restraints(self, aln):
            rsr = self.restraints
            for ids in (('OD1:98:A', 'O6A:131:A'),
                        ('N:65:A', 'O7B:132:A'),
                        ('OD2:73:A', 'O1C:133:A')):
                        atoms = [self.atoms[i] for i in ids]
                        rsr.add(forms.upper_bound(group=physical.upper_distance,
                          feature=features.distance(*atoms), mean=3.5, stdev=0.1)) 
    env = environ()
    env.io.hetatm = True
    a = mymodel(env, alnfile='test1.ali', knowns=('1lmp'), sequence='seq')
    a.starting_model = 1
    a.ending_model = 5
    a.make()
    В скрипте указано:

    В скрипте необходимо отредактировать строчки, в которых указаны какие водородные связи белка с лигандом должны быть В БУДУЩЕЙ МОДЕЛИ. Номера остатков и имена нужных атомов определим по выравниванию и тому, какие водородные связи имеются в образце. Критерий водородной связи: расстояние менее 3.5 ангстрем между азотом или кислородом белка с подходящими атомами лиганда.
    Если в моделируемом белке число остатков не совпадает с числом остатков в белке-образце, то номера "остатков" лиганда изменятся. 
    ВНИМАНИЕ. В скриптовом языке (на основе python ) важно с какого столбца начинается информация. Необходимо соблюдать предложенный в заготовке синтаксис.


    Полученный управляющий скрипт

  5. Запустим исполнение скрипта командой:

     mod9v7 myscript & 
  6. Просмотрим полученные модели.

  7. Как видим они лишь немного различаются по расположению боковых групп.

  8. Проверим качество моделей и выберем лучшую. Инструменты для оценки качества структуры можно найти в веб интерфейсе WHATIF .

Был проведен анализ с помощью Coarse Packing Quality Control:
модель 1    -     -1.119
модель 2    -     -1.095
модель 3    -     -1.163
модель 4    -     -1.136
модель 5    -     -1.143
1lmp        -     -0.984
If a residue has a score of -5.0 or lower, something is really going on: the residue makes symmetry contacts, is contacting a ligand
or an ion, or something is wrong.
Был проведен анализ с помощью Omega:
модель 1    -     Omega average = 181.946 and std. deviation = 4.271
модель 2    -     Omega average = 181.310 and std. deviation = 4.566
модель 3    -     Omega average = 181.983 and std. deviation = 4.424
модель 4    -     Omega average = 182.078 and std. deviation = 4.385
модель 5    -     Omega average = 182.260 and std. deviation = 4.807
1lmp        -     Omega average = 179.870 and std. deviation = 2.718
The omega angles for trans-peptide bonds in a structure is expected to give a
gaussian distribution with the average around +178 degrees, and a standard
deviation around 5.5.
По полученным данным можно сделать вывод, что лучшей структурой является модель 2:

© Пискунова Юлия 2011