Занятие 9. Качество структуры: PROCHECK, EDS, PDB_REDO.

  1.   Анализ выдачи программы PROCHECK.
    На сайте БД PDBSum была найдена выдача программы PROCHECK для записи PDB 1KNP. Карта Рамачандрана для данной структуры:

    Модель считается хорошей, если более 90% остатков (отличных от Gly и Pro) попали в предпочитаемые области на карте. Здесь этот процент равен 83.9%. Следовательно, нашу модель можно считать достаточно неплохой, однако далеко не самой оптимальной. Замечу, что запрещенные области не содержат остатки, отличные от глицина и пролина, и что всего 0.6% остатков (Ile 108, Gln 109, Ala 133) содержатся в допустимой области (соответственно, 15,5% находятся в разрешенной области).
  2.   Работа на сервере EDS. Раздел Significant regions.
    На сервере EDS была открыта страница структуры 1KNP. По данным, содержащимся в разделе Significant regions, 33 остатка имеют большой Z-score по RSR. Для дальнейшего анализа был выбран аргинин 254, чей RSR составил 0.391, коэффициент корреляции для электронной плотности ("real-space correlation coefficient")- 0.668, Z-score пространственного R-фактора - 2.796895.
    В PyMol было создано изображение его модели с электронной плотностью уровня 0.5 (белый цвет) и уровня 1.0 (желтый цвет):

    Как видно из картинки, электронная плотность обоих уровней не охватывает модель аргинина полностью, NH2 и особенно NE в нее не вписаны, качество структуры для данного остатка низкое. Поэтому вполне закономерны плохие значения таких характеристик, как Z-score и RSR.
  3.  Работа на сервере EDS. Раздел PDB_REDO.
    R-values etc.
    From PDB headerCalculated from dataAfter conservative optimisationAfter full optimisation
    R0.23000.23600.22150.2131
    R-free0.28100.28010.25890.2494
    σR-free 0.00560.00520.0050
    R-free Z-score 6.527.377.30

    В первой колонке содержатся значения параметров, взятых из самой записи PDB, во второй - значения, посчитанные по имеющимся данным. Видно, что они очень близки между собой. В последней колонке находятся значения параметров после полной оптимизации. В этом случае, значения R-фактора и R-free уменьшились, иначе говоря улучшились. В то же время уменьшилась разница между ними (0.0363 против 0.0510 ранее), что также говорит об улучшении качества структуры. Однако значение Z-score увеличилось, что, наоборот свидетельствует об ухудшении оптимизации (положительное значение Z-score говорит либо о заранее предвзятом выборе множества для расчета R-free, либо о необходимости дальнейшей оптимизации (в идеале Z-score должен быть равен нулю)).
    WHAT_CHECK validation
    Original PDB entryConservatively optimisedFully optimised
    1st generation packing quality1-0.938-0.390-0.303
    2nd generation packing quality1-1.744-0.953-0.798
    Ramachandran plot appearance1-3.858-1.955-1.670
    Chi-1/Chi-2 rotamer normality1-3.507-0.8080.159
    Backbone conformation1-1.625-0.708-0.671
    Bond length RMS Z-score21.0360.3230.316
    Bond angle RMS Z-score21.2870.5960.589
    Total number of bumps33025252
    Unsatisfied H-bond donors/acceptors3745150

    1 Чем выше, тем лучше
    2 Должно быть меньше 1.000
    3 Чем меньше, тем лучше

    Как видно из таблицы, после полной оптимизации произошло улучшение по всем параметрам.
  4. (*) Скачайте оптимизированную структуру и попробуйте выяснить, чем она отличается от исходной. В частности, стал ли остаток, выбранный вами в упр. 2, лучше вписываться в электронную плотность?

     

  5. Выдача WHAT_CHECK для структуры из PDB.
    В данной выдаче содержится множество различной информации от карты Рамачандрана и вторичной структуры до неправильной номенклатуры атомов. Здесь также можно узнать о необычных конформациях остатков, о проблемах, связанных с В-фактором, о пропущенных атомах или даже о молекулах воды без водородной связи.
Меню
· Главная
· Результаты исследований
· Семестры
· Полезные ссылки
· Контакты
© Ирина Поверенная, 2008