На главную страницу На страницу шестого семестра |
Пример использования трехмерного QSAR анализа для предсказания активности низкомолекулярных соединений в отношении данного белка. |
Файлы по практикуму.
Задание 11)Для проведения 3DQSAR анализа мы будем использовать программы Open3DQSAR и Open3DALIGN (open3dqsar.sourceforge.net).Дан набор из 88 веществ – ингибиторов тромбина (compounds.sdf). Для 85 из них активность известна, для трех – нам предстоит предсказать. Для начала необходимо построить пространственное выравнивание активных конформаций исследуемых веществ. Будем считать активной конформацией (то есть конформацией, в которой вещество-ингибитор взаимодействует с белком-мишенью) наиболее энергетически выгодную конформацию (часто это вполне соответствует истине). Попробуем сгенерировать эти конформации, используя программу obconformer из пакета OpenBabel: Получим файл compounds_best_conformer.sdf Далее необходимо сделать выравнивание полученных конформеров. Попробуем сделать это с помощью программы Open3DALIGN (open3dalign.sourceforge.net). То, что получилось: 3DQSARЗапустим программу, загрузим файл со структурами, загрузим файл с активностями данных соединений,зададим решетку вокруг исследуемых соединений. Давайте оставим часть наших соединений в качестве тестового набора, и не будем использовать их для построения модели, а также исключим (пока что) соединения с неизвестной активностью. Рассчитаем значения энергии ван-дер-Ваальсовых взаимодействий в узлах решетки. В некоторых узлах решетки псевдо-атом зонда (probe) находится слишком близко к атомам исследуемых содеинений, и дает слишком большую по модулю энергию. Установим ограничения на значения энергии. Cлишком маленькие значения энергии приравняем к 0.Исключим из анализа ячейки, в которых вариабельность в энергии взаимодействия с зондом для разных соединений малаю Построим регрессионную моделью
Получили коэффициенты корреляции для разного количества компонент, выделенных PLS. Pезультат построения регрессионой модели.Данная регрессионая модель должна работать неплохо, т.к. для 5 компонент коэффициент r^2 практически равен 1. Exp. Cum. exp. Exp. Cum. exp. PC var. X % var. X % var. Y % var. Y % SDEC r2 -------------------------------------------------------------------------- 0 0.0000 0.0000 0.0000 0.0000 0.9494 0.0000 1 15.9480 15.9480 32.8386 32.8386 0.7780 0.3284 2 5.1333 21.0813 36.3625 69.2011 0.5269 0.6920 3 4.6235 25.7048 15.6991 84.9002 0.3689 0.8490 4 3.8908 29.5956 7.5246 92.4248 0.2613 0.9242 5 4.0108 33.6064 2.8661 95.2909 0.2060 0.9529После кросс-валидации: PC SDEP q2 -------------------------- 0 0.9658 -0.0348 1 0.9164 0.0683 2 0.9733 -0.0509 3 0.9667 -0.0368 4 0.9880 -0.0829 5 0.9497 -0.0006При предсказании для тестовой выборки: PC r2(pred) SDEP -------------------------- 0 0.0000 1.0362 1 0.2655 0.8881 2 0.3296 0.8484 3 0.2353 0.9061 4 0.2754 0.8821 5 0.2536 0.8953 External predictions for dependent variable 1 (activity) -------------------------------------------------------------------------------------------------------------------------------------- N ID Name Actual 1 2 3 4 5 Opt PC n -------------------------------------------------------------------------------------------------------------------------------------- 60 60 05 8.1300 6.5362 6.5649 6.3036 6.1863 5.9037 2 61 61 07 7.8500 6.4288 5.8625 5.6520 6.0942 6.2735 1 62 62 10 7.7400 6.4525 6.8117 6.4491 6.5000 6.6354 2 63 63 11 7.7200 6.8459 7.0126 6.9466 6.9444 6.8063 2 64 64 14 7.5900 7.3339 7.2983 7.3018 7.2489 7.2357 1 65 65 16 7.4900 6.2337 6.9087 6.2785 6.2531 6.2390 2 66 66 20 7.3800 6.6250 6.2796 6.6885 6.5894 6.4578 3 67 67 21 7.3800 7.2617 6.7962 6.7349 6.6871 6.6377 1 68 68 29 6.9200 6.0938 5.9982 6.5703 6.5950 6.6329 5 69 69 30 6.9200 7.0488 6.8133 6.9456 6.7432 6.6088 3 70 70 31 6.9200 6.2497 6.9553 6.5524 6.6453 6.5897 2 71 71 35 6.7400 6.3576 6.7909 6.5704 6.7257 6.8988 4 72 72 39 6.6400 6.9040 7.4506 7.4324 7.5115 7.4146 1 73 73 46 6.4600 6.5787 6.3273 6.7238 6.2675 6.3233 1 74 74 49 6.2900 6.7069 6.5479 6.8242 6.8664 6.8862 2 75 75 51 6.2000 6.4310 6.7395 6.9855 6.8379 6.7511 1 76 76 54 6.0500 6.5177 6.3290 5.6878 6.0452 6.2058 4 77 77 56 5.9200 6.7963 7.2268 7.2174 6.9654 6.8699 1 78 78 58 5.6800 6.8033 6.6625 6.5011 6.4594 6.3098 5 79 79 61 5.5100 6.8759 6.9176 6.5928 6.6264 6.5714 5 80 80 65 5.1400 5.9560 5.2147 5.9189 5.9486 5.8982 2 81 81 67 4.8200 6.2282 5.7426 5.4340 5.7148 5.8929 3 82 82 70 4.5200 5.7210 5.5225 5.5448 5.7092 5.7558 2 83 83 71 4.4600 5.4736 4.9005 5.3628 5.3651 5.3559 2 84 84 81 6.5900 7.2111 7.0976 6.8200 6.6761 6.5722 5 85 85 82 6.5500 6.2816 6.7431 6.6970 6.8455 6.9410 3 2.Используем выравнивание и конформации, полученные с учетом структуры активного центра белка-мишени.Exp. Cum. exp. Exp. Cum. exp. PC var. X % var. X % var. Y % var. Y % SDEC r2 -------------------------------------------------------------------------- 0 0.0000 0.0000 0.0000 0.0000 0.9494 0.0000 1 12.1342 12.1342 48.4736 48.4736 0.6815 0.4847 2 13.2295 25.3637 14.5885 63.0621 0.5770 0.6306 3 7.6412 33.0049 13.2040 76.2661 0.4625 0.7627 4 8.0257 41.0305 4.3684 80.6345 0.4178 0.8063 5 6.0521 47.0827 3.8642 84.4987 0.3738 0.8450Кросс-валидация: PC SDEP q2 -------------------------- 0 0.9658 -0.0348 1 0.8027 0.2851 2 0.7664 0.3484 3 0.7061 0.4468 4 0.6735 0.4968 5 0.6401 0.5454Предсказание: External predictions for dependent variable 1 (activity) -------------------------------------------------------------------------------------------------------------------------------------- N ID Name Actual 1 2 3 4 5 Opt PC n -------------------------------------------------------------------------------------------------------------------------------------- 60 60 05 8.1300 7.8242 8.3027 8.4469 8.4282 8.1373 5 61 61 07 7.8500 6.4778 6.7144 6.2771 6.3645 6.1222 2 62 62 10 7.7400 7.2452 7.0656 7.2068 7.4376 7.3230 4 63 63 11 7.7200 7.6375 7.7144 7.8404 7.8458 7.7871 2 64 64 14 7.5900 7.1132 7.2879 7.4345 7.4701 7.3577 4 65 65 16 7.4900 7.0379 7.4351 7.3003 7.6168 7.6091 2 66 66 20 7.3800 7.0451 7.0807 7.6269 7.7125 7.5696 5 67 67 21 7.3800 6.6323 6.5107 6.7671 6.6284 6.5963 3 68 68 29 6.9200 7.1483 7.1651 7.6502 7.7134 7.5493 1 69 69 30 6.9200 7.0308 7.0890 7.5595 7.6340 7.6237 1 70 70 31 6.9200 6.8983 7.0028 7.7750 7.8847 7.7025 1 71 71 35 6.7400 6.5888 6.8182 6.2524 6.4197 6.4862 2 72 72 39 6.6400 5.7744 6.7056 6.6515 6.8244 6.8768 3 73 73 46 6.4600 5.9984 5.7132 5.7748 5.8811 6.0657 5 74 74 49 6.2900 6.5493 6.7236 6.8609 6.5919 6.9988 1 75 75 51 6.2000 6.0694 6.1966 6.3561 6.0004 6.1955 2 76 76 54 6.0500 5.2846 6.3125 6.0498 6.0197 6.3106 3 77 77 56 5.9200 6.4134 6.4729 5.9423 6.0789 5.9353 5 78 78 58 5.6800 7.1586 7.2264 6.4843 6.1598 6.0545 5 79 79 61 5.5100 7.1860 7.3900 6.7100 6.4666 6.4878 4 80 80 65 5.1400 5.7143 6.5006 6.2754 6.4480 6.1988 1 81 81 67 4.8200 5.9485 4.9121 4.3849 4.4630 4.2796 2 82 82 70 4.5200 5.1084 4.6466 4.3519 4.3077 4.1848 2 83 83 71 4.4600 6.9103 6.9730 7.4976 7.5830 7.6988 1 84 84 81 6.5900 6.7543 6.9522 7.2011 7.0336 7.3282 1 85 85 82 6.5500 6.4404 7.4006 7.0525 7.3994 7.2651 1 PC r2(pred) SDEP -------------------------- 0 0.0000 1.0362 1 0.3451 0.8385 2 0.3226 0.8529 3 0.2998 0.8671 4 0.3012 0.8662 5 0.2693 0.8858Используем модель для предсказания активностей соединений: Модель: Exp. Cum. exp. Exp. Cum. exp. PC var. X % var. X % var. Y % var. Y % SDEC r2 -------------------------------------------------------------------------- 0 0.0000 0.0000 0.0000 0.0000 0.9749 0.0000 1 12.5822 12.5822 46.4042 46.4042 0.7137 0.4640 2 14.2226 26.8048 15.5157 61.9199 0.6016 0.6192 3 6.7847 33.5895 11.1828 73.1027 0.5056 0.7310 4 8.7614 42.3509 4.2898 77.3925 0.4635 0.7739 5 4.7029 47.0537 4.5965 81.9889 0.4137 0.8199 Кросс-валидация: PC SDEP q2 -------------------------- 0 0.9865 -0.0240 1 0.8233 0.2868 2 0.7521 0.4049 3 0.7084 0.4720 4 0.6963 0.4899 5 0.7061 0.4754 Прeдсказание: External predictions for dependent variable 1 (activity) -------------------------------------------------------------------------------------------------------------------------------------- N ID Name Actual 1 2 3 4 5 Opt PC n -------------------------------------------------------------------------------------------------------------------------------------- 86 86 01 0.0000 7.1119 7.5466 7.4119 7.6262 7.7234 1 87 87 44 0.0000 6.9428 7.1202 7.0946 7.3278 7.5477 1 88 88 72 0.0000 5.5073 5.2436 5.1697 5.4378 5.4696 3 PC r2(pred) SDEP -------------------------- 0 0.0000 6.6604 1 0.0298 6.5603 2 -0.0155 6.7118 3 0.0082 6.6331 4 -0.0627 6.8660 5 -0.1011 6.9889Итак, предсказание активности: N Activity ================ 86 7.6262 87 7.3278 88 5.4378 |
|
© Zhuravleva Katya, 2009 |