Задание 10 (выполнено Борисовой Мариной)

PSI-BLAST

Задача: изучить работу PSI-BLAST.

I. Исследование работы итерации на примере четырёх белков.

ID белка AC белка Число итераций Для первой итерации Для последней итерации
Число находок выше порога (0,005) Худшее E-value выше порога Лучшее E-value ниже порога Число находок выше порога (0,005) Худшее E-value выше порога Лучшее E-value ниже порога
 MINC_ECOLI  P18196  4  161  0.005 (MINC_BACWK)  0.005 (MINC_GEOKA)  196  0.005 (FRMA_ECOLI)  0.040 (SECA_ANADF)
 SSRP_ECOLI  P0A832  2  300  8e-15 (SSRP_CAMFF)  нет  300  5e-37 (SSRP_POLSQ)  нет
 NUSB_ECOLI  P0A780  3  431  0.003(NUSB_RICAH)  0.015 (RSMB_SYNY3)  300  8e-04(RSMB_COXBU)  нет
 FDNG_ECOLI  P24183  5  147  0.004 (DMSA_RHOSH)  0.008 (NARG_ECOLI)  197  2e- 24 (T1RE_ECOLX)  0.016 (ILVX_BACSU)

 

II. Изучение сходимости итераций.

Расходятся итерации для белков P18196 и P24183. Попробуем посмотреть, что произойдёт для повышения и понижения порога (в ячейках указано количество находок в первой итерации - в пятой):

белок\порог 0.001 0.05 0.0005
P18196 154-188 166-500 149-188
P24183 145-193 152-492 145-193

После этих попыток видно, что всё равно итерации не сходятся.

В работах выполненных однокурсниками два года назад получилось добиться того, чтобы итерации сошлись. Возможно, это из-за того, что БД SwissProt пополнилась.


    © 2010 Borisova Marina