PSI-BLAST

1) Исследование последовательностей с помощью программы PSI-BLAST

ID белка AC белка Число итераций Для первой итерации Для последней итерации
Число находок выше порога (0,005) Худшее E-value выше порога Лучшее E-value ниже порога Число находок выше порога (0,005) Худшее E-value выше порога Лучшее E-value ниже порога
MINC_ECOLI P18196 5 126 0.004 0.005 239 0.003 0.007
SSRP_ECOLI P0A832 2 449 3e-10 5.0 449 8e-31 0.62
NUSB_ECOLI P0A780 4 327 0.003 0.008 388 2e-12 0.031
OMPT_ECOLI P09169 2 6 1e-77 0.36 6 8e-123; 0.41

Итак, все последовательности, кроме первой, сошлись хотя бы раз в пределах 5 итераций. "Разрыв" между значениями E-value у худшей находки выше порога и лучшей – ниже порога, как правило, медленно увеличивается от итерации к итерации.

Также я проследил за изменениями значения E-value у самой лучшей находки и у "средней" находки. Оказалось, что E-value у самой лучшей находки увеличивается с каждой итерацией, а у "средней" уменьшается.


Для первого белка был выполнен повторный поиск, но с порогом E-value 0.001. В этом случае сошлась третья итерация. Порог 0.001 строже отбирает гомологи, в отличие от порога 0.005, в данном случае его хватило, чтоб сошлась третья итерация.
Проверяя различные значения порога, я определил, что для того чтобы итерации сошлись, максимальное значение порога в данном конкретном случае можно поставить равное как раз 0.001.



© Айдарханов Руслан 2008