На главную страницу
На страницу второго семестра

PSI-BLAST

ID белка AC белка Число итераций Для первой итерации Для последней итерации
Число находок выше порога (0,005) Худшее E-value выше порога Лучшее E-value ниже порога Число находок выше порога (0,005) Худшее E-value выше порога Лучшее E-value ниже порога
MAF_BACSU Q02169 3 448 5e-05 0,18 454 2e-29 0,044
MINC_ECOLI P18196 6 162 0.005 0.005 881 0,002 0,094
SSRP_ECOLI P0A832 2 514 3e-10 5,4 514 5e-31 0,35
RP5M_RHIME P17265 4 15 0,005 0,12 25 8e-15 0,025
MINC_ECOLI* P18196 3 155 0,001 0,001 188 3e-10 0,001
  • Для каждой следующей итерации увеличивается число находок,E-value худшей находки выше порога и лучшей находки ниже порога при этом уменьшаются. В каждом отдельном случае от итерации к итерации это происходит, вообще говоря по-разному, но везде E-value худшей падает сравнительно значительно быстрее. Если проследить за значением самой лучшей изначально находки и некоторой средней для, например, Maf_Bacsu, окажется что E-value их от итерации к итерации постоянно колеблется, и с последней итерации они даже меняются местами, и средняя имеет теперь уже E-value лучше. Во втором задании для MINC_ECOLI* был произведён поиск с пониженным порогом, число итераций при этом понизился с 6 до 3. Это произошло, потому что, так как мы понижаем порог , то для следующей итерации уменьшается количество входных последовательностей при этом качество их увеличивается(т.к.E-v выше), таким образом круг сужается и сходятся находки раньше. Что касается вопроса каково максимальное значение порога, чтобы итерации вели себя также как при 0,001, вообще не знаю , но мне кажется что таково быть не должно потому что ведь при другом пороге входить будет каждый раз больше последовательностей, и неизвестно как они будут влиять на дальнейшие итерации, уже при пороге 0,002 3-ёх итераций недостаточно.

  • © Zhuravleva Katya, 2009