1.
Даны четыре аминокислотные последовательности. Первые три последовательности имеют в Swiss-Prot номера доступа P18196, P0A832, P0A780; четвёртая – последовательность исследуемого белка MOEB_ECOLI – P12282.
Для этих последовательностей необходимо провести итеративный поиск по банку Swiss-Prot программой PSI-BLAST. При поиске всем параметрам (кроме банка поиска и программы) оставляем значения по умолчанию. Выполняем до пяти итераций, пока появляются новые последовательности выше порога 0,005 на E-value; если же и после пятой итерации список не стабилизировался, останавляваемся на этом.
ID белка |
AC белка |
Число итераций |
Для первой итерации |
Для последней итерации |
Число находок выше порога (0,005) |
Худшее E-value выше порога |
Лучшее E-value ниже порога |
Число находок выше порога (0,005) |
Худшее E-value выше порога |
Лучшее E-value ниже порога |
MINC_ECOLI |
P18196 |
5 |
126 |
0.004 |
0.005 |
239 |
0.003 |
0.007 |
SSRP_ECOLI |
P0A832 |
2 |
449 |
3e-10 |
5.0 |
449 |
8e-31 |
0.62 |
NUSB_ECOLI |
P0A780 |
4 |
327 |
0.003 |
0.008 |
388 |
2e-12 |
0.031 |
MOEB_ECOLI |
P12282 |
5 |
144 |
0.002 |
0.006 |
403 |
0.005 |
0.005 |
Перая последовательность.
Список не стабилизировался даже после пяти итераций.
E-value MINC_ECOLI от итерации к итерации составлял: 4e-134, 2e-92, 2e-82, 4e-79, 2e-77 соответственно. Видно, что E-value рос и становился хуже. Это можно объяснить тем, что с каждой следующей итерацией поиск шел в менее жестких условиях в свяси с попаданием в список неродственных белков.
"Разрыв" между значениями E-value у худшей находки выше порога и лучшей – ниже порога от итерации к итерации составлял: (0.004 - 0.005), (7e-07 - 0.008), (0.001 - 0.010), (0.003 - 0.007), (0.003 - 0.007) соответственно.
Вторая последовательность.
Список стабилизировался после второй итерации.
E-value SSRP_ECOLI от итерации к итерации составлял: 4e-91, 2e-74 соответственно.
"Разрыв" между значениями E-value у худшей находки выше порога и лучшей – ниже порога от итерации к итерации составлял: (3e-10 - 5.0), (8e-31 - 0.62) соответственно. Он стал больше, так как мы видим более четкое отделение родственных белков от неродственных.
Третья последовательность.
Список стабилизировался после четвертой итерации.
E-value NUSB_ECOLI от итерации к итерации составлял: 5e-76, 1e-53, 1e-49, 7e-48 соответственно.
"Разрыв" между значениями E-value у худшей находки выше порога и лучшей – ниже порога от итерации к итерации составлял: (0.003 - 0.008), (0.002 - 0.006), (5e-07 - 0.017), (2e-12 - 0.031) соответственно.
Последовательность MOEB_ECOLI.
Список не стабилизировался даже после пятой итерации.
E-value MOEB_ECOLI от итерации к итерации составлял: 5e-144, 2e-96, 3e-85, 6e-81, 1e-76 cсоответственно. Видно, что E-value рос и становился хуже. Это можно объяснить тем, что с каждой следующей итерацией поиск шел в менее жестких условиях в свяси с попаданием в список неродственных белков.
"Разрыв" между значениями E-value у худшей находки выше порога и лучшей – ниже порога от итерации к итерации составлял: (0.002 - 0.006), (0.002 - 0.006), (0.005 - 0.005), (0.005 - 0.005), (0.005 - 0.005) соответственно.
2.
Для той последовательности, для которой итерации "не сошлись", провожу поиск снова, изменив порог с 0,005 на 0,001.
Первая последовательность.
Список стабилизировался после третьей итерации. Это можно объяснить тем, что не родственные белку MINC_ECOLI белки со значениями E-value от 0.001 до 0.005 не вошли в список и "не испортили" матрицу (в отличие от того случая, когда порог был 0.005).
Последовательность MOEB_ECOLI.
Список стабилизировался после пятой итерации. После третьей и после четвертой итерации в списке оказывался всего один "новый" белок. После пятой итерации такового не оказалось. После изменения порога неродственные белки, которые входили в список с прошлым порогом и мешали стабилизации, в список не вошли.