PSI-BLAST

    1.

    Даны четыре аминокислотные последовательности. Первые три последовательности имеют в Swiss-Prot номера доступа P18196, P0A832, P0A780; четвёртая – последовательность исследуемого белка MOEB_ECOLI – P12282.

    Для этих последовательностей необходимо провести итеративный поиск по банку Swiss-Prot программой PSI-BLAST. При поиске всем параметрам (кроме банка поиска и программы) оставляем значения по умолчанию. Выполняем до пяти итераций, пока появляются новые последовательности выше порога 0,005 на E-value; если же и после пятой итерации список не стабилизировался, останавляваемся на этом.

    ID белка AC белка Число итераций Для первой итерации Для последней итерации
    Число находок выше порога (0,005) Худшее E-value выше порога Лучшее E-value ниже порога Число находок выше порога (0,005) Худшее E-value выше порога Лучшее E-value ниже порога
    MINC_ECOLI P18196 5 126 0.004 0.005 239 0.003 0.007
    SSRP_ECOLI P0A832 2 449 3e-10 5.0 449 8e-31 0.62
    NUSB_ECOLI P0A780 4 327 0.003 0.008 388 2e-12 0.031
    MOEB_ECOLI P12282 5 144 0.002 0.006 403 0.005 0.005

    Перая последовательность.

    Список не стабилизировался даже после пяти итераций.

    E-value MINC_ECOLI от итерации к итерации составлял: 4e-134, 2e-92, 2e-82, 4e-79, 2e-77 соответственно. Видно, что E-value рос и становился хуже. Это можно объяснить тем, что с каждой следующей итерацией поиск шел в менее жестких условиях в свяси с попаданием в список неродственных белков.

    "Разрыв" между значениями E-value у худшей находки выше порога и лучшей – ниже порога от итерации к итерации составлял: (0.004 - 0.005), (7e-07 - 0.008), (0.001 - 0.010), (0.003 - 0.007), (0.003 - 0.007) соответственно.

    Вторая последовательность.

    Список стабилизировался после второй итерации.

    E-value SSRP_ECOLI от итерации к итерации составлял: 4e-91, 2e-74 соответственно.

    "Разрыв" между значениями E-value у худшей находки выше порога и лучшей – ниже порога от итерации к итерации составлял: (3e-10 - 5.0), (8e-31 - 0.62) соответственно. Он стал больше, так как мы видим более четкое отделение родственных белков от неродственных.

    Третья последовательность.

    Список стабилизировался после четвертой итерации.

    E-value NUSB_ECOLI от итерации к итерации составлял: 5e-76, 1e-53, 1e-49, 7e-48 соответственно.

    "Разрыв" между значениями E-value у худшей находки выше порога и лучшей – ниже порога от итерации к итерации составлял: (0.003 - 0.008), (0.002 - 0.006), (5e-07 - 0.017), (2e-12 - 0.031) соответственно.

    Последовательность MOEB_ECOLI.

    Список не стабилизировался даже после пятой итерации.

    E-value MOEB_ECOLI от итерации к итерации составлял: 5e-144, 2e-96, 3e-85, 6e-81, 1e-76 cсоответственно. Видно, что E-value рос и становился хуже. Это можно объяснить тем, что с каждой следующей итерацией поиск шел в менее жестких условиях в свяси с попаданием в список неродственных белков.

    "Разрыв" между значениями E-value у худшей находки выше порога и лучшей – ниже порога от итерации к итерации составлял: (0.002 - 0.006), (0.002 - 0.006), (0.005 - 0.005), (0.005 - 0.005), (0.005 - 0.005) соответственно.


    2.

    Для той последовательности, для которой итерации "не сошлись", провожу поиск снова, изменив порог с 0,005 на 0,001.


    Первая последовательность.

    Список стабилизировался после третьей итерации. Это можно объяснить тем, что не родственные белку MINC_ECOLI белки со значениями E-value от 0.001 до 0.005 не вошли в список и "не испортили" матрицу (в отличие от того случая, когда порог был 0.005).

    Последовательность MOEB_ECOLI.

    Список стабилизировался после пятой итерации. После третьей и после четвертой итерации в списке оказывался всего один "новый" белок. После пятой итерации такового не оказалось. После изменения порога неродственные белки, которые входили в список с прошлым порогом и мешали стабилизации, в список не вошли.

©2008 Михальченко Алексей