PSI-BLAST

На страничку второго семестра



  1. Задание 1.


  2. ID белка AC белка Число итераций Для первой итерации Для последней итерации
    Число находок выше порога (0,005) Худшее E-value выше порога Лучшее E-value ниже порога Число находок выше порога (0,005) Худшее E-value выше порога Лучшее E-value ниже порога
    MINC_ECOLI P18196 5 162 0,005 0,005 885 2e-05 0,16
    SSRP_ECOLI P0A832 3 514 3е-10 5,4 514 1e-31 0,36
    RP5M_RHIME P17265 4 15 0.005 0.12 25 8е-15 0.025
    P42419 IOLI_BACSU 5 10 9e-04 0.020 545 3e-07 0.006

    Комментарии для каждой из последовательностей:
    1. После 5й итерации список не стабилизировался. Стабилизировался после 10й итерации. Худшее и лучшее E-value от итерации к итерации колеблятся около значения 0,005. Я думаю, что это говорит о небольшой достоверности гомологичности соответствущих последовательностей.
    2. Список стабилизируется после 3 итерации. Худшее E-value выше порога в каждом случае имеет значение около e-31,а лучшее ниже порога - около 0,35. Это говорит о достоверной гомологичности последовательностей, находящихся выше порога и о том, что последовательности, находящиеся ниже порога не являются гомологами заданной последовательности.
    3. Список стабилизируется после 4 итерации. Значения худшего и лучшего E-value от итреации к итерации сильно варьируют.
    4. ПОсле 14 итерации список так и не стабилизировался. Оба значения E-value после каждой итерации сильно варьировали, да и список последовательностей после каждой итерации сильно менялся.

    Наблюдения:
    1. Когда перестают появляться новые последовательности выше порога E-value, худшее значение выше порога E-value может измениться еще один раз.
    2. С каждой новой итерацией число последовательностей в списке выше порога чаще всего увеличивается, хотя может уменьшаться.
    3. Чем сложнее стабилизируется список последовательностей, тем больше варьируют E-value.

    Изменения E-value:
    В Таблице представлен ход изменения значений E-value для двух последовательностей - гомологов моего белка.

    номер итерации A7ZAH3.1 Q57151.1
    1 5e-149 3e-08
    2 4e-108 3e-67
    3 5e-75 4e-54
    4 8e-61 9e-44
    5 7e-56 8e-40

    Значения E-value для последовательностей после первой и последующих итераций сильно меняются, последовательности в начале и конце списка приближаются друг к другу по E-value в случае с трудно стабилизирующимся списком. В случае быстрой стабилизации списка (как пример со вторым белком) значения E-value меняются незначительно.

  3. Задание 2


  4. ID белка AC белка Число итераций Для первой итерации Для последней итерации
    Число находок выше порога (0,005) Худшее E-value выше порога Лучшее E-value ниже порога Число находок выше порога (0,005) Худшее E-value выше порога Лучшее E-value ниже порога
    MINC_ECOLI P18196 4 155 0,001 0,001 188 1e-10 0.004

    Список стабилизировался уже на 4 итерации, так как заданы более жесткие условия отбора - порог 0,001.

    Можно предположить, что максимальный порог можно взять равным 0,004 (как E-value лучшей находки ниже порога), но, как показала практика, список в этом случае меняется и не стабилизируется после 5 итерации. Остается предположить, что порог 0,001 и является максимально возможным для формирования такого списка, так как E-value 0.001 - худшее значение среди находок выше порога. То есть не остается резерва для находок с еще большим E-value, а все последовательности с меньшим E-value уже отобраны.

© Karavaeva Julia 2009