BLAST - инструмент для быстрого поиска последовательностей в банках данных по гомологии


BLASTp(http://www.ncbi.nlm.nih.gov/BLAST)-программа, при помощи которой выполнялось задание.



  1. Часть 1. Поиск белка FadR по фрагменту его аминокислотной последовательности (1 кусок из 30 аминокислот, 2-й - тот же, но с3 искусственно внесенными заменами.
    Поиск проводился по базе данных SwissProt.Причем при поиске по маленькому кусочку нужно было изменять настройку Expect (так как BLAST находит в БД маленькую последовательность с большей вероятностью, отсюда аномально большое значение E-value, не укладывающеся в значение опции Expect). Еще нужно было убрать галочку Low Complexity.

    1-й кусок: NNRFPPGTILPAERELSELIGVTRTTLREV
    2-й кусок: NNRFTEDTILPAERELSELIGVTRTTLREV
    3-й кусок: LQRLARDGWL

    Исследуемый кусок Процент совпадающих остатков в выравнивании Вес выравнивания E-value
    Первый кусок из 30 остатков 100% 35.4 0.026
    Кусок с измененными 3-мя остатками 90% 37.0 0.010
    10 остатков 100% 18.0 0.004

    Причины отличия E-value кроются в том, что чем больше этот оказатель тем больше вероятность того, что такая последовантельость могла сама собой возникнуть. Т.е. чем меньше E-value, тем больше вероятность что мы нашли по участку последовательности, именно наш белок. Поэтому не удивительно, что в первом случае получено наименьшее значение. последовательность длиной в 10 может с большей вероятностью соответствовать множеству белков, а длиной 30 возникает с еньшей вероятностью, поэтому она характерна для моего белка с большей вероятностью. Вес выравнивания так же целиком зависит от того, какие последовательности выравнивались и чем больше вес тем больше веротность того, что найденный белок соответствует нашему куску последовательности.

  2. Часть 2. Является ли BLAST инструментом для поиска ортологов?

    Среди первых 20 приведенных программой
    белков нашлось всего 6 "примерно" ортологов,содержащих
    хотя бы название Rbsr в общем имени.Но, удивительно ,что все
    "ортологи" имеют очень маленькое E Value.
    Я бы не стал использовать эту программу для поиска.Она дает
    сомнительные результаты...