Программа BLASTP


Гипотетические гомологи YECD_ECOLI (AC: P0ADI7)

С помощью программы BLASTP были найдены белки - гипотетические гомологи YECD_ECOLI в базах данных SwissProt, PDB и "nr".

  Поиск по БД Swiss-Prot Поиск по БД PDB Поиск по БД "nr"
1. Лучшая находка
Идентификатор БД P0ADI7 1J2R AP_002487
E-value 8e-107 2e-107 1e-105
Вес (в битах) 385 383 385
% идентичности 100% (188/188) 99% (187/188) 100% (188/188)
Другие белки с теми же значениями E-value и веса в битах P0ADI8 (кластеризована с P0ADI7) отсутствуют 47 записей (P0ADI7, P0ADI8, ...) - кластеризованы в 2 записи
2. Количество найденных "хороших кандидатов" в гомологи
Число находок в списке описаний (Descriptions) с E-value<=1E-10) 3 (вместе с P0ADI7, P0ADI8) 1 (вместе с 1J2R) 100 только в Descriptions (без кластеризованых)
3. "Худшая" находка (последняя в выдаче с E-value<=1.0)
Номер находки в списке описаний (Descriptions) 22 11 1828
Идентификатор БД Q9DCC7 1SXJ ZP_01443624
E-value 0.79 0.70 0.99
Вес (в битах) 33.1 29.6 36.6
% идентичности 35% (14/40) 23% (24/102) 24% (39/158)
% сходства 60% (24/40) 46% (47/102) 40% (64/158)
Длина выравнивания 40 102 158
Координаты выравнивания (номера первых и последних а.о.) 121 - 160 (P0ADI7)
101 - 140 (Q9DCC7)
79 - 177 (P0ADI7)
46 - 139 (1SXJ)
10 - 162 (P0ADI7)
5 - 145 (ZP_01443624)
% гэпов 0% (0/40) 10% (11/102) 13% (22/158)

Лучшая находка во всех базах данных соответствует белку YECD_ECOLI (P0ADI7), но запись банка PDB несколько отличается от последовательности белка, который в ней описан (присутствуют 11 аминокислотных остатков на N конце и T вместо A на 33 позиции (по P0ADI7)), поэтому выравнивание P0ADI7 c 1J2R отличается от остальных выравниваний YECD_ECOLI самого с собой. Различия в количестве возможных гомологов белка в базах данных и в E-value "худшей находки" объясняются сильным отличием в объёме этих банков. В банке "nr" больше всего записей, поэтому больше потенциальных гомологов и самое большое E-value для "худшей находки", а в PDB банке меньше всего записей, соответственно и возможных гомологов меньше.


Поиск гипотетических гомологов YECD_ECOLI (AC: P0ADI7) с фильтром по таксонам

С помощью BLASTP был найден наилучший гомолог YECD_ECOLI в как можно более далеком от E.coli организме. Для поиска были взяты Homo sapiens, Archaea, Actinobacteria, Alteromonadales, Vibrionaceae (приведены в порядке приближения к E.coli). Первый подходящий белок (E-value < 0.001) был найден в Archaea (у человека гомолога белка в банках данных SwissProt, PDB и "nr" не обнаружено).

Идентификатор БД YP_306763
E-value 6e-46
Вес (в битах) 181
% идентичности 50% (96/192)
% сходства 63% (122/192)
Длина выравнивания 192
Координаты выравнивания (номера первых и последних а.о.) 2 - 188 (P0ADI7); 4 - 189 (YP_306763)
% гэпов 5% (11/192)

Поиск белка по его фрагменту

С помощью BLASTP был найден белок, содержащий последовательность, похожую на фрагмент белка YECD_ECOLI (см. "Выравнивание двух фрагментов вручную"). Затем, была получена последовательность лучшей находки в fasta формате и проведен поиск по AC этого белка.

  Поиск по фрагменту Поиск по полной
последовательности
АС лучшей находки P94573 P94573
E-value 7e-19 5e-108
Вес (в битах) 90.6 389
Другие белки с теми же значениями E-value и веса в битах
не найдены не найдены

Оба раза лучшей находкой был белок YWOC_BACSU (P94573). Отличия в E-value и в весе можно объяснить тем, что во второй раз длина выравнивания была равна длине последовательности белка, а не его фрагмента.

Было получено выравнивание белков YECD_ECOLI и YWOC_BACSU:

     YWOC_BACSU  5    LNIDFQKTALVIIDLQKGIVPI----DQSGQVVPNAKKLVDEFRKHNGFISFVNVAFH-D  59
                      L ++ + TALV+IDLQ+GI+P       + +VV  A KL  +FR     +  V V +  D
     YECD_ECOLI  2    LELNAKTTALVVIDLQEGILPFAGGPHTADEVVNRAGKLAAKFRASGQPVFLVRVGWSAD  61

     YWOC_BACSU  60   GADALKPQTDEPAQGGSGEMPADWAEFVPEIGVQDGDYTVTKRQWGAFFGTDLDLQLRRR  119
                      A+ALK   D P+   +  +P +W +    +G  D D  + KRQWGAF+GTDL+LQLRRR
     YECD_ECOLI  62   YAEALKQPVDAPSP--AKVLPENWWQHPAALGATDSDIEIIKRQWGAFYGTDLELQLRRR  119

     YWOC_BACSU  120  GIDTIVLCGIATNIGVESTAREAFQLGYQRIFITDAMSTFSDEEHEATLRFIFPRIGKSR  179
                      GIDTIVLCGI+TNIGVESTAR A++LG+  +   DA S  S E+H  ++  I+PRI + R
     YECD_ECOLI  120  GIDTIVLCGISTNIGVESTARNAWELGFNLVIAEDACSAASAEQHNNSINHIYPRIARVR  179

     YWOC_BACSU  180  TTEEFLEQV  188
                      + EE L  +
     YECD_ECOLI  180  SVEEILNAL  188
		

Выделенный фрагмент полностью совпадает с выравниванием фрагментов вручную (seq1 - фрагмент белка YECD_ECOLI; seq2 - фрагмент белка YWOC_BACSU):


Сравнение выравниваний, выданных программой BLASTP, с оптимальными глобальным и локальным выравниваниями.

С помощью программ Needle и Water были получены оптимальное глобальное и оптимальное локальное выравнивания соответственно (размеры штрафов за гэп были взяты равными стандартным для программы BLASTP (за создание - 11.0, за удлинение - 1.0)).

Выравнивание, построенное с помощью BLASTP


  YECD_ECOLI     LELNAKTTALVVIDLQEGILPFAGGPHTADEVVNRAGKLAAKFRASGQPVFLVRVGWSADYAEALKQPVDAPSP--AKVLPENWWQHPAALGATDSDIEIIKR
                 L ++ + TALV+IDLQ+GI+P       + +VV  A KL  +FR     +  V V +  D A+ALK   D P+   +  +P +W +    +G  D D  + KR
  YWOC_BACSU     LNIDFQKTALVIIDLQKGIVPI----DQSGQVVPNAKKLVDEFRKHNGFISFVNVAFH-DGADALKPQTDEPAQGGSGEMPADWAEFVPEIGVQDGDYTVTKR

  YECD_ECOLI   QWGAFYGTDLELQLRRRGIDTIVLCGISTNIGVESTARNAWELGFNLVIAEDACSAASAEQHNNSINHIYPRIARVRSVEEILNAL
               QWGAF+GTDL+LQLRRRGIDTIVLCGI+TNIGVESTAR A++LG+  +   DA S  S E+H  ++  I+PRI + R+ EE L  +
  YWOC_BACSU   QWGAFFGTDLDLQLRRRGIDTIVLCGIATNIGVESTAREAFQLGYQRIFITDAMSTFSDEEHEATLRFIFPRIGKSRTTEEFLEQV
		

В результате оказалось, что все три выравнивания (оптимальное глобальное, оптимальное локальное и выравнивание, полученное при помощи BLASTP) отличаются лишь длиной, т.е. соответствующие участки выравниваний полностью идентичны (легко проверить по расположению гэпов).


Назад

2008 ©