Программа BLASTP





1. Поиск гипотетических гомологов изучаемого белка в разных БД


Таблица 1. Результаты поиска гипотетических гомологов белка RECQ_ECOLI

  Поиск по БД Swiss-Prot Поиск по БД PDB Поиск по БД "NR"
1. Лучшая находка (в принципе должна соответствовать заданному белку)
Идентификатор БД  RECQ_ECOLI  1OYY  YP_002384744
E-value  0.0  0.0  0.0
Вес (в битах)  1266  1087  1254
% идентичности  609/609 (100%)  523/523 (100%)  606/609 (99%)
Найдены ли другие белки с теми же значениями E-value и веса в битах?
 Да, помимо моего белка с E-value 0.0 найдено ещё 4 белка. Среди них RECQ_SALTY.  Найден ещё 1 белок с таким же E-value: 1OYW_A.  Да, найдены. Среди них YP_002384744
2. Сколько хороших кандидатов в гомологи найдено? (число находок в списке описаний, Descriptions, с E-value < 1E-10)  198 находок с E-value, не превышающим 10^-10  8 находок с E-value, не превышающим 10^-10  4040
2. "Худшая" находка (последняя в выдаче с E-value < 1)
Номер находки в списке описаний (Descriptions)  1000  53  1000
Идентификатор БД  DCR1_CAEEL  2PL3  EAW63425
E-value  0.022  0.93  1e-87
Вес (в битах)  41.2  31.6  328
% идентичности  18/57 (31%)  13/33 (39%)  182/498 (36%)
% сходства  31/57 (54%)  19/33 (57%)  280/498 (56%)
Длина выравнивания  57  33  498
Координаты выравнивания (номера первых и последних а.о.)  275-331 442-498  30-62 52-84  14-484 544-1034
% гэпов  49/364 (13%)  0/33 (0%)  1/592 (0%)


Краткий комментарий к таблице:

2. Поиск гипотетических гомологов изучаемого белка с фильтром по таксонам



Основная задача - для изучаемого белка E. coli найти лучшего гомолога в организмах таксона, филогенетически как можно более далекого от E. coli. Для исследования предлагаются следующие таксоны: Homo sapiens, Archaea, Actinobacteria, Alteromonadales, Vibrionaceae (приведены в порядке приближения к E. coli). В этом же порядке проверяем на наличие гипотетического гомолога (критерий: E-value<0,001).

первый гомолог нашёлся сразу же в таксоне Homo sapiens, в нём их нашлось в общей сложности 38 штук. Итак, краткая характеристика первого гомолога:
Номер находки в списке описаний (Descriptions)  1
Идентификатор SwissProt  P54132
E-value  1e-93
Вес (в битах)  340
% идентичности  222/646 (34%)
% сходства  348/646 (53%)
Длина выравнивания  646
Координаты выравнивания (номера первых и последних а.о.)  15-1287
% гэпов  10%


Данный белок, как и мой, принадлежит к семейству Геликазы, подсемейству RecQ, также содержит 1 АТФ-связывающий домен, 1 С-терминальный домен; также участвует в ДНК-репарации и репликации.

3. Поиск белка по его фрагменту


Таблица 2. Результаты поиска белка в Swiss-Prot по фрагменту последовательности

  Поиск по фрагменту Поиск по полной
последовательности
АС лучшей находки  P71359  P71359
E-value  4e-17  0.0
Вес (в битах)  84.6  1289
Найдены ли другие белки с теми же значениями E-value и веса в битах?
 Не найдены.  Да, найдено 4 белка с тем же значением E-value.



Выравнивание белка RECQ_ECOLI с родственным ему белком RECQ_HAEIN:
  • Вес выравнивания: 788 бит;
  • E-value: 0.0;
  • Процент идентичности: 63%
  • Процент сходства: 78%;
  • Длина выравнивания: 593;
  • Процент гэповых участков: 0%;
  • Query - RECQ_HAEIN, Sbjct - RECQ_ECOLI.

    Query  16   ALSVLKSVFGYQSFRKGQEEVINAALNGQDALVVMATGNGKSLCYQIPALCFDGLTLVIS  75
                A  VL+  FGYQ FR GQEE+I+  L+G+D LVVM TG GKSLCYQIPAL  +GLT+V+S
    Sbjct  13   AKQVLQETFGYQQFRPGQEEIIDTVLSGRDCLVVMPTGGGKSLCYQIPALLLNGLTVVVS  72
    
    Query  76   PLISLMKDQVDQLQANGIEADFLNSSQTLEQQQQVQNKLISGQLKLLYVSPEKVMTNSFF  135
                PLISLMKDQVDQLQANG+ A  LNS+QT EQQ +V     +GQ++LLY++PE++M ++F 
    Sbjct  73   PLISLMKDQVDQLQANGVAAACLNSTQTREQQLEVMTGCRTGQIRLLYIAPERLMLDNFL  132
    
    Query  136  QLISYSKVCFIAIDEAHCISQWGHDFRPEYTQLGGLKASFPDAPIMALTATADYATQQDI  195
                + +++     +A+DEAHCISQWGHDFRPEY  LG L+  FP  P MALTATAD  T+QDI
    Sbjct  133  EHLAHWNPVLLAVDEAHCISQWGHDFRPEYAALGQLRQRFPTLPFMALTATADDTTRQDI  192
    
    Query  196  LRHLNLKNLHKYIGSFDRPNIRYTLEEKYKPMEQLTRFVLAQKGKSGIIYCNSRNKVERI  255
                +R L L +    I SFDRPNIRY L EK+KP++QL R+V  Q+GKSGIIYCNSR KVE  
    Sbjct  193  VRLLGLNDPLIQISSFDRPNIRYMLMEKFKPLDQLMRYVQEQRGKSGIIYCNSRAKVEDT  252
    
    Query  256  AESLRNKGVSAAAYHAGMETAIRERVQQDFQRDNVQVVVATIAFGMGINKSNVRFVAHFD  315
                A  L++KG+SAAAYHAG+E  +R  VQ+ FQRD++Q+VVAT+AFGMGINK NVRFV HFD
    Sbjct  253  AARLQSKGISAAAYHAGLENNVRADVQEKFQRDDLQIVVATVAFGMGINKPNVRFVVHFD  312
    
    Query  316  LPRSIESYYQETGRAGRDDLPAEAVLFYEPADYAWLQKILLEKPETPQRQIEQHKLEAIG  375
                +PR+IESYYQETGRAGRD LPAEA+LFY+PAD AWL++ L EKP+   + IE+HKL A+G
    Sbjct  313  IPRNIESYYQETGRAGRDGLPAEAMLFYDPADMAWLRRCLEEKPQGQLQDIERHKLNAMG  372
    
    Query  376  EFAESQTCRRLVLLNYFGEHRQTPCNNCDICLDPPKKYDGLVDAQKVMSTIYRVGQCFGA  435
                 FAE+QTCRRLVLLNYFGE RQ PC NCDICLDPPK+YDG  DAQ  +STI RV Q FG 
    Sbjct  373  AFAEAQTCRRLVLLNYFGEGRQEPCGNCDICLDPPKQYDGSTDAQIALSTIGRVNQRFGM  432
    
    Query  436  HYVIAVLRGMHNQKIIERQHHKLSVYGIGKDKSKEHWQSVIRQLIHLGFVQQVISELNPT  495
                 YV+ V+RG +NQ+I +  H KL VYG+G+DKS EHW SVIRQLIHLG V Q I++ +  
    Sbjct  433  GYVVEVIRGANNQRIRDYGHDKLKVYGMGRDKSHEHWVSVIRQLIHLGLVTQNIAQ-HSA  491
    
    Query  496  LQLTESAKVILKGEEPLELAMPRISAISKIAHNPQRQGVANYDKDLFARLRFLRKQIADK  555
                LQLTE+A+ +L+GE  L+LA+PRI A+   A   Q+    NYD+ LFA+LR LRK IAD+
    Sbjct  492  LQLTEAARPVLRGESSLQLAVPRIVALKPKAM--QKSFGGNYDRKLFAKLRKLRKSIADE  549
    
    Query  556  ENIPPYIVFNDATLQEMAQYMPTSNIEMLQINGVGSIKLERFGQPFMALIQEH  608
                 N+PPY+VFNDATL EMA+ MP +  EML +NGVG  KLERFG+PFMALI+ H
    Sbjct  550  SNVPPYVVFNDATLIEMAEQMPITASEMLSVNGVGMRKLERFGKPFMALIRAH  602
    


    Пробное выравнивание:



    Данный фрагмент из выравнивания, предложенного программой BlastP:

    Query  76   PLISLMKDQVDQLQANGIEADFLNSSQTLEQQQQVQNKLISGQLKLLYVSPEKVMTNSFF  135
                PLISLMKDQVDQLQANG+ A  LNS+QT EQQ +V     +GQ++LLY++PE++M ++F 
    Sbjct  73   PLISLMKDQVDQLQANGVAAACLNSTQTREQQLEVMTGCRTGQIRLLYIAPERLMLDNFL  132
    


    Видно, что выравнивания совпадают на участке 91-115 по RECQ_Ecoli. Разница только в том, что в выравнивании, предложеннном BLASTP, отсутсвуют гэпы, а в пробном выравнивании их 5. В целом совпали одни и те же аминокислоты в колонках.

    Поиск белка по фрагменту необходим для того, чтобы определить белок, выравнивания с которым мы проводили при пробных выравниваниях. RECQ_HAEIN - идентификатор этого белка в SwissProt. Его аминокислотная последовательность сохранена в файле: RECQ_HAEIN.fasta. Малая длина последоватеьности, как видно из таблицы, даёт большое значение E-Value.

    3. Сравнение выравниваний, выданных программой BLASTP, с оптимальными глобальным и локальным выравниваниями.



    Мы получили выравнивание двух белков. Теперь сравним это выравнивание, а также выравнивание, выданное BLASTP:


    а) с оптимальным частичным выравниванием;

    Сравнивать выравнивание, выданное BLAST, с оптимальным выравниванием имеет смысл, если последнее является оптимальным для функции Score, вычисляемой при тех же значениях штрафов за создание и удлинение гэпа, которыми пользовался BLAST. Поэтому прежде всего заглядываем в меню "Algorithm parameters" в самом конце страницы запроса BLASTP и из строки "Gap Costs" извлекаем необходимую информацию: existense-10, extension-1. Затем построим оптимальные локальное и глобальное выравнивания полных последовательностей соответствующих белков при тех же параметрах.

    Полное парное оптимальное выравнивание, предложенное BLASTP (Gap_penalty: 11.0, Gap extension penalty [0.5]: 1.0):

  • Вес выравнивания: 788 бит;
  • E-value: 0.0;
  • Процент идентичности: 63%
  • Процент сходства: 78%;
  • Длина выравнивания: 593;
  • Процент гэповых участков: 0%;
  • Query - RECQ_HAEIN, Sbjct - RECQ_ECOLI.

    Query  16   ALSVLKSVFGYQSFRKGQEEVINAALNGQDALVVMATGNGKSLCYQIPALCFDGLTLVIS  75
                A  VL+  FGYQ FR GQEE+I+  L+G+D LVVM TG GKSLCYQIPAL  +GLT+V+S
    Sbjct  13   AKQVLQETFGYQQFRPGQEEIIDTVLSGRDCLVVMPTGGGKSLCYQIPALLLNGLTVVVS  72
    
    Query  76   PLISLMKDQVDQLQANGIEADFLNSSQTLEQQQQVQNKLISGQLKLLYVSPEKVMTNSFF  135
                PLISLMKDQVDQLQANG+ A  LNS+QT EQQ +V     +GQ++LLY++PE++M ++F 
    Sbjct  73   PLISLMKDQVDQLQANGVAAACLNSTQTREQQLEVMTGCRTGQIRLLYIAPERLMLDNFL  132
    
    Query  136  QLISYSKVCFIAIDEAHCISQWGHDFRPEYTQLGGLKASFPDAPIMALTATADYATQQDI  195
                + +++     +A+DEAHCISQWGHDFRPEY  LG L+  FP  P MALTATAD  T+QDI
    Sbjct  133  EHLAHWNPVLLAVDEAHCISQWGHDFRPEYAALGQLRQRFPTLPFMALTATADDTTRQDI  192
    
    Query  196  LRHLNLKNLHKYIGSFDRPNIRYTLEEKYKPMEQLTRFVLAQKGKSGIIYCNSRNKVERI  255
                +R L L +    I SFDRPNIRY L EK+KP++QL R+V  Q+GKSGIIYCNSR KVE  
    Sbjct  193  VRLLGLNDPLIQISSFDRPNIRYMLMEKFKPLDQLMRYVQEQRGKSGIIYCNSRAKVEDT  252
    
    Query  256  AESLRNKGVSAAAYHAGMETAIRERVQQDFQRDNVQVVVATIAFGMGINKSNVRFVAHFD  315
                A  L++KG+SAAAYHAG+E  +R  VQ+ FQRD++Q+VVAT+AFGMGINK NVRFV HFD
    Sbjct  253  AARLQSKGISAAAYHAGLENNVRADVQEKFQRDDLQIVVATVAFGMGINKPNVRFVVHFD  312
    
    Query  316  LPRSIESYYQETGRAGRDDLPAEAVLFYEPADYAWLQKILLEKPETPQRQIEQHKLEAIG  375
                +PR+IESYYQETGRAGRD LPAEA+LFY+PAD AWL++ L EKP+   + IE+HKL A+G
    Sbjct  313  IPRNIESYYQETGRAGRDGLPAEAMLFYDPADMAWLRRCLEEKPQGQLQDIERHKLNAMG  372
    
    Query  376  EFAESQTCRRLVLLNYFGEHRQTPCNNCDICLDPPKKYDGLVDAQKVMSTIYRVGQCFGA  435
                 FAE+QTCRRLVLLNYFGE RQ PC NCDICLDPPK+YDG  DAQ  +STI RV Q FG 
    Sbjct  373  AFAEAQTCRRLVLLNYFGEGRQEPCGNCDICLDPPKQYDGSTDAQIALSTIGRVNQRFGM  432
    
    Query  436  HYVIAVLRGMHNQKIIERQHHKLSVYGIGKDKSKEHWQSVIRQLIHLGFVQQVISELNPT  495
                 YV+ V+RG +NQ+I +  H KL VYG+G+DKS EHW SVIRQLIHLG V Q I++ +  
    Sbjct  433  GYVVEVIRGANNQRIRDYGHDKLKVYGMGRDKSHEHWVSVIRQLIHLGLVTQNIAQ-HSA  491
    
    Query  496  LQLTESAKVILKGEEPLELAMPRISAISKIAHNPQRQGVANYDKDLFARLRFLRKQIADK  555
                LQLTE+A+ +L+GE  L+LA+PRI A+   A   Q+    NYD+ LFA+LR LRK IAD+
    Sbjct  492  LQLTEAARPVLRGESSLQLAVPRIVALKPKAM--QKSFGGNYDRKLFAKLRKLRKSIADE  549
    
    Query  556  ENIPPYIVFNDATLQEMAQYMPTSNIEMLQINGVGSIKLERFGQPFMALIQEH  608
                 N+PPY+VFNDATL EMA+ MP +  EML +NGVG  KLERFG+PFMALI+ H
    Sbjct  550  SNVPPYVVFNDATLIEMAEQMPITASEMLSVNGVGMRKLERFGKPFMALIRAH  602
    


    Теперь представим глобальное выравнивание программы NEEDLE (Gap_penalty: 11.0, Gap extension penalty [0.5]: 1.0):

  • Вес выравнивания: 1933 бит;
  • E-value: 0.0;
  • Процент идентичности: 61,2%
  • Процент сходства: 75,8%;
  • Длина выравнивания: 621;
  • Процент гэповых участков: 2,3%.

    RECQ_HAEIN         1 MLDSPLLSKIIEKPTALSVLKSVFGYQSFRKGQEEVINAALNGQDALVVM     50
                         |..:.:|:.   :..|..||:..||||.||.||||:|:..|:|:|.||||
    RECQ_ECOLI         1 MAQAEVLNL---ESGAKQVLQETFGYQQFRPGQEEIIDTVLSGRDCLVVM     47
    
    RECQ_HAEIN        51 ATGNGKSLCYQIPALCFDGLTLVISPLISLMKDQVDQLQANGIEADFLNS    100
                         .||.|||||||||||..:|||:|:||||||||||||||||||:.|..|||
    RECQ_ECOLI        48 PTGGGKSLCYQIPALLLNGLTVVVSPLISLMKDQVDQLQANGVAAACLNS     97
    
    RECQ_HAEIN       101 SQTLEQQQQVQNKLISGQLKLLYVSPEKVMTNSFFQLISYSKVCFIAIDE    150
                         :||.|||.:|.....:||::|||::||::|.::|.:.:::.....:|:||
    RECQ_ECOLI        98 TQTREQQLEVMTGCRTGQIRLLYIAPERLMLDNFLEHLAHWNPVLLAVDE    147
    
    RECQ_HAEIN       151 AHCISQWGHDFRPEYTQLGGLKASFPDAPIMALTATADYATQQDILRHLN    200
                         |||||||||||||||..||.|:..||..|.||||||||..|:|||:|.|.
    RECQ_ECOLI       148 AHCISQWGHDFRPEYAALGQLRQRFPTLPFMALTATADDTTRQDIVRLLG    197
    
    RECQ_HAEIN       201 LKNLHKYIGSFDRPNIRYTLEEKYKPMEQLTRFVLAQKGKSGIIYCNSRN    250
                         |.:....|.|||||||||.|.||:||::||.|:|..|:|||||||||||.
    RECQ_ECOLI       198 LNDPLIQISSFDRPNIRYMLMEKFKPLDQLMRYVQEQRGKSGIIYCNSRA    247
    
    RECQ_HAEIN       251 KVERIAESLRNKGVSAAAYHAGMETAIRERVQQDFQRDNVQVVVATIAFG    300
                         |||..|..|::||:||||||||:|..:|..||:.||||::|:||||:|||
    RECQ_ECOLI       248 KVEDTAARLQSKGISAAAYHAGLENNVRADVQEKFQRDDLQIVVATVAFG    297
    
    RECQ_HAEIN       301 MGINKSNVRFVAHFDLPRSIESYYQETGRAGRDDLPAEAVLFYEPADYAW    350
                         |||||.|||||.|||:||:||||||||||||||.|||||:|||:|||.||
    RECQ_ECOLI       298 MGINKPNVRFVVHFDIPRNIESYYQETGRAGRDGLPAEAMLFYDPADMAW    347
    
    RECQ_HAEIN       351 LQKILLEKPETPQRQIEQHKLEAIGEFAESQTCRRLVLLNYFGEHRQTPC    400
                         |::.|.|||:...:.||:|||.|:|.|||:||||||||||||||.||.||
    RECQ_ECOLI       348 LRRCLEEKPQGQLQDIERHKLNAMGAFAEAQTCRRLVLLNYFGEGRQEPC    397
    
    RECQ_HAEIN       401 NNCDICLDPPKKYDGLVDAQKVMSTIYRVGQCFGAHYVIAVLRGMHNQKI    450
                         .||||||||||:|||..|||..:|||.||.|.||..||:.|:||.:||:|
    RECQ_ECOLI       398 GNCDICLDPPKQYDGSTDAQIALSTIGRVNQRFGMGYVVEVIRGANNQRI    447
    
    RECQ_HAEIN       451 IERQHHKLSVYGIGKDKSKEHWQSVIRQLIHLGFVQQVISELNPTLQLTE    500
                         .:..|.||.|||:|:|||.|||.||||||||||.|.|.|:: :..|||||
    RECQ_ECOLI       448 RDYGHDKLKVYGMGRDKSHEHWVSVIRQLIHLGLVTQNIAQ-HSALQLTE    496
    
    RECQ_HAEIN       501 SAKVILKGEEPLELAMPRISAISKIAHNPQRQGVANYDKDLFARLRFLRK    550
                         :|:.:|:||..|:||:|||.|:...|  .|:....|||:.|||:||.|||
    RECQ_ECOLI       497 AARPVLRGESSLQLAVPRIVALKPKA--MQKSFGGNYDRKLFAKLRKLRK    544
    
    RECQ_HAEIN       551 QIADKENIPPYIVFNDATLQEMAQYMPTSNIEMLQINGVGSIKLERFGQP    600
                         .|||:.|:|||:|||||||.|||:.||.:..|||.:||||..||||||:|
    RECQ_ECOLI       545 SIADESNVPPYVVFNDATLIEMAEQMPITASEMLSVNGVGMRKLERFGKP    594
    
    RECQ_HAEIN       601 FMALIQEHKAILANAQNND--    619
                         |||||:.|      ...:|
    RECQ_ECOLI       595 FMALIRAH------VDGDDEE    609
    


    Это выравнивание в точности совпадает с выравниванием, представленным программой BLASTP.

    Оптимальное локальное выравнивание программы Water (Gap_penalty: 11.0, Gap extension penalty [0.5]: 1.0):

  • Вес выравнивания: 1949 бит;
  • E-value: 0.0;
  • Процент идентичности: 63,6%
  • Процент сходства: 78,1%;
  • Длина выравнивания: 593;
  • Процент гэповых участков: 0,5%.

    RECQ_ECOLI        13 AKQVLQETFGYQQFRPGQEEIIDTVLSGRDCLVVMPTGGGKSLCYQIPAL     62
                         |..||:..||||.||.||||:|:..|:|:|.||||.||.|||||||||||
    RECQ_HAEIN        16 ALSVLKSVFGYQSFRKGQEEVINAALNGQDALVVMATGNGKSLCYQIPAL     65
    
    RECQ_ECOLI        63 LLNGLTVVVSPLISLMKDQVDQLQANGVAAACLNSTQTREQQLEVMTGCR    112
                         ..:|||:|:||||||||||||||||||:.|..|||:||.|||.:|.....
    RECQ_HAEIN        66 CFDGLTLVISPLISLMKDQVDQLQANGIEADFLNSSQTLEQQQQVQNKLI    115
    
    RECQ_ECOLI       113 TGQIRLLYIAPERLMLDNFLEHLAHWNPVLLAVDEAHCISQWGHDFRPEY    162
                         :||::|||::||::|.::|.:.:::.....:|:|||||||||||||||||
    RECQ_HAEIN       116 SGQLKLLYVSPEKVMTNSFFQLISYSKVCFIAIDEAHCISQWGHDFRPEY    165
    
    RECQ_ECOLI       163 AALGQLRQRFPTLPFMALTATADDTTRQDIVRLLGLNDPLIQISSFDRPN    212
                         ..||.|:..||..|.||||||||..|:|||:|.|.|.:....|.||||||
    RECQ_HAEIN       166 TQLGGLKASFPDAPIMALTATADYATQQDILRHLNLKNLHKYIGSFDRPN    215
    
    RECQ_ECOLI       213 IRYMLMEKFKPLDQLMRYVQEQRGKSGIIYCNSRAKVEDTAARLQSKGIS    262
                         |||.|.||:||::||.|:|..|:|||||||||||.|||..|..|::||:|
    RECQ_HAEIN       216 IRYTLEEKYKPMEQLTRFVLAQKGKSGIIYCNSRNKVERIAESLRNKGVS    265
    
    RECQ_ECOLI       263 AAAYHAGLENNVRADVQEKFQRDDLQIVVATVAFGMGINKPNVRFVVHFD    312
                         |||||||:|..:|..||:.||||::|:||||:||||||||.|||||.|||
    RECQ_HAEIN       266 AAAYHAGMETAIRERVQQDFQRDNVQVVVATIAFGMGINKSNVRFVAHFD    315
    
    RECQ_ECOLI       313 IPRNIESYYQETGRAGRDGLPAEAMLFYDPADMAWLRRCLEEKPQGQLQD    362
                         :||:||||||||||||||.|||||:|||:|||.|||::.|.|||:...:.
    RECQ_HAEIN       316 LPRSIESYYQETGRAGRDDLPAEAVLFYEPADYAWLQKILLEKPETPQRQ    365
    
    RECQ_ECOLI       363 IERHKLNAMGAFAEAQTCRRLVLLNYFGEGRQEPCGNCDICLDPPKQYDG    412
                         ||:|||.|:|.|||:||||||||||||||.||.||.||||||||||:|||
    RECQ_HAEIN       366 IEQHKLEAIGEFAESQTCRRLVLLNYFGEHRQTPCNNCDICLDPPKKYDG    415
    
    RECQ_ECOLI       413 STDAQIALSTIGRVNQRFGMGYVVEVIRGANNQRIRDYGHDKLKVYGMGR    462
                         ..|||..:|||.||.|.||..||:.|:||.:||:|.:..|.||.|||:|:
    RECQ_HAEIN       416 LVDAQKVMSTIYRVGQCFGAHYVIAVLRGMHNQKIIERQHHKLSVYGIGK    465
    
    RECQ_ECOLI       463 DKSHEHWVSVIRQLIHLGLVTQNIAQ-HSALQLTEAARPVLRGESSLQLA    511
                         |||.|||.||||||||||.|.|.|:: :..|||||:|:.:|:||..|:||
    RECQ_HAEIN       466 DKSKEHWQSVIRQLIHLGFVQQVISELNPTLQLTESAKVILKGEEPLELA    515
    
    RECQ_ECOLI       512 VPRIVALKPKA--MQKSFGGNYDRKLFAKLRKLRKSIADESNVPPYVVFN    559
                         :|||.|:...|  .|:....|||:.|||:||.|||.|||:.|:|||:|||
    RECQ_HAEIN       516 MPRISAISKIAHNPQRQGVANYDKDLFARLRFLRKQIADKENIPPYIVFN    565
    
    RECQ_ECOLI       560 DATLIEMAEQMPITASEMLSVNGVGMRKLERFGKPFMALIRAH    602
                         ||||.|||:.||.:..|||.:||||..||||||:||||||:.|
    RECQ_HAEIN       566 DATLQEMAQYMPTSNIEMLQINGVGSIKLERFGQPFMALIQEH    608
    


    Это выравнивание также полностью совпадает с выравниванием BLASTP и NEEDLE. Удивительно, что при этом отличаются количественные данные. Возможно, это связано с тем, что в NEEDLE, WATER и BLASTP за каждый штраф за гэп начисляются разные веса.