Таблица 1. Результаты поиска гипотетических гомологов белка RECQ_ECOLI
|
Поиск по БД Swiss-Prot |
Поиск по БД PDB |
Поиск по БД "NR" |
1. Лучшая находка (в принципе должна соответствовать заданному белку) |
Идентификатор БД |
RECQ_ECOLI |
1OYY |
YP_002384744 |
E-value |
0.0 |
0.0 |
0.0 |
Вес (в битах) |
1266 |
1087 |
1254 |
% идентичности |
609/609 (100%) |
523/523 (100%) |
606/609 (99%) |
Найдены ли другие белки с теми же значениями E-value и веса в битах?
|
Да, помимо моего белка с E-value 0.0 найдено ещё 4 белка. Среди них RECQ_SALTY. |
Найден ещё 1 белок с таким же E-value: 1OYW_A. |
Да, найдены. Среди них YP_002384744 |
2. Сколько хороших кандидатов в гомологи найдено?
(число находок в списке описаний, Descriptions,
с E-value < 1E-10)
| 198 находок с E-value, не превышающим 10^-10 |
8 находок с E-value, не превышающим 10^-10 |
4040 |
2.
"Худшая" находка (последняя в выдаче с E-value < 1)
|
Номер находки в списке описаний (Descriptions) |
1000 |
53 |
1000 |
Идентификатор БД |
DCR1_CAEEL |
2PL3 |
EAW63425 |
E-value |
0.022 |
0.93 |
1e-87 |
Вес (в битах) |
41.2 |
31.6 |
328 |
% идентичности |
18/57 (31%) |
13/33 (39%) |
182/498 (36%) |
% сходства |
31/57 (54%) |
19/33 (57%) |
280/498 (56%) |
Длина выравнивания |
57 |
33 |
498 |
Координаты выравнивания (номера первых и последних а.о.) |
275-331
442-498 |
30-62
52-84 |
14-484
544-1034 |
% гэпов
| 49/364 (13%) |
0/33 (0%) |
1/592 (0%) |
Краткий комментарий к таблице:
- По поводу худшей находки в NR: худшая находка 4040 по списку, её e-value составляет 0.99, но парного выравнивания здесь BLAST не представил. Поэтому я укажу как худшую находку белок с e-value = 1e-87, для которого последним из списка представлено парное выравнивание с моим белком. Тоже самое в SwissProt, где худшая находка 1184 по списку и её E-value составляет 0.98, белок: POLG_HCVJF . Но в таблице представлены данные для белка DCR1_CAEEL.
- Белок найден во всех 3-х базах данных.
- Параметры выравнивания изучаемого белка с самим собой при поиске по разным БД отличаются в PDB, SwissProt и в Nr. Отличается вес, но не намного. В принципе должно отличаться E-value, что связано с тем, что E-value расчитывается по формуле E = l.K.L.e-λS, где L - объем банка данных, а л и K - параметры системы подсчета и размера поискового пространства. Таким образо, чем больше база данных, тем больше E-value. Следовательно, самый большой E-value в БД "nr", затем в "SwissProt" и только потом в PDB. Но в данном случае E-value настолько мал, что его округлили до целой части, то есть до 0.0.
- Количество потенциальных гомологов различается, в SwissProt оно значительно превышает количество в PDB, а в nr оно самое большее. Объяснить это можно также, что и в предыдущем случае.
- "Худшие" находки при поиске по разным БД не совпадают, их E-Value различаются на порядок. Лучшая из них 7e-82. Это снова непосредственно связано с объёмом БД.
2. Поиск гипотетических гомологов изучаемого белка с фильтром по таксонам
Основная задача - для изучаемого белка E. coli найти лучшего гомолога в организмах таксона, филогенетически как можно более далекого от E. coli.
Для исследования предлагаются следующие таксоны: Homo sapiens, Archaea, Actinobacteria, Alteromonadales, Vibrionaceae (приведены в порядке приближения к E. coli). В этом же порядке проверяем на наличие гипотетического гомолога (критерий: E-value<0,001).
первый гомолог нашёлся сразу же в таксоне Homo sapiens, в нём их нашлось в общей сложности 38 штук.
Итак, краткая характеристика первого гомолога:
Номер находки в списке описаний (Descriptions) |
1 |
Идентификатор SwissProt |
P54132 |
E-value |
1e-93 |
Вес (в битах) |
340 |
% идентичности |
222/646 (34%) |
% сходства |
348/646 (53%) |
Длина выравнивания |
646 |
Координаты выравнивания (номера первых и последних а.о.) |
15-1287 |
% гэпов
| 10% |
Данный белок, как и мой, принадлежит к семейству Геликазы, подсемейству RecQ, также содержит 1 АТФ-связывающий домен, 1 С-терминальный домен; также участвует в ДНК-репарации и репликации.
3. Поиск белка по его фрагменту
Таблица 2. Результаты поиска белка в Swiss-Prot по фрагменту последовательности
|
Поиск по фрагменту |
Поиск по полной последовательности |
АС лучшей находки |
P71359 |
P71359 |
E-value |
4e-17 |
0.0 |
Вес (в битах) |
84.6 |
1289 |
Найдены ли другие белки с теми же значениями E-value и веса в битах?
|
Не найдены. |
Да, найдено 4 белка с тем же значением E-value. |
Выравнивание белка RECQ_ECOLI с родственным ему белком RECQ_HAEIN:
Вес выравнивания: 788 бит;
E-value: 0.0;
Процент идентичности: 63%
Процент сходства: 78%;
Длина выравнивания: 593;
Процент гэповых участков: 0%;
Query - RECQ_HAEIN, Sbjct - RECQ_ECOLI.
Query 16 ALSVLKSVFGYQSFRKGQEEVINAALNGQDALVVMATGNGKSLCYQIPALCFDGLTLVIS 75
A VL+ FGYQ FR GQEE+I+ L+G+D LVVM TG GKSLCYQIPAL +GLT+V+S
Sbjct 13 AKQVLQETFGYQQFRPGQEEIIDTVLSGRDCLVVMPTGGGKSLCYQIPALLLNGLTVVVS 72
Query 76 PLISLMKDQVDQLQANGIEADFLNSSQTLEQQQQVQNKLISGQLKLLYVSPEKVMTNSFF 135
PLISLMKDQVDQLQANG+ A LNS+QT EQQ +V +GQ++LLY++PE++M ++F
Sbjct 73 PLISLMKDQVDQLQANGVAAACLNSTQTREQQLEVMTGCRTGQIRLLYIAPERLMLDNFL 132
Query 136 QLISYSKVCFIAIDEAHCISQWGHDFRPEYTQLGGLKASFPDAPIMALTATADYATQQDI 195
+ +++ +A+DEAHCISQWGHDFRPEY LG L+ FP P MALTATAD T+QDI
Sbjct 133 EHLAHWNPVLLAVDEAHCISQWGHDFRPEYAALGQLRQRFPTLPFMALTATADDTTRQDI 192
Query 196 LRHLNLKNLHKYIGSFDRPNIRYTLEEKYKPMEQLTRFVLAQKGKSGIIYCNSRNKVERI 255
+R L L + I SFDRPNIRY L EK+KP++QL R+V Q+GKSGIIYCNSR KVE
Sbjct 193 VRLLGLNDPLIQISSFDRPNIRYMLMEKFKPLDQLMRYVQEQRGKSGIIYCNSRAKVEDT 252
Query 256 AESLRNKGVSAAAYHAGMETAIRERVQQDFQRDNVQVVVATIAFGMGINKSNVRFVAHFD 315
A L++KG+SAAAYHAG+E +R VQ+ FQRD++Q+VVAT+AFGMGINK NVRFV HFD
Sbjct 253 AARLQSKGISAAAYHAGLENNVRADVQEKFQRDDLQIVVATVAFGMGINKPNVRFVVHFD 312
Query 316 LPRSIESYYQETGRAGRDDLPAEAVLFYEPADYAWLQKILLEKPETPQRQIEQHKLEAIG 375
+PR+IESYYQETGRAGRD LPAEA+LFY+PAD AWL++ L EKP+ + IE+HKL A+G
Sbjct 313 IPRNIESYYQETGRAGRDGLPAEAMLFYDPADMAWLRRCLEEKPQGQLQDIERHKLNAMG 372
Query 376 EFAESQTCRRLVLLNYFGEHRQTPCNNCDICLDPPKKYDGLVDAQKVMSTIYRVGQCFGA 435
FAE+QTCRRLVLLNYFGE RQ PC NCDICLDPPK+YDG DAQ +STI RV Q FG
Sbjct 373 AFAEAQTCRRLVLLNYFGEGRQEPCGNCDICLDPPKQYDGSTDAQIALSTIGRVNQRFGM 432
Query 436 HYVIAVLRGMHNQKIIERQHHKLSVYGIGKDKSKEHWQSVIRQLIHLGFVQQVISELNPT 495
YV+ V+RG +NQ+I + H KL VYG+G+DKS EHW SVIRQLIHLG V Q I++ +
Sbjct 433 GYVVEVIRGANNQRIRDYGHDKLKVYGMGRDKSHEHWVSVIRQLIHLGLVTQNIAQ-HSA 491
Query 496 LQLTESAKVILKGEEPLELAMPRISAISKIAHNPQRQGVANYDKDLFARLRFLRKQIADK 555
LQLTE+A+ +L+GE L+LA+PRI A+ A Q+ NYD+ LFA+LR LRK IAD+
Sbjct 492 LQLTEAARPVLRGESSLQLAVPRIVALKPKAM--QKSFGGNYDRKLFAKLRKLRKSIADE 549
Query 556 ENIPPYIVFNDATLQEMAQYMPTSNIEMLQINGVGSIKLERFGQPFMALIQEH 608
N+PPY+VFNDATL EMA+ MP + EML +NGVG KLERFG+PFMALI+ H
Sbjct 550 SNVPPYVVFNDATLIEMAEQMPITASEMLSVNGVGMRKLERFGKPFMALIRAH 602
Пробное выравнивание:
Данный фрагмент из выравнивания, предложенного программой BlastP:
Query 76 PLISLMKDQVDQLQANGIEADFLNSSQTLEQQQQVQNKLISGQLKLLYVSPEKVMTNSFF 135
PLISLMKDQVDQLQANG+ A LNS+QT EQQ +V +GQ++LLY++PE++M ++F
Sbjct 73 PLISLMKDQVDQLQANGVAAACLNSTQTREQQLEVMTGCRTGQIRLLYIAPERLMLDNFL 132
Видно, что выравнивания совпадают на участке 91-115 по RECQ_Ecoli. Разница только в том, что в выравнивании, предложеннном BLASTP, отсутсвуют гэпы, а в пробном выравнивании их 5. В целом совпали одни и те же аминокислоты в колонках.
Поиск белка по фрагменту необходим для того, чтобы определить белок, выравнивания с которым мы проводили при пробных выравниваниях. RECQ_HAEIN - идентификатор этого белка в SwissProt. Его аминокислотная последовательность сохранена в файле: RECQ_HAEIN.fasta.
Малая длина последоватеьности, как видно из таблицы, даёт большое значение E-Value.
3. Сравнение выравниваний, выданных программой BLASTP, с оптимальными глобальным и локальным выравниваниями.
Мы получили выравнивание двух белков. Теперь сравним это выравнивание, а также выравнивание, выданное BLASTP:
а) с оптимальным частичным выравниванием;
Сравнивать выравнивание, выданное BLAST, с оптимальным выравниванием имеет смысл, если последнее является оптимальным для функции Score, вычисляемой при тех же значениях штрафов за создание и удлинение гэпа, которыми пользовался BLAST. Поэтому прежде всего заглядываем в меню "Algorithm parameters" в самом конце страницы запроса BLASTP и из строки "Gap Costs" извлекаем необходимую информацию: existense-10, extension-1. Затем построим оптимальные локальное и глобальное выравнивания полных последовательностей соответствующих белков при тех же параметрах.
Полное парное оптимальное выравнивание, предложенное BLASTP (Gap_penalty: 11.0, Gap extension penalty [0.5]: 1.0):
Вес выравнивания: 788 бит;
E-value: 0.0;
Процент идентичности: 63%
Процент сходства: 78%;
Длина выравнивания: 593;
Процент гэповых участков: 0%;
Query - RECQ_HAEIN, Sbjct - RECQ_ECOLI.
Query 16 ALSVLKSVFGYQSFRKGQEEVINAALNGQDALVVMATGNGKSLCYQIPALCFDGLTLVIS 75
A VL+ FGYQ FR GQEE+I+ L+G+D LVVM TG GKSLCYQIPAL +GLT+V+S
Sbjct 13 AKQVLQETFGYQQFRPGQEEIIDTVLSGRDCLVVMPTGGGKSLCYQIPALLLNGLTVVVS 72
Query 76 PLISLMKDQVDQLQANGIEADFLNSSQTLEQQQQVQNKLISGQLKLLYVSPEKVMTNSFF 135
PLISLMKDQVDQLQANG+ A LNS+QT EQQ +V +GQ++LLY++PE++M ++F
Sbjct 73 PLISLMKDQVDQLQANGVAAACLNSTQTREQQLEVMTGCRTGQIRLLYIAPERLMLDNFL 132
Query 136 QLISYSKVCFIAIDEAHCISQWGHDFRPEYTQLGGLKASFPDAPIMALTATADYATQQDI 195
+ +++ +A+DEAHCISQWGHDFRPEY LG L+ FP P MALTATAD T+QDI
Sbjct 133 EHLAHWNPVLLAVDEAHCISQWGHDFRPEYAALGQLRQRFPTLPFMALTATADDTTRQDI 192
Query 196 LRHLNLKNLHKYIGSFDRPNIRYTLEEKYKPMEQLTRFVLAQKGKSGIIYCNSRNKVERI 255
+R L L + I SFDRPNIRY L EK+KP++QL R+V Q+GKSGIIYCNSR KVE
Sbjct 193 VRLLGLNDPLIQISSFDRPNIRYMLMEKFKPLDQLMRYVQEQRGKSGIIYCNSRAKVEDT 252
Query 256 AESLRNKGVSAAAYHAGMETAIRERVQQDFQRDNVQVVVATIAFGMGINKSNVRFVAHFD 315
A L++KG+SAAAYHAG+E +R VQ+ FQRD++Q+VVAT+AFGMGINK NVRFV HFD
Sbjct 253 AARLQSKGISAAAYHAGLENNVRADVQEKFQRDDLQIVVATVAFGMGINKPNVRFVVHFD 312
Query 316 LPRSIESYYQETGRAGRDDLPAEAVLFYEPADYAWLQKILLEKPETPQRQIEQHKLEAIG 375
+PR+IESYYQETGRAGRD LPAEA+LFY+PAD AWL++ L EKP+ + IE+HKL A+G
Sbjct 313 IPRNIESYYQETGRAGRDGLPAEAMLFYDPADMAWLRRCLEEKPQGQLQDIERHKLNAMG 372
Query 376 EFAESQTCRRLVLLNYFGEHRQTPCNNCDICLDPPKKYDGLVDAQKVMSTIYRVGQCFGA 435
FAE+QTCRRLVLLNYFGE RQ PC NCDICLDPPK+YDG DAQ +STI RV Q FG
Sbjct 373 AFAEAQTCRRLVLLNYFGEGRQEPCGNCDICLDPPKQYDGSTDAQIALSTIGRVNQRFGM 432
Query 436 HYVIAVLRGMHNQKIIERQHHKLSVYGIGKDKSKEHWQSVIRQLIHLGFVQQVISELNPT 495
YV+ V+RG +NQ+I + H KL VYG+G+DKS EHW SVIRQLIHLG V Q I++ +
Sbjct 433 GYVVEVIRGANNQRIRDYGHDKLKVYGMGRDKSHEHWVSVIRQLIHLGLVTQNIAQ-HSA 491
Query 496 LQLTESAKVILKGEEPLELAMPRISAISKIAHNPQRQGVANYDKDLFARLRFLRKQIADK 555
LQLTE+A+ +L+GE L+LA+PRI A+ A Q+ NYD+ LFA+LR LRK IAD+
Sbjct 492 LQLTEAARPVLRGESSLQLAVPRIVALKPKAM--QKSFGGNYDRKLFAKLRKLRKSIADE 549
Query 556 ENIPPYIVFNDATLQEMAQYMPTSNIEMLQINGVGSIKLERFGQPFMALIQEH 608
N+PPY+VFNDATL EMA+ MP + EML +NGVG KLERFG+PFMALI+ H
Sbjct 550 SNVPPYVVFNDATLIEMAEQMPITASEMLSVNGVGMRKLERFGKPFMALIRAH 602
Теперь представим глобальное выравнивание программы NEEDLE (Gap_penalty: 11.0, Gap extension penalty [0.5]: 1.0):
Вес выравнивания: 1933 бит;
E-value: 0.0;
Процент идентичности: 61,2%
Процент сходства: 75,8%;
Длина выравнивания: 621;
Процент гэповых участков: 2,3%.
RECQ_HAEIN 1 MLDSPLLSKIIEKPTALSVLKSVFGYQSFRKGQEEVINAALNGQDALVVM 50
|..:.:|:. :..|..||:..||||.||.||||:|:..|:|:|.||||
RECQ_ECOLI 1 MAQAEVLNL---ESGAKQVLQETFGYQQFRPGQEEIIDTVLSGRDCLVVM 47
RECQ_HAEIN 51 ATGNGKSLCYQIPALCFDGLTLVISPLISLMKDQVDQLQANGIEADFLNS 100
.||.|||||||||||..:|||:|:||||||||||||||||||:.|..|||
RECQ_ECOLI 48 PTGGGKSLCYQIPALLLNGLTVVVSPLISLMKDQVDQLQANGVAAACLNS 97
RECQ_HAEIN 101 SQTLEQQQQVQNKLISGQLKLLYVSPEKVMTNSFFQLISYSKVCFIAIDE 150
:||.|||.:|.....:||::|||::||::|.::|.:.:::.....:|:||
RECQ_ECOLI 98 TQTREQQLEVMTGCRTGQIRLLYIAPERLMLDNFLEHLAHWNPVLLAVDE 147
RECQ_HAEIN 151 AHCISQWGHDFRPEYTQLGGLKASFPDAPIMALTATADYATQQDILRHLN 200
|||||||||||||||..||.|:..||..|.||||||||..|:|||:|.|.
RECQ_ECOLI 148 AHCISQWGHDFRPEYAALGQLRQRFPTLPFMALTATADDTTRQDIVRLLG 197
RECQ_HAEIN 201 LKNLHKYIGSFDRPNIRYTLEEKYKPMEQLTRFVLAQKGKSGIIYCNSRN 250
|.:....|.|||||||||.|.||:||::||.|:|..|:|||||||||||.
RECQ_ECOLI 198 LNDPLIQISSFDRPNIRYMLMEKFKPLDQLMRYVQEQRGKSGIIYCNSRA 247
RECQ_HAEIN 251 KVERIAESLRNKGVSAAAYHAGMETAIRERVQQDFQRDNVQVVVATIAFG 300
|||..|..|::||:||||||||:|..:|..||:.||||::|:||||:|||
RECQ_ECOLI 248 KVEDTAARLQSKGISAAAYHAGLENNVRADVQEKFQRDDLQIVVATVAFG 297
RECQ_HAEIN 301 MGINKSNVRFVAHFDLPRSIESYYQETGRAGRDDLPAEAVLFYEPADYAW 350
|||||.|||||.|||:||:||||||||||||||.|||||:|||:|||.||
RECQ_ECOLI 298 MGINKPNVRFVVHFDIPRNIESYYQETGRAGRDGLPAEAMLFYDPADMAW 347
RECQ_HAEIN 351 LQKILLEKPETPQRQIEQHKLEAIGEFAESQTCRRLVLLNYFGEHRQTPC 400
|::.|.|||:...:.||:|||.|:|.|||:||||||||||||||.||.||
RECQ_ECOLI 348 LRRCLEEKPQGQLQDIERHKLNAMGAFAEAQTCRRLVLLNYFGEGRQEPC 397
RECQ_HAEIN 401 NNCDICLDPPKKYDGLVDAQKVMSTIYRVGQCFGAHYVIAVLRGMHNQKI 450
.||||||||||:|||..|||..:|||.||.|.||..||:.|:||.:||:|
RECQ_ECOLI 398 GNCDICLDPPKQYDGSTDAQIALSTIGRVNQRFGMGYVVEVIRGANNQRI 447
RECQ_HAEIN 451 IERQHHKLSVYGIGKDKSKEHWQSVIRQLIHLGFVQQVISELNPTLQLTE 500
.:..|.||.|||:|:|||.|||.||||||||||.|.|.|:: :..|||||
RECQ_ECOLI 448 RDYGHDKLKVYGMGRDKSHEHWVSVIRQLIHLGLVTQNIAQ-HSALQLTE 496
RECQ_HAEIN 501 SAKVILKGEEPLELAMPRISAISKIAHNPQRQGVANYDKDLFARLRFLRK 550
:|:.:|:||..|:||:|||.|:...| .|:....|||:.|||:||.|||
RECQ_ECOLI 497 AARPVLRGESSLQLAVPRIVALKPKA--MQKSFGGNYDRKLFAKLRKLRK 544
RECQ_HAEIN 551 QIADKENIPPYIVFNDATLQEMAQYMPTSNIEMLQINGVGSIKLERFGQP 600
.|||:.|:|||:|||||||.|||:.||.:..|||.:||||..||||||:|
RECQ_ECOLI 545 SIADESNVPPYVVFNDATLIEMAEQMPITASEMLSVNGVGMRKLERFGKP 594
RECQ_HAEIN 601 FMALIQEHKAILANAQNND-- 619
|||||:.| ...:|
RECQ_ECOLI 595 FMALIRAH------VDGDDEE 609
Это выравнивание в точности совпадает с выравниванием, представленным программой BLASTP.
Оптимальное локальное выравнивание программы Water (Gap_penalty: 11.0, Gap extension penalty [0.5]: 1.0):
Вес выравнивания: 1949 бит;
E-value: 0.0;
Процент идентичности: 63,6%
Процент сходства: 78,1%;
Длина выравнивания: 593;
Процент гэповых участков: 0,5%.
RECQ_ECOLI 13 AKQVLQETFGYQQFRPGQEEIIDTVLSGRDCLVVMPTGGGKSLCYQIPAL 62
|..||:..||||.||.||||:|:..|:|:|.||||.||.|||||||||||
RECQ_HAEIN 16 ALSVLKSVFGYQSFRKGQEEVINAALNGQDALVVMATGNGKSLCYQIPAL 65
RECQ_ECOLI 63 LLNGLTVVVSPLISLMKDQVDQLQANGVAAACLNSTQTREQQLEVMTGCR 112
..:|||:|:||||||||||||||||||:.|..|||:||.|||.:|.....
RECQ_HAEIN 66 CFDGLTLVISPLISLMKDQVDQLQANGIEADFLNSSQTLEQQQQVQNKLI 115
RECQ_ECOLI 113 TGQIRLLYIAPERLMLDNFLEHLAHWNPVLLAVDEAHCISQWGHDFRPEY 162
:||::|||::||::|.::|.:.:::.....:|:|||||||||||||||||
RECQ_HAEIN 116 SGQLKLLYVSPEKVMTNSFFQLISYSKVCFIAIDEAHCISQWGHDFRPEY 165
RECQ_ECOLI 163 AALGQLRQRFPTLPFMALTATADDTTRQDIVRLLGLNDPLIQISSFDRPN 212
..||.|:..||..|.||||||||..|:|||:|.|.|.:....|.||||||
RECQ_HAEIN 166 TQLGGLKASFPDAPIMALTATADYATQQDILRHLNLKNLHKYIGSFDRPN 215
RECQ_ECOLI 213 IRYMLMEKFKPLDQLMRYVQEQRGKSGIIYCNSRAKVEDTAARLQSKGIS 262
|||.|.||:||::||.|:|..|:|||||||||||.|||..|..|::||:|
RECQ_HAEIN 216 IRYTLEEKYKPMEQLTRFVLAQKGKSGIIYCNSRNKVERIAESLRNKGVS 265
RECQ_ECOLI 263 AAAYHAGLENNVRADVQEKFQRDDLQIVVATVAFGMGINKPNVRFVVHFD 312
|||||||:|..:|..||:.||||::|:||||:||||||||.|||||.|||
RECQ_HAEIN 266 AAAYHAGMETAIRERVQQDFQRDNVQVVVATIAFGMGINKSNVRFVAHFD 315
RECQ_ECOLI 313 IPRNIESYYQETGRAGRDGLPAEAMLFYDPADMAWLRRCLEEKPQGQLQD 362
:||:||||||||||||||.|||||:|||:|||.|||::.|.|||:...:.
RECQ_HAEIN 316 LPRSIESYYQETGRAGRDDLPAEAVLFYEPADYAWLQKILLEKPETPQRQ 365
RECQ_ECOLI 363 IERHKLNAMGAFAEAQTCRRLVLLNYFGEGRQEPCGNCDICLDPPKQYDG 412
||:|||.|:|.|||:||||||||||||||.||.||.||||||||||:|||
RECQ_HAEIN 366 IEQHKLEAIGEFAESQTCRRLVLLNYFGEHRQTPCNNCDICLDPPKKYDG 415
RECQ_ECOLI 413 STDAQIALSTIGRVNQRFGMGYVVEVIRGANNQRIRDYGHDKLKVYGMGR 462
..|||..:|||.||.|.||..||:.|:||.:||:|.:..|.||.|||:|:
RECQ_HAEIN 416 LVDAQKVMSTIYRVGQCFGAHYVIAVLRGMHNQKIIERQHHKLSVYGIGK 465
RECQ_ECOLI 463 DKSHEHWVSVIRQLIHLGLVTQNIAQ-HSALQLTEAARPVLRGESSLQLA 511
|||.|||.||||||||||.|.|.|:: :..|||||:|:.:|:||..|:||
RECQ_HAEIN 466 DKSKEHWQSVIRQLIHLGFVQQVISELNPTLQLTESAKVILKGEEPLELA 515
RECQ_ECOLI 512 VPRIVALKPKA--MQKSFGGNYDRKLFAKLRKLRKSIADESNVPPYVVFN 559
:|||.|:...| .|:....|||:.|||:||.|||.|||:.|:|||:|||
RECQ_HAEIN 516 MPRISAISKIAHNPQRQGVANYDKDLFARLRFLRKQIADKENIPPYIVFN 565
RECQ_ECOLI 560 DATLIEMAEQMPITASEMLSVNGVGMRKLERFGKPFMALIRAH 602
||||.|||:.||.:..|||.:||||..||||||:||||||:.|
RECQ_HAEIN 566 DATLQEMAQYMPTSNIEMLQINGVGSIKLERFGQPFMALIQEH 608
Это выравнивание также полностью совпадает с выравниванием BLASTP и NEEDLE. Удивительно, что при этом отличаются количественные данные. Возможно, это связано с тем, что в NEEDLE, WATER и BLASTP за каждый штраф за гэп начисляются разные веса.