I. Работа в командной строке Linux





1. Смена активной директории и просмотр содержимого директорий.

 - выполнение команды "ls" позволяет просмотреть содержимое активной директории (диска H).

 - при выполнении команды "ls .." Linux перемещает в директорию, содержащую выход к собственной рабочей директории (список студентов 1-ого курса ФББ).

 - совокупность команд "cd .." а потом "ls" позволяет вернуться в предыдущую директорию, а повтор команды перенаправляет в предпредыдущую директорию (в данном случае это года по поступлению).

 - команда "pwd" отображает полный путь к домашней директории.

 - при помощи команды "cd Term_2", а затем с помощью "cd Practices5" я вошла в нужную мне директорию, а при помощи команды "ls" просмотрела её содержимое.

Создание и просмотр файлов.

  - пакет программ EMBOSS "seqret sw:p15043 -auto" создаёт в директории новый файл "recq_ecoli.fasta, в чём мы убеждаемся при помощи команды "ls". Затем, выполнив команду "more recq_ecoli.fasta", можно просмотреть содержимое данного файла: последовательность белка Recq_Ecoli в формате Fasta.

  - пакет программEMBOSS "entret sw:p15043 -auto" создаёт в директории новый файл "recq_ecoli.entret", представляющий собой файл UniProt.



 2. Некоторые способы облегчения работы в командной строке.

 - клавиши "вверх" и "вниз" позволяют не вводить одни и те же команды по несколько раз. То есть стрелочкой "вверх" можно выбрать любую введённую ранее команду, стрелочкой "вниз" - вернуться к вводу.

 - команда "history" выдаёт список всех введённых ранее команд.

 - команда "more w " позволяет не вводить название файла целиком, а только первую букву, если в директории нет файлов, первые буквы названия которых схожи с выбранным.

II. Построить и сравнить оптимальные глобальное и оптимальное локальное выравнивание 2-х последовательностей



1. Построить полное (глобальное) оптимальное выравнивание с помощью программы needle пакета EMBOSS.

  Последовательность моего белка:

>RECQ_ECOLI P15043 RecName: Full=ATP-dependent DNA helicase recQ; EC=3.6.1.-;
MAQAEVLNLESGAKQVLQETFGYQQFRPGQEEIIDTVLSGRDCLVVMPTGGGKSLCYQIP
ALLLNGLTVVVSPLISLMKDQVDQLQANGVAAACLNSTQTREQQLEVMTGCRTGQIRLLY
IAPERLMLDNFLEHLAHWNPVLLAVDEAHCISQWGHDFRPEYAALGQLRQRFPTLPFMAL
TATADDTTRQDIVRLLGLNDPLIQISSFDRPNIRYMLMEKFKPLDQLMRYVQEQRGKSGI
IYCNSRAKVEDTAARLQSKGISAAAYHAGLENNVRADVQEKFQRDDLQIVVATVAFGMGI
NKPNVRFVVHFDIPRNIESYYQETGRAGRDGLPAEAMLFYDPADMAWLRRCLEEKPQGQL
QDIERHKLNAMGAFAEAQTCRRLVLLNYFGEGRQEPCGNCDICLDPPKQYDGSTDAQIAL
STIGRVNQRFGMGYVVEVIRGANNQRIRDYGHDKLKVYGMGRDKSHEHWVSVIRQLIHLG
LVTQNIAQHSALQLTEAARPVLRGESSLQLAVPRIVALKPKAMQKSFGGNYDRKLFAKLR
KLRKSIADESNVPPYVVFNDATLIEMAEQMPITASEMLSVNGVGMRKLERFGKPFMALIR
AHVDGDDEE


Последовательность родственного белка:
>RECQ_BACSU P50729 RecName: Full=ATP-dependent DNA helicase recQ; EC=3.6.1.-; AltName: Full=Recombination protein S;
MTKLQQTLYQFFGFTSFKKGQQDIIESILSGKDTIAMLPTGGGKSLCYQLPGYMLDGMVL
IVSPLLSLMEDQVQQLKARGEKRAAALNSMLNRQERQFVLEHIHRYKFLYLSPEALQSPY
VLEKLKSVPISLFVIDEAHCISEWGHDFRPDYSKLGQLRKKLGHPPVLALTATATKETLQ
DVMNLLELQHAVRHLNSVNRPNIALRVENAADTAEKIDRVIQLVENLQGPGIVYCPTRKW
AKELAGEIKSKTSSRADFYHGGLESGDRILIQQQFIHNQLDVICCTNAFGMGVDKPDIRY
VIHFHLPQTAEAFMQEIGRAGRDGKPSVSILLRAPGDFELQEQIIQMESVTAEEIADVIR
VLEKTEERDERRLRDVLLQYGVGETQARMMIHLFMQGKTSVELMKKEISYRMELKLEKMH
RVSFLLQRDGCLRQALLTYFDESYEPDDGNLPCCSHCGFDLSLYEQKGERSKMAPLDSWS
SELHRIFSLQTVGELN


Пользуясь программой seqret, я создала файл opt.needle с поседовательностью белка, родственного моему. Таким образом я построила полное оптимальное выравнивание двух белков - моего и родственного:
RECQ_ECOLI         1 MAQAEVLNLESGAKQVLQETFGYQQFRPGQEEIIDTVLSGRDCLVVMPTG     50
                              .:..:|.|.:.||:..|:.||::||:::|||:|.:.::|||
RECQ_BACSU         1 ---------MTKLQQTLYQFFGFTSFKKGQQDIIESILSGKDTIAMLPTG     41

RECQ_ECOLI        51 GGKSLCYQIPALLLNGLTVVVSPLISLMKDQVDQLQANG-VAAACLNSTQ     99
                     ||||||||:|..:|:|:.::||||:|||:|||.||:|.| ..||.|||..
RECQ_BACSU        42 GGKSLCYQLPGYMLDGMVLIVSPLLSLMEDQVQQLKARGEKRAAALNSML     91

RECQ_ECOLI       100 TREQQLEVMTGCRTGQIRLLYIAPERLMLDNFLEHLAHWNPVLLAVDEAH    149
                     .|:::..|:.  ...:.:.||::||.|.....||.|......|..:||||
RECQ_BACSU        92 NRQERQFVLE--HIHRYKFLYLSPEALQSPYVLEKLKSVPISLFVIDEAH    139

RECQ_ECOLI       150 CISQWGHDFRPEYAALGQLRQRFPTLPFMALTATADDTTRQDIVRLLGLN    199
                     |||:|||||||:|:.|||||::....|.:||||||...|.||::.||.|.
RECQ_BACSU       140 CISEWGHDFRPDYSKLGQLRKKLGHPPVLALTATATKETLQDVMNLLELQ    189

RECQ_ECOLI       200 DPLIQISSFDRPNIRYML---MEKFKPLDQLMRYVQEQRGKSGIIYCNSR    246
                     ..:..::|.:||||...:   .:..:.:|::::.|:..:| .||:||.:|
RECQ_BACSU       190 HAVRHLNSVNRPNIALRVENAADTAEKIDRVIQLVENLQG-PGIVYCPTR    238

RECQ_ECOLI       247 AKVEDTAARLQSKGISAA-AYHAGLENNVRADVQEKFQRDDLQIVVATVA    295
                     ...::.|..::||..|.| .||.|||:..|..:|::|..:.|.::..|.|
RECQ_BACSU       239 KWAKELAGEIKSKTSSRADFYHGGLESGDRILIQQQFIHNQLDVICCTNA    288

RECQ_ECOLI       296 FGMGINKPNVRFVVHFDIPRNIESYYQETGRAGRDGLPAEAMLFYDPAD-    344
                     ||||::||::|:|:||.:|:..|::.||.|||||||.|:.::|...|.| 
RECQ_BACSU       289 FGMGVDKPDIRYVIHFHLPQTAEAFMQEIGRAGRDGKPSVSILLRAPGDF    338

RECQ_ECOLI       345 ----------------MAWLRRCL---EEKPQGQLQDI------------    363
                                     :|.:.|.|   ||:.:.:|:|:            
RECQ_BACSU       339 ELQEQIIQMESVTAEEIADVIRVLEKTEERDERRLRDVLLQYGVGETQAR    388

RECQ_ECOLI       364 --------------------------ERHKLNAMGAFAEAQTCRRLVLLN    387
                                               :..|::.:....:...|.|..||.
RECQ_BACSU       389 MMIHLFMQGKTSVELMKKEISYRMELKLEKMHRVSFLLQRDGCLRQALLT    438

RECQ_ECOLI       388 YFGEGRQEPCGNCDIC------------------LDPPKQYDGSTDAQIA    419
                     ||.|..:...||...|                  :.|...:........:
RECQ_BACSU       439 YFDESYEPDDGNLPCCSHCGFDLSLYEQKGERSKMAPLDSWSSELHRIFS    488

RECQ_ECOLI       420 LSTIGRVNQRFGMGYVVEVIRGANNQRIRDYGHDKLKVYGMGRDKSHEHW    469
                     |.|:|.:|                                          
RECQ_BACSU       489 LQTVGELN------------------------------------------    496

RECQ_ECOLI       470 VSVIRQLIHLGLVTQNIAQHSALQLTEAARPVLRGESSLQLAVPRIVALK    519
                                                                       
RECQ_BACSU       496 --------------------------------------------------    496

RECQ_ECOLI       520 PKAMQKSFGGNYDRKLFAKLRKLRKSIADESNVPPYVVFNDATLIEMAEQ    569
                                                                       
RECQ_BACSU       496 --------------------------------------------------    496

RECQ_ECOLI       570 MPITASEMLSVNGVGMRKLERFGKPFMALIRAHVDGDDEE    609
                                                             
RECQ_BACSU       496 ----------------------------------------    496
Файл "opt.needle" содержит информацию о данном выравнивании, а именно: названия белков, штрафы за гэпы, длины выравнивания, процент идентичности, процент сходства, количество гэпов, а также само глобальное выравнивание.

Задание штрафов за гэпы, отличных от заданных по умолчанию.

  После того, как я изменила параметры по умолчанию (штраф за образование гэпа, штраф за его тпродление), увеличив их вдвое, произошли следущие изменения: пробел 219-221 в 1-м выравнивании заполнился, но образовался пробел 234-235. В остальном выранивание не изменилось. Длина первого выравнивания - 690, процент идентичности - 24,2 %, процент сходства - 38,9 %, процент гэпов - 39,9%, общий вес - 759,5. Длина второго выравнивания - 689, процент идентичности - 23,8 %, процент сходства - 37,3 %, процент гэпов - 39,6%, общий вес - 647. Изменения в длине выравнивания и в весе замен соответсвуют изменению в выравнивании. Полученный файл: op.needle

RECQ_ECOLI         1 MAQAEVLNLESGAKQVLQETFGYQQFRPGQEEIIDTVLSGRDCLVVMPTG     50
                              .:..:|.|.:.||:..|:.||::||:::|||:|.:.::|||
RECQ_BACSU         1 ---------MTKLQQTLYQFFGFTSFKKGQQDIIESILSGKDTIAMLPTG     41

RECQ_ECOLI        51 GGKSLCYQIPALLLNGLTVVVSPLISLMKDQVDQLQANG-VAAACLNSTQ     99
                     ||||||||:|..:|:|:.::||||:|||:|||.||:|.| ..||.|||..
RECQ_BACSU        42 GGKSLCYQLPGYMLDGMVLIVSPLLSLMEDQVQQLKARGEKRAAALNSML     91

RECQ_ECOLI       100 TREQQLEVMTGCRTGQIRLLYIAPERLMLDNFLEHLAHWNPVLLAVDEAH    149
                     .|:::..|:.  ...:.:.||::||.|.....||.|......|..:||||
RECQ_BACSU        92 NRQERQFVLE--HIHRYKFLYLSPEALQSPYVLEKLKSVPISLFVIDEAH    139

RECQ_ECOLI       150 CISQWGHDFRPEYAALGQLRQRFPTLPFMALTATADDTTRQDIVRLLGLN    199
                     |||:|||||||:|:.|||||::....|.:||||||...|.||::.||.|.
RECQ_BACSU       140 CISEWGHDFRPDYSKLGQLRKKLGHPPVLALTATATKETLQDVMNLLELQ    189

RECQ_ECOLI       200 DPLIQISSFDRPNIRYMLMEKFKPLDQLMRYVQ--EQRGKSGIIYCNSRA    247
                     ..:..::|.:||||...:.......:::.|.:|  |.....||:||.:|.
RECQ_BACSU       190 HAVRHLNSVNRPNIALRVENAADTAEKIDRVIQLVENLQGPGIVYCPTRK    239

RECQ_ECOLI       248 KVEDTAARLQSKGISAA-AYHAGLENNVRADVQEKFQRDDLQIVVATVAF    296
                     ..::.|..::||..|.| .||.|||:..|..:|::|..:.|.::..|.||
RECQ_BACSU       240 WAKELAGEIKSKTSSRADFYHGGLESGDRILIQQQFIHNQLDVICCTNAF    289

RECQ_ECOLI       297 GMGINKPNVRFVVHFDIPRNIESYYQETGRAGRDGLPAEAMLFYDPADMA    346
                     |||::||::|:|:||.:|:..|::.||.|||||||.|:.::|...|.|..
RECQ_BACSU       290 GMGVDKPDIRYVIHFHLPQTAEAFMQEIGRAGRDGKPSVSILLRAPGDFE    339

RECQ_ECOLI       347 WLRRCL--------------------EEKPQGQLQDI-------------    363
                     ...:.:                    ||:.:.:|:|:             
RECQ_BACSU       340 LQEQIIQMESVTAEEIADVIRVLEKTEERDERRLRDVLLQYGVGETQARM    389

RECQ_ECOLI       364 -------------------------ERHKLNAMGAFAEAQTCRRLVLLNY    388
                                              :..|::.:....:...|.|..||.|
RECQ_BACSU       390 MIHLFMQGKTSVELMKKEISYRMELKLEKMHRVSFLLQRDGCLRQALLTY    439

RECQ_ECOLI       389 FGEGRQEPCGNCDIC------------------LDPPKQYDGSTDAQIAL    420
                     |.|..:...||...|                  :.|...:........:|
RECQ_BACSU       440 FDESYEPDDGNLPCCSHCGFDLSLYEQKGERSKMAPLDSWSSELHRIFSL    489

RECQ_ECOLI       421 STIGRVNQRFGMGYVVEVIRGANNQRIRDYGHDKLKVYGMGRDKSHEHWV    470
                     .|:|.:|                                           
RECQ_BACSU       490 QTVGELN-------------------------------------------    496

RECQ_ECOLI       471 SVIRQLIHLGLVTQNIAQHSALQLTEAARPVLRGESSLQLAVPRIVALKP    520
                                                                       
RECQ_BACSU       496 --------------------------------------------------    496

RECQ_ECOLI       521 KAMQKSFGGNYDRKLFAKLRKLRKSIADESNVPPYVVFNDATLIEMAEQM    570
                                                                       
RECQ_BACSU       496 --------------------------------------------------    496

RECQ_ECOLI       571 PITASEMLSVNGVGMRKLERFGKPFMALIRAHVDGDDEE    609
                                                            
RECQ_BACSU       496 ---------------------------------------    496


Получение выдачи в формате, пригодном для импорта в GeneDoc.

  Запустив прграмму needle командой needle recq_ecoli.fasta P50729.fasta GD.msf -aformat msf, я получила файл GD.msf , пригодный для чтения в GenDoc.

2. Построить локальное (частичное) оптимальное выравнивание тех же последовательностей с помощью программы water пакета EMBOSS.

 Выравнивание при обычных параметрах сохранено в файле opt.water :

RECQ_ECOLI        14 KQVLQETFGYQQFRPGQEEIIDTVLSGRDCLVVMPTGGGKSLCYQIPALL     63
                     :|.|.:.||:..|:.||::||:::|||:|.:.::|||||||||||:|..:
RECQ_BACSU         5 QQTLYQFFGFTSFKKGQQDIIESILSGKDTIAMLPTGGGKSLCYQLPGYM     54

RECQ_ECOLI        64 LNGLTVVVSPLISLMKDQVDQLQANG-VAAACLNSTQTREQQLEVMTGCR    112
                     |:|:.::||||:|||:|||.||:|.| ..||.|||...|:::..|:.  .
RECQ_BACSU        55 LDGMVLIVSPLLSLMEDQVQQLKARGEKRAAALNSMLNRQERQFVLE--H    102

RECQ_ECOLI       113 TGQIRLLYIAPERLMLDNFLEHLAHWNPVLLAVDEAHCISQWGHDFRPEY    162
                     ..:.:.||::||.|.....||.|......|..:|||||||:|||||||:|
RECQ_BACSU       103 IHRYKFLYLSPEALQSPYVLEKLKSVPISLFVIDEAHCISEWGHDFRPDY    152

RECQ_ECOLI       163 AALGQLRQRFPTLPFMALTATADDTTRQDIVRLLGLNDPLIQISSFDRPN    212
                     :.|||||::....|.:||||||...|.||::.||.|...:..::|.:|||
RECQ_BACSU       153 SKLGQLRKKLGHPPVLALTATATKETLQDVMNLLELQHAVRHLNSVNRPN    202

RECQ_ECOLI       213 IRYML---MEKFKPLDQLMRYVQEQRGKSGIIYCNSRAKVEDTAARLQSK    259
                     |...:   .:..:.:|::::.|:..:| .||:||.:|...::.|..::||
RECQ_BACSU       203 IALRVENAADTAEKIDRVIQLVENLQG-PGIVYCPTRKWAKELAGEIKSK    251

RECQ_ECOLI       260 GISAA-AYHAGLENNVRADVQEKFQRDDLQIVVATVAFGMGINKPNVRFV    308
                     ..|.| .||.|||:..|..:|::|..:.|.::..|.|||||::||::|:|
RECQ_BACSU       252 TSSRADFYHGGLESGDRILIQQQFIHNQLDVICCTNAFGMGVDKPDIRYV    301

RECQ_ECOLI       309 VHFDIPRNIESYYQETGRAGRDGLPAEAMLFYDPAD--------------    344
                     :||.:|:..|::.||.|||||||.|:.::|...|.|              
RECQ_BACSU       302 IHFHLPQTAEAFMQEIGRAGRDGKPSVSILLRAPGDFELQEQIIQMESVT    351

RECQ_ECOLI       345 ---MAWLRRCL---EEKPQGQLQDI-------------------------    363
                        :|.:.|.|   ||:.:.:|:|:                         
RECQ_BACSU       352 AEEIADVIRVLEKTEERDERRLRDVLLQYGVGETQARMMIHLFMQGKTSV    401

RECQ_ECOLI       364 -------------ERHKLNAMGAFAEAQTCRRLVLLNYFGEGRQEPCGNC    400
                                  :..|::.:....:...|.|..||.||.|..:...||.
RECQ_BACSU       402 ELMKKEISYRMELKLEKMHRVSFLLQRDGCLRQALLTYFDESYEPDDGNL    451

RECQ_ECOLI       401 DIC------------------LDPPKQYDGSTDAQIALSTIGRVN    427
                     ..|                  :.|...:........:|.|:|.:|
RECQ_BACSU       452 PCCSHCGFDLSLYEQKGERSKMAPLDSWSSELHRIFSLQTVGELN    496


Длина выравнивания: 495, процент идентичности: 33,7%, процент сходства: 53,3%, процент гэповых участков: 17,0%, общий вес: 763, 5, Gap_penalty: 10.0, Extend_penalty: 0.5. Несложно заметить, что это локальное выравнивание отличается от соответсвующего по параметрам глобального выравнивания только тем, что начинается первое с 1-ого а.о., а 2-ое начинается с 14-ого (для RECQ_ECOLI) и с 5-ого (для RECQ_BACSU). В остальном выравнивания полностью совпадают.

Выравнивание при увеличении параметров вдвое: op.water :

RECQ_ECOLI        14 KQVLQETFGYQQFRPGQEEIIDTVLSGRDCLVVMPTGGGKSLCYQIPALL     63
                     :|.|.:.||:..|:.||::||:::|||:|.:.::|||||||||||:|..:
RECQ_BACSU         5 QQTLYQFFGFTSFKKGQQDIIESILSGKDTIAMLPTGGGKSLCYQLPGYM     54

RECQ_ECOLI        64 LNGLTVVVSPLISLMKDQVDQLQANG-VAAACLNSTQTREQQLEVMTGCR    112
                     |:|:.::||||:|||:|||.||:|.| ..||.|||...|:::..|:.  .
RECQ_BACSU        55 LDGMVLIVSPLLSLMEDQVQQLKARGEKRAAALNSMLNRQERQFVLE--H    102

RECQ_ECOLI       113 TGQIRLLYIAPERLMLDNFLEHLAHWNPVLLAVDEAHCISQWGHDFRPEY    162
                     ..:.:.||::||.|.....||.|......|..:|||||||:|||||||:|
RECQ_BACSU       103 IHRYKFLYLSPEALQSPYVLEKLKSVPISLFVIDEAHCISEWGHDFRPDY    152

RECQ_ECOLI       163 AALGQLRQRFPTLPFMALTATADDTTRQDIVRLLGLNDPLIQISSFDRPN    212
                     :.|||||::....|.:||||||...|.||::.||.|...:..::|.:|||
RECQ_BACSU       153 SKLGQLRKKLGHPPVLALTATATKETLQDVMNLLELQHAVRHLNSVNRPN    202

RECQ_ECOLI       213 IRYMLMEKFKPLDQLMRYVQ--EQRGKSGIIYCNSRAKVEDTAARLQSKG    260
                     |...:.......:::.|.:|  |.....||:||.:|...::.|..::||.
RECQ_BACSU       203 IALRVENAADTAEKIDRVIQLVENLQGPGIVYCPTRKWAKELAGEIKSKT    252

RECQ_ECOLI       261 ISAA-AYHAGLENNVRADVQEKFQRDDLQIVVATVAFGMGINKPNVRFVV    309
                     .|.| .||.|||:..|..:|::|..:.|.::..|.|||||::||::|:|:
RECQ_BACSU       253 SSRADFYHGGLESGDRILIQQQFIHNQLDVICCTNAFGMGVDKPDIRYVI    302

RECQ_ECOLI       310 HFDIPRNIESYYQETGRAGRDGLPAEAMLFYDPAD    344
                     ||.:|:..|::.||.|||||||.|:.::|...|.|
RECQ_BACSU       303 HFHLPQTAEAFMQEIGRAGRDGKPSVSILLRAPGD    337


Длина выравнивания: 335, процент идентичности: 43,0%, процент сходства: 65,1%, процент гэпов: 1,8%, Gap_penalty: 20.0, Extend_penalty: 1.0 Сравнивая между собой глобальное выравнивание при увеличении параметров вдвое с соответствующим локальным выравниванием, можно отметить только одно изменение: при локальном выравнивании изменяются рамки, для RECQ_ECOLI: 14-344, для RECQ_BACSU: 5-337.

Выравнивание при уменьшении параметров вдвое: o.water :

RECQ_ECOLI        17 LQET----FGYQQFRPGQEEIIDTVLSGRDCLVVMPTGGGKSLCYQIPAL     62
                     ||:|    ||:..|:.||::||:::|||:|.:.::|||||||||||:|..
RECQ_BACSU         4 LQQTLYQFFGFTSFKKGQQDIIESILSGKDTIAMLPTGGGKSLCYQLPGY     53

RECQ_ECOLI        63 LLNGLTVVVSPLISLMKDQVDQLQANG-VAAACLNSTQTR-EQQ--LEVM    108
                     :|:|:.::||||:|||:|||.||:|.| ..||.|||...| |:|  ||  
RECQ_BACSU        54 MLDGMVLIVSPLLSLMEDQVQQLKARGEKRAAALNSMLNRQERQFVLE--    101

RECQ_ECOLI       109 TGCRTGQI---RLLYIAPERLMLDNFLEHLAHWNPV-LLAVDEAHCISQW    154
                           .|   :.||::||.|.....||.|.. .|: |..:|||||||:|
RECQ_BACSU       102 ------HIHRYKFLYLSPEALQSPYVLEKLKS-VPISLFVIDEAHCISEW    144

RECQ_ECOLI       155 GHDFRPEYAALGQLRQRF--PTLPFMALTATADDTTRQDIVRLLGLNDPL    202
                     ||||||:|:.|||||::.  |  |.:||||||...|.||::.||.|...:
RECQ_BACSU       145 GHDFRPDYSKLGQLRKKLGHP--PVLALTATATKETLQDVMNLLELQHAV    192

RECQ_ECOLI       203 IQISSFDRPNIRYML------MEKFKPLDQLMRYVQEQRGKSGIIYCNSR    246
                     ..::|.:||||...:      .||   :|::::.|:..:| .||:||.:|
RECQ_BACSU       193 RHLNSVNRPNIALRVENAADTAEK---IDRVIQLVENLQG-PGIVYCPTR    238

RECQ_ECOLI       247 --AKVEDTAARLQSKGISAAA--YHAGLENNVRADVQEKFQRDDLQIVVA    292
                       ||  :.|..::|| .|:.|  ||.|||:..|..:|::|..:.|.::..
RECQ_BACSU       239 KWAK--ELAGEIKSK-TSSRADFYHGGLESGDRILIQQQFIHNQLDVICC    285

RECQ_ECOLI       293 TVAFGMGINKPNVRFVVHFDIPRNIESYYQETGRAGRDGLPAEAMLFYDP    342
                     |.|||||::||::|:|:||.:|:..|::.||.|||||||.|:.::|...|
RECQ_BACSU       286 TNAFGMGVDKPDIRYVIHFHLPQTAEAFMQEIGRAGRDGKPSVSILLRAP    335

RECQ_ECOLI       343 ADMAWLRRCLEEKPQGQLQDIERHKLNAMGAFAEAQTCRRLVLLNYFGEG    392
                     .|.             :||:                   :::        
RECQ_BACSU       336 GDF-------------ELQE-------------------QII--------    345

RECQ_ECOLI       393 RQEPCGNCDICLDPPKQYDGSTDAQIALSTIGRVNQRFGMGYVVEVIR--    440
                                     |.:..|..:||                 :|||  
RECQ_BACSU       346 ----------------QMESVTAEEIA-----------------DVIRVL    362

RECQ_ECOLI       441 ----GANNQRIRDYGHDKLKVYGMGRDKSHEHWVSVIRQLIHLGLVTQNI    486
                         ..:.:|:||.    |..||:|..::        |.:|||       
RECQ_BACSU       363 EKTEERDERRLRDV----LLQYGVGETQA--------RMMIHL-------    393

RECQ_ECOLI       487 AQHSALQLTEAARPVLRGESSLQLAVPRIVALKPKAMQKSFGGNYDRKLF    536
                                   .::|::|::|            |:|..  :|..:| 
RECQ_BACSU       394 --------------FMQGKTSVEL------------MKKEI--SYRMEL-    414

RECQ_ECOLI       537 AKLRK-------------LRKSIA---DES------NVP--PYVVFNDAT    562
                      ||.|             ||:::.   |||      |:|  .:..| |.:
RECQ_BACSU       415 -KLEKMHRVSFLLQRDGCLRQALLTYFDESYEPDDGNLPCCSHCGF-DLS    462

RECQ_ECOLI       563 LIE-------MAEQMPIT--ASEM---LSVNGVG    584
                     |.|       ||   |:.  :||:   .|:..||
RECQ_BACSU       463 LYEQKGERSKMA---PLDSWSSELHRIFSLQTVG    493 


Длина выравнивания: 634, процент идентичности: 32,2%, процент сходства: 49,1%, процент гэпов: 33,1%, Gap_penalty: 5.0, Extend_penalty: 0.25.

Сравнение между собой локального выравнивания с обычными параметрами с локальными выравниваниями при использовании в 2 раза меньших параметров (одинаковые участки будут отмечены жирным шрифтом):

RECQ_ECOLI        14 KQVLQETFGYQQFRPGQEEIIDTVLSGRDCLVVMPTGGGKSLCYQIPALL     63
                     :|.|.:.||:..|:.||::||:::|||:|.:.::|||||||||||:|..:
RECQ_BACSU         5 QQTLYQFFGFTSFKKGQQDIIESILSGKDTIAMLPTGGGKSLCYQLPGYM     54

RECQ_ECOLI        64 LNGLTVVVSPLISLMKDQVDQLQANG-VAAACLNSTQTREQQLEVMTGCR    112
                     |:|:.::||||:|||:|||.||:|.| ..||.|||...|:::..|:.  .
RECQ_BACSU        55 LDGMVLIVSPLLSLMEDQVQQLKARGEKRAAALNSMLNRQERQFVLE--H    102

RECQ_ECOLI       113 TGQIRLLYIAPERLMLDNFLEHLAHWNPVLLAVDEAHCISQWGHDFRPEY    162
                     ..:.:.||::||.|.....||.|......|..:|||||||:|||||||:|
RECQ_BACSU       103 IHRYKFLYLSPEALQSPYVLEKLKSVPISLFVIDEAHCISEWGHDFRPDY    152

RECQ_ECOLI       163 AALGQLRQRFPTLPFMALTATADDTTRQDIVRLLGLNDPLIQISSFDRPN    212
                     :.|||||::....|.:||||||...|.||::.||.|...:..::|.:|||
RECQ_BACSU       153 SKLGQLRKKLGHPPVLALTATATKETLQDVMNLLELQHAVRHLNSVNRPN    202

RECQ_ECOLI       213 IRYML---MEKFKPLDQLMRYVQEQRGKSGIIYCNSRAKVEDTAARLQSK    259
                     |...:   .:..:.:|::::.|:..:| .||:||.:|...::.|..::||
RECQ_BACSU       203 IALRVENAADTAEKIDRVIQLVENLQG-PGIVYCPTRKWAKELAGEIKSK    251

RECQ_ECOLI       260 GISAA-AYHAGLENNVRADVQEKFQRDDLQIVVATVAFGMGINKPNVRFV    308
                     ..|.| .||.|||:..|..:|::|..:.|.::..|.|||||::||::|:|
RECQ_BACSU       252 TSSRADFYHGGLESGDRILIQQQFIHNQLDVICCTNAFGMGVDKPDIRYV    301

RECQ_ECOLI       309 VHFDIPRNIESYYQETGRAGRDGLPAEAMLFYDPAD--------------    344
                     :||.:|:..|::.||.|||||||.|:.::|...|.|              
RECQ_BACSU       302 IHFHLPQTAEAFMQEIGRAGRDGKPSVSILLRAPGDFELQEQIIQMESVT    351

RECQ_ECOLI       345 ---MAWLRRCL---EEKPQGQLQDI-------------------------    363
                        :|.:.|.|   ||:.:.:|:|:                         
RECQ_BACSU       352 AEEIADVIRVLEKTEERDERRLRDVLLQYGVGETQARMMIHLFMQGKTSV    401

RECQ_ECOLI       364 -------------ERHKLNAMGAFAEAQTCRRLVLLNYFGEGRQEPCGNC    400
                                  :..|::.:....:...|.|..||.||.|..:...||.
RECQ_BACSU       402 ELMKKEISYRMELKLEKMHRVSFLLQRDGCLRQALLTYFDESYEPDDGNL    451

RECQ_ECOLI       401 DIC------------------LDPPKQYDGSTDAQIALSTIGRVN    427
                     ..|                  :.|...:........:|.|:|.:|
RECQ_BACSU       452 PCCSHCGFDLSLYEQKGERSKMAPLDSWSSELHRIFSLQTVGELN    496


Сравнение локального выравнивания с увеличенными вдвое параметрами с выравниванием, параметры которого двое меньше стандартных параметров (жирным шрифтом отмечены одинаковые участки):

RECQ_ECOLI        14 KQVLQETFGYQQFRPGQEEIIDTVLSGRDCLVVMPTGGGKSLCYQIPALL     63
                     :|.|.:.||:..|:.||::||:::|||:|.:.::|||||||||||:|..:
RECQ_BACSU         5 QQTLYQFFGFTSFKKGQQDIIESILSGKDTIAMLPTGGGKSLCYQLPGYM     54

RECQ_ECOLI        64 LNGLTVVVSPLISLMKDQVDQLQANG-VAAACLNSTQTREQQLEVMTGCR    112
                     |:|:.::||||:|||:|||.||:|.| ..||.|||...|:::..|:.  .
RECQ_BACSU        55 LDGMVLIVSPLLSLMEDQVQQLKARGEKRAAALNSMLNRQERQFVLE--H    102

RECQ_ECOLI       113 TGQIRLLYIAPERLMLDNFLEHLAHWNPVLLAVDEAHCISQWGHDFRPEY    162
                     ..:.:.||::||.|.....||.|......|..:|||||||:|||||||:|
RECQ_BACSU       103 IHRYKFLYLSPEALQSPYVLEKLKSVPISLFVIDEAHCISEWGHDFRPDY    152

RECQ_ECOLI       163 AALGQLRQRFPTLPFMALTATADDTTRQDIVRLLGLNDPLIQISSFDRPN    212
                     :.|||||::....|.:||||||...|.||::.||.|...:..::|.:|||
RECQ_BACSU       153 SKLGQLRKKLGHPPVLALTATATKETLQDVMNLLELQHAVRHLNSVNRPN    202

RECQ_ECOLI       213 IRYMLMEKFKPLDQLMRYVQ--EQRGKSGIIYCNSRAKVEDTAARLQSKG    260
                     |...:.......:::.|.:|  |.....||:||.:|...::.|..::||.
RECQ_BACSU       203 IALRVENAADTAEKIDRVIQLVENLQGPGIVYCPTRKWAKELAGEIKSKT    252

RECQ_ECOLI       261 ISAA-AYHAGLENNVRADVQEKFQRDDLQIVVATVAFGMGINKPNVRFVV    309
                     .|.| .||.|||:..|..:|::|..:.|.::..|.|||||::||::|:|:
RECQ_BACSU       253 SSRADFYHGGLESGDRILIQQQFIHNQLDVICCTNAFGMGVDKPDIRYVI    302

RECQ_ECOLI       310 HFDIPRNIESYYQETGRAGRDGLPAEAMLFYDPAD    344
                     ||.:|:..|::.||.|||||||.|:.::|...|.|
RECQ_BACSU       303 HFHLPQTAEAFMQEIGRAGRDGKPSVSILLRAPGD    337


Итак, в глобальных выравниваниях за исключением участков 219-221 по RECQ_ECOLI первой цепи и 209-211 второй). Различия выравнивания с обычными параметрами и выравнивания с увеличенными вдвое парематрами всего лишь в двух местах, в остальных участках выравнивания идентичны.

Opt.water (Gap_penalty: 10.0, Extend_penalty: 0.5.):

RECQ_ECOLI       213 IRYML---MEKFKPLDQLMRYVQEQRGKSGIIYCNSRAKVEDTAARLQSK    259
                     |...:   .:..:.:|::::.|:..:| .||:||.:|...::.|..::||
RECQ_BACSU       203 IALRVENAADTAEKIDRVIQLVENLQG-PGIVYCPTRKWAKELAGEIKSK    251


Op.water (Gap_penalty: 20.0, Extend_penalty: 1.0):

RECQ_ECOLI       213 IRYMLMEKFKPLDQLMRYVQ--EQRGKSGIIYCNSRAKVEDTAARLQSKG    260
                     |...:.......:::.|.:|  |.....||:||.:|...::.|..::||.
RECQ_BACSU       203 IALRVENAADTAEKIDRVIQLVENLQGPGIVYCPTRKWAKELAGEIKSKT    252


Соответствующие локальные выравнивания полностью совпадают с соответствующими глобальными выравниваниями.



Дополнительные задания



1. Построить карту локального сходства заданных последовательностей с помощью программы dotmatcher пакета EMBOSS.

Для выполнения этого задания я воспользовалась командой dotmatcher -help. Таким образом я узнала, что при помощи программы dotmatcher можно построить график, расширения файла, содержащего график, могут быть следущими: ps, hpgl, hp7470, hp7580, meta, cps, x11, tekt, tek, none, data, xterm. В Putty вводим команду dotmatcher recq_ecoli.fasta P50729.fasta dotmatcher.ps -graph. В результате получился следущий график: