Подготовка данных
Для исследования была взята последовательность белка
Malk_ecoli.
Ген моего белка взят из
этого задания.
С помощью Blast был найден ортолог - последовательность, совпадающая с нашей на 60-80% и имеющая похожую аннотацию в UniProt:
>ref|ZP_01970971.1| maltose/maltodextrin ABC transporter, ATP-binding protein [Vibrio
cholerae NCTC 8457]
gb|EAZ73711.1| maltose/maltodextrin ABC transporter, ATP-binding protein [Vibrio
cholerae NCTC 8457]
Length=373
Score = 437 bits (1124), Expect = 3e-123, Method: Compositional matrix adjust.
Identities = 214/326 (65%), Positives = 257/326 (78%), Gaps = 13/326 (3%)
Query 1 LRMIAGLETITSGDLFIGEKRMNDTPPAERGVGMVFQSYALYPHLSVAENMSFGLKLAGA 60
LR IAGLE ITSGDLFIGE+RMND P++RGVGMVFQSYALYPHL++ +NMSFGLKL+ A
Sbjct 46 LRCIAGLEDITSGDLFIGEQRMNDVEPSKRGVGMVFQSYALYPHLNLYDNMSFGLKLSKA 105
Query 61 KKEVINQRVNQVAEVLQLAHLLDRKPKALSGGQRQRVAIGRTLVAEPSVFLLDEPLSNLD 120
K I +RV+ AE+LQL+HLLDR+PKALSGGQRQRVAIGRTLV++P+VFLLDEPLSNLD
Sbjct 106 DKSEIKKRVDHAAEILQLSHLLDRQPKALSGGQRQRVAIGRTLVSQPNVFLLDEPLSNLD 165
Query 121 AALRVQMRIEISRLHKRLGRTMIYVTHDQVEAMTLADKIVVLDAGRVAQVGKPLELYHYP 180
AALRVQMR EI++L ++LG TMIYVTHDQVEAMT+ADKIVVLDAG V+QVGKPLELYHYP
Sbjct 166 AALRVQMRSEITKLQRKLGCTMIYVTHDQVEAMTMADKIVVLDAGFVSQVGKPLELYHYP 225
Query 181 ADRFVAGFIGSPKMNFLPVKVTATAIDQVQVELPMPNRQQVWLPVESRDVQVGANMSLGI 240
+RFVAGFIGSPKMNF+ V + D+VQV+L N W+PV+ V G MSLGI
Sbjct 226 QNRFVAGFIGSPKMNFMSVFIEGVEKDRVQVQL--SNGTTFWIPVDGTTVTRGERMSLGI 283
Query 241 RPEHLLPSDIADVILEGEVQVVEQLGNETQIHIQIPSIRQNLVYRQNDVVLVEEG----- 295
RPEHL+ ++ D +EG+V +VE+LGNETQ+++ + +++YRQ D + VE G
Sbjct 284 RPEHLVEAEHGDAKIEGKVMIVEKLGNETQVYMNLKGSDSDVIYRQPDTLDVETGDTLTI 343
Query 296 ------CHLFREDGTACRRLHKEPGV 315
CHLF DG ACRRLHKE GV
Sbjct 344 GIPAHRCHLFHSDGRACRRLHKEKGV 369
Здесь
нашлась последовательность с АС
UPI0000F34B30 и ее ген.