Программа BLASTP 1 |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Таблица 1. Результаты поиска гипотетических гомологов белка OTC1_ECOLI
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Лучшая находка во всех трех БД соответствовала искомому белку. Во всех трех случаях E-value оказалось одинаковым и равным нулю. Тем не менее вес выравнивания совпал только в SwissProt и nd, в PDB он оказался чуть меньше, так как в файле PDB, соответствующем нашему белку, не быд учтен инициирующий аминокислотный остаток метионин, в отличие от последовательностей в SwissProt и nd. Поэтому выравнивание оказалось короче на единицу. Количество хороших гомологов в разных БД сильно отличается. Самое большое количество результатов - в банке nd, поскольку его объем наибольший: он включает в себя и SwissProt, и PDB, и несколько других БД, поэтому поиск проводился в самых широких масштабах. Меньше всего гомологов обнаружилось в PDB, этот банк содержит информацию о третичных структурах белков, и его объем сравнительно небольшой, т.к. обнаружение третичной структуры - довольно сложный процесс, кроме того, не все белки ее имеют. "Худшие" находки во всех банках также различны, что обусловлено, опять-таки, размерами БД , то есть возможностью сравнения нашего белка с как можно большим числом последовательностей (например, для "худшей" находки в PDB значение E-value на 9 порядков меньше, чем в двух других БД). При подсчете E-value объем банка учитывается. Выберем лучшую находку из "худших". Если считать лучшей находку с минимальным E-value, то, конечно, это будет находка в банке PDB. Для этой находки также максимален вес выравнивания и его длина. А вот процент идентичности больше в SwissProt, но всего лишь на 1%. Тем не менее в выравнивании в PDB наибольший процент гэпов. |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
2 Поиск гипотетических гомологов изучаемого белка с фильтром по таксонам |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
При поиске гомологов исследуемого белка в организме Homo sapiens по БД SwissProt было обнаружено два белка, из них меньшее значение E-value имеет белок, описанный в следующей таблице: |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Таблица 2. Свойства выравнивания белка OTC1_ECOLI с его гипотетическим
|
Идентификатор БД | P00480 |
E-value | 1e-50 |
Вес (в битах) | 197 |
% идентичности | 37% |
% сходства | 55% |
Длина выравнивания | 328 |
Координаты выравнивания (номера первых и последних а.о.) | В заданном белке 7-333, в найденном 40-343 |
% гэпов | 7% |
>seq2 ENFGKLEGITLVYCGDGR
Поиск по фрагменту | Поиск по полной последовательности |
|
АС лучшей находки | P65606 | P65606 |
E-value | 6e-10 | 0 |
Вес (в битах) | 60.9 | 697 |
Найдены ли другие белки с теми же значениями E-value и веса в битах? |
да, найден один белок (см. выше), его AC: Q8RP83 | не найдены |
Query 5 FQGRSFLAEKDFSREEFEYLIDFSAHLKDLKKRGVPHHYLEGKNIALLFEKTSTRTRAAF 64 F + FL DF+ E L+ +A LK KK G L GKNIAL+FEK STRTR +F Sbjct 4 FYHKHFLKLLDFTPAELNSLLQLAAKLKADKKSGKEEAKLTGKNIALIFEKDSTRTRCSF 63 Query 65 TTAAIDLGAHPEYLGANDIQLGKKESTEDTAKVLGRMFDGIEFRGFSQRMVEELAEFSGV 124 AA D GA YLG + Q+G KES +DTA+VLGRM+DGI++RG+ Q +VE LAE++ V Sbjct 64 EVAAYDQGARVTYLGPSGSQIGHKESIKDTARVLGRMYDGIQYRGYGQEIVETLAEYASV 123 Query 125 PVWNGLTDEWHPTQMLADYLTIKENF-GK-LEGITLVYCGDGRNNVANSLLVAGTLMGVN 182 PVWNGLT+E+HPTQ+LAD LT++E+ GK +TLVY GD RNN+ NS+L A L G++ Sbjct 124 PVWNGLTNEFHPTQLLADLLTMQEHLPGKAFNEMTLVYAGDARNNMGNSMLEAAALTGLD 183 Query 183 VHIFSPKELFPAEEIVKLAEEYAKESGAHVLVTDNVDEAVKGADVFYTDVWVSMGE-EDK 241 + + +P+ +P +V A+++G ++ +T++V + V+GAD YTDVWVSMGE ++K Sbjct 184 LRLVAPQACWPEAALVTECRALAQQNGGNITLTEDVAKGVEGADFIYTDVWVSMGEAKEK 243 Query 242 FKERVELLQPYQVNMELIKKANNDNLIFLHCLPAFHDTNTVYGKDVAEKFGVK-EMEVTD 300 + ER+ LL+ YQVN ++++ N + FLHCLPAFHD T GK +AE+FG+ MEVTD Sbjct 244 WAERIALLREYQVNSKMMQLTGNPEVKFLHCLPAFHDDQTTLGKKMAEEFGLHGGMEVTD 303 Query 301 EVFRSKYARHFDQAENRMHTIKAVMAATL 329 EVF S + FDQAENRMHTIKAVM ATL Sbjct 304 EVFESAASIVFDQAENRMHTIKAVMVATL 332
OTCC2_STRA5 1 MTQVFQGRSFLAEKDFSREEFEYLIDFSAHLKDLKKRGVPHHYLEGKNIA 50 ...|..:.||...||:..|...|:..:|.||..||.|.....|.||||| OTC1_ECOLI 1 -MSGFYHKHFLKLLDFTPAELNSLLQLAAKLKADKKSGKEEAKLTGKNIA 49 OTCC2_STRA5 51 LLFEKTSTRTRAAFTTAAIDLGAHPEYLGANDIQLGKKESTEDTAKVLGR 100 |:|||.|||||.:|..||.|.||...|||.:..|:|.|||.:|||:|||| OTC1_ECOLI 50 LIFEKDSTRTRCSFEVAAYDQGARVTYLGPSGSQIGHKESIKDTARVLGR 99 OTCC2_STRA5 101 MFDGIEFRGFSQRMVEELAEFSGVPVWNGLTDEWHPTQMLADYLTIKENF 150 |:|||::||:.|.:||.|||::.||||||||:|:||||:|||.||::|:. OTC1_ECOLI 100 MYDGIQYRGYGQEIVETLAEYASVPVWNGLTNEFHPTQLLADLLTMQEHL 149 OTCC2_STRA5 151 -GK-LEGITLVYCGDGRNNVANSLLVAGTLMGVNVHIFSPKELFPAEEIV 198 || ...:||||.||.|||:.||:|.|..|.|:::.:.:|:..:|...:| OTC1_ECOLI 150 PGKAFNEMTLVYAGDARNNMGNSMLEAAALTGLDLRLVAPQACWPEAALV 199 OTCC2_STRA5 199 KLAEEYAKESGAHVLVTDNVDEAVKGADVFYTDVWVSMGE-EDKFKERVE 247 ......|:::|.::.:|::|.:.|:|||..|||||||||| ::|:.||:. OTC1_ECOLI 200 TECRALAQQNGGNITLTEDVAKGVEGADFIYTDVWVSMGEAKEKWAERIA 249 OTCC2_STRA5 248 LLQPYQVNMELIKKANNDNLIFLHCLPAFHDTNTVYGKDVAEKFGVK-EM 296 ||:.||||.::::...|..:.||||||||||..|..||.:||:||:. .| OTC1_ECOLI 250 LLREYQVNSKMMQLTGNPEVKFLHCLPAFHDDQTTLGKKMAEEFGLHGGM 299 OTCC2_STRA5 297 EVTDEVFRSKYARHFDQAENRMHTIKAVMAATLGNLFIPKV 337 |||||||.|..:..|||||||||||||||.|||.. OTC1_ECOLI 300 EVTDEVFESAASIVFDQAENRMHTIKAVMVATLSK------ 334
OTCC2_STRA5 5 FQGRSFLAEKDFSREEFEYLIDFSAHLKDLKKRGVPHHYLEGKNIALLFE 54 |..:.||...||:..|...|:..:|.||..||.|.....|.||||||:|| OTC1_ECOLI 4 FYHKHFLKLLDFTPAELNSLLQLAAKLKADKKSGKEEAKLTGKNIALIFE 53 OTCC2_STRA5 55 KTSTRTRAAFTTAAIDLGAHPEYLGANDIQLGKKESTEDTAKVLGRMFDG 104 |.|||||.:|..||.|.||...|||.:..|:|.|||.:|||:|||||:|| OTC1_ECOLI 54 KDSTRTRCSFEVAAYDQGARVTYLGPSGSQIGHKESIKDTARVLGRMYDG 103 OTCC2_STRA5 105 IEFRGFSQRMVEELAEFSGVPVWNGLTDEWHPTQMLADYLTIKENF-GK- 152 |::||:.|.:||.|||::.||||||||:|:||||:|||.||::|:. || OTC1_ECOLI 104 IQYRGYGQEIVETLAEYASVPVWNGLTNEFHPTQLLADLLTMQEHLPGKA 153 OTCC2_STRA5 153 LEGITLVYCGDGRNNVANSLLVAGTLMGVNVHIFSPKELFPAEEIVKLAE 202 ...:||||.||.|||:.||:|.|..|.|:::.:.:|:..:|...:|.... OTC1_ECOLI 154 FNEMTLVYAGDARNNMGNSMLEAAALTGLDLRLVAPQACWPEAALVTECR 203 OTCC2_STRA5 203 EYAKESGAHVLVTDNVDEAVKGADVFYTDVWVSMGE-EDKFKERVELLQP 251 ..|:::|.::.:|::|.:.|:|||..|||||||||| ::|:.||:.||:. OTC1_ECOLI 204 ALAQQNGGNITLTEDVAKGVEGADFIYTDVWVSMGEAKEKWAERIALLRE 253 OTCC2_STRA5 252 YQVNMELIKKANNDNLIFLHCLPAFHDTNTVYGKDVAEKFGVK-EMEVTD 300 ||||.::::...|..:.||||||||||..|..||.:||:||:. .||||| OTC1_ECOLI 254 YQVNSKMMQLTGNPEVKFLHCLPAFHDDQTTLGKKMAEEFGLHGGMEVTD 303 OTCC2_STRA5 301 EVFRSKYARHFDQAENRMHTIKAVMAATL 329 |||.|..:..|||||||||||||||.||| OTC1_ECOLI 304 EVFESAASIVFDQAENRMHTIKAVMVATL 332
Выравнивание, построенное в needle | Выравнивание, построенное в water | Выравнивание, построенное в BLASTP | |
Вес выравнивания | 842 | 846 | 866 |
Длина выравнивания | 341 | 329 | 329 |
Гэпы | 11/341 | 4/329 | 4/329 |