Учебный сайт
Главная Семестры Проекты Обо мне

Поиск в геноме участков, кодирующих белки, похожие на заданный
Поиск белка P0ABD8 (последовательность которого была получена при помощи программы seqret из базы данных SwissProt: посмотреть последовательность) осуществлялся в геноме бактерии Pasteurella multocida при помощи программы blastall с параметрами:
 blastall -p tblastn -d pm -i bccp_ecoli.fasta -o tblastn_bccp
Опция -p tblastn: поиск осуществляется по известной белковой последовательности среди нуклеотидных последовательностей
Опция -d pm: программой используются индексные файлы, созданные ранее, с базовым именем pm
Опция -i bccp_ecoli.fasta: последовательность белка, подаваемая на вход программе Опция -o tblastn_bccp: результат работы программы, посмотреть
Поиск гомологов белка P0ABD8 в геноме бактерии Pasteurella multocida
Число находок с Е-value<0,001 2
Число всех находок 4
Характеристика лучшей находки:  
E-value находки 6e-33
Название геномной последовательности Pasteurella multocida subsp. multocida str. (Pm70 section 117 of 204 of the complete genome.)
Координаты выравнивания(-ий) в найденной последовательности 5936:6181

Нахождение записи EMBL по последовательности с помощью программы BLASTN
На сайте EBI в банке "EMBL standart prokaryote" был проведен поиск AC записи гена гомолога белка P0ABD8 (найденного в предыдущем задании) в нынешнем релизе EMBL.
В результате:
AC: AE004439
Координаты из аннотации: 1298798-1299043
Отрывок записи EMBL, соответствующий данным координатам:
	FT   CDS             complement(1297617..1299035)
	FT                   /codon_start=1
	FT                   /transl_table=11
	FT                   /gene="aspA"
	FT                   /locus_tag="PM1103"
	FT                   /product="AspA"
	FT                   /db_xref="GOA:Q9CLV0"
	FT                   /db_xref="HSSP:1JSW"
	FT                   /db_xref="InterPro:IPR018951"
	FT                   /db_xref="UniProtKB/TrEMBL:Q9CLV0"
	FT                   /protein_id="AAK03187.1"
	FT                   /translation="MTVTRKEVDLLGEREVPADAYWGIHTLRAVENFNISNAVISDVPD
	FT                   FVRGMVMVKKATALANGELGAIPDKIAKAIVAACDEILTTGKCLDQFPSDIYQGGAGTS
	FT                   VNMNTNEVVANLALELLGHKKGEYQYLDPMDHVNASQSTNDAYPTGFRIAVYNSIMKLV
	FT                   AKVLYLQQGFENKAKEFSHILKMGRTQLQDAVPMTVGQEFKAFSVLLDEEVRNLTRTAE
	FT                   YLLEVNLGATAIGTGLNTPKGYAPLAVKYLSEVTGLPCVLAENLIEATSDCGAYVMVHG
	FT                   ALKRTAVKLSKVCNDLRLLSSGPRAGLNEINLPELQAGSSIMPAKVNPVVPEVVNQVCY
	FT                   KVMGNDTTITFAAEAGQLQLNVMEPVIAQAMFESIDILTNACVNLRDKCIDGITVNKET
	FT                   CENYVFNSIGIVTYLNPFIGHHNGDLVGKICAKTGRGVKEVVLEKGLLTEAELDDILSV
	FT                   ENLMNPTYKAKLNK"
Этот участок является частью CDS (1297617-1299035), он соответствует записи Q9CLV0 SwissProt. Как видно, правая координата выходит за границы CDS на 8 нуклеотидов. Имя кодируемого данной CDS гена - aspA, последовательность лежит на комплементарной цепи.

Поиск гомологов с помощью программы BLASTN
При помощи опции BLASTN программы blastall был осуществлен поиск нуклеотидной последовательности белка P0ABD8 по нуклеотидной последовательности генома бактерии Pasteurella multocida (подобно первому заданию). Полученный на выходе программы файл: посмотреть.
По результатам программы была заполнена таблица:
Число находок с Е-value<0,001 1
Число всех находок 11
Характеристика лучшей находки:  
E-value находки 6e-08
Название геномной последовательности Pasteurella multocida subsp. multocida str. (Pm70 section 117 of 204 of the complete genome.)
Координаты выравнивания(-ий) в найденной последовательности 6312:6394

По сравнению с tblastn, при помощи blastn было найдено гораздо больше последовательностей, однако действительно гомологом из них можно назвать только одну, с низким e-value, которое, тем не менее, выше, чем у e-value лучшей находки из упражнения 1. В этом случае находка из той же последовательности, что и в 1 упражнении, однако координаты выравнивания другие.

Отчет по заданию BLAST(продолжение)
Отчет по выполнению задания

© Яшина 2009