Программы пакета BLAST для работы с нуклеотидными последовательностями | |||||||||||||||||||||
:Главная :Семестры :Сайт ФББ | |||||||||||||||||||||
I. Поиск в геноме участков, кодирующих белки, похожие на заданныйБыл произведён поиск белков в геноме организма Xanthomonas campestris,похожих на белок с известной аминокислотной последовательностью - HSLO_ECOLI.Для работы программы tblastn были созданы индексные файлы командой:formatdb -i xc_genome.fasta -p F -n xc и далее запущена сама программа командой blastall -p tblastn -d xc -i p0a6y5.fasta -o output.txt -e 0.001. Результатом программы является файл output.txt. По результатам поиска была заполнена таблица:
II. Аналогичный поиск сразу в нескольких геномахРезультат поиска в файле output2. E-value находки, лучшей по результатам предыдущего упражнения,изменился,причём увеличился до 6e-33,что естесственно,т.к. база поиска изменилась.Общее количество находок с e-value меньше 0.001 - три.III. Поиск гомологов с помощью программы BLASTNВ результате был получен файл с описанием выравниваний - results.txt.На вход программе был подан fasta-файлс нуклеотидной последовательностью,кодирующей белок HSLO_ECOLI. По результатам программы blastn наилучшее выравнивание имеет значение E-value=e-17 c геномом Salmonella typhimurium LT2,которое совпадает с наилучшей находкой в задании2,однако остальные две находки различаются.Соответствующее выравнивание: >AE008860 AE006468 |AE008860| Salmonella typhimurium LT2, section 164 of 220 of the complete genome. Length = 21321 Score = 601 bits (303), Expect = e-171 Identities = 735/879 (83%) Strand = Plus / Plus Query: 1 atgccgcaacatgaccaattacatcgctatctgtttgaaaactttgccgtgcgcggcgaa 60 |||||||||||||||||||||||||| ||||||||||||||||||||||| |||||||| Sbjct: 18426 atgccgcaacatgaccaattacatcgttatctgtttgaaaactttgccgttcgcggcgag 18485 Query: 61 ctggtaaccgtttcggaaaccctgcaacagatccttgagaaccacgattatccgcagccc 120 ||||||||||||||||||||| ||||||||||||| || || || | ||||||||||| Sbjct: 18486 ctggtaaccgtttcggaaaccttgcaacagatcctcgacaatcataactatccgcagccg 18545 Query: 121 gttaaaaacgtgctggcagaactgctggttgcgaccagcctgttaaccgctacgctgaag 180 || |||| ||| ||||| ||||||||||| || || ||||| | ||||| ||||||||| Sbjct: 18546 gtgaaaaccgtactggccgaactgctggtcgccactagcctactgaccgcgacgctgaag 18605 Query: 181 tttgatggtgatatcaccgtacagctgcagggcgacggtccgatgaatctggcggttatt 240 |||| |||||| || || |||||||| ||||||||||| ||| | | |||||||| || Sbjct: 18606 tttgctggtgacattacggtacagctccagggcgacgggccgttaagcctggcggtgatc 18665 Query: 241 aacggtaacaataaccagcagatgcgcggtgtggcgcgcgtgcagggcgaaattccagaa 300 || || || ||| | |||||||||||||| || || ||||| |||||||| || || || Sbjct: 18666 aatggcaataatcagcagcagatgcgcggcgtagctcgcgttcagggcgatatccctgac 18725 Query: 301 aatgccgacctgaaaacgctggtcggcaatggttacgtggtgatcaccattaccccgagc 360 ||||| || || ||||||||||| ||||| || || |||||||||||||||| ||| Sbjct: 18726 aatgcggatctcaaaacgctggttggcaacggctatctggtgatcaccattacgccggaa 18785 Query: 361 gaaggcgaacgctatcagggcgtagttggtctggaaggtgataccctggcggcctgcctg 420 || || ||||||||||||||||| || ||||||||||| ||||| |||||||| |||||| Sbjct: 18786 gagggtgaacgctatcagggcgtggtgggtctggaaggcgatactctggcggcgtgcctg 18845 Query: 421 gaagattactttatgcgttctgaacagctgccgacgcgcctgtttattcgcaccggcgac 480 ||||||||||| |||| || || ||| ||||||||||||||||||| || |||||||| Sbjct: 18846 gaagattacttcctgcgctccgagcagttgccgacgcgcctgtttatccgtaccggcgat 18905 Query: 481 gtagacggcaaaccggctgcaggcggtatgttgttgcaggtaatgcctgcgcaaaatgcc 540 || ||||| |||||||| ||||| || |||||| | ||||| ||||| || || || || Sbjct: 18906 gtcgacggtaaaccggcggcaggtggaatgttgcttcaggtgatgccggcacagaacgcg 18965 Query: 541 cagcaggacgactttgaccacctggcgacgctaaccgaaaccatcaaaaccgaagaactg 600 ||| ||| || || ||||| ||||| | | | || |||||||| |||| |||||| ||| Sbjct: 18966 caggcggaggatttcgaccatctggctatgttgacggaaaccattaaaagcgaagagctg 19025 Query: 601 ctgaccttaccggcaaacgaagtgttgtggcgtttgtatcacgaagaagaggtgacggtt 660 ||||| ||||||||||| || ||| ||||||||||||||||||||||||| || ||| | Sbjct: 19026 ctgacgttaccggcaaatgacgtgctgtggcgtttgtatcacgaagaagaagtcacgctc 19085 Query: 661 tacgatccgcaggatgtggagttcaaatgcacctgctcgcgtgaacgttgcgccgatgcg 720 ||||||||||| |||| || |||||||||||||| || || ||||||||||| | ||| Sbjct: 19086 tacgatccgcaaaatgttgaattcaaatgcacctgttcacgcgaacgttgcgcgggcgcg 19145 Query: 721 ctgaaaacgctgcctgatgaagaagttgatagcatcctggcggaagatggcgaaattgac 780 |||||||| |||| ||||||||||| || ||||| ||||||||||| |||||||| || Sbjct: 19146 ctgaaaacattgccggatgaagaagtggacagcattctggcggaagaaggcgaaatcgat 19205 Query: 781 atgcattgtgattactgcggtaaccactatctgttcaatgcgatggatattgctgaaatc 840 ||||| || ||||||||||| || || || |||||||||||||||||||| || || ||| Sbjct: 19206 atgcactgcgattactgcggcaatcattacctgttcaatgcgatggatatcgcggagatc 19265 Query: 841 cgcaacaacgcgtctccggcagatccgcaagttcattaa 879 || |||||||| ||||| || ||||| || ||||||||| Sbjct: 19266 cgtaacaacgcctctcctgccgatccacaggttcattaa 19304 Аннотация соответствующего участка генома здесь. В этом участке закодирован белок HSP33,на 92% идентичный HSP33 E.Coli. |
|||||||||||||||||||||
©Кирилин Евгений,2007 |