Программы пакета BLAST для работы с нуклеотидными последовательностями
 :Главная   :Семестры   :Сайт ФББ
Программы пакета BLAST для работы с нуклеотидными последовательностями

I. Поиск в геноме участков, кодирующих белки, похожие на заданный

Был произведён поиск белков в геноме организма Xanthomonas campestris,похожих на белок с известной аминокислотной последовательностью - HSLO_ECOLI.Для работы программы tblastn были созданы индексные файлы командой:

formatdb -i xc_genome.fasta -p F -n xc

и далее запущена сама программа командой

blastall -p tblastn -d xc -i p0a6y5.fasta -o output.txt -e 0.001.

Результатом программы является файл output.txt.
По результатам поиска была заполнена таблица:
Число находок с Е-value<0,001 1
Характеристика лучшей находки:  
   E-value находки 3e-33
AC соответствующей записи EMBL AE012399
Координаты выравнивания(-ий) в записи EMBL 7782-8645
Координаты CDS в записи EMBL 7782-8672
AC UniProt для этого CDS Q8P6V0

II. Аналогичный поиск сразу в нескольких геномах

Результат поиска в файле output2. E-value находки, лучшей по результатам предыдущего упражнения,изменился,причём увеличился до 6e-33,что естесственно,т.к. база поиска изменилась.Общее количество находок с e-value меньше 0.001 - три.

III. Поиск гомологов с помощью программы BLASTN

В результате был получен файл с описанием выравниваний - results.txt.
На вход программе был подан fasta-файлс нуклеотидной последовательностью,кодирующей белок HSLO_ECOLI.

По результатам программы blastn наилучшее выравнивание имеет значение E-value=e-17 c геномом Salmonella typhimurium LT2,которое совпадает с наилучшей находкой в задании2,однако остальные две находки различаются.Соответствующее выравнивание:
>AE008860 AE006468 |AE008860| Salmonella typhimurium LT2, section 164 of
             220 of the complete genome.
          Length = 21321

 Score =  601 bits (303), Expect = e-171
 Identities = 735/879 (83%)
 Strand = Plus / Plus

                                                                         
Query: 1     atgccgcaacatgaccaattacatcgctatctgtttgaaaactttgccgtgcgcggcgaa 60
             |||||||||||||||||||||||||| ||||||||||||||||||||||| |||||||| 
Sbjct: 18426 atgccgcaacatgaccaattacatcgttatctgtttgaaaactttgccgttcgcggcgag 18485

                                                                         
Query: 61    ctggtaaccgtttcggaaaccctgcaacagatccttgagaaccacgattatccgcagccc 120
             ||||||||||||||||||||| ||||||||||||| || || ||  | ||||||||||| 
Sbjct: 18486 ctggtaaccgtttcggaaaccttgcaacagatcctcgacaatcataactatccgcagccg 18545

                                                                         
Query: 121   gttaaaaacgtgctggcagaactgctggttgcgaccagcctgttaaccgctacgctgaag 180
             || |||| ||| ||||| ||||||||||| || || |||||  | ||||| |||||||||
Sbjct: 18546 gtgaaaaccgtactggccgaactgctggtcgccactagcctactgaccgcgacgctgaag 18605

                                                                         
Query: 181   tttgatggtgatatcaccgtacagctgcagggcgacggtccgatgaatctggcggttatt 240
             |||| |||||| || || |||||||| ||||||||||| ||| | |  |||||||| || 
Sbjct: 18606 tttgctggtgacattacggtacagctccagggcgacgggccgttaagcctggcggtgatc 18665

                                                                         
Query: 241   aacggtaacaataaccagcagatgcgcggtgtggcgcgcgtgcagggcgaaattccagaa 300
             || || || ||| | |||||||||||||| || || ||||| |||||||| || || || 
Sbjct: 18666 aatggcaataatcagcagcagatgcgcggcgtagctcgcgttcagggcgatatccctgac 18725

                                                                         
Query: 301   aatgccgacctgaaaacgctggtcggcaatggttacgtggtgatcaccattaccccgagc 360
             ||||| || || ||||||||||| ||||| || ||  |||||||||||||||| |||   
Sbjct: 18726 aatgcggatctcaaaacgctggttggcaacggctatctggtgatcaccattacgccggaa 18785

                                                                         
Query: 361   gaaggcgaacgctatcagggcgtagttggtctggaaggtgataccctggcggcctgcctg 420
             || || ||||||||||||||||| || ||||||||||| ||||| |||||||| ||||||
Sbjct: 18786 gagggtgaacgctatcagggcgtggtgggtctggaaggcgatactctggcggcgtgcctg 18845

                                                                         
Query: 421   gaagattactttatgcgttctgaacagctgccgacgcgcctgtttattcgcaccggcgac 480
             |||||||||||  |||| || || ||| ||||||||||||||||||| || |||||||| 
Sbjct: 18846 gaagattacttcctgcgctccgagcagttgccgacgcgcctgtttatccgtaccggcgat 18905

                                                                         
Query: 481   gtagacggcaaaccggctgcaggcggtatgttgttgcaggtaatgcctgcgcaaaatgcc 540
             || ||||| |||||||| ||||| || |||||| | ||||| ||||| || || || || 
Sbjct: 18906 gtcgacggtaaaccggcggcaggtggaatgttgcttcaggtgatgccggcacagaacgcg 18965

                                                                         
Query: 541   cagcaggacgactttgaccacctggcgacgctaaccgaaaccatcaaaaccgaagaactg 600
             |||  ||| || || ||||| ||||| | | | || |||||||| |||| |||||| |||
Sbjct: 18966 caggcggaggatttcgaccatctggctatgttgacggaaaccattaaaagcgaagagctg 19025

                                                                         
Query: 601   ctgaccttaccggcaaacgaagtgttgtggcgtttgtatcacgaagaagaggtgacggtt 660
             ||||| ||||||||||| || ||| ||||||||||||||||||||||||| || ||| | 
Sbjct: 19026 ctgacgttaccggcaaatgacgtgctgtggcgtttgtatcacgaagaagaagtcacgctc 19085

                                                                         
Query: 661   tacgatccgcaggatgtggagttcaaatgcacctgctcgcgtgaacgttgcgccgatgcg 720
             |||||||||||  |||| || |||||||||||||| || || ||||||||||| |  |||
Sbjct: 19086 tacgatccgcaaaatgttgaattcaaatgcacctgttcacgcgaacgttgcgcgggcgcg 19145

                                                                         
Query: 721   ctgaaaacgctgcctgatgaagaagttgatagcatcctggcggaagatggcgaaattgac 780
             ||||||||  |||| ||||||||||| || ||||| ||||||||||| |||||||| || 
Sbjct: 19146 ctgaaaacattgccggatgaagaagtggacagcattctggcggaagaaggcgaaatcgat 19205

                                                                         
Query: 781   atgcattgtgattactgcggtaaccactatctgttcaatgcgatggatattgctgaaatc 840
             ||||| || ||||||||||| || || || |||||||||||||||||||| || || |||
Sbjct: 19206 atgcactgcgattactgcggcaatcattacctgttcaatgcgatggatatcgcggagatc 19265

                                                    
Query: 841   cgcaacaacgcgtctccggcagatccgcaagttcattaa 879
             || |||||||| ||||| || ||||| || |||||||||
Sbjct: 19266 cgtaacaacgcctctcctgccgatccacaggttcattaa 19304

Аннотация соответствующего участка генома здесь.
В этом участке закодирован белок HSP33,на 92% идентичный HSP33 E.Coli.
©Кирилин Евгений,2007