Пакет BLAST (продолжение) | ||||
:Главная :Семестры :Сайт ФББ | ||||
I. Работа с программой getorf пакета EMBOSSТребовалось найти при помощи программы getorf всевозможные открытые рамки считывания, удовлетворяющие следующим условиям: -длина не менее 30 нуклеотидов -открытой рамкой считывания считался отрезок последовательности ДНК не содержащий стоп-кодонов(значение параметра find - 1) -при использовании бактериального кода. В результате получили команду: getorf -find 1 -minsize 30 -table 11 -sequence d89965.entret В результате получили файл Используя выравнивание получили,что 5 рамка соответствует CDS, а 13 - записи Swiss-Prot(UniProtKB/Swiss-Prot:P0A7B8). II.Поиск некодирующих последовательностей программой BLASTN.1. Запускаем BlastN по банку из 3 геномов(Salmonella typhimurium LT2, Pasteurella multocida, Xanthomonas campestris),(без и с указанием порога E-value):blastall -p blastn -d all -i trna_ecoli.fasta -o trna -m 9 blastall -p blastn -d all -i trna_ecoli.fasta -o trna -m 9 -e 0.001 Результат trna.xls III.Поиск некодирующих последовательностей программой megablast.1.Поиск гомологичных тРНК при помощи программы megablast.megablast -d all -i trna_ecoli.fasta -o trnamega -m 9 2.Поиск гомолочичных тРНК при помощи программы discontigous megablast megablast -d all -i trna_ecoli.fasta -o trnadisc -m 9 -D 2 -t 18 -W 11 -N 1 Для параметров: -D 2 (задает тип выдачи, в данном случае "2" - стандартная выдача blast) -t 18 (Длина слов из последовательностей тРНК, которые будут искаться в геноме бактерий) -W 11 (Длина слов из генома бактерий, по которым ведется поиск) -N 1 V.Анализ результатов.Рассмотрим тРНК thrW.Программа BLASTN нашла гомологичный участок в геноме Xanthomonas campestris, а megablast не отыскала данного участка.Аннотация данного участка в записи EMBL: AC AE012214; DE Xanthomonas campestris pv. campestris str. ATCC 33913, section 122 of 460 DE of the complete genome. OS Xanthomonas campestris pv. campestris str. ATCC 33913 FT tRNA 8259..8334 FT /gene="XCC1158" FT /product="tRNA-Thr" FT /note="Found by tRNAscan" Найденный участок кодирует tRNA-Thr.tRNAscan - скорее всего программа для поиска тРНК. Рассмотрим выравнивание данных гомологичных участков у E.coli и Xanthomonas campestris: # Length: 76 # Identity: 69/76 (90.8%) # Similarity: 69/76 (90.8%) # Gaps: 0/76 ( 0.0%) # Score: 317.0 # # #======================================= AE012214 1 gccggaatagctcagttggtagagcggcgcattcgtaatgcgtaggtcgt 50 ||||..|||||||||||||||||||.||||||||||||||||.||||||| thrW 1 gccgatatagctcagttggtagagcagcgcattcgtaatgcgaaggtcgt 50 AE012214 51 aggttcgattcctatttccggcacca 76 ||||||||.|||||||..|||||||| thrW 51 aggttcgactcctattatcggcacca 76В алгоритмах BLASTN и megablast разница в том, что BLASTN ищет слово длины 11 , а megablast 28 (что делает его более быстрым),в данной последовательности же слова такой длины не имеется.Эта программа создана для быстрого поиска заданной последовательности, а не ее гомологов. Что касается программы discontigous megablast , то она,как следует из таблицы,лучше справляется с поиском гомологов, т.к в слове заданной длины не обязаны совпадать все позиции- чередование совпадений и несовпадений задается определенным правилом в опциях программы. |
||||
©Кирилин Евгений,2007 |