Пакет BLAST (продолжение)
 :Главная   :Семестры   :Сайт ФББ
Пакет BLAST (продолжение)

I. Работа с программой getorf пакета EMBOSS


Требовалось найти при помощи программы getorf всевозможные открытые рамки считывания, удовлетворяющие следующим условиям:
-длина не менее 30 нуклеотидов
-открытой рамкой считывания считался отрезок последовательности ДНК не содержащий стоп-кодонов(значение параметра find - 1)
-при использовании бактериального кода.
В результате получили команду:
getorf -find 1 -minsize 30 -table 11 -sequence d89965.entret
В результате получили файл
Используя выравнивание получили,что 5 рамка соответствует CDS, а 13 - записи Swiss-Prot(UniProtKB/Swiss-Prot:P0A7B8).

II.Поиск некодирующих последовательностей программой BLASTN.

1. Запускаем BlastN по банку из 3 геномов(Salmonella typhimurium LT2, Pasteurella multocida, Xanthomonas campestris),(без и с указанием порога E-value):
blastall -p blastn -d all -i trna_ecoli.fasta -o trna -m 9
blastall -p blastn -d all -i trna_ecoli.fasta -o trna -m 9 -e 0.001
Результат trna.xls

III.Поиск некодирующих последовательностей программой megablast.

1.Поиск гомологичных тРНК при помощи программы megablast.
megablast -d all -i trna_ecoli.fasta -o trnamega -m 9
2.Поиск гомолочичных тРНК при помощи программы discontigous megablast
megablast -d all -i trna_ecoli.fasta -o trnadisc -m 9 -D 2 -t 18 -W 11 -N 1
Для параметров:
-D 2 (задает тип выдачи, в данном случае "2" - стандартная выдача blast)
-t 18 (Длина слов из последовательностей тРНК, которые будут искаться в геноме бактерий)
-W 11 (Длина слов из генома бактерий, по которым ведется поиск)
-N 1

V.Анализ результатов.

Рассмотрим тРНК thrW.Программа BLASTN нашла гомологичный участок в геноме Xanthomonas campestris, а megablast не отыскала данного участка.
Аннотация данного участка в записи EMBL:
AC AE012214;
DE Xanthomonas campestris pv. campestris str. ATCC 33913, section 122 of 460
DE of the complete genome.
OS Xanthomonas campestris pv. campestris str. ATCC 33913
FT tRNA 8259..8334
FT /gene="XCC1158"
FT /product="tRNA-Thr"
FT /note="Found by tRNAscan"
Найденный участок кодирует tRNA-Thr.tRNAscan - скорее всего программа для поиска тРНК.
Рассмотрим выравнивание данных гомологичных участков у E.coli и Xanthomonas campestris:
# Length: 76
# Identity:      69/76 (90.8%)
# Similarity:    69/76 (90.8%)
# Gaps:           0/76 ( 0.0%)
# Score: 317.0
# 
#
#=======================================

AE012214           1 gccggaatagctcagttggtagagcggcgcattcgtaatgcgtaggtcgt     50
                     ||||..|||||||||||||||||||.||||||||||||||||.|||||||
thrW               1 gccgatatagctcagttggtagagcagcgcattcgtaatgcgaaggtcgt     50

AE012214          51 aggttcgattcctatttccggcacca     76
                     ||||||||.|||||||..||||||||
thrW              51 aggttcgactcctattatcggcacca     76
В алгоритмах BLASTN и megablast разница в том, что BLASTN ищет слово длины 11 , а megablast 28 (что делает его более быстрым),в данной последовательности же слова такой длины не имеется.Эта программа создана для быстрого поиска заданной последовательности, а не ее гомологов. Что касается программы discontigous megablast , то она,как следует из таблицы,лучше справляется с поиском гомологов, т.к в слове заданной длины не обязаны совпадать все позиции- чередование совпадений и несовпадений задается определенным правилом в опциях программы.
©Кирилин Евгений,2007