Поиск сходных нуклеотидных последовательностей, не кодирующих белки

Третий семестр На главную
Банк EMBL Пакет BLAST Поиск сходных нуклеотидных последовательностей

На четвертой позиции моего белка находится аминокислота T (Threonine).
С помощью команды "grep -n "codon.*threonine" ecoli.embl>result.txt", были получен файл со всеми треониновыми тРНК у Escherichia coli K-12.
Затем была извлечена последовательность, используя команду seqret ecoli.embl -sask.

 Аминокислотный остаток в 4-ой позиции белка AMPC_ECOLI T
  Соответствующий кодон в гене ampC 5'-ACG-3'
  Идеальный антикодон 5'-CGU-3'
  Сколько можно было бы ожидать разных тРНК для остатка T, если опираться на генетический код? 4
  Сколько разных тРНК для остатка T аннотировано в геноме кишечной палочки? 3
  Характеристика выбранной для дальнейшего изучения тРНК:
      имя гена thrW
      локализация гена в геноме 262095..262170
      распознаваемый кодон ACG
      антикодон CGU

Результат поиска всех треониновых тРНК у Escherichia coli K-12

6073:FT                   /note="codon recognized: ACG; anticodon: CGU threonine
77177:FT                   /note="codons recognized: ACY; anticodon: GGU threonine
93943:FT                   /note="codons recognized: ACD; anticodon: UGU threonine
93979:FT                   /note="codons recognized: ACY; anticodon: GGU threonine

Используемые команды:
  1. для fasta: fasta34
  2. для BLASTN: formatdb -i bs_genome.fasta -p F -n bs и blastall -p blastn -i thrW.fasta -d bs -o resultblastn.txt
  3. для Megablast: megablast -d bs -i thrW.fasta -o resultmega.txt -D 2
  4. для discontiguous MegaBLAST: megablast -d bs -i thrW.fasta -o resultdis.txt -D 2 -W 11 -t 21 -N 1

Результаты поиска гомологичной т-РНК

Программа FASTA BLASTN MegaBLAST discontiguous MegaBLAST
Длина якоря 6 11 28 11
Результаты поиска 25 7 0 1
Число находок с E-value < 0,01 1 4   0
Характеристика лучшей находки:
      E-value 0.0057 9e-04   13
      длина выравнивания 68 18   15
      вес выравнивания 114.9 38   24
      координаты в геноме 11557-11625 143496-143478   137660-137675
Аннотация лучшей находки по записи EMBL:
      имя гена trnO rpsE   rplB
      это тРНК? да нет   нет
      это тоже <аланиновая> тРНК? да      

Программа MegaBLAST сработала хуже всего- не найдено ни одного выравнивания. Чуть лучше дела обстоят с discontiguous MegaBLAST-была найдена 1 находка с очень плохим E-value. Более или менее (по сравнению с другими) сработала программа fasta-было найдено 25 выравниваний,причём лучшее E-value=0.0057. Лучше всех сработала программа BLASTN-было найдено 7 находок, причём E-value лучшей находки равно 9e-04, что тоже не очень хорошо. Вывод: ни одна из программ не работала нормально.
©Виктор Соколов