На страницу III-ого семестра
Четвертый аминокислотный остаток в BIOB_Ecoli - аргинин (Arg, R, Arginine)
Для поиска в геноме строк, в которых есть информация о аспарагиновых т-РНК, воспользовались комадной grep:
grep -n codon.*arginine ecoli.embl > ans.txt
Было найдено 7 различных, строк. Нашему кодону отвечали только 4 т-РНК. Все четыре последовательности, кодирующие т-РНК с антикодоном ACG, абсолютно одинаковые, поэтому для дальнейшего исследования выберем т-РНК, закодированную в гене argQ. Получим ее последовательность вырезая, соответствующий ген из полного генома E-coli:
seqret -sask ecoli.embl (координаты 2815806..2815882, исх. файл argQ.fasta)
Аминокислотный остаток в 4-ой позиции белка BIOB_ECOLI | R (аргинин) |
Соответствующий кодон в гене bioB | 5'-CGC-3' |
Идеальный антикодон | 5'-GCG-3' |
Сколько можно было бы ожидать разных тРНК для остатка R, если опираться на генетический код? | 6 |
Сколько разных тРНК для остатка X аннотировано в геноме кишечной палочки? | 7 |
Характеристика выбранной для дальнейшего изучения тРНК: | |
имя гена | argQ |
локализация гена в геноме | 2815806..2815882 на комплементарной цепи; локус b2691 |
распознаваемый кодон | CGH (H - любое основание кроме G) |
антикодон | ACG |
Результат поиска всех аргининовых
тРНК у Escherichia coli K-12 |
|
12887:FT /note="codons recognized: AGR; anticodon: UCU arginine 55726:FT /note="codon recognized: AGG; anticodon: CCU arginine 63576:FT /note="codons recognized: CGH; anticodon: ACG arginine 63588:FT /note="codons recognized: CGH; anticodon: ACG arginine 63600:FT /note="codons recognized: CGH; anticodon: ACG arginine 63612:FT /note="codons recognized: CGH; anticodon: ACG arginine 89785:FT /note="codon recognized: CGG; anticodon: CCG arginine |
Команды UNIX, использованные при выполнении данного задания:
fasta34 (затем ввел параметры)
blastall -p blastn -d bs -i argQ.fasta -o blastn.txt
megablast -d bs -i argQ.fasta -D 0 -N 1 -W 11 -t 16 -o dmegablast.txt
megablast -d bs -i argQ.fasta -D 2 -o megablast.txt
Программа | FASTA | BLASTN | MegaBLAST | discontiguous MegaBLAST |
Длина якоря | 6 | 11 | 28 | 12 |
Результаты поиска | Всего находок 4 | Общее число находок 110, куски генома длиной не более 30 пар нуклеотидов | Ничего не найдено!!! | Всего находок 7 |
Число находок с E-value < 0,01 | 1 | 5 | | 2 |
Характеристика лучшей находки: | ||||
E-value | 6,5*10-11 | 9*10-4 | | 5*10-5 |
длина выравнивания | 77 | 27 | | 59 |
вес выравнивания | 233,7 bits | 38,2 bits | | 42,1 bits |
координаты в геноме | 11466..11538 | 3171156..3171130 | | 950922..950977 |
Аннотация лучшей находки по записи EMBL: | ||||
имя гена | trnO-Ile {EMBL:AL009126} | trnB-Asn {EMBL:AL009126} (участок этого гена) | | trnD-Asn {EMBL:AL009126} (участок этого гена) |
это тРНК? | да | да | | да |
это тоже аспарагиновая т-РНК? | нет | нет | | нет |
Наиболее успешно с задачей справилась программа FASTA. Это, очевидно, можно объяснить тем, что короткий якорь для выполнения поставленной задачи пришелся, как нельзя кстати. На вход подавалось достаточно короткая последовательность (всего 77 пар нуклеотидов), поэтому, чтобы "зацепить" какие-то удачные находки, большой якорь не нужен.
Второе место заняла программа discontiguous MegaBLAST. У ее находки и e-value похуже, и длина выравнивания покороче, и вес выравнивания слабоват. Очевидно, не очень удачно подобрал параметры для поиска. Потому как теоретически эта программа должна подходить под поставленную задачу наилучшим образом.
Третее место за программой BLASTN - нашла кучу коротких кусочков, с маленьким весом и e-value. С задачей справилась не очень, на мой взгляд.
Почетное четвертое место заняла программа MegaBLAST, которая ничего не нашла. Этого и следовало ожидать, такой длинный якорь (28 п.н.!!!) не смог нигде "зацепится". Собственно говоря, для таких целей MegaBLAST и не используют.