На страницу III-ого семестра

Поиск сходных нуклеотидных последовательной, не кодирующих белки

  1. Определение тРНК, использованной рибосомой при присоединении 4-ого аминокислотного остатка к растущей цепи белка BIOB_ECOLI
  2. Четвертый аминокислотный остаток в BIOB_Ecoli - аргинин (Arg, R, Arginine) Для поиска в геноме строк, в которых есть информация о аспарагиновых т-РНК, воспользовались комадной grep:

    grep -n codon.*arginine ecoli.embl > ans.txt

    Было найдено 7 различных, строк. Нашему кодону отвечали только 4 т-РНК. Все четыре последовательности, кодирующие т-РНК с антикодоном ACG, абсолютно одинаковые, поэтому для дальнейшего исследования выберем т-РНК, закодированную в гене argQ. Получим ее последовательность вырезая, соответствующий ген из полного генома E-coli:

    seqret -sask ecoli.embl (координаты 2815806..2815882, исх. файл argQ.fasta)

     Аминокислотный остаток в 4-ой позиции белка BIOB_ECOLI R (аргинин)
      Соответствующий кодон в гене bioB 5'-CGC-3'
      Идеальный антикодон 5'-GCG-3'
      Сколько можно было бы ожидать разных тРНК для остатка R, если опираться на генетический код? 6
      Сколько разных тРНК для остатка X аннотировано в геноме кишечной палочки? 7
      Характеристика выбранной для дальнейшего изучения тРНК:
          имя гена argQ
          локализация гена в геноме 2815806..2815882 на комплементарной цепи; локус b2691
          распознаваемый кодон CGH (H - любое основание кроме G)
          антикодон ACG

     Результат поиска всех аргининовых тРНК у Escherichia coli K-12

    
    12887:FT                   /note="codons recognized: AGR; anticodon: UCU arginine
    55726:FT                   /note="codon recognized: AGG; anticodon: CCU arginine
    63576:FT                   /note="codons recognized: CGH; anticodon: ACG arginine
    63588:FT                   /note="codons recognized: CGH; anticodon: ACG arginine
    63600:FT                   /note="codons recognized: CGH; anticodon: ACG arginine
    63612:FT                   /note="codons recognized: CGH; anticodon: ACG arginine
    89785:FT                   /note="codon recognized: CGG; anticodon: CCG arginine

  3. Поиск гомологичных тРНК в родственном геноме
  4. Команды UNIX, использованные при выполнении данного задания:

    fasta34 (затем ввел параметры)

    blastall -p blastn -d bs -i argQ.fasta -o blastn.txt

    megablast -d bs -i argQ.fasta -D 0 -N 1 -W 11 -t 16 -o dmegablast.txt

    megablast -d bs -i argQ.fasta -D 2 -o megablast.txt

    Программа FASTA BLASTN MegaBLAST discontiguous MegaBLAST
    Длина якоря 6 11 28 12
    Результаты поиска Всего находок 4 Общее число находок 110, куски генома длиной не более 30 пар нуклеотидов Ничего не найдено!!! Всего находок 7
    Число находок с E-value < 0,01 1 5 2
    Характеристика лучшей находки:
          E-value 6,5*10-11 9*10-4 5*10-5
          длина выравнивания 77 27 59
          вес выравнивания 233,7 bits 38,2 bits 42,1 bits
          координаты в геноме 11466..11538 3171156..3171130 950922..950977
    Аннотация лучшей находки по записи EMBL:
          имя гена trnO-Ile {EMBL:AL009126} trnB-Asn {EMBL:AL009126} (участок этого гена) trnD-Asn {EMBL:AL009126} (участок этого гена)
          это тРНК? да да да
          это тоже аспарагиновая т-РНК? нет нет нет

    Наиболее успешно с задачей справилась программа FASTA. Это, очевидно, можно объяснить тем, что короткий якорь для выполнения поставленной задачи пришелся, как нельзя кстати. На вход подавалось достаточно короткая последовательность (всего 77 пар нуклеотидов), поэтому, чтобы "зацепить" какие-то удачные находки, большой якорь не нужен.
    Второе место заняла программа discontiguous MegaBLAST. У ее находки и e-value похуже, и длина выравнивания покороче, и вес выравнивания слабоват. Очевидно, не очень удачно подобрал параметры для поиска. Потому как теоретически эта программа должна подходить под поставленную задачу наилучшим образом.
    Третее место за программой BLASTN - нашла кучу коротких кусочков, с маленьким весом и e-value. С задачей справилась не очень, на мой взгляд. Почетное четвертое место заняла программа MegaBLAST, которая ничего не нашла. Этого и следовало ожидать, такой длинный якорь (28 п.н.!!!) не смог нигде "зацепится". Собственно говоря, для таких целей MegaBLAST и не используют.


© Sedliarov Vitaliy