Структура тРНК





 

  1. PDB код - 1mj1
    В соответствующем коду файле 1mj1.pdb содержится информация о структуре фенилаланиновой тРНК бактерии ESCHERICHIA COLI, а также другие структуры:

    - ELONGATION FACTOR TU
    - RIBOSOMAL PROTEIN (2 штуки)
    - SARCIN-RICIN LOOP OF 23SRRNA
    - HELIX 69 OF 23S RRNA
    - L11 RIBOSOMAL PROTEIN

    Присутствуют следующие молекулы (поле FORMUL):

    Примечание. Подробнее о них ниже в пункте номер 2.
    
    2MG    2(C11 H16 N5 O8 P1)                                          
    H2U    4(C9 H15 N2 O9 P1)                                           
    M2G    2(C12 H18 N5 O8 P1)                                          
    OMC    2(C10 H16 N3 O8 P1)                                          
    OMG    2(C11 H16 N5 O8 P1)                                          
     YG    2(C21 H29 N6 O12 P1)                                         
    PSU    4(C9 H13 N2 O9 P1)                                           
    5MC    4(C10 H16 N3 O8 P1)                                          
    7MG    2(C11 H18 N5 O8 P1)                                          
    5MU    2(C10 H15 N2 O9 P1)                                          
    1MA    2(C11 H18 N5 O7 P1)                                          
    
    Идентификаторы цепей тРНК: C и D. Цепи идентичны, выбираю цепь С.

    Важно: поскольку цепи С и D идентичны, а для цепи D в банке PDB существует спец. pdb файл 1TRA (это все описано в 1mj1.pdb), в котором кроме исследуемой РНК нет других мешающих работе структур, это можно принять на заметку. 1tra.pdb


  2. Последовательность тРНК (поле SEQRES) (с указанием цепи) Участки последовательности, которые вошли в разные спирали выделены цветом.
    
    1 C   76    G   C   G   G   A   U   U   U   A 2MG   C   U   C          
    2 C   76    A   G H2U H2U   G   G   G   A   G   A   G   C M2G          
    3 C   76    C   C   A   G   A OMC   U OMG   A   A  YG   A PSU          
    4 C   76  5MC   U   G   G   A   G 7MG   U   C 5MC   U   G   U          
    5 C   76    G 5MU PSU   C   G 1MA   U   C   C   A   C   A   G          
    6 C   76    A   A   U   U   C   G   C   A   C   C   A                  
          
    Модифицированные основания для цепи С (поле MODRES, HETNAM, HET) названия по-русски. 

    Примечание. Поле MODRES формально существует для обоих цепей РНК: D и C. И если бы они отличались, данные в этом поле тоже были бы специфичны для цепей. То есть это не просто перечисление модифицированных оснований, но еще и данные по количеству, номеру и принадлежности к цепи. Однако для 7MG и 1MA названия не было прописано. К тому же, в поле FORMUL приведена атомарная структура молекл, что говорит о том, что для полного представления о модифицированных основаниях, необходимо рассматривать совокупность полей FORMUL, MODRES, HETNAM и HET

    
    2MG C   10    G  2N-метилгуанозин-5'-монофосфат               
    H2U C   16    U  5,6-дигидроуридин-5'-монофосфат              
    H2U C   17    U  5,6-дигидроуридин-5'-монофосфат              
    M2G C   26    G  N2-диметилгуанозин-5'-монофосфат             
    OMC C   32    C  O2'-метилцитозин-5'-монофосфат               
    OMG C   34    G  O2'-метилгуанозин-5'-монофосфат              
     YG C   37    G  WYBUTOSINE [ вибутозин ]                     
    PSU C   39       псевдоуридин-5'-монофосфат                   
    5MC C   40    C  5-метилцитидин-5'-монофосфат                 
    7MG C   46    G  7N-метил-8-гидрогуанозин-5'-монофосфат       
    5MC C   49    C  5-метилцитидин-5'-монофосфат                 
    5MU C   54    U  5-метилуридин-5'-монофосфат                  
    PSU C   55       псевдоуридин-5'-монофосфат                   
    1MA C   58    A  6-гидро-1-метиладенозин-5'-монофосфат        
    
    Заметка. вместо того, чтобы исследовать 4 разных поля и сопоставлять их данные, порой бывает много проще посмотреть лишь в одно поле Chemical Component на сайте PDB - в нем содержатся все нужные данные.

    Нумерация цепи РНК в PDB-записи

       - номера начального =1
       - и конечного нуклеотидов =76

    Пропусков нет


  3. Программой find_pair была проанализирована структура РНК.

    В файле 1mj1.pdb 2 тРНК и другие структуры, поэтому я использовал другой файл 1tra.pdb, в котором содержится только молекула идентичная молекула РНК, что позволит много быстрее получить наиболее чистый результат.

    Заметка. Доскональное исследование pdb файла может оказаться весьма полезным.

    Была выполнена команда
     find_pair -t 1tra.pdb 1tra_pair.fp  
    Было обнаружено две двойные спирали в пространстве, 
    во вторичной структуре - это 4 участка двойной спирали

    Helix #1 14 пар оснований
    Helix #2 12 пар оснований


  4. Работа в RasMol:

    Изображение Команды
    restrict none
    select all
    backbone 150
    сolor white
    define hel1 1-7, 49-54, 58, 61-72
    select hel1
    color blue
    define hel2 8, 10-14, 22-33, 36, 38-44
    select hel2
    color purple
    set fontsize 10
    set fontstroke 0
    select phosphorus and G1
    Label --------------G1
    color label white
    select phosphorus and A76
    Label ------A76
    color label white

    Cоответственно G1 на 3' и A 75 на 5' концах.
  5. Анализ c помощью RusMol:

    • внеспиральный стекинг-взаимодействие между основаниями:

      Стекинг-взаимодействие можно предположить между

      А73 и G1
      G22 и A9

    •  водородные связи между основаниями, не сводящиеся к Уотсон-Криковскому спариванию комплементарных оснований

      non-Watson-Crick base-pairs (всего 5 штук) :

            G4-----U69
      5MU54-----1MA58
      PSU55-----G18
      PSU39-----A31
           A44-----M2G26

  6. На какую из форм ДНК похожи спирали:
    Обе спирали тРНК являются правыми и двойными, шаг синей спирали составляет 11-12 пар нуклеотидов это похоже на А-форму ДНК. При виде с торца виден характерный бублик с просветом посередине.
    Рассмотрим участок красной спирали C74.P--С63.P
    шаг спирали = 30,16 Å, по этому показателю спираль также похожа на А-форму ДНК.


  7. Программа einverted из пакета EMBOSS:

    На вход подаваласт последовательность без модифицированных оснований, дабы программа могла их узнать. Последовательность:
    
    GCGGAUUUAGCUCAGUUGGGAGAGCGCCAGACUGAAGAUCUGGAGGUCCUGUGUUCGAUCCACAGAAUUCGCACCA
    Было использовано значение параметра Minimum score threshold 10, так как при больших значениях программа ничего не находила.
    
    
    : Score 16: 8/10 ( 80%) matches, 0 gaps
          22 gagcgccaga 31      
             || | |||||
          48 ctggaggtct 39      
    
    : Score 15: 5/5 (100%) matches, 0 gaps
          49 ctgtg 53      
             |||||
          65 gacac 61      

    Вес слишком мал, если учитывать, что минимальный вес по дефолту программы равен 50. Можно предположить, что это произошло из-за того, что программа работает формально с последовательностью букв, а особенности молекулы не принимаются за данные. Тем не менее программа нашла хорошие участки цельной (в первом случае почти цельной) спирали. Пусть они и коротенькие. К тому же сама последовательность невелика, что объясняет полученный (неудовлетворительный с первого взгляда) результат.
  8. Анализ тРНК программой mfold

    Пришлось перевести последовательность в формат UNIX.
    Без задания параметра Р программа не выдала изображения, отражавшего близкую к реальности вторичную структуру РНК. При задании параметра Р=10 был получен максимально близкий к реальности файл



    Параметр Р=10 означает, что структура может отличаться по вычисленной энергии на 10% от оптимального.