- PDB код - 1mj1
В соответствующем коду файле 1mj1.pdb
содержится информация о структуре
фенилаланиновой тРНК бактерии ESCHERICHIA COLI,
а также другие структуры:
- ELONGATION FACTOR TU
- RIBOSOMAL PROTEIN (2 штуки)
- SARCIN-RICIN LOOP OF 23SRRNA
- HELIX 69 OF 23S RRNA
- L11 RIBOSOMAL PROTEIN
Присутствуют следующие молекулы (поле
FORMUL):
Примечание. Подробнее о них
ниже в пункте номер 2.
2MG 2(C11 H16 N5 O8 P1)
H2U 4(C9 H15 N2 O9 P1)
M2G 2(C12 H18 N5 O8 P1)
OMC 2(C10 H16 N3 O8 P1)
OMG 2(C11 H16 N5 O8 P1)
YG 2(C21 H29 N6 O12 P1)
PSU 4(C9 H13 N2 O9 P1)
5MC 4(C10 H16 N3 O8 P1)
7MG 2(C11 H18 N5 O8 P1)
5MU 2(C10 H15 N2 O9 P1)
1MA 2(C11 H18 N5 O7 P1)
Идентификаторы цепей тРНК: C и D. Цепи
идентичны, выбираю цепь С.
Важно: поскольку цепи С и D идентичны, а
для цепи D в банке PDB существует спец. pdb
файл 1TRA (это
все описано в 1mj1.pdb), в котором кроме
исследуемой РНК нет других мешающих
работе структур, это можно принять на
заметку. 1tra.pdb
- Последовательность тРНК (поле SEQRES) (с
указанием цепи) Участки
последовательности, которые вошли в
разные спирали выделены цветом.
1 C 76 G C G G A U U U A 2MG C U C
2 C 76 A G H2U H2U G G G A G A G C M2G
3 C 76 C C A G A OMC U OMG A A YG A PSU
4 C 76 5MC U G G A G 7MG U C 5MC U G U
5 C 76 G 5MU PSU C G 1MA U C C A C A G
6 C 76 A A U U C G C A C C A
Модифицированные
основания для цепи С (поле MODRES, HETNAM, HET)
названия по-русски.
Примечание. Поле
MODRES формально существует для обоих
цепей РНК: D и C. И если бы они отличались,
данные в этом поле тоже были бы
специфичны для цепей. То есть это не
просто перечисление модифицированных
оснований, но еще и данные по количеству,
номеру и принадлежности к цепи. Однако
для 7MG и 1MA названия не было прописано. К
тому же, в поле FORMUL приведена атомарная
структура молекл, что говорит о том, что
для полного представления о
модифицированных основаниях,
необходимо рассматривать совокупность
полей FORMUL, MODRES, HETNAM и HET
2MG C 10 G 2N-метилгуанозин-5'-монофосфат
H2U C 16 U 5,6-дигидроуридин-5'-монофосфат
H2U C 17 U 5,6-дигидроуридин-5'-монофосфат
M2G C 26 G N2-диметилгуанозин-5'-монофосфат
OMC C 32 C O2'-метилцитозин-5'-монофосфат
OMG C 34 G O2'-метилгуанозин-5'-монофосфат
YG C 37 G WYBUTOSINE [ вибутозин ]
PSU C 39 псевдоуридин-5'-монофосфат
5MC C 40 C 5-метилцитидин-5'-монофосфат
7MG C 46 G 7N-метил-8-гидрогуанозин-5'-монофосфат
5MC C 49 C 5-метилцитидин-5'-монофосфат
5MU C 54 U 5-метилуридин-5'-монофосфат
PSU C 55 псевдоуридин-5'-монофосфат
1MA C 58 A 6-гидро-1-метиладенозин-5'-монофосфат
Заметка.
вместо того, чтобы исследовать 4 разных
поля и сопоставлять их данные, порой
бывает много проще посмотреть лишь в
одно поле Chemical Component на сайте PDB - в нем
содержатся все нужные данные.
Нумерация цепи РНК в PDB-записи
- номера начального =1
- и конечного нуклеотидов =76
Пропусков нет
- Программой find_pair была
проанализирована структура РНК.
В файле 1mj1.pdb 2 тРНК и другие
структуры, поэтому я использовал другой
файл 1tra.pdb, в котором содержится только
молекула идентичная молекула РНК, что
позволит много быстрее получить
наиболее чистый результат.
Заметка. Доскональное исследование pdb
файла может оказаться весьма полезным.
Была выполнена команда
find_pair -t 1tra.pdb 1tra_pair.fp
Было обнаружено две двойные
спирали в пространстве,
во вторичной
структуре - это 4 участка двойной спирали
Helix #1 14 пар оснований
Helix #2 12 пар оснований
- Работа в RasMol:
Изображение |
Команды |
|
restrict none
select all
backbone 150
сolor white
define hel1 1-7, 49-54, 58, 61-72
select hel1
color blue
define hel2 8, 10-14, 22-33, 36, 38-44
select hel2
color purple
set fontsize 10
set fontstroke 0
select phosphorus and G1
Label --------------G1
color label white
select phosphorus and A76
Label ------A76
color label white |
Cоответственно G1 на 3' и A 75 на 5' концах.
- Анализ c помощью RusMol:
- внеспиральный стекинг-взаимодействие
между основаниями:
Стекинг-взаимодействие можно
предположить между
А73 и G1
G22 и A9
-
водородные
связи между основаниями, не
сводящиеся к Уотсон-Криковскому
спариванию комплементарных оснований
non-Watson-Crick base-pairs (всего 5 штук) :
G4-----U69
5MU54-----1MA58
PSU55-----G18
PSU39-----A31
A44-----M2G26
На какую из форм ДНК похожи спирали:
Обе спирали тРНК являются правыми и
двойными, шаг синей спирали составляет
11-12 пар нуклеотидов это похоже на А-форму
ДНК. При виде с торца виден характерный
бублик с просветом посередине.
Рассмотрим участок красной спирали C74.P--С63.P
шаг спирали = 30,16 Å, по этому показателю
спираль также похожа на А-форму ДНК.
- Программа einverted из пакета
EMBOSS:
На вход подаваласт последовательность
без модифицированных оснований, дабы
программа могла их узнать.
Последовательность:
GCGGAUUUAGCUCAGUUGGGAGAGCGCCAGACUGAAGAUCUGGAGGUCCUGUGUUCGAUCCACAGAAUUCGCACCA Было
использовано значение параметра Minimum score
threshold 10, так как при больших значениях
программа ничего не находила.
: Score 16: 8/10 ( 80%) matches, 0 gaps
22 gagcgccaga 31
|| | |||||
48 ctggaggtct 39
: Score 15: 5/5 (100%) matches, 0 gaps
49 ctgtg 53
|||||
65 gacac 61 Вес
слишком мал, если учитывать, что
минимальный вес по дефолту программы
равен 50. Можно предположить, что это
произошло из-за того, что программа
работает формально с
последовательностью букв, а особенности
молекулы не принимаются за данные. Тем
не менее программа нашла хорошие
участки цельной (в первом случае почти
цельной) спирали. Пусть они и
коротенькие. К тому же сама
последовательность невелика, что
объясняет полученный (неудовлетворительный
с первого взгляда) результат.
- Анализ тРНК программой mfold
Пришлось перевести
последовательность в формат UNIX.
Без задания параметра Р программа не
выдала изображения, отражавшего близкую
к реальности вторичную структуру РНК.
При задании параметра Р=10 был получен
максимально близкий к реальности файл
Параметр Р=10 означает, что структура
может отличаться по вычисленной энергии
на 10% от оптимального.
|