Исследование структуры тРНК

Характеристики PBD-файла.
С помощью программы get_pdb с сервера kodomo-count.cmm.msu.ru был получен документ c PDB-кодом 1il2. Он содержит информацию о структуре белок-нуклеинового комплекса. Последний, как понятно из названия, состоит из двух компонентов: нуклеиновая кислота – аспартил-тРНК; белок – аспартил-тРНК-синтетаза (одна из 20 аминоацил-тРНК-синтетаз клетки, осуществляющая реакцию присоединения остатка аспарагиновой кислоты к акцептирующему концу аспартил-тРНК с образованием в результате аминоацил-тРНК, то есть, грубо говоря, "реакцию" AСП + тРНК^асп –> АСП-тРНК^асп).
Каждый из компонентов представлен двумя цепями: белок – A и B, РНК – C и D (это не значит, что тРНК двуспиральна, просто аминоацил-тРНК-синтетазы (АРСазы) функционируют в клетке как димеры, и каждая связывает в активном центре по молекуле тРНК). В принципе, димер АРСазы может связывать в своих активных центрах разные изоакцепторные аспартил-тРНК, (тРНК разного типа, связывающие одну и ту же аминокислоту, в данном случае – аспарагиновую кислоту), однако из поля SEQRES pdb-файла узнаем, что последовательности цепей C и D одинаковы, поэтому выбираем случайно для дальнейшего изучения цепь C
Следует отметить такой интересный факт: составляющие комплекса получены из разных организмов (белок – из E.coli, РНК – из Sacchromyces cereviciae). Думается, это можно объяснить следующим образом. Аминоацил-тРНК высокоспецифичны, однако эта специфичность "однобока": безошибочно отличая один антикодон от другого и одну аминокислоту от другой и не допуская неверного связывания, они в то же время нормально работают с подходящими по антикодону тРНК из других организмов (причем в нашем случае таксономическое расстояние велико: кишечная палочка относится к Прокариотам, дрожжи - к Эукариотам). Исходя из этого, можно предположить, что исследователи взяли APCазу палочки, "дали" ей в качестве субстрата соответствующую тРНК дрожжей и, закристаллизовав полученный химерный комплекс, изучили его с помощью рентгеноструктурного анализа. Причины создания смешанного комплекса неясны (возможно, молекулы данного типа именно из этих организмов удобнее в экспериментах, удачнее кристаллизуются, и т.д.)
Приведенные данные, касающиеся состава исследуемого комплекса тРНК-белок, взяты из полей COMPND и SOURSE документа с PDB-кодом 1il2.

Последовательность аспартил-тРНК: минорные нуклеотиды и странности нумерации.

Исследуемая тРНК состоит из 75-ти остатков. Ниже приведена ее нуклеотидная последовательность (окраска дана по результатам третьего задания):

PSU

H2U

PSU

1MG

5MC

5MU

PSU

Как видим, 8 из 75-ти остатков являются тем или иным образом модифицированными. Значит, наша аспартил-тРНК содержит чуть больше десяти процентов минорных нуклеотидов – средняя величина для тРНК (данные "Молекулярной биологии" Коничева А.С.). Среди них следующие "нетипичные" нуклеотиды:

PSU: Псевдоуридин-5'-монофосфат
H2U: 5,6-Дигидроуридин-5'-монофосфат
1MG: 1N-метилгуанозин-5'-монофосфат
5MC: 5-метилцитидин-5'-монофосфат
5MU: 5-метилуридин-5'-монофосфат

Примечание: Далее будем для простоты называть нуклеозиды (дигидроуридин), имея в виду соответствующие нуклеотиды (5,6-дигидроуридин-5'-монофосфат).

Чтобы изучить нумерацию остатков тРНК, получили по одной строке поля ATOM pdb-файла для каждого остатка, использовав такой конвейер:

grep O1P 1il2.pdb | grep -v D | grep -v AMO > 1.txt

то есть направили в файл 1.txt строки документа, содержащие необходимую нам информацию (последние два "grep'а" конвейера использовали для исключения строк, содержащих информацию о атомах цепи D и аспартил-аденозин-5-монофосфата – субстрата реакции аминоацилирования, включающего остаток AMP. Альтернативный способ исключения из раcсмотрения ненужной информации – работа с файлом, полученным командой RasMol "save pdb" и содержащим данные, касающиеся структуры только цепи C (тогда не нужно писать конвейер. можно ограничиться одним grep'ом). В итоге получили такой список. Обратившись к нумерации остатков в нем, отмечаем:

Нумерация начинается с 901 остатка, оканчивается на 976
Номер 947 отсутствует (за 946-ым нуклеотидом сразу же идет 948-ой)
Нет "лишних" номеров (вставок, "insertion codes")

Попробуем привести объяснения перечисленным фактам. Почему нумерация в отдельно взятой молекуле тРНК начинается не с единицы, а со столь большого номера 901? Думается, потому, что нумерация в pdb-файле общая для всех молекул: нуклеотидов, аминокислот, воды... (для однозначности определения атома, остатка при, например, проведении операций в RasMol, то есть с целью предотвращения пересечения нумерации остатков белка и нуклеиновой кислоты), и ни для одного класса соединений нумерация не начинается в единицы. Получилось так, что атомам аспартил-тРНК, цепь С, дали девятисотые номера.

Как было выяснено с помощью обычного текстового поиска, остаток под номером 947 в документе нигде не встречается, то есть это "безвозвратная потеря" нумерации. Для указания вставок нумерации в pdb-документах есть даже отдельная строка, нот она в нашем случае пуста: вставок нет. Объяснить факт существования пропуска и отсутствия вставки достаточно сложно. Чем предыдущий скорее всего, пропуски и вставки – формальный способ сделать более ясной и понятной нумерацию во вторичной структуре. Если существует двуцепочечный участок РНК, и в одной из цепей выпетливание, то нуклеотиды, участвующие в нем нумеруются №a, №b..., и наоборот, номера находящихся напротив выпетливания нуклеотидов "теряются", чтобы не нарушать нумерацию в спиральном участке (то есть, чтобы пронумерованы "обычным образом" были только спаренные основания, видимо, это по каким-то причинам удобно, например, для более понятной записи структуры только двуспиральных участков). Проиллюстрируем сказанное:

Рисунок 1.

Такое объяснение кажется логичным, однако есть одна нестыковка: по рисунку понятно, что если есть пропуск, то должна быть и вставка (они обе связаны с одним выпетливанием), а у нас только пропуск. Поэтому, чтобы проверить наше предположение, необходимо узнать вторичную структуру участка исследуемой тРНК, где "пропал" номер. Для этого обратимся к следующим заданиям.

Анализ структуры с помощью find_pair: поиск двуцепочечных участков.
Чтобы проанализировать вторичную структуру аспартил-тРНК, воспользуемся уже известной нам по прошлому практикуму программой find_pair. Выполнив
```
find_pair -t 1IL2C.PDB pairs.txt
```
получаем в файле pairs.txt информацию о комплементарных парах, образующихся между основаниями аспартил-тРНК и, соответственно, о двуцепочечных участках вторичной структуры последней. Таких участков три, причем один из них состоит всего из одной пары (значит, "с точки зрения" программы find_pair, одно спаривание оснований – это уже спираль, хотя в выдаче программы упоминается, что одна из спиралей является изолированной парой).
Обратимся подробнее к результатам поиска дуплексов. Нуклеотиды, участвующие в их образовании, на последовательности тРНК, показанной в задании 2, отмечены разными цветами (соответственно спирали, в составе которой они находятся):
1. Спираль 1 (длина 14 нуклеотидов) – желтый цвет
2. Спираль 2 (длина 15 нуклеотидов) – светло-оранжевый цвет
3. Спираль 3 (длина 1 нуклеотид) – коричневый цвет
Судя по раскраске последовательности можно понять, что преобладающая часть нуклеотидов аспартил-тРНК образует дуплексы (в их состав входят 60 из 75 остатков).
К сожалению, раскраска в таблице не столь наглядна, как хотелось бы поэтому повторим схему последовательности, окрашенной по спиралям, еще раз;
UCCGUA U A GUU PSU AA H2U G GH2UC H2UCAGAAUGGGCGCPSU UGUC 1MG CGUGCCAGAU 5MC GGGG 5MU PSU C A A U UCCCCGUCGCGGA GCCA
Кроме данных о числе и длине спиральных участков, find_pair выдает информацию о неканонических взаимодействиях. В нашем случае их 12 из 60, причем большинство минорных нуклеотидов находится в двуцепочечных участках, что подтверждает утверждение из практикума по работе с ChemSketch: неканонические нуклеотиды важны при формировании высших уровней организации РНК (вторичной и третичной структур). Интересно, что неканонические взаимодействия (мисмэтчи, от английского mismatch) на схеме в выдаче find_pair изображаются иначе, чем канонические.
Кроме того, отметим тот факт, что псевдоурацил взаимодействует не только с аденином, но и другими основаниями: гуанином и цитозином. Урацил (а здесь на втором листе мы обсуждали сходство "контактных свойств" урацила и его псевдо–аналога) тоже достаточно часто контактирует в нашем случае с гуанином; а вот пар UC мы не видим.
Да и вообше, пара GU в литературе рассматривается зачастую как отдельный тип взаимодействия двух оснований (мисмэтч, напоминающий по энергии уотсон-криковские пары), и даже имеет специальное название: "GU-wobble pair", где wobble – "качание, шатание, неоднозначность" (см. здесь, четвертая страница); ее значение фундаментально для вторичной структуры РНК, кроме того, она играет очень большую роль во многих процессах, связанных с РНК (и не только транспортной): узнавании и специфическом связывании РНК с белками и, что особенно для нас интересно, кодон-антикодоновых взаимодействиях (явление "качания" при подобных взаимодействиях во многом обусловлено GU-контактом, что и дало, по-видимому, ему название). Информации о подобном ключевом взаимодействии между гуанином и псевдоурацилом найти не удалось. Это может говорить о наличии разницы в значимости между двумя этими основаниями, несмотря на сходную специфичность взаимодействия, обусловленную равнозначностью тех частей молекул, которые контактируют в дуплексе с другим основанием. По приведении такого примера становится понятна разница между немодифицированными и минорными основаниями, пусть даже достаточно сходными; думается нет смысла рассматривать дополнительно другие примеры.
Однако, зная еще по школьным учебникам, что вторичная структура РНК напоминает клеверный лист, мы были удивлены, когда прочли результаты работы find_pair. Найдено всего две спирали (третья, "вырожденная", не в счет). Из этого не сложишь знаменитого клеверного листа с тремя-четырьмя петлями и четырьмя-пятью стеблями! Однако ответ приходит быстро, если вспомнить, что в третичной структуре РНК два спирализованных участка, лежащих перпендикулярно друг другу. Значит, find_pair нашла все взаимодействия: участвующие в формировании вторичной и третичной структуры.
Вспомним, что элементы вторичной структуры складываются в основном за счет инвертированных повторов в последовательности, а уже потом эти элементы взаимодействуют между собой (в том числе с помощью водородных связей между удаленными в первичной структуре остатками). Зная это, попробуем "вычленить" из данных find_pair информацию об инвертированных повторах и построить схему вторичной структуры аспартил-тРНК, игнорируя удаленные взаимодействия. Ниже приведена такая схема (в "цифровом" виде, числа "9" убраны, то есть 949 заменено на 49 для меньшей громоздкости):
```
										

                          75  
                          74
                          73
                        1-72   <Акцепторный стебель
	                2-71
                        3-70
                        4-69
                        5-68
                        6-67
                        7-66              6059
   H2U                  8    65 64 63 62 61   58                    
    16 15               9     |  |  |  |  |   |   57 
   17      14 13 12 11 10    49 50 51 53 54  55 56
   18      |  |  |  |  |     48
     19 20 21 22 23 24 25    46    ?Псевдоуридиновая петля
                         \   45
  Дигидроуридиновая       26-44
               петля      27-43
                          28-42
                          29-41  <Антикодоновый стебель
                          30-40
                          31-39
                          32-38
                        33      37
                         34 35 36   <Антикодоновая петля>
```
Как видим, наша тРНК имеет вполне классический облик. Далее, при формировании третичной структуры, акцепторный стебель провзаимодействует различными способами (см. пункт V) с псевдоуридиновым, сформировав первую спираль, антикодоновый с дигидроуридиновым (соответственно, вторую спираль).
Вернемся к нашему предположению о причинах вставки или пропуска в нумерации. К сожалению, они не подтвердились в нашем случае: в участке вблизи от 948 номера (где утерян 947-ой), нет никакого выпетливания.

Визуализация вторичной и третичной структур аспартил-тРНК с помощью RasMol

Для создания изображения был использован файл 1il2C.pdb, полученный при выполнении предыдущих заданий с помощью команды RasMol save pdb. Файл содержит структуру только изучаемой цепи C аспартил-тРНК. В итоге выполнения в RasMol ПЕРВОЙ ЧАСТИ (до команды pause) такого скрипта (для определения используемых множеств атомов написан также такой скрипт), получаем изображение нашей тРНК в остовной модели, с раскрашиванием по вторичной структуре, то есть по спиралям. Рисунок приведен ниже. Желтым цветом отображены нуклеотиды (точнее, соответствующие им части сахарофосфатного остова), принимающие участие в формировании первой спирали; оранжевым – второй, красным – два нуклеотида третьей. Серым показаны немногочисленные остатки одноцепочечных участков.

Рисунок 2

При визуальном анализе структуры может показаться, что программа find_pair сделала ошибки, и некоторые участки не могут образовать спираль, поскольку располагаются далеко друг от друга (к примеру, остатки, образующие однонуклеотидную третью спираль, кажутся сильно удаленными). Чтобы показать, что подобные предположения неверны, в скрипте дописаны еще три части для визуализации каждой из спиралей в проволочной модели. В итоге последовательно (за счет команды pause между частями скрипта) генерируются три изображения. Последние вынесены на отдельную страничку. По рассмотрении данных рисунков становится понятно, что удаленность в третичной структуре остатков, формирующих спираль, – всего лишь видимость

Третичная структура тРНК. Необычные взаимодействия

В литературе ("Молекулярная биология" Коничева, "Гены и Геномы") упоминается, что укладывание цепи тРНК в определенную третичную структуру (которую грубо можно охарактеризовать как взаимное расположение элементов вторичной структуры – стволов, петель, выпетливаний – в пространстве) опосредуется образованием нескольких типов особых ("третичных") внутримолекулярных взаимодействий. Среди них:

Образование дополнительных, зачастую неканонических, пар оснований между остатками удаленных друг от друга в первичной структуре участков (данный тип взаимодействий мы уже рассмотрели, на самом деле ранее, при анализе find_pair и построении изображений тРНК в RasMol, поэтому здесь его описываем мало).
Образование "триплетов" оснований между остатками одно- и двутяжевых элементов. Пример отдельного такого "триплета" (не относящегося к нашей тРНК, см. здесь, страница 7).
Интеркаляция (внедрение) оснований одного участка цепи между двумя основаниями другого участка, ведущая к внецепочечному стэкингу. Думается, это возможно не только между двумя одноцепочечными участками, но и между одно-и двуцепочечным (внеспиральный стэкинг).
Образование дополнительных водородных связей между 2'-OH-группами остатков рибозы и основаниями, а также другими группами сахарофосфатного остова (полагаем, что это менее специфичное взаимодействие, чем предыдущие).

Попробуем найти с помощью RasMol примеры выделенных взаимодействий в нашей молекуле тРНК. Будем снова работать с файлом, содержащим структуру только изучаемой цепи РНК. Сначала, чтобы найти примеры необычных водородных связей и стэкинга, оставим для рассмотрения только атомы оснований в проволочной модели: restrict rna and not backbone; wireframe 50.

Как и ожидалось, больше третичных взаимодействий удалось рассмотреть в области менее правильной (более изломанной, см. выше, а также рисунки на этой странице) второй спирали. Думается, последняя и демонстрирует несимметричную изломанную структуру по причине большого количества неканонических связей, триплетов и случаев внеспирального стэкинга, то есть, иными словами, взаимодействия с одноцепочечным(и) участком(ами). Действительно, с одной из сторон к исследуемой спирали подходят два таких участка, наиболее интересны в которых самые близкие к дуплексу остатки (по одному на участок): 945-ый гуанин и 946-ой аденин (Рис.3, зеленый цвет)

Рисунок 3. Общий вид третичного взаимодействия со спиралью2.

На рисунке хорошо видно, что остатки, окрашенные зеленым, не просто подходят близко, но даже интеркалируются в структуру спирали. В данном случае ожидаемо увидеть внеспиральный стекинг. Интересно отметить, что и внутриспиральный стекинг в тРНК необычен: спирали в A-форме (РНК), в отличие от структур в форме B (ДНК) обладают свойством двуцепочечного стекинга. Это означает, что плоскости оснований одной цепи дуплекса могут взаимодействовать с плоскостями не только той же, но и второй цепи (что невозможно в форме B). Примеры такого взаимодействия хорошо видны и в спиралях 1 и 2 нашей РНК, и в спирали ДНК-A, построенной нами с помощью fiber на предыдущем занятии. Такая интересная особенность A-формы возникает из-за того, что основания отодвинуты от оси спирали и расположениы иначе, чем в B-форме.

Вернемся однако, к внецепочечному стекингу. На рисунке хорошо видно, что плоскости интеркалирующих оснований расположены прямо под и над плоскостями оснований спирали, и расстояния между ними такие же, как между основаниями спирали по вертикали. Мы знаем, что последние участвуют в стэкинге, значит, при похожих расстояниях, интекалирующие пурины тоже вовлечены в подобное взаимодействие, укрепляя тем самым структуру спирали.

Интересно, что кроме стэкинга, два описанных интеркалирующих нуклеотида участвуют еще и в образовании триплетов оснований. Всего удалось увидеть два триплета друг над другом, каждый из которых образован при участии либо гуанина 945, либо аденина 909. Приведем изображения указанных взаимодействий:

Рисунок 4.Образование триплетов оснований в аспартил т-РНК

Здесь мы, как говорится, "убили двух зайцев": на рисунке видно, во-первых, неканоническое взаимодействие G-U (наиболее прочный из его вариантов, которые мы изобразили здесь на странице четыре), во-вторых, связывание данной пары еще и с третьим нуклеотидом - гуанином 945, не принадлежащим спирали2, ведущее к образованию триплета. Данный нуклеотид показан на рисунке иным цветом. Ниже взаимодействующих с ним остатков спирали2 показаны дополнительно остатки этой структуры. Интересно, что с внеспиральным гуанином взаимодействуют оба основания пары (у атома гуанина два донорных атома водорода, а оба подходящих к нему близко атома – акцепторы).
А вот и нативный вариант того, что мы изображали здесь (страница 7), как пример триплета. Еще более прочное взаимодействие, чем на рисунке справа: основная пара каноническая (хотя пары AU и GU содержат в нашем примере по две водородных связи, первая прочнее по стерическим и другим причинам)

Для получения всех изображений использовался такой скрипт. Но прежде был написан скрипт, определяющий множества атомов трех спиралей.

Анализ формы спирали
Выполняя задания предыдущего практикума, мы узнали два основных способа определения формы спирали нуклеиновой кислоты (имеется в виду A, B.. форма). Первый – визуально-количественный, при помощи средств RasMol (им мы пользовались, определяя форму неизвестной ДНК), второй – с помощью программы analyse (в выдаче которой, кроме всего прочего, содержится информация о форме НК). Хотя раньше мы анализировали ДНК, а сейчас РНК, принципиальной разницы нет, и при определении формы спиралей, входящих в состав вторичной структуры аспартил-тРНК , будем пользоваться теми же методами. Второй способ, безусловно, короче, однако будем использовать его как проверочный после того как проанализируем тРНК с помощью RasMol.
Сперва оставим одну из спиралей (script 1.def; restrict helix1; wireframe), сохраним ее для удобства в отдельном файле (save pdb helix1.pdb) и будем далее работать только с ней.
Повернем спираль в окне RasMol торцом к нам. Становится заметно отверстие, и это напоминает A-форму. Далее выделим атомы фосфора в шариковой модели (select *.P; cpk) и посчитаем число остатков на виток. Полных витков всего, и в общем спираль имеет неправильную форму, наблюдаются изломы, но удается осуществить подсчет. В спирали 1 аспартил-тРНК 11 остатков на виток. Нам уже известно, что в A-форме ДНК как раз одиннадцать нуклеотидов на один виток спирали. Наконец, обратимся к бороздкам. Более узкой(10.79) оказывается глубокая большая бороздка, более широкой (16.02) – малая (измерения осуществлялись по той же схеме как в предыдущем практикуме). Все это снова похоже на форму A. Из сделанных измерений и наблюдений сделаем вывод: двуцепочечные участки РНК похожи на A-форму ДНК.
Подтвердим это с помощью программы analyse. В одном из выходных файлов (HELIX1.out) в таблице, начинающейся со слов "Classification of each dinucleotide step" упоминается форма. И это A-форма. Таким образом, сделанные выше с помощью RasMol выводы верны.
Понятно, что проанализировать третью спираль нельзя (она состоит из одного остатка), со второй тоже возникают сложности, так как она очень изломана и имеет нерегулярную структуру. Но судя по тому, что и в ней с торца удается увидеть небольшое отверстие, можно предположить, образно говоря, что и ей A-форма не чужда.
Программа einverted
Для работы с программой einverted из текста pdb-файла была получена и сохранена в fasta-формате последовательность аспартил-тРНК. C минорными нуклеотидами можно было поступить двояко: заменить их обозначения в последовательности на
1. N – любой нуклеотид
2. обозначение близкого канонического нуклеотида (PSU,H2U → U; 2MC → C и т.п.)
Попробовали сделать и так, и так. При запуске программы einverted нам задавались вопросы. При этом мы поменяли только один из параметров – "Minimum score threshold", его пришлось сделать очень маленьким (5 вместо 50), только в таком случае выдавались какие-то результаты. Значение этого параметра (порог веса)становится понятным при открытии выходных файлов. В них инвертированный повторы представляются как выравнивания, и чем больше совпадений, то есть комплементарных пар, тем больше вес. В нашем случае участки короткие, веса маленькие, поэтому и порог приходится занижать.
В результате для двух рассматриваемых случаев получили разные результаты. Если мы создавали неопределенность, записывая минорные нуклеотиды как N, программа "увидела" два инвертированных участка, если же использовали канонические аналоги – только один. Участки короткие и содержат в обоих случаях только канонические нуклеотиды (никаких остатков N). Значит, наличие или отсутствие неопределенности влияет каким-то образом на поиск инвертированных повторов, однако точно определить данное влияние сложно. Вероятно, наличие позиций, которые может занимать любой нуклеотид, дает больше степеней свободы в поиске, позволяет рассматривать большее разнообразие структур, поэтому выдается больше результатов.
В первом случае в одном из двух участков все основания комплементарны, в другом есть одна некомплементарная пара GT. Если же взять второй случай (где в последовательности неканонические нуклеотиды заменялись на обычные), то выдается только один участок (первый из вышеописанных, с полным спариванием).
Однако в любом случае выдается не более двух коротких участков инвертированных повторов (которые образуют спирали). Программа find_pair нашла больше (и, как мы убедились с помощью RasMol, см. пункт IV, а также при построении схемы вторичной структуры и сравнении ее с канонической, правильно нашла) инвертированных повторов – возможных двуспиральных участков. Каковы причины отличия?
Важно, что find_pair учитывает неканонические взаимодействия (в том числе с минорными нуклеотидами), а einverted – нет. Как мы поняли при выполнении предыдущих заданий, такие взаимодействия очень важны для формирования вторичной структуры, и, если они "не считаются", получается мало комплементарных пар в спиралях, для einverted такие участки имеют малый вес и не демонстрируются в выдаче. Из этого можно сделать выводы: во-первых, этим примером снова доказывается важность неканонических оснований и взаимодействий в формировании структуры тРНК, во-вторых, ясно, что программа einverted способна показать нам только какой-то участок полной спирали, и то не всегда. Результатов поиска инвертированных повторов явно недостаточно для того, чтобы охарактеризовать вторичную структуру РНК, ведь она намного сложнее, чем совокупность таких повторов, образующих дуплексы, и одноцепочечных участков.
Анализ структуры с помощью программы mfold
В отдельную директорию рабочей папки поместили файл с последовательностью тРНК в фаста-формате; минорные нуклеотиды заменили схожими комплементарными. Для работы использовали такую команду:
```
mfold SEQ=tRNA.fasta P=X
```
где X – значение параметра P – число, означающее, на сколько процентов выдаваемое предсказание вторичной структуры может отличаться по своей вычисленной энергии от оптимального. В выдаче mfold очень много файлов (не зря завели отдельную папку!), среди них необходимый(ые) нам файл(ы) с расширением GIF, демонстрирующий(ие) изображение предсказанной структуры. Понятно, что чем больше значение P, тем больше степеней свободы и, соответственно, количество выдаваемых структур.
Было проведено несколько "итераций" mfold, далее полученные изображения рассмотрели на пример схожести с построенной по данным find_pair вторичной структурой аспартил-тРНК (рис). Наиболее удовлетворительной показалась третья по счету структура, полученная при втором обращении к mfold (со значением P, равным 15-ти). Остальные совсем не напоминают нам нашу схему вторичной структуры, будучи иногда ОЧЕНЬ далеки от нее. Все, кроме выбранной, либо не похожи на клеверный лист вовсе, либо не обладают одним из стеблей. А ,как мы узнали при выполнении задания по работе с find_pair, наша тРНК имеет "классическую" вторичную структуру (по данным find_pair).
Интересно, что большинство структур имеют правильно сложенный акцепторный стебель, зачастую сильно отличаясь в остальном.
Может возникнуть вопрос: почему наиболее подходящее изображение получается при значении параметра P, равном 15? Ведь это означает, что построенная вторичная структура отличается по энергии от термодинамически выгодной на 15 процентов – небольшая величина, но, возможно, серьезная. может ли существовать эта структура в природе? Может, во-первых, потому, что ее образование все же термодинамически выгодно: значение δG (свободной энергии образования) отрицательно, хотя и меньше по модулю, чем идеальное. Во-вторых, следует помнить постулат: РНК без белка в клетке не существует. И белки, скорее всего, поддерживают в других условиях не очень устойчивую и выгодную с точки зрения термодинамики структуру (нужно помнить, что при фолдинге – образовании высших структур укладки – белки уже в большом количестве связаны с РНК).
Рисунок 5. Результаты работы с mfold.