Исследование структуры тРНК

Краткое описание структуры в файле 2cv1.pdb

2cv1.pdb
В файле приведены координаты атомов следующих макромолекул из организма Thermus theemophilus: две тРНК и две глутамил-тРНК синтетазы, а также лигандов: одной АТФ и аналога L-глутамата. Для исследования была выбрана цепь D, представляющая глутаминовую тРНК со следующей последовательностью:

[501] 5' - GGCCCCAUCGUCUAGCGGUUAGGACGCGGCCCUCUCA
           AGGCCGAAACGGGGGUUCGAUUCCCCCUGGGGUCACCA - 3' [576], 
где 501 и 576 - номера первого и последнего нуклеотида.
В последовательности также имеет триплет CCA на 3'-конце, к которому присоединяется аминокислота и в файле приведены координаты его атомов.

Исследование вторичной структуры

С помощью программы find_pair пакета 3DNA были определены возможные водородные связи между азотистыми основаниями (выходной файл программы analyze). В соответствии с полученными данными:

  • акцепторный стебель состоит из участка 501-507 и комплементарного ему участка 566-572,
  • Т-стебель состоит из участка 549-553 и комплементарного ему участка 561-565,
  • D-стебель состоит из участка 522-525 и комплементарного ему участка 510-513,
  • антикодоновый стебель состоит из участка 526-532 и комплементарного ему участка 538-544.
Кроме того известно, что глутаминовая кислота кодируется кодонами GAA и GAG. В соответствии с этим на антикодоновой петле был найден антикодон CUC.

Скрипт для получения изображения
restrict none
select all
color white
backbone 70
select 501-507, 566-572
color red
select 549-553, 561-565
color green
select 522-525, 510-513
color blue
select 526-532, 538-544
color orange
select 534-536
wireframe 50
cpk 80
color violet
На Рис.1: Акцепторный стебель выделен красным, Т-стебель - зеленым, D-стебель - синим, антикодоновый - оранжевым, предполагаемый антикодон - фиолетовым.

Структуру стеблевых дуплексов поддерживают 19 канонических и 4 неканонические пары оснований. Одна из неканонических пар (урацил + гуанин):

В структуре также имеются вариабельная петля, нуклеотиды с 545 по 548. Но отсутствуют нуклеотиды с тимидином и дигидроуридином.

Исследование третичной структуры

По выходному файлу программы analyze видно, что стекинг-взаимодействие между основаниями конца акцепторного стебля и начала Т-стебля и между антикодоновым и D-стеблем небольшое, но есть. Площади перекрывания равны соответственно 2.30 и 1.61:

В третичной структуре имеются дополнительные водородные связи между основаниями D- и Т-петель. Это каноническое взаимодействие G519 - C556 и неканоническое G518 - U555. Изображение первого из них:

Предсказание вторичной структуры тРНК

Получение вторичной структуры с помощью программы einverted весьма затруднительно. При длительном подборе параметров наилучшим вариантом стал следующий вызов программы:

  • штраф за гэп 12
  • минимальный вес 10
  • вес совпадения 5
  • вес несовпадения -6

Для получения предсказания вторичной структуры тРНК по алгоритму Зукера, была использована программа mfold. Сначала была использована команда со стандартными значениями параметров (P=5):

mfold SEQ='2cv1_nucl.fasta'
Затем я менял параметр P, придавая ему значения 10,15,20. Например:
mfold SEQ='2cv1_nucl.fasta' P=10
Но при увеличении значения параметра P появлялись структуры, всё больше отличающиеся от реальной. При стандартном значении была получена структура, наиболее близкая к реальной:

Реальная и предсказанная вторичная структура тРНК из файла 2cv1.pdb
Участок структуры Позиции в структуре
(по результатам find_pair)
Результаты предсказания
с помощью einverted
Результаты предсказания
по алгоритму Зукера
Акцепторный стебель 5' 501-507 3'
5' 566-572 3'
Всего 7 пар
предсказано 5 пар из 7 реальных предсказано 7 пар из 7 реальных
D-стебель 5' 510-513 3'
5' 522-525 3'
Всего 4 пар
предсказано 0 пар предсказано 4 пары из 4 реальных и лишняя
T-стебель 5' 549-553 3'
5' 561-565 3'
Всего 5 пар
предсказано 0 пар предсказано 5 пар, но со сдвигом на 1 нуклеотид
Антикодоновый стебель 5' 526-532 3'
5' 538-544 3'
Всего 7 пар
предсказано 0 пар предсказано 5 пар из 7 реальных
Общее число канонических пар нуклеотидов 23 5 22

einverted
На мой взгляд, эта программа не годится для предсказания вторичной структуры тРНК, так как либо она вообще не способна дать удовлетворительный результат, либо это возможно, но подбор параметров слишком затруднителен, требует много времени.

mfold
Первый факт, который меня смутил, это расхождения номеров некоторых нуклеотидов в рисунке предсказанной вторичный структуры по алгоритму Зукера и в файле PDB. Как оказалось, в файле PDB после 546 нуклеотида идёт 548 нуклеотид, а номера на рисунке соответствуют позициям нуклеотидов в файле с последовательностью. Неизвестно, с чем бы это могло быть связано. Данные в таблице приведены с учётом этого.

Алгоритм Зукера выдал довольно близкую к реальной структуру, сделав вполне объяснимые ошибки: не указал неканонические взаимодействия на концах антикодонового стебля и выполнил в Т-стебле сдвиг на 1 нуклеотид, который привёл всего к одноу дополнительному неканоническому взаимодействию. Таким образом, эта программа является неплохим средством для предсказания вторичной структуры тРНК.



© Айдарханов Руслан 2008