Исследование белок-нуклеиновых контактов.

Заданный мне PDB файл: DNA_photolyase (DNA photolyase) 1TEZ. Поиск проводился на сайте PDB. В результате найден файл 1TEZ.pdb.
Результат поиска на сайте PDB
Для изучения были выбраны цепи L,K,B, где L и K - цепи ДНК. Цепи L,K и B образуют следующий комплекс:
Комплекс, образованный цепями L,K,B


































































На картинке в проволочной модели изображён выбранный комнлекс. Более толстым (wireframe 40) выделена двухцепочечная ДНК.

Задание выполнялось в программе RasMol. Для этого прежде всего было определено, как в тексте полученных структур названы нужные атомы. Выяснилось, что:
основания в цепях ДНК называютя dc,dg,da,dt.
атомы остатка сахара -- C1',C2',C3',C4',O4'.
атомы фосфорной кислоты -- OP1,OP2,P.
атомы азотистых оснований -- C2,N3,C4,N4,C5,C6,N1,O2.(для C)
Далее, согласно заданию, были заданы несколько множеств при помощи команды define.
  1. Множества полярных атомов ДНК:
  1. Множества  неполярных атомов ДНК:
Полярными атомами будем считать все атомы кислорода и азота, а неполярными - все атомы углерода.
Подробное описание этих множеств, то есть команды, при помощи которых они были заданы, можно посмотреть в файле отчёта в формате doc внизу страницы. Также эти команды представленны в скрипте.
  1. Кроме того, в скрипте dna.def, предложенном в задании, описаны ещё три множества:
Первое из предложенных множеств не потребовалось для выполнения задания. Изначальный вариант пришлось исправить в
соответствии с тем, как обозначаются основания в pdb файле:

SEQRES   1 K   11   DA  DT  DC  DG  DG  DC  DT TCP  DC  DG  DC                 
SEQRES   1 L    9   DC  DG  DA  DA  DG  DC  DC  DG  DA                         

Исправленные команды были добавлены к итоговому скрипту (см.выше) для удобства. Кроме того, поскольку изучались не все цепи, описанные в pdb файле, было задано множество dna2, содержащее только цепи K,L и B, и работа велась только с ним.
Далее на основе созданных множеств и при помощи команды select within(<порог расстояния>, <множество>) - что тоже подробно описано в файле отчёта в формате doc - были получены данные о контактах атомов ДНК с атомами белка, которые и были занесены в таблицу.

Контакты разного типа в комплексе: "Complex between DNA and the DNA photolyase from Anacystis nidulans".

Полярные Гидрофобные Всего
Контакты белка с ...
... остатками 2'-дезоксирибозы 3 37 40
... остатками фосфорной кислоты 13 по условию задания в остатках фосфорной кислоты нет атомов, которые мы можем рассматривать как неполярные 13
... остатками азотистых оснований со стороны большой бороздки 1 5 6
... остатками азотистых оснований со стороны малой бороздки 2 3 5
            
Будем счатать, что что общее число взаимодействий для множества атомов складывается из числа их полярных и гидрофобных взаимодействий.
Полярных взаимодействий всего получилось 21( командой select within(3.5,polardna) and protein and *B and (nitrogen,oxygen)), то есть 21-3-13-1-2=2 "лишних" взаимодействия.
Гидрофобных взаимодействий L и K цепей ДНК с B цепью белка получилось36(командой select within(4.5,nonpolardna) and protein and *B and carbon), то есть 56-37-5-3=11"лишних" взаимодействий.
С чем может быть связано присутствие 2 "лишних" полярных и 11 гидрофобных взаимодействий?
Был создан скрипт, иллюстрирующий контакты изучаемого комплекса, описанные в таблице.

Рассмотрим подробнее полярные взаимодействия.
Их всего 21.
Изображение полярных взаимодействий ДНК

Контакты с остатками 2'-дезоксирибозы выделены более крупным, их всего 3. Контактов с остатками фосфорной кислоты всего 13, они выделены фиолетовым цветом и по картинке видно, что в одном атоме (NH1 6540 ARG 350) они пересекаются с контактами дезоксирибозы.
Контакт молекулы белка цепи B с остатками азотистых оснований со стороны большой бороздки всего один, он обозначен жёлтым, со стороны малой бороздки - 2, окрашены в зелёный цвет. Также на картинке подписаны три контакта, не вошедшие ни в одну из вышеперечисленных групп:
OE2 5966 GLU 283
OD1 6529 ASN 349
ND2 6530 ASN 349

Чем они могут быть обусловлены?
Теперь посчитаем ещё раз число контактов: 3+13-1(общий)+1+2+3(не вошедших в группы)=21. Значит, все контакты учтены. Тем не менее интересным кажется то, что с атомом NH1 6540 ARG 350 в ДНК образуется сразу две связи - одна через дезоксирибозу и одна через остаток фосфорной кислоты, то есть в этом месте усиливается прикрепление белка к ДНК. Это должно нести какой-то функциональный смысл.

Рассмотрим подробнее гидрофобные взаимодействия.
Их всего 56.
Изображение гидрофобных взаимодействий
Контакты белка с остатками 2'-дезоксирибозы обозначены розовым цветом, их 37, а с остатками азотистых оснований со стороны большой бороздки - более крупным, их 5. Их общих контактов, соответственно большие розовые, 3:
CG 6953 PRO 402
CH2 5993 TRP 286
CZ2 5991 TRP 286

Контактов молекулы белка цепи B с остатками азотистых оснований  со стороны малой бороздки 3 и они просто подписаны. Откуда видно, что  один из них, а именно CG 6953 PRO 402 является общим как для контактов с остатками азотистых оснований со стороны большой и малой бороздок, так и для контактов с остатками 2'-дезоксирибозы. Что также наводит на мысль о функциональной значимости увеличения прочности связи именно с этой частью белка. Возможно, этот участок белка является связывающим сайтом. Несложно заметить, что количество общих, то есть «усиленных» контактов с белком среди гидрофобных больше, чем среди полярных. С чем же это может быть связано? Помимо того, что таких контактов больше по количеству(для полярных всего 1, а для гидрофобных - 3), они различаются и по качеству(«тройной» контакт).
Также есть несколько контактов, не вошедших ни в одну из групп:
CD 5964 GLU 283
CG 6528 ASN 349
CG 6564 MET 353
CZ3 6887 TRP 392
CE3 6885 TRP 392
CD2 6882 TRP 392
CE2 6884 TRP 392
CG 6880 TRP 392
CB 6879 TRP 392
CD1 6881 TRP 392
CD1 5986 TRP 286
CG 5985 TRP 286
CE2 6034 TYR 290
CE3 5990 TRP 286
CZ3 5992 TRP 286

Посчитаем контакты: 37+5+ 3-3(общие для рибозы и остатков азотистых оснований со стороны большой бороздки)-1(посчитанный трижды)+15(«не учтённых»)=56. Значит, все контакты учтены.

Опять же, как и в случае полярных взаимодействий, есть атом CG 6953 PRO 402, с которым молекула ДНК образует сразу три контакта. Наверняка, это связано с расположением сайта связывания белка. На равне с тем, что ещё два атома белка, расположенных рядом,  образуют по два контакта каждый с цепью ДНК.

Итак, гидрофобных, то есть неспецифических, контактов ДНК с белком более чем в два раза больше, чем специфических (полярных), причём больше всего специфических контактов образует белок с остатками фосфорной кислоты, неспецифических - остатками 2'-дезоксирибозы. Большая и малая бороздки мало учавствуют в образовании как специфических, так и неспецифических контактов, при этом самое большое их количество - это неспецифические контакты с остатками азотистых оснований со стороны большой бороздки.  Далее были рассмотрены контакты ДНК с наиболее интересными атомами белка – с атомами, образующими 2 и более контактами:
NH1 6540 ARG 350 – образует два полярных(специфических) контакта
CG 6953 PRO 402 - образует три гидрофобных контакта
CH2 5993 TRP 286 – образует два гидрофобных контакта
CZ2 5991 TRP 286 – образует два гидрофобных контакта
Имеет смысл рассмотреть как атомы, образующие специфические контакты, так и неспецифические, причём специфическими будем считать контакты, обеспечивающие узнавание сайта в молекуле ДНК.
Взаимодействие ДНК с отдельными остатками белка
На рисунке в проволочной модели представлена структура изучаемой ДНК. Зелёным цветом в проволочной модели представлены аминокислотные остатки, содержащие данные атомы, которые в свою очередь представлены в шариковой модели с раскраской по атомам. Также представлены в шариковой модели с раскраской по атомам атомы изучаемой ДНК, находящиеся на расстоянии  не большем 4.5 Å для атомов CG 6953 PRO 402,CH2 5993 TRP 286,CZ2 5991 TRP 286 и 3.5 Å для NH1 6540 ARG 350. Изучаемые атомы подписаны.
В соответствии с полученной картинкой, можно сделать предположение, что механизм работы белка каким-то образом связан с деформацией (растяжением) ДНК. Причём на картинке видно, что деформация довольно сильная - одну цепь как бы "отвернули" от другой.
Проверить эту догадку можно только выяснив истинную функцию белка.
* Интересно что атом кислорода контактирующий с NH1 6540 ARG 350(на картинке - верхний) распознаётся RasMol как гетероатом:
O3' 15663 Hetero: TCP 8. Выбрав гетероатомы в рассматриваемой структуре (см. рисунок), получаем:
Гетероатомы в рассматриваемой структуре
Гетероатомы представлены на картинке в шариковой модели раскрашенные жёлтым цветом.
Рассмотрим специфические (полярные) контакты данного нуклеозида (TCP 8) с белком  при помощи команды select within.
Контакты гетероатомов с атомами белков  
Гетероатомы как прежде представлены в шариковой модели и раскрашены жёлтым цветом. Также в шариковой модели, но с раскраской по атомам и более крупно изображены атомы контактирующих с данным нуклеозидом аминокислотных остатков белка: ARG 350 и ASN 349. Заметим, что это соседние остатки.
Возникает вопрос: что обозначается RasMol как гетероатомы ( в изучаемой структуре их 18)?

Информация о гетероатомах
HET    TCP  I   8      18  
HET    TCP  K   8      18  
HET     MG   9001       1    
HET     MG   9002       1     
HET    FAD   5485      53 
HET    HDF   5486      26
HET    FAD   6485      53 
HET    HDF   6486      26
HET    FAD   7485      53
HET    HDF   7486      26
HET    FAD   8485      53
HET    HDF   8486      26
HETNAM     TCP 5'-METHYLTHYMIDINE
HETNAM      MG MAGNESIUM ION
HETNAM     FAD FLAVIN-ADENINE DINUCLEOTIDE
HETNAM     HDF 8-HYDROXY-10-(D-RIBO-2,3,4,5-TETRAHYDROXYPENTYL)-5-
HETNAM   2 HDF  DEAZAISOALLOXAZINE
FORMUL   1  TCP    2(C11 H16 N2 O5) 
FORMUL  13   MG    2(MG 2+)
FORMUL  15  FAD    4(C27 H33 N9 O15 P2)
FORMUL  16  HDF    4(C16 H17 N3 O7)
FORMUL  23  HOH   *1614(H2 O)

Причём в изучаемой структуре присутствуют только  TCP 8.
Абсорбция энергии УФ излучения молекулами ДНК приводит к образованию различных типов повреждений. Хотя одно- и двуцепочечные разрывы, а также ДНК-белковые сшивки могут возникать, большая часть индуцированных УФ-излучением повреждений приходится на модификацию азотистых оснований, с образованием циклобутан пиримидиновых димеров (CPD) и пиримидин-пиримидоновых фотопродуктов (6-4PP), как наиболее часто встречающихся типов фотоповреждений.
Пиримидиновые димеры являются ингибиторами и для репликации, и для транскрипции, что замедляет рост и приводит к мутагенезу в процессе репликации ДНК, если такие повреждения остаются неотрепарированными.
Для удаления индуцированных светом повреждений в ДНК у многих организмов применяются ферменты, специфично связывающиеся с CPD (CPD-фотолиаза) или с 6-4PP (6-4PP-фотолиазы) и исправляющие эти повреждения. CPD-фотолиазы обнаружены в бактериях, грибах, растениях, беспозвоночных и во многих позвоночных, 6-4PP-фотолиазы обнаружены, пока, только в Drosophila, тутовом шелкопряде, Xenopus laevis и в гремучих змеях, но не у Escherichia coli или дрожжей. У людей не обнаружено фотолиаз. Фотолиазы содержат FAD как каталитический кофактор и дополнительный хромофор в качестве светособирающей антенны.
Дополнительные хромофоры – это или 5,10-метенилтетрагидрофолат (MTHF), или 8-гидрокси-5-деазорибофлавин (8-HDF), с максимумами поглощений на длинах волн 380 и 440 нм, соответственно. Кристаллические структуры CPD-фотолиаз E.coli и Anacystis nidulans подтверждают, что для связывания с ДНК ферменты поворачивают пиримидиновый димер из дуплекса в углубление, содержащее каталитический кофактор. Затем циклобутановое кольцо расщепляется в ходе переноса, индуцированного светом электрона. CPD-фотолиазы селективно распознают CPD, подобно ДНК-связывающим белкам.
Класс CDP-специфичных фотолиаз из микроорганизмов, определенный как класс I фотолиаз, был первым охарактеризованным представителем семейства фотолиаз. 
Схема
Схематичное изображение фотореактивации в хроматине. Октамеры гитонов голубого цвета, ДНК - черного. Фотолиаза связывается с циклобутан-пиримидиновыми димерами (CPD), поворачивает пиримидиновый димер и регенерирует природные пиримидины в ходе, зависимой от освещения, реакции. Фотолиаза предпочтительно репарирует CPD в линкетной ДНК. Репарация в нуклеосомах замедлена и, предположительно, облегчается динамическими свойствами нуклеосом, перемещающих повреждения ДНК в область линкерной ДНК.
Источник:  www.cellbiol.ru

Таким образом, исходя из функции белка, можно предположить, что выделенные на рисунке атомы распознаются RasMol как гетероатомы потому, что они не свойственны обычной структуре ДНК - это результат повреждения излучением, что подтверждается наличием спецефических контактов и необычной "деформированной" формой спирали. То есть структура была получена в процессе репарации.

Было найдено описание заданного белка в UniProt, результатом поиска является страница.
Описание заданного мне белка:
Информация о белке из UniProt
Также на этой странице в поле Cross-references находятся интересующие нас ссылки на базу Pfam.

Pfam Pfam

На схеме доменной структуры ДНК-связывающий домен обозначен красным, как следует из приведённых подписей, также преведены номера позиций его начала и конца.
На указанной в том же поле странице  находится информация о ДНК-связывающем домене белка PHR_SYNP6, приведено его описание:
Дезоксирибопиримидиновая фотолиаза (DNA photolyase) - ДНК рапарирующий энзим, который связывается с повреждённым УФ участком ДНК, содержащим пиримидиновые димеры и, после абсорбции фотонов с длиной волны от 300 до 500 nm, разрывает циклобутановое кольцо, соединяющее два пиримидина димира. ДНК фотолиаза- это энзим, нуждающийся для своей активности в двух хромосомных кофакторах: восстановленном FADH2 а также в 5,10-метинилтетрагидрофоляте (5,10-MTFH) или в окисленном производном 8-гидрокси-5- дезафлавина (8-HDF) - F420, выполняющих функцию антенны, в то время как FADH2 хромофор, как считается, отвечает за перенос электронов.
На той же странице были получены множественные выравнивания 24 последовательностей в формате MSF и из 804 последовательностей в формате MSF. В соответствии с выравниванием из 24 последовательностей рассматриваемые выше остатки 349-ый аспарагина и 350-й аргинина являются довольно консервативными: аспарагин находится в той же позиции у 12 из 24 последовательностей, аргинин - у 13 и 24.

Выравнивание 24 последовательностей Здесь изображен интересующий нас участок выравнивания 24 последовательностей.
Красным цветом выделена строка, соответствующая изучаемому белку, синим - те остатки в выравнивании, которые полностью совпадают с рассматриваемыми отдельно аспарагином и аргинином, голубым - отличающиеся от данных остатки.

Так что в целом, догадку можно считать подтвердившейся.
Для выполнения этого задания при помощи команды:
get_pdb 1TEZ
был получен файл pdb1tez.ent, содержащий весь комплекс целиком, при этом основания названы в нём стандартно, а не так, как было разбирано в пункте 1.
Далее, при помощи команд RasMol:
select within(10.,*L,*K)
save pdb 1TEZ_R.ENT
был создан файл, содержащий только изучаемые цепи ДНК и атомы белка, которые могли бы контактировать с данной ДНК.
Затем при помощи команды:
nucplot 1TEZ_R.PDB
 было получено изображение в формате Postscript, иллюстрирующее контакты белка с ДНК.
Изображение, выданное программой nucplot
Итак, внимательно проанализировав результаты, выданные программой nucplot, можно прийти к выводу, что количество контактов как гидрофобных, так и полярных , найденных программой, меньше числа контактов, занесённых в таблицу. Возможно, это связано с более "жёсткими" ограничениями, накладываемыми алгоритмом программы. Особенно сильно отличаются количества гидрофобныъх взаимодействий. Из-за того, что поиск вручную кажется мне более надёжным, использование программы nucplot для поиска гидрофобных контактов, кажется мне недостаточно эффективным.
Что касается интересующих меня контактов, действительно на схеме представлены контакты ДНК с 402-м пролином, 286-м триптофаном, также отдельно показан контакт с 283-м остатком глутаминовой кислоты, который также мной рассматривался при пересчёте числа гидрофобных взаимодействий (в списке "неучтённых" он первый), но не показался интересным, поэтому отдельно его контакт не изучался. Странно то, что в схеме не упоминаются 350-й аргинин и 349-ый аспарагин, которые, как я считаю, специфически взаимодействуют с ДНК и обеспечивают узнавание сайта в молекуле.
Заинтересовавшее меня модифицированное основание TCP 8 на схеме почему-то отсутствует, даже цепь K, к которой оно относится, начинается с 7-го основания. Видимо программа nucplot проигнорировала TCP 8 потому, что его атомы описываются в RasMol как гетероатомы.
 
Протокол к занятию.
 



Главная  Первый семестр  Второй семестр  Третий семестр