Учебный сайт Люды Андреевой


Исследование ДНК-белковых взаимодействий в структуре комплекса Engrailed Homeodomain и фрагмента ДНК

Краткое описание структуры в файле 1HDD.pdb

В pdb файле приведены координаты атомов следующих молекул:


Для исследования была выбрана C-цепь белка и A и B-цепи ДНК с последовательностью:
цепь A [1]  TTTTGCCATGTAATTACCTAA. [21]
            ||||||||||||||||||||||
цепь B [42] .AAACGGTACATTAATGGATTA [22],

где в [ ] приведены номера первого и последнего нуклеотидов.

Функции белка, структура которого представлена в файле p02836.pdb

На сайте UniProtKB был получен файл с описанием белка Segmentation polarity homeobox protein engrailed (HMEN_DROME). По данным UniProt, функция белка заключается в определении сегментации тела. Он также отвечает за развитие центральной нервной системы. Является транскрипционным регулятором, подавляющим активированные промоторы. Белок располагается в ядре. Обычно фосфорилирован, и это влияет на функцию. Принадлежит к семейству engrailed homeobox. Содержит один домен для связывания с ДНК-гомеобоксом.

Исследование структуры ДНК

Днк, описанная в приведённом выше документе pdb, представляет собой правозакрученную B-форму.
Исследуем влияние белка на торсионные углы ДНК. Для этого воспользуемся программами find_pair и analyze, предварительно переведя pdb файл в старый формат (remediator). Выполним команду find_pair DNA_old.pdb stdout | analyze и получим файл DNA_old.out. В данном файле содержится информация о торсионных углах в молекулах ДНК. Экспортируем эти данные в Exel (см. файл) и проанализируем. Стоит отметить, что средние значения торсионных углов различаются у А и В цепей в пределах 20 градусов. Я искала такие комплементарные пары, значения торсионных углов которых значительно отличаются от среднего в обеих цепях (если эти искажения связаны с ДНК, то должны обнаруживаться на обеих цепях). Такими парами, на мой взгляд, можно назвать 3T-41A, 9G-34C и 12T-32A. При рассмотрении этих участков в программе RasMol взаимодействия с белком кажутся возможными только для пары A12-T32 (на рисунке синим обозначены нуклеотиды 3T-41A, 9G-34C, интересующий нас -12T-32A - зелёным):

На мой взгляд, взаимодействия с белком не сильно влияют на торсионные углы ДНК, поскольку структура ДНК поддерживается большим количеством водородных связей и стекинг-взаимодействиями. Изменение углов привело бы к ухудшению этих связей и нарушению структуры, что может быть чревато нарушениями функции ДНК.

Исследование природы ДНК-белковых контактов

Создадим скрипт my_dna.def, в котором обозначим следующие множества:

dna1 (*:A.*, *:B.*)
o_phosphate (*.OP? and dna1)
o_ribosa (*.O4' and dna1)
c_ribosa (*.c?' and dna1)
p_dna (*.P? and dna1)
h_donor_dna (dg.n1, dg.n2, da.n6, dc.n4, dt.n3)
h_acceptor_dna (dt.o4, dt.o2, dc.n3, dc.o2, da.n3, da.n1, da.n7, dg.n3, dg.o6, dg.n7)
hydrophob_dna (*.c? and dna1)
polar_protein ((*.O?, *.N?) and *:c.*)
hydrophob_protein ((*.C?, *.S?) and *:C.*)
big_dna_polar (dc.n4,da.n6, da.n7, dg.n6, dg.n7, dt.o4)
small_dna_polar (dc.o2, da.n3, dg.n3, dt.o2)
big_dna_hydrophob (dc.c4, dc.c5, dc.c6, da.c5, da.c6, da.c8, dg.c6, dg.c5, dg.c8, dt.c5, dt.c5m, dt.c4)
small_dna_hydrophob (da.c2, da.c4, dg.c2, dg.c4, dt.c2)

Будем считать, что присутствует полярный контакт, если расстояние между полярными атомами (O, N ) менее 3.5A, и гидрофобный контакт, если расстояние между гидрофобными атомами (P, S, C) менее 4.5A. По результатам работы скрипта составим таблицу:

Контакты атомов белка с Полярные Неполярные Всего
      остатками 2'-дезоксирибозы нет 13 13
      остатками фосфорной кислоты 3 4 7
      остатками азотистых оснований со стороны большой бороздки 0 1 1
      остатками азотистых оснований со стороны малой бороздки 0 1 0

Как видно из таблицы, белковая молекула практически не взаимодействует с азотистыми основаниями ДНК, но присутствуют контакты с сахарофосфатным остовом ДНК, причём гидрофобных взаимодействий больше. Это довольно странно, потому что остов ДНК заряжен отрицательно, и гидрофобные углероды дезоксирибозы "окружены" отрицательным зарядом. Тем не менее, мне не удалось обнаружить больше полярных контактов. Взаимное расположение белка и ДНК можно наблюдать более подробно на следующем рисунке:

На рисунке видно, что одна из альфа-спиралей заходит и взаимодействует с большой бороздкой ДНК, однако при подробном рассмотрении в RasMol выясняется, что большинство аминокислотных остатков этой спирали гидрофобны. Поскольку альфа-спираль заходит в бороздку, у неё появляется возможность взаимодействовать с гидрофобными атомами ДНК.

Получение популярной схемы ДНК-белковых контактов с помощью nucplot

Переведём pdb файл в старый формат: remediator --old 1HDD.pdb > 1HDD_old.pdb
Воспользуемся программой nucplot:
nucplot 1HDD_old.pdb
и получим файл nucplot.ps.
С помощью ассоциированной программы GSview откроем файл и получим популярную схему ДНК-белковых контактов:

На рисунке видно, что ДНК имеет только один контакт с белком. О такой скудности контактов говорят и небольшое количество нуклеотидов с отклонёнными от среднего значениями торсионных углов (см. выше). Значит, либо условия рентгеноструктурного анализа изменили взаимосвязь ДНК и белка, либо на самом деле ДНК-белковые взаимодействия реализуются с помощью гидрофобных контактов.

Возможный распознающий контакт

Рассмотрев предыдущую картинку, исследуем единственный полярный (через водородную связь) контакт между С34 ДНК и белком:

Однако мне сложно назвать распознающим контактом взаимодействие остова белка с остовом ДНК, поэтому я попыталась найти контакты с помощью RasMol. Для этого были выбраны атомы белка, удалённые от ДНК менее, чем на 4.5A. Среди них был обнаружен подходящий (аспарагин 51 цепи С и аденин 13):

Расстояние между амино-группой аспарагина и N7 гуанина составляет 3.44A, а между карбонильной группой аспарагина и амино-группой аспарагина - 3.14A. Такие расстояния характерны для водородных связей, и поскольку наблюдается контакт между азотистым основанием ДНК и боковым радикалом белка, я думаю, можно назвать его распознающим.

Характеристика ДНК-связывающего домена p02836 (UniProt ID)

На сайте Pfam найдём исследуемый белок HMEN_DROME: http://pfam.sanger.ac.uk//protein/p02836.
Определим доменную структуру белка:

Source Domain Start End
PfamA Homeobox 455 511
PfamA Engrail_1_C_sig 512 543
ДНК-связывающим доменов является Homeobox (см. рисунок выше).

Краткое описание домена гомеобокс по данным InterPro

Гомеобокс был впервые обнаружен в некоторых белках сегментации у дрозофилы, однако сейчас установлено, что он сохранился во многих других животных, включая позвоночных. Гены Hox кодируют регуляторы, содержащие гомеодомен, которые реализуют различные генетические программы, ответственные за формирование оси тела от головы к хвосту. Домен связывается с ДНК по типу "спираль со спиралью". Этот мотив определяется двумя альфа-спиралями, близко контактирующими с ДНК. Одна из спиралей связывается с ДНК водородными связями и гидрофобными взаимодействиями, образующимися с остовом ДНК и метильными группами тимина. Другая спираль стабилизирует структуру.


©Andreeva_2008