Исследование белок-нуклеиновых контактов


  1. Сравнение файлов PDB: выбор "поля деятельности".

    С сайта PDB были загружены (в виде архива rar):

    1. Заданный pdb-файл с идентификатором 1G9Y(файл PDB gz в разделе Download files)
    2. Файл, содержащий информацию о структуре биологической единицы изучаемого ДНК-белкового комплекса ("Biological unit coordinates" в том же разделе).

    Необходимо сравнить полученные структуры и, исходя из этого, заключить, что именно содержится в 1G9Y.pdb – биологическая единица исследуемого комплекса или что-то иное (ее часть, например).

    Какими путями возможно выполнить поставленную задачу сравнения двух структур?

    1) C помощью средств программы RasMol.

    Откроем оба файла. Внешне структуры схожи, явных (крупных, бросающихся в глаза) отличий заметить не удается. Однако комплексы состоят из макромолекул, и поэтому содержат множество атомов: из-за сложности структуры нельзя сравнить точно. Но можно сказать однозначно – размеры комплексов приблизительно одинаковы. Для более четкой и детальной визуализации объектов с целью сравнения можно воспользоваться различными командами RasMol.

    То, что сложно увидеть в структуре целого комплекса, можно попробовать рассмотреть, убрав какие-то компоненты. Для этого используем команду RasMol restrict, оставляя в окне визуализатора каждый раз одну какую-ту часть: белок, ДНК, гетероатомы (в том числе молекулы воды). Кроме того, по выполнении команды restrict RasMol выдает в командной строке количество выделенных атомов; таким образом легко подсчитать и сравнить число атомов в каждом элементе структуры. Возможно использование различных моделей изображения молекул – "проволочной" (wireframe), "шариковой" (spacefill) и др.Результаты сравнения, проведенного с помощью описанных приемов, приведены ниже:

    – молекулы ДНК в обоих случаях двуспиральны

    – с внешней стороны в модели spacefill видно три гетероатома (атома кальция) в ДНК обеих структур

    – одинаковое число атомов в ДНК и того и другого комплекса

    – одинаковое число атомов белка

    – одинаковое число гетероатомов (воды и Ca2+) в обоих случаях

    – одинаковое общее число атомов (3980)

    Кроме того, команды backbone и cartoons позволяют сравнить белковые части комплексов. Выполнив такой скрипт в каждом случае, получаем одинаковые изображения симметричных гомодимеров с идентичной вторичной структурой.

    2) Сравнение текстового формата pdb-файлов

    Следует заметить, что размеры файлов, содержащих информацию о изучаемых структурах, отличаются (файл с биологической единицей на 25 кБ меньше). Такая разница в размере файлов объяснима: больший (1G9Y) включает 4297 строк, второй файл – 3972 строк. Однако ясно, что для нашей задачи это отличие не является важным: дополнительные строки содержат информацию описательного характера (об авторах, источниках, ключевых словах...) и не относятся к строению структуры. Значимых строк (ATOM, SEQRES, HETNAM, HELIX, SHEET...) приблизительно равное количество (3956 и 3959). Лишние три строки – дополнительное описание гетероатомов в документе 1G9Y (см таблицу 1 ниже) – ничего не меняют. Таким образом, число значимых для нас строк обоих документов одинаково, что подтверждает наблюдения, сделанные ранее. Кроме того, поле SEQRES дает информацию об идентичности аминокислотных и нуклеотидных последовательностей в обоих случаях, и о наличии двух цепей белка (то есть димера) и двух – ДНК в каждом файле.

    Таблица 1.

    Часть документа PDB, характеризующая гетероатомы
    1G9YБиоединица
    HET     CA    801       1
    HET     CA    802       1
    HET     CA    803       1
    HETNAM      CA CALCIUM ION
    FORMUL   5   CA    3(CA1 2+)           
    FORMUL   8  HOH   *435(H2 O1)
    HETNAM      CA CALCIUM ION
    FORMUL   5   CA    3(CA1 2+)
    FORMUL   8  HOH   *435(H2 O1)

    Последнее, что необходимо сказать – координаты одних и тех же атомов в разных документах не отличаются совершенно, хотя нумерация атомов разная (чтобы проверить это, были взяты случайные десять строк поля ATOM одного файла, во втором найдены соответствующие им и проведено сравнение).

    Исходя из сделанного сравнения, понятно, что структуры ДНК-белковых комплексов из обоих файлов PDB идентичны, то есть каждая представляет собой биологическую единицу. Между документами PDB имеются только формальные (незначимые для нас) отличия. Поэтому в дальнейшем исследовании оба файла равнозначны.

  2. Исследование контактов между молекулами эндонуклеазы I-Crei и ДНК.

    Было решено исследовать контакты двух основных типов: гидрофильные – водородные связи – и гидрофобные. Первые определялись как взаимодействия между атомами аминокислоты и нуклеотида, подходящими по донорно-акцепторным характеристикам и находящимися на расстоянии не более 3.5Åдруг от друга. Вторые – как взаимодействия определенных атомов углерода, серы и т.п., отстоящих друг от друга меньше, чем на 4.5Å. Так как гидрофобные взаимодействия обычно осуществляются группами атомов (обращенными друг к другу и вместе образующими неполярную полость), наибольшее внимание было уделено именно таким скоплениям. Могут или не могут определенные атомы белка или ДНК образовывать те или иные контакты (быть донором, акцептором, участвовать в неполярном взаимодействии), определялось по таблице в документе AtomTypes, взятом с диска P (мы использовали данный ресурс еще в первом семестре при работе с проектом генно-инженерного эксперимента)

    Для визуализации необходимых атомов – кандидатов на участие в связывании с остатками ДНК, написали два скрипта.Один вместе с данным преподавателями скриптом использовали для определения рабочих множеств атомов, другой(сложный, генерирующий несколько изображений) – для непосредственной визуализации. Работая с изображениями, выдаваемыми при выполнении второго скрипта, пользовались инструментами Pick Distance и Pick label, чтобы измерять расстояния и узнавать названия атомов (для проверки их способности к участию в определенном взаимодействии с помощью AtomTypes).

    Как выяснилось, белок взаимодействует со всеми компонентами спирали ДНК: пентозофосфатным остовом и основаниями. Есть связи с атомами фосфатных групп, дезоксирибозы, оснований большой бороздки. С атомами малой бороздки I-Crei не взаимодействует никак.

    Результаты поиска взаимодействий приведем в нескольких таблицах (указан каждый остаток, так или иначе связанный с ДНК, также приведены примечания, характеризующие взаимодействие). Результаты приведены для каждой цепи (A и B).

    Таблица 1. Полярные взаимодействия с атомами дезоксирибозы

    цепь Aцепь B
    ser32 ? близко расположены (2,8),

    но не подходят по д/а (оба акцепторы)

    lys339 +
    lys142 + asp220 – слишком большое расстояние (3.47)

    не подходит по д/а (оба акцепторы)

    lys139 + lys316 +

    Так как RasMol выделяет атомы в требуемой области механически, вне зависимости от того, есть или нет там связи, необходимо было проверить для каждого атома кислорода или азота, во-первых, подходит ли он достаточно близко к полярному атому основания (3.49 Å, безусловно, меньше, чем 3.5, но вряд ли между столь удаленными атомами будет образовываться устойчивая водородная связь). Во-вторых, соответствуют ли два близких атома друг другу по донорно-акцепторным взаимодействиям (один должен быть донором, другой –акцептором). С одной стороны, конечно, если атомы подошли друг к другу довольно близко, скорее всего, между ними есть связь, хотя бы с помощью водяного мостика, с другой, эти атомы могли быть "притянуты" друг у другу за счет образования близко какого-то еще контакта. Плюсы в таблице означают наличие связи, минусы – ее отсутствие (в примечании рядом объяснено, почему было принято решение об отсутствии связи между данными атомами). Как видим, возможны и спорные случаи: 32-й серин подходит близко к полярному атому дезоксирибозы, но совершенно не соответствует последнему по донорно-акцепторным характеристикам. Можно предполагать здесь наличие водяного мостика.

    Общее замечание: видно, что номер определенного остатка цепи B всегда отличается от номера того же остатка (помним, что I-Crei – гомодимер!) цепи A на 200 позиций. Это очень удобно и наглядно. На самом деле, как узнаем, обратившись к pdb-файлу, нумерация для двух цепей общая.

    Кроме того, в этой и последующих таблицах видно, что цепи воздействуют с ДНК очень симметрично, даже одними и теми же атомами одних и тех же аминокислот; отличия бывают очень редко.

    Таблица 2. Полярные взаимодействия с кислородами фосфатных групп.

    цепь Aцепь B
    lys116+ lys316+
    lys34+ lys234+
    thr143+'' thr343+''
    lys142+'' lys342+''
    gln26? – оба рассматриваемых атома акцепторы gln226? – оба рассматриваемых атома акцепторы
    ser22+' ser222+'
    asn136+ asn336+
    ser138+ ser338+
    asp137+ asp337+
    lys98+' lys298+'
    lys139+ lys339+
    asp20 asp220?? 2 атома подошли на достаточно
    близкие расстояния, но оба акцепторы
    lys48+''' lys248+, взаимодействует двумя атомами,
    один из которых - '''
    gln47+ gln247+
    arg51+''' arg251+'''

    В таблице есть информация об атомах одной цепи, образующих пары по принципу взаимодействия с одним и тем же атомом кислорода фосфатной группы. Они объединены обозначением "плюс с определенным количеством штрихов". Проще говоря, мы видим во второй колонке таблицы плюсик с одним штрихом напротив надписи, означающей 98-ой остаток лизина цепи A. Ищем в этой же колонке еще одно такое обозначение (+'). Находим его рядом с серином 22. Значит, атомы этих двух остатков связываются с одним и тем же атомом кислорода фосфатной группы. Как возможна подобная связь? Можно найти два объяснения. Первое – формирование "мерцающей связи". Известно, что если, скажем, рядом с одним донорным атомом располагаются на подходящем (меньше 3.5 Å) расстоянии два акцепторных (и наоборот), образование связи возможно и с тем, и с другим. Однако атом водорода "имеется в наличии" всего один, в каждый момент времени существует только одна связь. Но в другой момент можно ожидать замыкание второй, потом – снова первой, и т.п. Структура динамична в результате температурных и иных флуктуаций.

    Во-вторых, как известно, в воде каждая молекула образует четыре водородных связи, в том числе две как акцептор. То есть кислород с его двумя неподеленными электронными парами, в принципе, может акцептировать два водорода. Рассмотрение осложняется тем, что структура гораздо воды менее сложна по сравнению со структурой белка или ДНК,и кислород, "закрепленный" в последних, может вести себя иначе, поэтому акцептирование им двух водородов спорно. Однако некоторые атомы оснований точно могут быть донорами двух водородов сразу, то есть образование двух водородных связей с одним атомом возможно (см. таблицу ниже).

    Таблица 3. Полярные взаимодействия с атомами большой бороздки

    цепь A цепь B
    ser32+ ser232+
    asn30+ asn230+
    gln38++ Двумя атомами две связи с атомами аденина gln238++ Двумя атомами две связи с атомами аденина, причем NE2 образует мерцающую связь с атомами соседних аденинов
    gln44+ gln244+
    gln26? расстояние 3.33 но акц-акц< gln226?
    lys28+
    tyr33+,сразу две водородных связи с атомами аденина одним атомом tyr233*+,сразу две водородных связи с атомами аденина одним атомом
    arg68++ Двумя атомами сразу две связи с двумя атомами гуанина, причем возможна мерцающая связь атома NH2 с атомом тимина arg268++ Двумя атомами сразу две связи с двумя атомами гуанина
    arg70++ Двумя атомами, для NH1 мерцающая связь с атомами гуанина и тимина arg270++ Двумя атомами, для NH1 мерцающая связь с атомами гуанина и тимина

    Какме замечания есть по поводу данных, представленных в таблице 3? Здесь впервые появляется обозначение "++". Сразу два плюсика означают два взаимодействия двух атомов аминокислоты с двумя атомами основания. Как видим, такое встречается не так уж редко. Интересно, что некоторые аминокислоты имеют пару близко расположенных атомов радикала, один из которых донор, другой акцептор, и эти атомы при взаимодействии с ДНК находят каждый себе пару (понятно, что атомы основания должны при этом располагаться тоже близко) и связываются с ней полярно. Получается более прочное взаимодействие, чем одиночная водородная связь. К тому же подобное связывание – ключ к специфичности: не в каждом участке молекулы возможно найти подходящую пару из близко расположенных определенным образом донора и акцептора.

    Таблица 4. Неполярные взаимодействия с атомами дезоксирибозы

    цепь Aцепь B
    ile81+ --
    val73+ val273+
    ile24во взаимодействии участвуют сразу три атома ile224 *3во взаимодействии участвуют сразу три атома
    gly21+ gly221+
    ala25 + ala225 +
    gly19 + gly219 +

    Таблица 5. Неполярные взаимодействия с атомами большой бороздки

    цепь Aцепь BA
    ile24во взаимодействии участвуют сразу два атома ile224во взаимодействии участвуют сразу два атома
    pro29 +, проверено экспериментально*/td> pro229+
    val73во взаимодействии участвуют сразу два атома аминокислоты val273во взаимодействии участвуют сразу три атома

    Как видим, некоторые остатки, имеющие жесткие разветвленные гидрофобные радикалы (изолейцин, валин) участвуют во взаимодействии сразу несколькими атомами. Понятно, что это означает совсем иное, чем в случае полярной связи. Ведь при гидрофобном контакте нет прямого взаимодействия между какими-то двумя атомами, как при полярном. Это скорей формирование некоего гидрофобного "мешка", внутри которого нет воды, и чем больше атомов в его "стенках", тем лучше.

    Интересно, что предопределенное множество неполярных атомов белковой молекулы "hydrophobic" включает не только атомы углерода, но и атомы кислорода и азота остова цепи белка. Для обного из остатков каждой цепи (пролины 29 и 229) выделился как раз такой кислородный атом. Сперва его участие в гидрофобном взаимодействии оспаривалось, но потом просто выделили в RasMol его 4.5-ангстремное окружение и посмотрели, есть ли там неполярный мешок. Получили такую картинку:

    Рисунок 1.

    Как видим, действительно, множество атомов пролина (рассматривался только один из двух, со вторым все аналогично), в том числе и спорный кислород вместе с углеродом основания, окружают область, где нет воды, тогда как вокруг вода присутствует (красные шарики).

     

    Было решено в случае водородных связей учитывать не молекулы аминокислот, и даже не атомы, вступающие во взаимодействия, а сами контакты. Достаточно сложно было их подсчитать, поскольку многие из них неоднозначны. Но условились считать по следующим правилам:

    A) правила подсчета водородных связей

    1. Считать каждое взаимодействие одной аминокислоты,
    2. Спорные контакты (например, те, где близко подходят друг к другу два акцептора) не учитывать,
    3. В случае мерцающей связи считать оба возможных взаимодействия

    B) Правила подсчета неполярных взаимодействий

    В данном случае все просто: приводится число аминокислот, поскольку, опосредуется ли взаимодействие одним атомо или тремя, влияет на его прочность, а не на общее количество связей в молекуле. Итоги занесем в таблицу:

    Таблица 6. Число взаимодействий разного типа между белком и ДНК.

      Полярные Гидрофобные Всего Полярные Гидрофобные ВсегоИТОГО для двух цепей
    Контакты указанной цепи белка с ... цепь Aцепь B
    ... остатками 2'-дезоксирибозы 2 6 8 2 6 8 16
    ... остатками фосфорной кислоты 13* 13 14* 14 27
    ... остатками азотистых оснований со стороны большой бороздки 14 3 17 13 3 16 33
    ... остатками азотистых оснований со стороны малой бороздки

  3. Поиск специфических контактов, обеспечивающих узнавание сайта в молекуле ДНК.

    Узнавание – значит специфическое взаимодействие с определенным участком последовательности, отличающимся от других. То есть здесь будет основополагающими контакты с остатками оснований, а связи с остовом - укрепляющими и скорей второстепенными. Кроме того, обычно узнается непрерывный участок последовательности (сайт), поэтому нужно найти аминокислоты, образующие связи с таким участком (естественно, они не обязательно идут в первичной структуре белка одна за другой!). Вспомним, что наш белок - эндонуклеаза, кроме того, это эндонуклеаза класса II (материалы Medline). Такие белки узнают палиндромную последовательность ДНК – двуцепочечный участок нуклеотидной записи, читающийся одинаково с обеыих цепей (с соблюдением полярности!). Исследуемый участок ДНК длиной 24 н.о отдаленно напоминает палиндромную последовательность, однако большого сходства между цепями не наблюдается.

     5' C  G  A  A  A  C  T  G  T  C  T  C  A  C  G  A  C  G  T  T  T  T  G  C 3'
     
     3' G  C  T  T  T  G  A  C  A  G  A  G  T  G  C  T  G  C  A  A  A  A  C  G 5'
    Кроме того, из проведенного ранее исследования контактов белок-ДНК понятно, что остатки эндонуклеазы взаимодействуют с цепями НК не по всей длине, а в определенных участках – вероятных сайтах специфического узнавания. Наша задача – идентифицировать эти участки и рассмотреть аминокислоты, наиболее сильно и специфически связывающиеся с остатками таких сайтов

    Если посмотреть на расположение атомов белковой молекулы, вступающих в полярные и неполярные взаимодействия с атомами большой бороздки ДНК (к малой, как мы поняли раньше, никакие участки эндонуклеазы не подходят достаточно близко), замечаем по две группы тесно расположенных атомов для каждой из цепей белка. Среди атомов данных групп и имеет смысл искать значимые для специфического узнавания, поскольку аминокислоты этих групп связываются с близко расположенными в последовательности ДНК основаниями (образующими в общей сложности четыре незнакомых нам пока сайта) и имеют возможность специфично узнавать какие-то участки.

    Анализ предложенных областей проводился для обеих цепей (как поняли ранее, взаимодействия практически симметричны, однако в отличие от аминокислотных, участвующие в определенных связях нуклеотидные остатки могут варьировать по причине неидеальности изучаемого палиндрома). В результате исследования составлена следующая таблица:

    Таблица. Сайты последовательности ДНК, узнаваемые эндонуклеазой I-Crei

    Участки, узнаваемые цепью AУчастки, узнаваемые цепью B

    5 GAA  3
    3  TTT 5
    

    5 TT 3
    3 AAC 5
    

    5 GT   3
    3 CAGA 5
    

    5 CGAC  3
    3   TG  5
    

    Чтобы более наглядно представить расположение исследуемых сайтов, раскрасим участки последовательности, узнаваемые белковой цепью A, в желтый, а цепью B – в зеленый цвет:

      C G A A A C T G T C T C A C G A C G T T T T G C
      G C T T T G A C A G A G T G C T G C A A A A C G

    Как видно из схемы, сайты узнавания симметричны и достаточно схожи (имеется в виду, на разных цепях ДНК). С некоторой степенью условности их можно назвать палиндромными.

    Теперь проанализируем аминокислоты, связывание которых с атомами большой бороздки играет наиболее важную роль в узнавании. На самом деле сложно выделить одну какую-то молекулу, поскольку узнается целый сайт и такое узнавание осуществляется сразу несколькими атомами разных аминокислот. Однако постараемся выделить остаток, контактирующий с наибольшим числом нуклеотидов какого-либо палиндрома Исследуем все четыре сайта, поскольку неизвестно, как белок связывается: сразу двумя субъединицами, или сперва одной, потом другой. Кроме того, одни и те же аминокислоты разных цепей могут узнавать совершенно разные остатки. Например, ser32 цепи A связывается с акцепторным азотом гуанина, а соответствующий ему ser232 цепи B – донорным азотом цитозина (в данном случае подобная лабильность связана с возможностью атома кислорода серинового радикала играть роль как донора, так и акцептора; в других случаях ). Множественность лишних структур в окне визуализатора ведет к сложности восприятия и ошибкам, поэтому напишем дополнительные скрипты для отображения непосредственно областей анализируемых сайтов. Изображения последних со стороны ДНК смотрите в таблице здесь

    Среди остатков белка, видимых на рисунках, нет аминокислот, вступающих с ДНК одновременно в полярные и неполярные взаимодействия. Таким образом. чтобы выбрать остаток(ки), "ответственные" за специфическое узнавания исследуемого участка ДНК белком, нужно разобраться, какой тип контактов специфичнее. Думается, полярные связи более специфичны, нежели неполярные взаимодействия, поскольку образование водородной связи происходит между двумя определенными атомами с установленными ролями (донор и акцептор), и в иной "ориентации" (донор-донор, акцептор-акцептор) невозможно. В свою очередь, в гидрофобный контакт возможно вхождение множества в принципе любых способных на образование такого типа контактов атомов (чаще углеродных), и выход или дополнительное присоединение одного большого значения не имеют. Сами обозначения – водородная cвязь и неполярное взаимодействие говорят о разнице в специфичности. Поэтому будем искать специфически связывающиеся с молекулой ДНК аминокислотные остатки среди тех, что образуют полярные взаимодействия, а неполярные контакты отодвинем пока на второй план как реализующие дополнительное укрепляющее связывание. Подтверждает это, что с действительно палиндромными сайтами аминокислоты связываются полярно, а атомы НК, "портящие" вид палиндрома часто вступают в гидрофобное взаимодействие с другими остатками. Можно предположить, что на самом деле реально специфичное связывание – полярное, а соседние неполярные взаимодействия только укрепляют его

    Так как в узнавании расщепляемой 24-нуклеотидной последовательности важны все четыре сайта (как видим, среди них можно различить два типа - краевые и срединные), нужные остатки приведем для обоих. Думается, что в специфическом связывании краевых сайтов наибольшую роль играют Tyr33 и Gln38, а срединных - аргинины 268 и 270. Из таблиц задания 2 видно, как много связей могут образовывать эти остатки с атомами оснований исследуемых сайтов. Аргинины, например, прямо узнают три из шести нуклеотидов участка, а косвенно – с учетом комплементарности и того, что они связываются с разными цепями – и все шесть. Ниже приведены изображения, демонстрирующие связывание указанных остатков с атомами участков нуклеотидной последовательности.

    Рисунок 2.


    Зеленым для определенности обозначена одна из цепей (цепь C); коричневые большие шарики – атомы азота аргининов; коричневый малый (на рисунке не подписан) – азот глутамина; белые – атомы кислорода тирозина и глутамина. Весь остаток не показан ни в одном из случаев, это только сделает рисунок громоздким. Красные и синие меньшие шарики – атомы соответственно кислорода и водорода указанных оснований. Водородные связи в виде пунктирной линии.

  4. Краткое описание функций белка I-Crei: работа с Uniprot и Pfam.

    С помощью SRS нашли документ Uniprot (точнее Uniprot/SwissProt), описывающий исследуемый белок. ID данной записи – DNE1_CHLRE, белок взят из хлоропласта организма Chlamydomonas reinhardtii (зеленая одноклеточная водоросль). Из полученного документа (поля DE и CC) узнаем четыре интересных факта:

    1) Белок называется также "23S rRNA intron protein" – "белок интрона 23S рибосомальной РНК"

    Чтобы узнать, почему белок так назван, и каким образом он связан с интроном 23S рPHK, обратимся к статьям, упомянутым в документе Swiss-Prot (поля R*). Оказывается, последовательность исследуемого белка закодирована в интроне гена рибосомальной РНК(!). Очень интересное явление, ведь обычно белки кодируются экзонами генов, а рДНК не является белок-кодирующей областью. Кроме того, еще более замечательный факт: интрон, в котором закодирована последовательность I-Crei относится к так называемым интронам класса I. Известно, что РНК-копии таких участков ДНК представляют собой рибозимы – каталитически активные молекулы РНК, способные к аутосплайсингу.

    2) Функция: данная эндонуклеаза вовлечена в хоминг интронов класса I.

    Судя по материалам Интернет, хоминг интронов класса I – это "явление, наблюдаемое при скрещивании особей двух типов, ген одной из которых не содержит интрон в определенном положении; интроны из ДНК другой особи способны возвращаться в свое положение". Также указывается на то, что этот процесс невозможен без интронной мобильности, которая определяется как "подвижность интрона. Способность интрона к перемещению между молекулами ДНК или РНК" Следует понимать, что подвижность участка нуклеотидной последовательности и его перемещение между двумя молекулами ДНК невозможно при сохранении целостности этих молекул (если это не репликационно-опосредуемый процесс). Чтобы дать интрону возможность "путешествовать", I-Crei вырезает его из ДНК, узнавая палиндромный участок и задействуя свою эндонуклеазную активность. Получается, что данный белок, кодируясь интроном класса I, с ним же и работает в течение жизни, опосредуя выщепление его из ДНК в процессах хоминга.

    3) Узнает и расщепляет 19-24-нуклеотидные палиндромные сайты ДНК.

    Исследуемый нами pdb-файл с белок-нуклеиновым комплексом содержит информацию о последовательности ДНК длиной как раз в 24 нуклеотида. Кроме того, выше было указано, что этот участок симметричен и напоминает неидеальный палиндром. Таким, образом, наши предположения о структуре участка ДНК, сделанные с использованием текстового формата pdb-файла и средств RasMol, подтвердились. Верным оказалось и другое предположение: белок узнает такой длинный участок целиком, комплексно. Это означает не то, что он связывается с каждым остатком (что неверно, как мы уже знаем из предыдущих заданий), а то, что если белку предложить последовательность ДНК, обладающую не всеми специфическими сайтами узнавания (скажем, тремя вместо четырех – "за счет замен нуклеотидов или просто экзонуклеазного отщепления краевого сайта), он "не узнает" ее.

    4) Напоминает эндонуклеазы семейства LAGLIDADG. Чтобы узнать больше о данном семействе, воспользуемся ссылками из того же документа SwissProt (поле DR), которые ведут к соответствующей записи Pfam и множественному выравниванию.

    Однако более удобным показалось получить множественное выравнивание Pfam окружным (но знакомым по второму семестру) путем через SMART. В результате выполнения несложных операций получили файл с выравниванием LAGLIDADG-подобных доменов. Рассмотрим последнее на предмет консервативности выбранных в предыдущем задании остатков, вероятно, опосредующих специфичное связывание эндонуклеазы с ДНК (Аргинины (2)70) и (2)68, тирозин (2)33, глутамин (2)38, отмечены в выравнивании синим). Оказывается, судя по эталонному выравниванию, они неконсервативны! Хотя в случае аргининов примерно треть доменов в выравнивании имеет в соответствующей позиции либо тоже аргинин, либо родственную аминокислоту лизин (окрашено желтым). Однако имеют на том же месте совсем неродственные остатки. Отсюда можно резюмировать, что, возможно, мы ошиблись с выбором самых важных участков, погнавшись за количеством связей.

  5. Построение схемы контактов белка с ДНК с помощью nucplot

    Конечно, существует менее скрупулезный и занимающий меньше времени метод отыскания контактов в ДНК-белковых комплексах (и не только). Ведь сравнительно несложные условия существования контактов (расстояния, донор-акцепторные условия), которые использовались нами при выполнении данного практикума, легко "дать понять машине". Одна из подобных программ – nucplot.

    Запустим программу:

    nucplot 1G9Y[bioed].pdb
    и получим в рабочей директории файл с расширением ps. Он содержит три страницы, на каждой последующей – продолжение изображения с предыдущей. Листать в Ghostscript кажется неудобным, поэтому переведем документ в pdf-формат.

    Перейдем к непосредственному анализу полученного сложного изображения. Оно иллюстрирует обе цепи молекулы ДНК, и в виде выносок контактирующие (непосредственно или через водяные мостики) атомы белка и воды. Это уже первое отличие: в нашей и без того непростой схеме взаимодействий (см. пункт 2) воду мы "опустили", возможно, проигнорировав часть опосредуемых водой водородных взаимодействий, связывающих ДНК и белок. Однако данные взаимодействия непостоянны, малоспецифичны,и менее прочны, чем те, что мы описали. Так что, не рассматривая воду и образуемые ею мостики, мы немногое потеряли. Второй интересный момент: похоже, что на изображении, выданном nucplot, нет гидрофобных контактов. Кроме водородных связей, в легенде указаны еще и некие "Nonbonded contacts". Однако вряд ли это неполярные контакты (указанно расстояние их существования маленькое, 3.35 Å, кроме того, как видно по рисунку, их образуют только аминокислоты с полярными радикалами). Мы так до конца и не поняли, какие это именно контакты. Ясно только то, что они образуются лишь между атомами аминокислот с полярным радикалом и оснований ДНК.

    Обратимся к частностям. Кажется, что программа nucplot нашла больше контактов, чем мы с помощью RasMol. Однако на самом деле большинство "лишних" взаимодействий на рисунке являются водородными связями с водой. Однако некоторые "забракованные" нами контакты nucplot все же отобразил! Например, серин, по мнению программы, связывается с остовом безо сякого водяного мостика, тогда как даже после дополнительной проверки в RasMol понятно, что якобы взаимодействующие атомы оба акцепторы. Причину подобного решения программы понять сложно. Однако можно предположить, что nucplot не проверяет атомы, найденные им в определенной окрестности, на предмет правильности донорно-акцептороного взаимодействия. Хотя, наверное, не должна быть эта программа такой простой.

    Последнее, что интересно проверить: нашла ли программа взаимодействия с теми остаткам, которые в пункте 3 были названы ключевыми в специфическом узнавании белком ДНК. Оказывается, нашла все, кроме Arg (2)70.



©Ганчарова Ольга