1.Краткое описание структуры в файле 1BDT.pdb

В файле приведены координаты атомов следующих молекул

Белок и ДНК из Бактериофага Р22 .
Для исследования были выбраны цепи A, B, C, D белка и цепи E, F, представляющие ДНК со следующей последовательностью:

цепь E  [1]  5'- TATAGTAGAGTGCTTCTATCAT -  3' [22] 
                  ||||||||||||||||||||| 
цепь F [22] 3'  - TATCATCTCACGAAGATAGTAA - 5' [1],
    

где 1 и 22 - номера первого и последнего нуклеотида.

2.Функции белка, структура которого представлена в файле 1BDT.pdb

По данным документа UniProt, белок, представленный в структре, является транскрипционным репрессором генов arc и ant, при этом первичная структура данного полипептида кодируется геном arc. Белок пренадлежит семейству 22arc/mnt. Соединяется с ДНК как гомотетрамер.

3.Исследование структуры ДНК

С помощью программ find_pair и analyze было определено,что данная ДНК представлена в В-форме.
Classification of each dinucleotide step in a right-handed nucleic acid
structure: A-like; B-like; TA-like; intermediate of A and B, or other cases
  
    step       Xp      Yp      Zp     XpH     YpH     ZpH    Form
   1 AT/AT   -3.45    8.72    0.64   -5.74    8.68    1.09
   2 TA/TA   -3.40    8.86    0.59   -6.68    8.41    2.85
   3 AG/CT   -3.09    8.74    0.35   -5.54    8.49    2.14     B
   4 GT/AC   -3.34    9.30    0.31   -7.43    9.07    2.11     B
   5 TA/TA   -2.14    8.80    0.57   -0.84    8.74   -1.16
   6 AG/CT   -3.18    8.89   -0.14   -4.91    8.43    2.76     B
   7 GA/TC   -3.07    8.97    0.05   -4.23    8.88    1.30     B
   8 AG/CT   -2.96    8.94   -0.21   -2.85    8.91    0.74     B
   9 GT/AC   -3.65    9.08   -1.25   -4.97    9.16   -0.40     B
  10 TG/CA   -2.96    8.92   -0.10   -1.65    8.89   -0.74     B
  11 GC/GC   -2.93    8.90    0.03   -1.28    8.75   -1.60     B
  12 CT/AG   -3.29    9.19   -0.86   -5.06    9.22    0.54     B
  13 TT/AA   -2.31    9.08   -0.07   -1.59    9.07   -0.55     B
  14 TC/GA   -2.76    9.12    0.09   -4.66    8.71    2.70     B
  15 CT/AG   -3.12    8.93   -0.11   -2.96    8.92    0.25     B
  16 TA/TA   -2.77    8.65    0.42   -2.08    8.65   -0.34     B
  17 AT/AT   -3.81    9.06    0.24   -8.03    8.66    2.67     B
  18 TC/GA   -3.16    8.86    0.51   -5.27    8.57    2.29
  19 CA/TG   -3.33    8.74    0.85   -7.57    8.30    2.85
  20 AT/AT   -3.66    8.59    0.34   -5.15    8.59    0.48
Были определены средние значения торсионных углов для внутренних нуклеотидов. Наиболее отклоняющиеся от средних значения торсионных углов имеют Тимин19 из цепи Е и Аденин5 из цепи F, причем они образуют комплементарную пару..
При визуальном анализе прекрасно видно, что комплекс весьма симметричен. Поэтому можно предположить, что симметрия должна проявиться и в отклонениях значений торсионных углов, т.е. G5 из Е и С19 из F должны демонстрировать резкие отклонения от средних значений, как это было видно из таблицы для Т19 из Е и А5 из F. Но это предположение не подтверждается.

4.Исследование природы ДНК-белковых контактов

1) скрипт my_dna.def , в котором определены множества атомов, необходимые для заполнения следующей таблицы.
2)
Контакты атомов белка с Полярные Неполярные Всего
      остатками 2'-дезоксирибозы  2  29  31
      остатками фосфорной кислоты  35  41  76
      остатками азотистых оснований со стороны большой бороздки  6  25  31
      остатками азотистых оснований со стороны малой бороздки  0  0  0

3) Наблюдения:
Заметно, что число неполярных взаимодействий сильно превышает число полярных. Объясняю это тем, что 1. по сравнению с полярными атомами число неполярных, вообще говоря, больше как в белке, так и в ДНК, 2. полярные атомы спрятаны внутри молекулы нуклеиновой кислоты(за исключением кислородов фосфатных групп), так как они поддерживают вторичную структуру молекуклы ДНК. Также видно, что остатки оснований со стороны малой бороздки не взаимодействую с атомами белка, это вызвано их ориентированным вглубь молекулы ДНК пространственным расположением.

5.Получение популярной схемы ДНК-белковых контактов с помощью nucplot

Была использована команда nucplot 1BDT_old.pdb . В результате были получены картинки:
Очевидно, что контактов белка с остовом молекулы ДНК намного больше, чем с азотистыми основаниями. Взаимодействия белка с азотистыми основаниями можно рассматривать как проявление селективности, избирательности белка. Это можно положить в основу рассуждений при выборе распознающих контактов. Интересно то, что контакты между водой и азотистыми основаниями представлены в таком большом количестве.
Результаты на картинке и мой собственный вывод из пункта 3 весьма коррелируют. В коментариях к заданию III я указал пару 19Т(Е) - 5А(F) с наиболее отклоняющимися значениями торсионных углов. Как видно из представленных картинок, никакое основание из пары не взаимодействует непосредственно с белком, лишь аденин опосредованно,через фосфат; когда же число водородных связей с водой максимально для всего комплекса и равно трем. Предположительно, это имеет некое функциональное значение. Должно быть, эти пять связей и вызвали такие отклонения в значениях двугранных углов.

6.Возможный(е) распознающий(е) контакт(ы)

Ресунок показывает, что одна аминокислота имеет лишь одну связь с ДНК. Ниже рисунок, изображающий взаимодействие метионина с фосфатом.
Думаю, что хорошим кандидатом на роль распознающего контакта подходят аминокислоты Gln9, Asn11, Arg13 из цепей А и В белка и, соответственно рисунку программы nucplot, контактирующие с ними азотистые основания. Это можно считать правдоподобным, так как атомы именно этих аминокислот образуют связи непосредственно с атомами азотистых оснований, а значит проявляют некую избирательность, которая невозможна при контакте с сахаро-фосфатным остовом. Названные аминокислотные остатки входят в состав β-тяжей каждой из цепей. Кроме того, атомы кислорода Тимина6 цепи Е и Аспарагина11 цепи В находятся на растоянии 3.19 Å, что достаточно мало.

7. Характеристика ДНК-связывающего домена RARC_BPP22

С помощью инструментов Pfam определил доменную структуру белка из исследуемого комплекса.
В данном белке домен встречается в каждй из 4-х цепей. В цепи А с 4-ой по 52-ю позицию, в цепи В с 4-й по 53-ю, в цепях С и D с 4-й по 50-ю. Полное название ДНК-связывающего домена в InterPro - Arc-подобный ДНК-связывающий домен (InterPro: IPR005569 Arc-like DNA binding). Arc-репрессор образуется из 2-х Arc-репрессорных димеров и взаимодействует с сайтом оператора,который состоит из 21-й пары нуклеотидов. Каждый Arc-димер использует антипараллельные бета-тяжи чтобы распознавать основания со стороны большой броздки. Эти бета-тяжи принадлежат разным полипептидам, входящим в состав каждого димера. 2 антипараллельных бета-тяжа образуют бета-лист. Итого в димере 2 бета-листа.