Исследование ДНК-белковых взаимодействий в структуре комплекса цепи А белка NGFI-A и цепей С и D ДНК

  1. Краткое описание структуры в файле 1p47.pdb
  2. В файле приведены координаты атомов следующих молекул:

    1. EGR PROTEIN 1: белок фактора раннего роста домовой мыши; у него представлены 2 цепи, A и B.
    2. MOLECULE: 5'-D(*G*T*G*G*C*G*T*G*G*G*C*G*G*C*G*T*G*G*G *C*G*T)-3'; цепь C.
    3. MOLECULE: 5'-D(*C*A*C*G*C*C*C*A*C*G*C*C*G*C*C*C*A*C*G *C*C*A)-3'; цепь D.

    Для нашего исследования мы взяли цепь белка A и цепи С и D ДНК со следующими последовательностями:

    цепь С [1] 5' - gtggcgtgggcggcgtgggcgt - 3' [22] 
                     |||||||||||||||||||||  
    цепь D [63] 3' - accgcacccgccgcacccgcac  - 5' [42],
        

    где 1 и 22, 42 и 63 - номера первого и последнего нуклеотидов, соответственно.

  3. Функции белка, структура которого представлена в файле 1p47.pdb
  4. Белок NGFI-A является регулятором транскрипции, распознаёт и связывается с ДНК на EGR-сайт.
    Активирует транскрипцию генов, чьи белки необходимы клетке при митозе и дифференциации.
    Располагается в ядре.
    Принадлежит к семейству белков, которые называют "цинковыми пальцами".
    [Transcriptional regulator. Recognizes and binds to the DNA sequence 5'-CGCCCCCGC-3'(EGR-site). Activates the transcription of target genes whose products are required for mitogenesis and differentiation.]

  5. Исследование структуры ДНК
  6. С помощью файлов, полученых в результате запуска программ find_pair и analyze мы определили тип формы ДНК.
    Предположительно, это правозакрученная В форма (согласно данным, содержащимся в файле (1p47_old.out )

    Файл Excel с данными о торсионных углах структуры.
    Взаимодействие с белком, бесспорно, изменяет стерическую форму молекулы ДНК. Оно наблюдается по всей длине ДНК, и наибольшие отклонения торсионных углов видны в местах, где белок располагается недалеко от ДНК (желтым отмечены нуклеотиды с наибольшими отклонениями торсионных углов).





























  7. Исследование природы ДНК-белковых контактов
  8. Таблица. Контакты разного типа в комплексе белка (цепь А) и ДНК (цепи С, D) записи 1P47.pdb


    Будем считать полярными атомы кислорода и азота, а неполярными – атомы углерода, фосфора и серы.
    Назовем полярным контактом ситуацию, в которой расстояние между полярным атомом белка и полярным атомом ДНК меньше 3.5 ангстрем.
    Аналогично, неполярным контактом будем считать пару неполярных атомов на расстоянии меньше 4.5 ангстрем.
    Скрипт, позволяющий определить множества атомов:
           
    define bg (*.n4, *.n6, *.n7, *.o4, *.o6, *.c5, *.c6, (*.c4,*.c7 and pyrimidine), (*.c8 and purine)) and dna 
    define sm (*.o2,*.n3,*.n2,*.c2,(*.c4 and purine)) and dna
    define dezox (*.C?*, *.O?*)  and dna
    define ph (*.O?P, *.P) and dna
    define pol (*.N??, *.O??)
    define nepol (carbon or sulphur or phosphorus)
    define p1 within (3.5, dezox and pol) and *A and protein and pol
    define p2 within (3.5, (ph and pol))  and *A and protein and pol
    define p3 within (3.5, (bg and pol))  and *A and protein and pol
    define p4 within (3.5, (sm and pol))  and *A and protein and pol
    define np1 within (4.5, (dezox and nepol))  and *A and protein and nepol
    define np2 within (4.5, (ph and nepol))  and *A and protein and nepol
    define np3 within (4.5, (bg and nepol))  and *A and protein and nepol
    define np4 within (4.5, (sm and nepol))  and *A and protein and nepol
    


    Контакты атомов белка с Полярные Неполярные Всего
          остатками 2'-дезоксирибозы 1 8 9
          остатками фосфорной кислоты 11 10 21
          остатками азотистых оснований со стороны большой бороздки 14 18 32
          остатками азотистых оснований со стороны малой бороздки 0 1 1

    Как видно из таблицы, в целом, неполярных контактов больше, чем полярных. Был замечен всего один контакт с цепью А белка в области малой бороздки, а больше всего контактов ДНК с цепью А белка в области большой бороздки.


  9. Получение популярной схемы ДНК-белковых контактов с помощью nucplot
  10. Для данного исследования я взяла не только А, но и B цепи белка, цепи C и D ДНК. Использованная команда: nucplot 1P47_old.pdb
    В результате получила следующие картинки:






    Из рисунков видно, что взаимодействий с дезоксирибозой больше, чем с фосфатами, хотя, если внимательно посмотреть, то можно заметить, что числовые данные опровергают данное наблюдение. Можно предположить, что у программы nucplot иной механизм распознавания взаимодействий, чем у Rasmol.

  11. Возможный распознающий контакт
  12. На роль распознающего контакта подходит взаимодействие с ARG124, т.к. возможно образование целых двух водородных связей:
    между атомом кислорода О6 гуанина и атомом водорода при аминогруппе аргинина (если смотреть в записи PDB, то это NH1).






























  13. Характеристика ДНК-связывающего домена белка EGR1_MOUSE
  14. C помощью Pfam была получена доменная структура белка EGR1_MOUSE, образующего комплекс с ДНК:


     Source  Domain  Start  End 
    PfamAzf-C2H2336360
    PfamAzf-C2H2366388
    PfamAzf-C2H2394416

    По данным Pfama данный белок имеет 1 домен Zinc finger, C2H2-type, этот домен содержит 2 консервативных цистеина и 2 гистидина, которые координируют ион цинка. Домен состоит из двух коротких бета-цепей, следующих за альфа-спиралью. Терминальная аминогруппа спирали связывает большую бороздку ДНК, замыкая zinc fingers. Также сказано, что распознающим сайтом в ДНК является гексануклеотид GGGCGG.