Проект "Поиск белка с заданной функциональной специфичностью."

Главная

Задача заключается в том, чтобы определить, есть ли белок с заданной специфичностью в заданном протеоме.

Белок-прототип: PurR_Ecoli является транскрипционным репрессором гена PurR

Группа: purr.

Из названия белка понятно, что он взят из организма кишечной палочки (Escherichia coli K-12 substr. MG1655), поэтому данные об этом белке можно посмотреть на сайте EcoCyc.

  1. Описание функциональных особенностей группы purr
  2. Длина:                    341 ак
    Структура:                гомодимер
    Доменная организация:     2 структурных и функциональных домена.
    
                              
                              (изображение взято из БД PFAM)
                              
                              N-концевой домен(LacI) содержит "спираль-поворот-спираль" мотив(HTH) для связывания с ДНК
                              С-концевой домен(Peripla_BP_1) содержит лиганд-связывающий мотив
                              оба домена соединены петлей, которая также важна для связывания с ДНК, эту последовательность могут
                              расщеплять протеазы, если белок не связан с ДНК.
    Семейство:                GalR/LacI                        
    Реакция:                  PurR + hypoxanthine = PurR-hypoxanthine (связывание с гипоксантином)
    Функция:                  регулирует транскрипцию нескольких генов, которые участвуют в биосинтезе пуриновых
                              и пиримидиновых нуклеотидов, а также в его собственном синтезе.
    Эффектор(корепрессор):    гипоксантин или гуанин(продукты пуринового метаболизма) 
                                
                              (картинки взяты из БД KEGG)
                              
                              связывание приводит к конформационным изменениям, что позволяет белку связаться с ДНК
                              сайт связывания состоит из 16 нуклеотидов: консенсус этой последовательности 5'-ACGCAAACGTTTTCNT-3'(инвертированный повтор)
    

  3. Создание множественного выравнивания доменов с разметкой по группам специфичности.
  4. Создание хорошего множественного выравнивания эффекторсвязывающих доменов группы белков purr

    На сайте БД PFAM находим доменную структуру белка-прототипа purR_Ecoli. .

    Peripla_BP_1 - эффекторсвязывающий домен.
    На странице с описанием этого домена получили выравнивание всех эффекторсвязывающих доменов в fasta-формате. Для получения выравнивания доменов, заданных в purr, был написан скрипт purr.scr. В результате получили файл PF00532_purr.fasta с множественным выравниванием эффекторсвязывающих доменов группы специфичности purr.

    Создание единого множественного выравнивания заданных доменов всех групп специфичности

    В GeneDoc экспортировали все группы специфичности, группируя и размечая их разными цветами при добавлении. Полученное выранивание в файле effectorbind.msf
    Посмотреть изображение.

    В полученном выравнивании одна консервативная позиция для всех групп специфичности - 146; позиция 112 является консервативной для всех, кроме ptxs; Группы расположены в следующем порядке: purr, frur, galss, gntr, laci, mali, ptxs, rbsr, scrr, thur_raft, trer.

    В группе purr консервативными позициями являются 31-36, 39, 52, 57, 59, 61, 64, 65, 68, 69, 72-75, 101, 103, 104, 107-112, 114, 115, 131, 142, 143, 146-151, 167, 170, 175, 177, 179, 180, 182,190, 191, 197, 202, 204, 209, 217, 221, 222, 224, 225, 230, 233, 243, 244, 247, 250, 253, 255, 278, 279, 283-286, 289, 291-293, 296, 301, 304, 308, 310, 311, 313, 314, 322-328, 337, 338, 340, 342-247, 349, 352, 353, 356, 359, 360, 363, 364.
    Всего 107 позиций. Такое большое количество консервативных позиций говорит о том, что белок высоко специфичен.

    Тоже самое выполнили для ДНК-связывающего домена.

    Полученное выранивание в файле dnabind.msf
    Посмотреть изображение.
    На изображении черным выделены консервативные позиции для всех групп: 43, 46, 63, 72. Позиция 44 является консервативной в пределах каждой группы.

    Создание лого-изображения полного выравнивания заданных доменов и выравнивания доменов заданной группы специфичности.

    Используя ресурс WebLogo были получены следующие лого-изображения(гэпов нет).
    для эффекторсвязывающих доменов группы специфичности purr
    Посмотреть изображение.
    для всех эффекторсвязывающих доменов
    Посмотреть изображение.

  5. Создание профиля и поиск белка с заданной специфичностью purr по заданному протеому Xanthomonas campestris pv. campestris (strain B100).
  6. Создание профиля множественного выравнивания для доменов с заданной специфичностью purr

    1) Расчет веса последовательностей выборки c помощью программы pfw пакета PFTOOLS.

       Команда: 
            pfw -m dnabind_purr.fasta > dnabind_purr_weighted.fasta
            pfw -m effectbind_purr.fasta > effectbind_purr_weighted.fasta
     

    2) По взвешенному выравниванию строим профиль с помощью pfmake.

       Команда: 
            pfmake -m dnabind_purr_weighted.fasta /usr/share/pftools23/blosum45.cmp > dna_profile.prf
            pfmake -m effectbind_purr_weighted.fasta /usr/share/pftools23/blosum45.cmp > effector_profile.prf
    
    

    3) Затем нормируем профиль с помощью autoscale.

       Команда: 
            autoscale -m effector_profile.prf > effector_profile_scaled.prf
            autoscale -m dna_profile.prf > dna_profile_scaled.prf
     

    Поиск белков со специфичностью purr по протеому Xanthomonas campestris pv. campestris (strain B100).

    Протеом Xanthomonas campestris pv. campestris (strain B100) был получен из БД UniProt/Trembl.

    C помощью программы pfsearch пакета PFTOOLS был проведен поиск белков со специфичностью purr по протеому Xanthomonas campestris pv. campestris (strain B100).

       Команда:
            pfsearch -C 15.0 -f effector_profile_scaled.prf Xanthomonas_campestris.fasta > effector_15.search
            pfsearch -C 15.0 -f dna_profile_scaled.prf Xanthomonas_campestris.fasta > dna_15.search
    
    Поиск был проведен с различными значениями порога (5, 10, 15, 20, 30). При значении порога равным 15 в случае ДНК-связывающих доменов был найден единственный белок B0RLC9_XANCB, который также был найден при аналогичном поиске эффекторсвязывающих доменов (всего находок 10).
    Будем рассматривать результаты с порогом 15.

    Последовательности найденных белков: effector_found.fasta и dna_found.fasta.
    С помощью программы ClustalW2 построили выравнивание полученных последовательностей для ДНК-связывающих и эффекторсвязывающих доменов с уже имеющимся для группы специфичности purr, импортировали его в GeneDoc: effector_aln.msf и dna_aln.msf.

    Эффекторсвязывающий домен

    Красным цветом выделены белки группы специфичности purr, черным показаны консервативные позиции (всего 16), они являются консервативными и для всей группы. В позиции 369 только у белка B0RLC9_XANCB стоит Y, как в группе специфичности.

    Посмотреть изображение

    Была исследована структура белка прототипа (PDB ID - 1BDH), оказалось, что выделенные консервативные позиции не имеют никакого отношения к сайту связывания с эффектором. Аминокислотные остатки, которые взаимодействуют с эффектором, в файле hpa.pdb.

    ДНК-связывающий домен

    Из 31 консервативных аминокислотных остатков только 7 взаимодействуют с ДНК, при том, что просмотр структуры показывает, что есть другие аминокислотные остатки, взаимодействующие с ДНК. Аминокислотные остатки, которые взаимодействуют с ДНК по данным айла 1BDH.pdb в dna.pdb.

    Посмотреть изображение

    Таким образом, приходим к выводу, что из полученных белков ни один не принадлежит группе специфичности purr.


    © Ксения Лежнина 2008