Проект
"Поиск белка с заданной функциональной специфичностью."

1. Первый этап: описание функциональных особенностей заданной группы.

Для работы мне был дан белок-прототип PurR_Ecoli.
На сайте EcoCyc, а именно на странице "Escherichia coli K-12 substr. MG1655 Protein: PurR transcriptional repressor" была получена информация о специфических функциональных свойствах.

PurR - это транскрипционный репрессор семейства белков GalR/LacI. Его димер контролирует транскрипцию несколько генов, участвующих в биосинтезе пуриновых и пиримидиновых нуклеотидов и в синтезе самого PurR. Он связывается с двумя продуктами метаболизма пурина: гипоксантином и гуанином, что позволяет ему связаться с ДНК. Сайт связывания на ДНК состоит из 16 пар нуклеотидов, представляет из себя инвертированный повтор.

В БД KEGG находим структурные формулы лигандов:
ГипоксантинГуанин

2. Второй этап: создание множественного выравнивания доменов с разметкой по группам специфичности.

1. Создать хорошее множественное выравнивание доменов заданной группы белков.

Для этого задания мне определили группу специфичность purr и ДНК-связывающий домен. По картинке с мотивами в БД InterPro для моего белка-прототипа мотив для ДНК-связывающего домена в БД SMART оказался самым длинным. Поэтому будет удобней работать с доменами этой БД.

В SMART мной были получены:

  • представительское выравнивание ДНК-связывающих доменов HTH_LACI семейства LACI (SMART.fasta).
  • последовательности ДНК-связывающих доменов всех бактериальных белков этого семейства (dna_purr_all.fasta)
По идентификаторам последовательностей (purr), по мнению эксперта, обладающих данной специфичностью, были выделены последовательности из файла с доменами всех бактериальных белков. Некоторых последовательностей, указанных экспертом, не оказалось, поэтому они были получены из БД Swiss-Prot программой seqret. Затем с помощью программы ClustalW2 было получено выравнивание необходимых доменов под профиль SMART.fasta.
Окончательное выравнивание группы специфичности: dna_purr_aln.fasta.

2. Создать единое множественное выравнивание заданных доменов всех групп специфичности.

Импортируем выравнивания всех групп специфичности в GeneDoc. Для ДНК-связывающих доменов сдвинем группы так, чтоб консервативные позиции оказались друг под другом. Удалим колонки с гэпами. Записи различных групп специфичности располагаются рядом. Заданная группа специфичности находится на самом верху.

    Ракраска остатков была выполнена следующим образом:
  • каждая группа специфичности покрашена отдельным цветом;
  • способ раскраски "Shade Group Conserved", то есть позиции, консервативные в пределах группы, раскрашены в цвет группы, а позиции, консервативные для всех последовательностей, - в чёрный цвет;
  • позиции, консервативные в пределах каждой группы, но в которых находятся разные остатки в разных группах, раскрашены у первой последовательности зелёным цветом.
Для наиболее быстрого нахождения позиций из последнего пункта была нажата кнопка "D", в результате чего буквы в позициях, соответсвующих консенсусу всего выравнивания были заменены на точки. Мной были выбраны позиции двух типов: консервативные внутри группы и не заменённые точками и не консервативные в других группах специфичности; консервативные внутри группы и заменённые точками, но не консервативные в других последовательностях.

- Эффекторсвязывающий домен: effectbind.gif

- ДНК-связывающий домен: DNAbind.gif

3. Создайте лого-изображения полного выравнивания заданных доменов и выравнивания доменов заданной группы специфичности.

Для создания лого-изображений использовались выравнивания с удалёнными колонками, состоящими только из гэпов.
    Эффекторсвязывающий домен:
  • Logo для полного выравнивания: logo_effect.png
  • Logo для выравнивания группы purr: logo_purr.png
    ДНК-связывающий домен:
  • Logo для полного выравнивания: logo_DNA.png
  • Logo для выравнивания группы purr: logo_purrDNA.png

3. Третий этап: поиск белка заданной группы специфичности в протеоме

Был задан протеом организма Pseudomonas aeruginosa. На сервере SRS были получены последовательности всех белков из TrEMBL с ID: *_PSEAE, соответствующими белкам данного организма. Используем БД TrEMBL, так как в ней имеется информация обо всех возможных, ещё не аннотированных белках. Также был скачен файл из PBD с ID 1BDH, содержащим расположение структур одного из белков в выборке группы специфичности, а именно PURR_ECOLI (AC: P0ACP7), ДНК и эффектора, с которыми он связывается, для дополнительной проверки важных позиций.
Последовательно были выполнены следующие программы:
  • pfw - для добавления весов в выравнивание группы специфичности
  • pfmake - для составления профиля группы специфичности
  • autoscale - для нормирования этого профиля
  • pfsearch - для для поиска последовательностей в протеоме по профилю (со значением порога 20.0)
  • ClustalW2 - для выравнивания найденных последовательностей под выравнивание семейства
-ДНК-связывающий домен: DNAbind.search.aln, DNAsearch.gif
Были найдены 3 идентичные последовательсности с разными AC. Поэтому на картинке оставлена только одна. Некоторые позиции в найденной последовательности не совпадают с консервативными в группе. Кроме того среди специфических для данной группы позиций, в найденной последовательности есть только одна совпадающая.
С помощью RasMol в файле PDB были обнаружены аминокислотные остатки, взаимодействующие с ДНК гидрофильными и гидрофобными связями. Это остатки: Val13, Ser14, Thr17, Ala29, Thr32, Leu54. Не все из этих позиций совпадают в найденной последовательности с группой специфичности, но совпадающие позиции не являются специфичными только для данной группы.

-Эффекторсвязывающий домен: effectbind.search.aln, effect_search.gif

Было найдено 9 последовательностей, из которых только 3 различные. Консервативных в группе позиций, совпадающих в найденных последовательностях, меньше половины от всех консервативных. А также случаи совпадения со специфическими позициями единичны.
С помощью RasMol в файле PDB (позиция 58 в файле PDB соответствует позиции 1 в последовательности эффектор-связывающего домена белка PURR_ECOLI) были обнаружены аминокислотные остатки, взаимодействующие с лигандом гипоксантином гидрофильными и гидрофобными связями. Это остатки (в скобках позиция в домене PURR_ECOLI): Ala71(14), Tyr73(16), Arg189(132), Thr191(134), Arg195(138), Phe220(163), Asp274(217). Из них консервативные: Tyr73(16), Arg189(132), Arg195(138), Phe220(163), Asp274(217). В найденных последовательностях совпадают лишь некоторые из этих позиций.

По данным результатам можно сделать вывод, что в протеоме Pseudomonas aeruginosa нет белков, имеющих ДНК-связывающих и эффектор-связывающих доменов группы специфичности PurR, то есть нет белка-репрессора пуринового оперона.



© Айдарханов Руслан 2008