Поиск белка с заданной функциональной специфичностью

1. Первый этап: описание функциональных особенностей заданной группы.

Рассмотрим свойства белка-прототипа GalR_Ecoli (страничка, посвященная этому белку на сайте EcoCys).
Этот белок представляет собой ДНК-связывающий транскрипционный фактор, которрый подавляет транскрипцию оперонов, отвечающих за транспорт и катаболизм D-галактозы. Активация этих оперонов происходит либо при наличии D-галактозы (эффектора) и в отсутствие глюкозы, либо при отсутствии обоих факторов.
GalR принадлежит к семейству транскрипционных регуляторов GalR/LacI и, как и другие белки из этого семейства, состоит из двух доменов: консервативного N-концевого, содержащего ДНК-связывающий участок, и С-концевого, который связывается с эффектором и участвует в димеризации.

Функциональные свойства по данным GO:
  • регуляция транскрипции ДНК, участие в метаболизме углеводов (галактозы);
  • связывание с ДНК и белками, активность в качестве транскрипционного фактора (может как активировать, так и подавлять транскрипцию);
  • расположение - внутри клетки, в цитоплазме.
Эффектором является β-D-галактоза:



2. Второй этап: создание множественного выравнивания доменов с разметкой по группам специфичности.

1. Получение хорошего множественного выравнивания доменов заданной группы белков

Необходимо выровнять эффекторсвязывающие домены белков из группы scrr.
Вначале с помощью БД Pfam определим доменную структуру белка-прототипа GalR_Ecoli:

Нам нужен С-концевой эффекторный домен Peripla_BP_1. Получим полное выравнивание всех доменов этого типа в формате FASTA: PF00532_full.fasta. Далее при помощи скрипта scrr.scr из полного выравнивания выделим только те последовательности, которые указаны в файле с протеомом scrr. В результате получаем файл с выравниванием: PF00532_scrr.fasta.

2. Получение единого множественного выравнивания заданных доменов всех групп специфичности

Было получено множественное выравнивание эффекторных доменов следующих групп:
  • galrs (выделена салатовым, далее группы покрашены разными цветами в последовательности, соответствующей этому списку)
  • frur
  • gntr
  • laci
  • mali
  • ptxs
  • purr
  • rbsr
  • scrr
  • thur-rafr
  • trer
Можно также посмотреть выравнивание в формате *.msf.
Есть только одна позиция, консервативная для всех групп доменов - это 151-я позиция выравнивания.
Для белков заданной группы специфичности (galrs) специфичными являются следующие позиции:
60, 71, 109, 112, 120, 171, 176, 182, 211, 214, 219, 260, 266, 268, 294, 309. Возможно, эти позиции соответствуют аминокислотным остаткам, участвующим в связывании с конкретным эффетором, характерным для данной группы специфичности.

3. Лого-изображения полного выравнивания заданных доменов и выравнивания доменов заданной группы специфичности.

При помощи ресурса WebLogo были получены лого-изображения выравниваний, полученных в задании 2:
1. Выравнивание эффекторных доменов белков группы специфичности scrr;
2. Единое множественное выравнивание доменов всех групп специфичности.

3. Третий этап: построение профиля выравнивания белков группы специфичности galrs и поиск по нему в протеоме Tolumonas auensis DSM 9187

Для построения профиля использовалось выравнивание galrs.fasta.

Вначале при помощи программы pfw к выравниванию были добавлены веса белков:
pfw -m galrs.fasta > galrs_w.fasta
Файл выдачи: galrs_w.fasta.

Далее создаем профиль по полученному выравниванию с весами:
pfmake -m galrs_w.fasta /usr/share/pftools23/blosum45.cmp > profile.prf
Профиль: profile.prf.

Нормируем полученный профиль относительно случайной базы:
autoscale -m profile.prf > profile_norm.prf
Нормированный профиль: profile_norm.prf.

По полученному профилю проведем поиск в протеоме Tolumonas auensis DSM 9187:
pfsearch -f profile_norm.prf Tolumonas.fasta > results.txt
Файл выдачи: results.txt.
Было найдено 19 белков, их последовательности сохранены в файле found_seqs.fasta. Затем эти последовательности были добавлены к исходному выравниванию. Все сохранено в файле for_clustalw.fasta. Этот файл подавался на вход программе ClustalW2.
В результате получили выравнивание (посмотреть в формате *.msf), зеленым выделены белки группы специфичности galrs (исходное выравнивание, по которому был построен профиль), фиолетовым - специфичные для данной группы остатки.

Из выравнивания видно, что белок №2600 из протеома Tolumonas auensis DSM 9187 содержит почти все специфичные позиции группы galrs. Можно сделать вывод, что этот белок относится к данной группе специфичности.

Назад