Учебный сайт Шиндяпиной А.В.

Поиск белка с заданной функциональной специфичностью


Первый этап: описание функциональных особенностей заданной группы.

Для исследования мне был дан белок B5Y088_KLEP3 из организма Klebsiella pneumoniae (Клебсиелла пневмонии, Палочка Фридлендера). Он является репрессором сахарозного оперона. Данных об эффекторе на странице UniProt нет.
 Biological process	regulation of transcription, DNA-dependent

                        response to fructose stimulus

                        transcription

Cellular component	intracellular


Molecular function	transcription factor activity

Второй этап: создание множественного выравнивания доменов с разметкой по группам специфичности.

Создание хорошего множественного выравнивания доменов группы thur-rafr

Т.к. в БД Pfam по мимо нужного мне домена аннотирован еще Peripla_BP_1(изображение ниже), воспользовалась БД SMART.

Cначала получила представительское выравнивание доменов в формате FASTA с помощью БД SMART и последовательности всех бактериальных доменов данного семейства в формате FASTA. С помощью скрипта
 
#!/bin/bash

for i in `cat thur_rafr`; do

grep -A 30 ${i} smart1.fasta >> pfam_filtered.ali

done
получила получила только нужные мне последовательности ДНК-связывающих доменов . С помощью программы ClustalW2 (/home/preps/golovin/progs/bin/clustalw2) Выравняла последовательности нужных ДНК-связывающих доменов под профиль представительского выравнивания SMART.fasta, из полученного файла удалила последовательности представительского выравнивания, в итоге получила следующий файл - dna_al.fasta .

2. Создание единого множественного выравнивания

Импортировала в GENEDOC полученные выравнивания и расскрасила по группам специфичности. Полученный файл - all.msf
Изображение - all.png
Позиции выравнивания, консервативные (одинаковые) и характерные только для моей группы (scrr): 52, 253.
Позиции выравнивания, консервативные (одинаковые) только для моей группы (scrr), но встречабющиеся и в других группах: 29, 58, 70, 72, 83, 90, 108, 160, 169, 210, 212, 225, 257, 262, 263, 265.
Позиции выравнивания, консервативные (одинаковые) для нескольких групп, включая мою:34, 36, 37, 38, 44, 49, 50, 57, 64, 65, 68, 73-76, 79, 85, 95, 101, 104, 105, 107, 109, 110, 112, 114, 117, 143, 145, 146, 149, 150, 201, 203, 204, 209, 213, 217, 218, 233, 244, 260, 261.

3. Получение картинок logo

с помощью серевера WebLogo получила для своей группы scrr и для общего выравнивания следующие картинки :
logo1.png
logo.png

3.Третий этап: построение профиля для группы scrr и поиск по нему в протеоме Pantoea ananatis LMG 20103.

1.Создание и нормирование профиля.

К ранее полученному выравниванию эффекторсвязывающих доменов семейства scrr додавила веса с помощью программы pfw :
pfw -m scrr.fasta > scrr_w.ali
полученный файл - scrr_w.ali .
После чего с помощью программы pfmake получила профиль данного выравнивания:
pfmake -m scrr_w.ali /usr/share/pftools23/blosum45.cmp > scrr_pf.prf
Полученный файл - scrr_pf.prf
После чего с помощью программы autoscale было проведено нормирование профиля:
autoscale -m scrr_pf.prf > scrr_pf.scaled.prf
Полученный файл - scrr_pf.scaled.prf

2. Поиск по профилю в протеоме Pantoea ananatis LMG 20103

С помощью программы pfsearch провела поиск, задав значения порога 5, 10 и 30. Пример команды с порогом 5:
pfsearch -C 5.0 -f scrr_pf.scaled.prf Pantoea.fasta > scrr5.search
На выходе получила файлы scrr5.search(50 находок), scrr10.search (17 находок) и scrr30.search (1 находка) .
После чего получила файл с последовательностями, найденными при пороге 10 (17 находок) - scrr10.fasta .
В файле scrr.msf синим помечены позиции, признанными специфичными ранее, а светло-оранжевым - совпадающие со специфичными.
Изображение - scrr.png
©, "ООО Шиндяпина 2008"