I. Первый этап: описание функциональных особенностей заданной группы.

Заданный мне белок-прототип B5Y088_KLEP3. Поиск в UniProt показал, что:
                  1. Biological process - регуляция транскрипции.
                  2. Molecular function - ДНК-связывающий белок, фактор транскрипционной активности.
                  3. Cellular component - внутриклеточный компонент.
                 

II. Второй этап: создание множественного выравнивания доменов с разметкой по группам специфичности.

1. Mножественное выравнивание доменов заданной группы белков.

Из БД Pfam было взято выравнивание эффекторсвязывающих доменов типа Peripla_BP_1 (PF00532), полученного из анализа доменной структуры белка-прототипа B5Y088_KLEP3. Далее с помощью скрипта

                           #!/bin/bash

                           for i in `cat trer`; do

                           grep -A 30 ${i} PF00532_full.fasta >> PF00532_trer.fasta

                           done
                      
где trer - заданная мне группа специфичночти белков. Выравнивание данной группы можно скачать в формате msf Так же она представлено на картинке

2. Eдиное множественное выравнивание заданных доменов всех групп специфичности

Изображение полного выравнивания всех групп специфичности можно рассмотреть по этой ссылке .
Позиции в общем выравнивании, характерные именно для моей группы специфичности trer:
29, 68, 70, 90, 160, 212, 244, 265, 257.

3. Лого-изображения полного выравнивания заданных доменов и выравнивания доменов заданной группы специфичности.

Картинка logo для доменов группы специфичности scrr представлена по данной ccылке . А картинка для выравнивания доменов всех групп специфичности ccылке .

II. Третий этап. Создать по полученному ранее выравниванию профиль и по нему найти последовательности белков в заданном протеоме.

1. Прежде, чем создавать профиль необходимо дать вес выравниванию. Это было сделано с помощью программы pfw. Команда:
pfw -m scrr.fasta > scrr_w_al.fasta

2. Профильсоздавался с помощью программы pfmake. Команда:
pfmake -m scrr_w_al.fasta /usr/share/pftools23/blosum45.cmp > scrr_prof.prf

3. Дальше профиль нормировался с помощью программы autosale. Команда:
autoscale -m scrr_prof.prf > scrr_prof_sc.prf

4. По заданному протеому Tolumonas был проведен поиск белков с помощью полученного профиля. Команда:
pfsearch -f scrr_prof_sc.prf Tolumonas.fasta > scrr_fin
Было получено 14 находок.

5. Полученные белки были выровнены с белками, по которым строился профиль.
выравнивание можно посмотреть здесь.
В формате msf. Среди найденных по профилю белков больше всего в группу специфичночти подходит белок 811, так он совпадает в большенстве позиций с группой белков scrr, по которой профиль строился.