Задание 9 (выполнено Борисовой Мариной)

Мотивы, паттерны и профили

Задача: научиться строить паттерны и сравнивать их.

I. Создание паттернов аминокислотных последовательностей

В предыдущем задании было получено выравнивание и его изображение. Из выравнивания был выбран наиболее консервативный фрагментик:

Создадим следующие паттерны:

1. Первый паттерн - фрагмент последовательности исследуемого белка.

I-R-N-T-C-T-Y-C-S-V-G-C-G-L-L-M-Y-S

2. Второй ("сильный") паттерн должен распознавать все белки выборки:

[TISVY]-[TRQK]-[STN]-[VTLS]-C-[CTPAR]-[YF]-C-[SAG]-V-[GS]-C-[GS]-[LMVF]-[ILESMD]-[VMLA]-[HYVSAW]-[TSA]

3. Третий ("слабый") паттерн на основе второго:

C-X-[YF]-C-[SAG]-V-[GS]-C-[GS]-[LMVF]-X-[VMLA]

Проделаны следующие манипуляции с "сильными" паттерном:

- заменены позиции, где было 5 разных остатков на Х.

- удалено 2 позиции с правого конца и 4 слевого.

Таблица 1. Сравнение паттернов.

Характеристика паттерна Паттерн В скольких последовательностях банка Swiss-Prot найден мотив, удовлетворяющий паттерну? Все ли последовательности из Вашего выравнивания найдены?
Фрагмент последовательности  I-R-N-T-C-T-Y-C-S-V-G-C-G-L-L-M-Y-S  1  Нет, найден только исследуемый белок.
Сильный  [TISVY]-[TRQK]-[STN]-[VTLS]-C-[CTPAR]-[YF]-C-[SAG]-V-[GS]-C-[GS]-[LMVF]-[ILESMD]-[VMLA]-[HYVSAW]-[TSA]  20  Да
Слабый  X(4)-C-X-[YF]-C-[SAG]-V-[GS]-C-[GS]-[LMVF]-X-[VMLA]  28  Да

В выдаче при поиске "слабого" паттерна были следующие белки:

sp|Q934F5|FDHA_DESGI
sp|P06131|FDHA_METFO
sp|P61159|FDHA_METJA
sp|Q795Y4|FDHL_BACSU
sp|Q2FEI5|FDHL_STAA3
sp|Q2FVV9|FDHL_STAA8
sp|Q2YYT1|FDHL_STAAB
sp|Q5HDP9|FDHL_STAAC
sp|Q931G2|FDHL_STAAM
sp|Q99RW4|FDHL_STAAN
sp|Q6GEC4|FDHL_STAAR
sp|Q6G711|FDHL_STAAS
sp|Q7A057|FDHL_STAAW
sp|Q4L8G8|FDHL_STAHJ
sp|Q49ZN0|FDHL_STAS1
sp|P24183|FDNG_ECOLI
sp|P32176|FDOG_ECOLI
sp|P46448|FDXG_HAEIN
sp|Q6D5Z2|NAPA_ERWCT
sp|C6DK59|NAPA_PECCP
sp|B0TSW5|NAPA_SHEHH
sp|Q8EIJ1|NAPA_SHEON
sp|Q67QZ1|NAPA_SYMTH
sp|O33732|NARB_SHEFN
sp|P39458|NARB_SYNE7
sp|P73448|NARB_SYNY3
sp|Q06457|NASA_KLEOX
sp|O34720|YJGC_BACSU.

Видно, что большая часть это формиат дегидрогеназы, как и изучаемый белок. Остальные нитрат редуктазы и ещё один дальний гомолог формиат дегидрогеназы.

II. Все описанные в PROSITE мотивы в заданном белке FDNG_Ecoli

Таблица 2. Результаты поиска мотивов в заданном белке.

Идентификатор документа PROSITE (AC) Название мотива Краткое описание мотива Тип подписи (паттерн, профиль) Паттерн (регулярное выражение) Специфична ли подпись? Сколько мотивов нашлось в белке?
PS51318
TAT
Сайт транслокации спаренных аргининов профиль
-
неспецифична 1
PS00551 MOLYBDOPTERIN_PROK_1 Сайт прокариотической молибдоптериновой оксидоредуктазы паттерн [STAN]-x-[CH]-x(2,3)-C-[STAG]-[GSTVMF]-x-C-x-[LIVMFYW]-x-[LIVMA]-x(3,4)-[DENQKHT] специфична 1
PS00932 MOLYBDOPTERIN_PROK_1 Сайт прокариотической молибдоптериновой оксидоредуктазы паттерн  A-x(3)-[GDTN]-[IF]-x-[DNQTKEH]-x-[DEAQ]-x-[LIVM]-x-[LIVMC]-x-[NS]-x(2)-[GS]-x(4,5)-[AV]-x-[LIVMEF]-[STY] специфична 1

    © 2010 Borisova Marina