МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ИМЕНИ М.В.ЛОМОНОСОВА
ФАКУЛЬТЕТ БИОИНЖЕНЕРИИ И БИОИНФОРМАТИКИ

Домашняя страничка Ильи Курочкина

Главная

I Семестр

II Семестр

Проекты

Обратная Связь

Мотивы, паттерны и профили

  • Создание паттернов аминокислотных последовательностей

    Возьмем паттерн по выравниванию программы muscle: выравнивание белка RSUA_ECOLI с гомологами
    Я взял фрагмент выравнивания 215-230 (соответсвует 175-190 а.о белка RSUA_ECOLI):

    Было создано три паттерна, отвечающие фрагменту выравнивания. Первый паттерн представляет собой в точности фрагмент последовательности белка RSUA_ECOLI. Второй ("сильный") паттерн должен распознать все последовательности фрагмента выравнивания. Третий ("слабый") паттерн отвечает более мягким требованиям к последовательностям.

    Таблица результатов поиска по паттернам в базе данных SwissProt

    Характеристика паттерна Паттерн В скольких последовательностях банка Swiss-Prot найден мотив, удовлетворяющий паттерну? Все ли последовательности из Вашего выравнивания найдены?
    Фрагмент последовательности R-L-T-I-S-E-G-R-Y-H-Q-V-K-R-M-F 7 (файл с результатом) Нет, из выравнивания найдена только последовательность моего белка
    Сильный [ERLKN]-[VILA]-[VTQI]-[LI]-[FVTHS]-[EQ]-
    G-[KLR]-[NKHY]-[RH]-[EQIV]-[IV]-[RK]-R-[IML]-[FCTAL]
    31 (файл с результатом) Найдены все последовательности из выравнивания
    Слабый X-{YWRKHCMDE}-[VTQINL]-[LIV]-X-[EQDN]-
    G-[KLRIV]-{AG}-[RHK]-[EQIVDNL]-[IVL]-[RKH]-R-[IMLV]-X
    62 (файл с результатом) Найдены все последовательности из выравнивания

    По первому, самому строгому, паттерну (представляющему собой фрагмент последовательности белка RSUA_ECOLI) с помощью PROSITE в базе данных SwissProt было найдено 7 последовательности, 3 из которых - это исходный белок RSUA_ECOLI (просто найденный в разных штаммах бактерии Escherichia coli). Среди оставшихся 4 последовательностей, белки из того же семейства бактерий, что и E.Coli - Enterobacteriaceae.

    В каждую позицию сильного паттерна были поставлены соответсвующие аминокислоты белков выравнивания, поэтому все белки выравнивания были найдены в результате поиске по нему. Помимо этих белков, были найдены белки выполняющие те же функции в организмах различных гамма-протеобактерий.

    Ну и самый мягкий паттерн выдал, разумеется, самое большое количество белков (62 последовательностей). Причем, были найдены белки (A5G913 и A1AV03), которые выполняют совершенно другие функции, что говорит о том, что такой "слабый" паттерн нельзя применять для поиска мотива в возможных гомологах белков.

  • Все описанные в PROSITE мотивы в заданном белке RSUA_ECOLI

    Идентификатор документа PROSITE (AC) Название мотива Краткое описание мотива Тип подписи (паттерн, профиль) Паттерн (регулярное выражение) Специфична ли подпись? Сколько мотивов нашлось в белке? Координаты мотива в белке
    PS50889 S4 S4-РНК связывающий домен (S4 RNA-binding domain profile) Профиль Страница с матрицей Специфична 1 1-68
    PS01149 PSI_RSU Rsu семейство псевдоуридин синтетаз (Rsu family of pseudouridine synthase signature) Паттерн G-R-L-D-x(2)-
    [STA]-x-G-[LIVFA]-
    [LIVMF](3)-[ST]-
    [DNST]
    Специфична 1 99-113
    PS00008 MYRISTYL Сайт N-миристоилирования (N-myristoylation site) Паттерн G-{EDRKHPFYW}-
    x(2)-[STAGCN]-{P}
    Неспецифична 3 12 - 17
    24 - 29
    51 - 56
    PS00006 CK2_PHOSPHO_SITE Cайт фосфорилирования казеинкиназой II (Casein kinase II phosphorylation site) Паттерн [ST]-x(2)-[DE] Неспецифична 3 74 - 77
    177 - 180
    223 - 226
    PS00005 PKC_PHOSPHO_SITE сайт фосфорилирования протеинкиназой C (Protein kinase C phosphorylation site) Паттерн [ST]-x-[RK] Неспецифична 2 118 - 120
    123 - 125
    PS00007 TYR_PHOSPHO_SITE Cайт фосфорилирования тирозинкиназой (Tyrosine kinase phosphorylation site ) Паттерн [RK]-x(2)-[DE]-x(3)- Y or [RK]-
    x(3)-[DE]-x(2)-Y
    Неспецифична 1 125 - 132

© 2008,Илюха Курочкин,Inc