Паттерны и профили

1) Создание паттернов аминокислотных последовательностей

В предыдущей работе было выполнено множественное выравнивание последовательностей белка OMPT_ECOLI и его гомологов.
В формате msf.
Картинка.

Я выбрал фрагмент, для которого создавал паттерны:


Результаты выполнения упражнения представлены в таблице:
Характеристика паттерна Паттерн В скольких последовательностях банка Swiss-Prot найден мотив, удовлетворяющий паттерну? Все ли последовательности из Вашего выравнивания найдены?
Фрагмент последовательности NAGYYVTPNAKVYVEG 2 нет
Сильный [ND]-[AI]-G-Y-Y-[VI]-T-[PS]-[NS]-A-K-[IVF]-[FY]-[AVI]-E-[GF] 5 да
Слабый G-[FY](2)-{DERKH}-[ST]-X(2)-{DERKH}-[KR]-X-[FY] 38 да

Создавая слабый паттерн, я постепенно менял сильный, пока не добился удовлетворяющего меня результата. Вот что я проделывал:

  1. Убрал по паре а.о. с концов.
  2. Поставил X на тех позициях, где были непохожие а.о.
  3. Сделал ослабление за счёт включения похожих а.о., замены которых часто встречаются (F -> [FY], T -> [ST], K -> [RK]).
  4. Ослабил гидрофобную позицию [VI] запретом на заряженные а.о. {DERKH}.
  5. Ослабил A запретом на заряженные а.о. {DERKH}.
Любопытно, что после четвёртого шага было найдено всего 11 а.о., а после пятого уже 38.

Среди множества бактерий в находках по слабому паттерну также оказались белки ресничного простейшего, окуня, мыши, человека и вируса.


2) Все описанные в PROSITE мотивы в заданном белке OMPT_ECOLI

Идентификатор документа PROSITE (AC) Название мотива Краткое описание мотива Тип подписи (паттерн, профиль) Паттерн (регулярное выражение) Специфична ли подпись? Сколько мотивов нашлось в белке?
PS00834 OMPTIN_1 Аспартил протеаза, подпись 1 семейства omptin паттерн W - T - D - x - S - x - H - P - x - T специфична 1
PS00835 OMPTIN_2 Аспартил протеаза, подпись 2 семейства omptin паттерн A - G - Y - Q - E - [ST] - R - [FYW] - S - [FYW] - [TN] - A - x - G - G - [ST] - Y специфична 1
PS00008 MYRISTYL Сайт N-миристоилирования паттерн G-{EDRKHPFYW}-x(2)-[STAGCN]-{P} неспецифична 7
PS00005 PKC_PHOSPHO_SITE Сайт фосфорилирования белковой киназы C паттерн [ST] - x - [RK] неспецифична 6
PS00007 TYR_PHOSPHO_SITE Сайт фосфорилирования тирозиновой киназы паттерн [RK] - x(2) - [DE] - x(3) - Y
либо
[RK] - x(3) - [DE] - x(2) - Y
неспецифична 2
PS00009 AMIDATION Сайт амидирования паттерн x - G - [RK] - [RK] неспецифична 2
PS00004 CAMP_PHOSPHO_SITE Сайт фосфорилирования cAMP- и cGMP-зависимой белковой киназы паттерн [RK](2) - x - [ST] неспецифична 2
PS00006 CK2_PHOSPHO_SITE Сайт фосфорилирования казеиновой киназы II паттерн [ST] - x(2) - [DE] неспецифична 5
PS00001 ASN_GLYCOSYLATION Сайт N-гликозилирования паттерн N - {P} - [ST] - {P} неспецифична 3



© Айдарханов Руслан 2008