В предыдущей работе было выполнено множественное выравнивание
последовательностей белка OMPT_ECOLI и его гомологов.
В формате msf.
Картинка.
Я выбрал фрагмент, для которого создавал паттерны:
Результаты выполнения упражнения представлены в таблице:
Характеристика паттерна | Паттерн | В скольких последовательностях банка Swiss-Prot найден мотив, удовлетворяющий паттерну? | Все ли последовательности из Вашего выравнивания найдены? |
Фрагмент последовательности | NAGYYVTPNAKVYVEG | 2 | нет |
Сильный | [ND]-[AI]-G-Y-Y-[VI]-T-[PS]-[NS]-A-K-[IVF]-[FY]-[AVI]-E-[GF] | 5 | да |
Слабый | G-[FY](2)-{DERKH}-[ST]-X(2)-{DERKH}-[KR]-X-[FY] | 38 | да |
Создавая слабый паттерн, я постепенно менял сильный, пока не добился удовлетворяющего меня результата. Вот что я проделывал:
- Убрал по паре а.о. с концов.
- Поставил X на тех позициях, где были непохожие а.о.
- Сделал ослабление за счёт включения похожих а.о., замены которых часто встречаются (F -> [FY], T -> [ST], K -> [RK]).
- Ослабил гидрофобную позицию [VI] запретом на заряженные а.о. {DERKH}.
- Ослабил A запретом на заряженные а.о. {DERKH}.
Среди множества бактерий в находках по слабому паттерну также оказались белки ресничного простейшего, окуня, мыши, человека и вируса.
2) Все описанные в PROSITE мотивы в заданном белке OMPT_ECOLI
Идентификатор документа PROSITE (AC) | Название мотива | Краткое описание мотива | Тип подписи (паттерн, профиль) | Паттерн (регулярное выражение) | Специфична ли подпись? | Сколько мотивов нашлось в белке? |
PS00834 | OMPTIN_1 | Аспартил протеаза, подпись 1 семейства omptin | паттерн | W - T - D - x - S - x - H - P - x - T | специфична | 1 |
PS00835 | OMPTIN_2 | Аспартил протеаза, подпись 2 семейства omptin | паттерн | A - G - Y - Q - E - [ST] - R - [FYW] - S - [FYW] - [TN] - A - x - G - G - [ST] - Y | специфична | 1 |
PS00008 | MYRISTYL | Сайт N-миристоилирования | паттерн | G-{EDRKHPFYW}-x(2)-[STAGCN]-{P} | неспецифична | 7 |
PS00005 | PKC_PHOSPHO_SITE | Сайт фосфорилирования белковой киназы C | паттерн | [ST] - x - [RK] | неспецифична | 6 |
PS00007 | TYR_PHOSPHO_SITE | Сайт фосфорилирования тирозиновой киназы | паттерн | [RK] - x(2) - [DE] - x(3) - Y либо [RK] - x(3) - [DE] - x(2) - Y |
неспецифична | 2 |
PS00009 | AMIDATION | Сайт амидирования | паттерн | x - G - [RK] - [RK] | неспецифична | 2 |
PS00004 | CAMP_PHOSPHO_SITE | Сайт фосфорилирования cAMP- и cGMP-зависимой белковой киназы | паттерн | [RK](2) - x - [ST] | неспецифична | 2 |
PS00006 | CK2_PHOSPHO_SITE | Сайт фосфорилирования казеиновой киназы II | паттерн | [ST] - x(2) - [DE] | неспецифична | 5 |
PS00001 | ASN_GLYCOSYLATION | Сайт N-гликозилирования | паттерн | N - {P} - [ST] - {P} | неспецифична | 3 |