На главную страницу второго семестра

Работа с базой данных ProSite

Составление паттерна белка

Фрагмент множественного выравнивания белка PHOQ_ECOLI с его потенциальными ортологами
                                                                       
                                                    *                  
R E S E _ B A C S U     1   :   S H E L R T P I S M L Q G Y   :   1 4
Y Y C G _ B A C S U     1   :   S H E L R T P L T T M R S Y   :   1 4
B A E S _ E C O L I     1   :   S H E L R T P L A V L R G E   :   1 4
C I A H _ S T R R 6     1   :   S H E L R T P L A V L Q N R   :   1 4
R S T B _ E C O L I     1   :   A H E L R T P L V R L R Y R   :   1 4
C U S S _ E C O 5 7     1   :   A H E I R T P I T N L I T Q   :   1 4
C O P S _ P S E S M     1   :   A H E L R T P I S N L R T H   :   1 4
P H O Q _ E C O L I     1   :   T H S L K T P L A V L Q S T   :   1 4
P R R B _ M Y C B O     1   :   S H E L R T P L T A M R T N   :   1 4
S A S A _ P R O M A     1   :   A H E L R T P L S A A K L A   :   1 4
C S S S _ B A C S U     1   :   S H D L K T P V M V I R G Y   :   1 4
                                    H e l r T P                        
По данному фрагменту был составлен паттерн:
[SAT]-H-[ESD]-[LI]-[RK]-T-P-[ILV]-[STAVM]-x(1)-[IMLA]-[QRIK]-x(1)-{G}
В результате поиска было найдено 30 последовательностей, удовлетворяющих данному паттерну. Из 10 последовательностей потенциальных ортологов белка PHOQ_ECOLI были найдены все.
Удивительно, но все найденные белки относятся к классу сенсорных белков, их описания схожи с описанием исследуемого белка.

Известные сайты и мотивы в белке PHOQ_ECOLI

Идентификатор документа PROSITE(AC) Идентификатор документа с описанием мотива Название мотива Тип подписи (паттерн, профиль) Паттерн (регулярное выражение) Насколько подпись специфична? Сколько мотивов нашлось в белке?
PS50885 PDOC50885 HAMP domain profile профиль ? ? 1
PS50109 PDOC50109 Histidine kinase domain profile профиль ? ? 1
PS00005 PDOC00005 Protein kinase C phosphorylation site паттерн [ST]-x-[RK] Не специфичен 14
PS00001 PDOC00001 N-glycosylation site паттерн N-{P}-[ST]-{P} Не специфичен 3
PS00006 PDOC00006 Casein kinase II phosphorylation site паттерн [ST]-x(2)-[DE] Не специфичен 6
PS00029 PDOC00029 Leucine zipper pattern паттерн L-x(6)-L-x(6)-L-x(6)-L Специфичен 1
PS00008 PDOC00008 N-myristoylation site паттерн G-{EDRKHPFYW}-x(2)-[STAGCN]-{P} Не специфичен 6
PS00007 PDOC00007 Tyrosine kinase phosphorylation site паттерн [RK]-x(2)-[DE]-x(3)-Y or [RK]-x(3)-[DE]-x(2)-Y Есть белки, не принадлежащие к семейству 1
PS00003 PDOC00003 Tyrosine sulfation site паттерн ? ? 1





© Низамутдинов Игорь, 2004