На главную страницу второго семестра

Создание паттернов для поиска и распознавания аминокислотных последовательностей.

  В качестве гомологов белка DEOC_ECOLI были взяты следующие белки:

IDIdentityE-scoreОрганизм
DEOC_VIBCH831e-101Vibrio cholerae
DEOC_SHEON712e-80 Shewanella oneidensis
DEOC_CHRVO674e-80 Chromobacterium violaceum
DEOC_AGRT5552e-58 Agrobacterium tumefaciens
DEOC_BACCR412e-22 Bacillus cereus


  У всех description "Deoxyribose-phosphate aldolase (Phosphodeoxyriboaldolase) (Deoxyriboaldolase) (DERA)".

Фрагмент выравнивания, по которому строились паттерны:

                                                                         
                                            *                            
D E O C _ E C O L I   :   A G A D F I K T S T G K V A V N A T   :     1 8
D E O C _ V I B C H   :   A G A D F I K T S T G K V P V N A T   :     1 8
D E O C _ S H E O N   :   A G A D F I K T S T G K V P V N A T   :     1 8
D E O C _ C H R V O   :   A G A D F I K T S T G K V P V N A T   :     1 8
D E O C _ A G R T 5   :   E G A D F I K T S T G K V A V N A T   :     1 8
D E O C _ B A C C R   :   A G A D F V K T S T G F S T G G A T   :     1 8
                          a G A D F 6 K T S T G k v   v n A T            


Результаты поиска по паттернам в банке данных Swiss-Prot:



Характеристика паттерна Паттерн В скольких последовательностях банка Swiss-Prot найден мотив, удовлетворяющий паттерну? Все ли последовательности из Вашего выравнивания найдены?
Фрагмент последовательности AGADFIKTSTGKVAVNAT 4 (из них 1 - DEOC_ECOLI, еще две последовательности из того же организма и последняя - из Shigella flexneri). только мой белок DEOC_ECOLI.
Сильный [AE]-GADF-[IV]-KTSTG-[KF]-[VS]-[APT]-[VG]-[NG]-AT 28 (DERA: 1 из Agrobacterium tumefaciens, 6 из Bacillus, 1 из Chromobacterium violaceum, 1 из Shewanella oneidensis, 3 из Escherichia coli, 3 из Vibrio,по 2 из Salmonella и Streptococcus,по 1 из Clostridium, Lactobacillus, Photorhabdus и Shigella; DERA1: 1 из Vibrio; DERA2: 1 из Bacillus, 1 из Vibrio, 2 из Yersinia). все 5.
Слабый GADF-[IVL]-KTSTG-X-[VSAILMNQ]-{WFYH}-X(2)-AT 58 (DEOC, DEOC1 и DEOC2). все 5.


Комментарий к таблице

  Был проведен поиск последовательностей банка Swiss-Prot, включающих мотивы, соответствующие каждому из терх паттернов. Паттерны были созданы следующим образом:
  1. Первый паттерн в точности является фрагментом последовательности белка DEOC_ECOLI. Он нашел последовательности моего белка под различными названиями, а также последовательность из Shigella flexneri с таким же участком.
  2. Второй ("сильный") паттерн я постарался построить так, чтобы он распознавал все белки выборки, и только их. В действительности паттерн нашел вдобавок те же последовательности под другими названиями и ряд белков из других организмов.
  3. Третий ("слабый") паттерн создан на основе второго смягчением требований к последовательности. В результате найдено 58 белков с началом в ID вроде DEOC.
  Как проводить поиск см. подсказку.


©Хайруллин Альберт