Для выполнения основного задания (поиска гомологов моего белка по паттернам) необходимо было первоначально найти (каким-то иным способом) несколько "стартовых" гомологов и определить более-менее общую для них и моего белка последовательность, на основе которой в дальнейшем создавались паттерны. С этой целью было осуществлено следующее:
  |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |
  |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   | * |   |   |   | 1 | 0 |   |   |   |   | * |   |   |   |   |   |   |   |
A | A | T | 4 | _ | A | R | A | T | H |   |   |   | 1 |   | : |   | Q | C | L | S | G | T | G | S | L | R | V | G | A | E | F | L |   | : |   |   | 1 | 6 |
A | A | T | 1 | _ | M | E | D | S | A |   |   |   | 1 |   | : |   | Q | G | L | S | G | T | G | S | L | R | V | G | G | E | F | L |   | : |   |   | 1 | 6 |
A | A | T | C | _ | O | R | Y | S | A |   |   |   | 1 |   | : |   | Q | C | L | S | G | T | G | S | L | R | V | G | G | E | F | L |   | : |   |   | 1 | 6 |
A | A | T | C | _ | D | A | U | C | A |   |   |   | 1 |   | : |   | Q | C | L | S | G | T | G | S | L | R | V | G | G | E | F | L |   | : |   |   | 1 | 6 |
A | A | T | _ | E | C | O | L | I |   |   |   |   | 1 |   | : |   | Q | T | P | G | G | T | G | A | L | R | V | A | A | D | F | L |   | : |   |   | 1 | 6 |
A | A | T | _ | P | S | E | A | E |   |   |   |   | 1 |   | : |   | Q | A | V | G | G | T | G | A | L | K | L | G | A | D | F | L |   | : |   |   | 1 | 6 |
  |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   | Q |   |   |   | G | T | G |   | L | 4 | 6 | g |   |   | F | L |   |   |   |   |   |   |
Как создавались паттерны.
Первый паттерн был "создан" с помощью сочетания клавиш Ctrl-C/Ctrl-V. Это никак не измененный (кроме. пожалуй, вставки дефисов) участок последовательности моего белка AAT_ECOLI длиной 16 а.о.
Второй паттерн сильный написан уже по правилам создания паттернов
Таблица 1.
Характеристика паттерна
Паттерн
В скольких последовательностях БД Swiss-Prot
найден мотив, удовлетворяющий паттерну?
Все ли последовательности из созданного ранее выравнивания найдены?
Фрагмент последовательности
Q-T-P-G-G-T-G-A-L-R-V-A-A-D-F-L
В одной
последовательности
моего белка AAT_ECOLI, из которой и был взят короткий участок, использовавшийся как запрос при поиске
Нет, только одна (AAT_ECOLI)
Сильный
Q-[CGTA]-[LVP]-[SG]-G-T-G-[SA]-L-[RK]-[VL]-[GA]-[AG]-[ED]-
F-L В семи
Да, среди семи найденных последовательностей шесть нам уже знакомы
Слабый
Q-X-{KDER}-[SG]-G-T-G-[SA]-L-{AVLIGED}-
{KDERH}-[GA]-[AG]-{AVLICP}-F-L В двадцати трех
Да