Создание паттернов для поиска и распознавания аминокислотных последовательностей

На главную страницу второго семестра

  1. Вспомогательная работа. Создание множественного выравнивания белка AAT_ECOLI и его ортологов.

      Для выполнения основного задания (поиска гомологов моего белка по паттернам) необходимо было первоначально найти (каким-то иным способом) несколько "стартовых" гомологов и определить более-менее общую для них и моего белка последовательность, на основе которой в дальнейшем создавались паттерны. С этой целью было осуществлено следующее:

    • Поиск с помощью BLASTP в БД Swiss-Prot ортологов моего белка AAT_ECOLI (будем считать ортологами белки с одинаковыми или близкими названиями, например, AAT1 и AAT4) и выбор среди них пяти "представителей", отвечающих данным требованиям процента идентичности и e-value.

    • Построение множественного выравнивания полученных шести последовательностей (AAT_ECOLI + 5 ортологов) с помощью программы muscle.

    • Импортирование полученного выравнивания в редактор GeneDoc (для удобства), и выбор участка последовательности с достаточно высоким уровнем консервативности. Был выбран отрезок из шестнадцати аминокислот. Он приведен ниже:
                                                                                   
                                                *       1 0         *              
      A A T 4 _ A R A T H       1   :   Q C L S G T G S L R V G A E F L   :     1 6
      A A T 1 _ M E D S A       1   :   Q G L S G T G S L R V G G E F L   :     1 6
      A A T C _ O R Y S A       1   :   Q C L S G T G S L R V G G E F L   :     1 6
      A A T C _ D A U C A       1   :   Q C L S G T G S L R V G G E F L   :     1 6
      A A T _ E C O L I         1   :   Q T P G G T G A L R V A A D F L   :     1 6
      A A T _ P S E A E         1   :   Q A V G G T G A L K L G A D F L   :     1 6
                                        Q       G T G   L 4 6 g     F L            

    • Насчет цветовых обозначений – см.первый и третий столбцы таблицы 1 страницы-отчета за первый практикум этого блока

      

  2. Создание паттернов по множественному выравниванию. Поиск белков по написанным паттернам в базе данных Swiss-Prot.

    Как создавались паттерны.

       Первый паттерн был "создан" с помощью сочетания клавиш Ctrl-C/Ctrl-V. Это никак не измененный (кроме. пожалуй, вставки дефисов) участок последовательности моего белка AAT_ECOLI длиной 16 а.о.

       Второй паттерн – сильный – написан уже по правилам создания паттернов

    Таблица 1.

    Характеристика паттерна Паттерн В скольких последовательностях БД Swiss-Prot найден мотив, удовлетворяющий паттерну? Все ли последовательности из созданного ранее выравнивания найдены?
    Фрагмент последовательности Q-T-P-G-G-T-G-A-L-R-V-A-A-D-F-L В одной – последовательности моего белка AAT_ECOLI, из которой и был взят короткий участок, использовавшийся как запрос при поиске Нет, только одна (AAT_ECOLI)
    Сильный
    Q-[CGTA]-[LVP]-[SG]-G-T-G-[SA]-L-[RK]-[VL]-[GA]-[AG]-[ED]- F-L
    В семи Да, среди семи найденных последовательностей шесть нам уже знакомы
    Слабый
    Q-X-{KDER}-[SG]-G-T-G-[SA]-L-{AVLIGED}- {KDERH}-[GA]-[AG]-{AVLICP}-F-L
    В двадцати трех Да

      

  3. Комментарии и замечания.

      


© Ганчарова Ольга