Множественное выравнивание последовательностей.

  1. Ознакомление с программой Muscle
  2. Задача – получить выравнивание вирусных белков, называемых "дельта-антигенами", посредством программы muscle и посмотреть на него в GeneDoc.
    1. Воспользовавшись SRS, я составил запрос к банку данных SwissProt: дельта-антигены я искал в вирусах рода "Deltavirus", запрос выглядит так: ([swissprot-Description:delta*] & [swissprot-Taxonomy:Deltavirus*]) .
    2. Было найдено 34 последовательности. Я сохранил их в формате fasta. Вот ссылка. Такое количество последовательностей очень проблематично выровнять вручную,но я всё-таки попробовал "подогнать" хотя бы несколько последовательностей в GeneDoc. Что из этого получилось - смотреть здесь, формат, как обычно, msf, или в виде картинки.
    3. Последовательности, находящиеся в файле "delta.fasta", я выровнял программой muscle:
      muscle -in delta.fasta -out delta_aligned.fasta
    4. Теперь осталось импортировать то что получилось в GeneDoc.
      Множественное выравнивание в формате msf - здесь
      Множественное выравнивание в виде рисунка gif - здесь
    С помощью команды seqret был получен файл fasta с указанными последовательностями

  3. Выравнивание набора гомологов своего белка
  4. C помощью BLAST в банке SwissProt были найдены гомологи белка CISY_ECOLI. E-value не больше 0.001, чтобы исключить возможность появления негомологичных белков. Меня интересовали выравнивания с процентом идентичности не более 90, то есть найденные белки были не должны быть слишком близки моему. Список белков, выбранных мной из выданных BLAST, выданный мне белок стоит на первом месте этого списка:
    sw:CISY_ECOLI
    sw:CISY_SYNY3
    sw:CISY_CAEEL
    sw:CISY2_YEAST
    sw:CISY_CANTR
    sw:CISY_LEIMA
    sw:CISY_TETAD
    sw:CISY_DAUCA
    sw:CISY_BAREL
    

    С помощью команды seqret был получен файл fasta с указанными последовательностями:
    seqret @myproteins.list myproteins.fasta
    
    Для выравнивания этих последовательностей воспользуемся muscle:
    muscle -in myproteins.fasta -out myproteins_aligned.fasta
    
    Получен файл в формате fasta
    В GeneDoc выравнивание выглядит следующим образом

    Выравнивание было проведено относительно последнего в указанном выше списке белка.
    В белках есть участки с повышенной долей консервативных позиций:
    - координаты по остаткам моего белка 226-273,; координаты по столбцам выравнивания 283-331

    Участки с меньшей долей консервативных позиций, вряд ли они имеют биологический смысл:
    - координаты по остаткам моего белка 46-102,; координаты по столбцам выравнивания 80-143

    - 165-174 по остаткам моего белка; координаты по столбцам выравнивания 219-228

    - 245-257;376-388

    - 357-369;432-444

    Участок с малой долей консервативных позиций (выравнивание не имеет биологического смысла):
    - 1-45;1-79


Назад