Программы построения выравниваний

Второй семестр На главную
Белок в банках данных Работа с SRS Выравнивание вручную Матрицы замен
Были подготовлены 3 файла с аминокислотными последовательностями:
  1. myprot.fasta - последовательность моего белка;
  2. secondprot.fasta - последовательность белка BLC3_SALTY;
  3. thirdprot.fasta - кусок последовательности моего белка.

Выравнивание последовательностей возможных гомологов.

Глобальное выравнивание последовательностей из файлов myprot.fasta и secondprot.fasta с помощью алгоритма Нидельмана-Вунша находится в файле 1to2.needle.
Локальное выравнивание тех же последовательностей с помощью алгоритма Смита-Ватермана находится в файле 1to2.water.

Параметры, при которых проводилось выравнивание:

Сравнение выравниваний:

Выравнивание последовательностей, содержащих общие участки

Глобальное выравнивание последовательностей из файлов myprot.fasta и thirdprot.fasta содержится в файле 1to3.needle;
Локальное выравнивание тех же последовательностей с использованием алгоритма Смита-Ватермана находится в файле 1to3.water;
3 локальных выравнивания с наибольшим весом, сделанные с помощью программы matcher, находятся в файле 1to3.matcher.

Работа с программой matcher

В файле находятся сразу 3 выравнивания.
Первое из выравниваний имеет следующие характеристики:
Это соответствует выравниванию со вторым куском последовательности из файла thirdprot.fasta, однако оно не дало точного совпадения. Первые аминокислоты в последовательностях различаются, однако остальная часть последовательности одинакова. Получается выравнивание из 13 аминокислот.
Второе из выравниваний имеет следующие характеристики:
Это выравнивание в точности соответствует первому куску из ampC_ECOLI, который находится в файле thirdprot.fasta, что объясняет 100% идентичность.
Третье из выравниваний имеет следующие характеристики:
Это выравнивание не является выравниванием, отображающим истинную гомологию последовательностей, т.к. выравнивание не соответствует выбранным кускам, взятым из последовательности ampC_ECOLI для формирования последовательности thirdprot

Сравнение результатов:
Очевидно, что программы needle и water работают по другому принципу, нежели matcher. Это можно заключить из внешнего вида выравниваний, а также из характеристик выравниваний.

Параметры программ построения выравниваний:
Мы сравниваем глобальные выравнивания последовательностей из файлов myprot.fasta и thirdprot.fasta с использованием алгоритма Нидельмана-Вунша с разными параметрами штрафов за гэпы.
Чем меньше штраф за гэп, тем больше вес выравнивания: 73, 61 и 56 соответственно.

Ссылки на файлы:


Различие между файлами небольшое:
В фале с штрафом за гэп 1, есть двойной гэп и после некоторого промежутка одинарный.
В файле же с штрафом в 5 и 10 за гэп такого разиения нет, а есть 1 гэп на 3 аминокислоты.
Вес выравнивания уменьшается с увеличением штрафа а гэп.

Карта локального сходства.

С помощью программы dotmatcher были построены карты локального сходства последовательностей из файлов myprot.fasta и thirdprot.fasta с разными параметрами.
Каждая линия, отображенная на карте, соответствует локальному выравниванию последовательностей.
Параметр "Порог" определяет минимальный вес выравнивания, необходимый для того, чтобы оно отобразилось на карте.
При уменьшении параметра "Окно" количество линий становится больше, а их длина - короче.

Ссылки на карты:

  1. карта 1
  2. карта 2
  3. карта 3

Сравним карты:
На первой карте мы видим 2 полосы.
На второй карте мы не видим ни одной полосы, т.к. поро очень высокий.
На третьей катре мы видим множество полос, т.к. порог очень низкий.


©Виктор Соколов