На главную страницу второго семестра.

Программы построения глобального и локального выравнивания


Для выполнения задания были подготовлены три файла с аминокислотными последовательностями в FASTA формате:
  1. myprot.fasta - аминокислотная последовательность вашего белка;
  2. secondprot.fasta - последовательность одного из белков, найденных мной при выполнении заданий 4 и 5 занятия 2;
  3. thirdprot.fasta - искусственно созданная последовательность, склеенная из двух небольших (10-12 букв каждый) участков аминокислотной последовательности моего белка.

Последующие действия выполнялись на сервере kodomo-count.cmm.msu.ru.

1. Выравнивание последовательностей со схожей функцией (возможных гомологов)

  1. Первым делом мы построили глобальное выравнивание последовательностей из myprot.fasta и secondprot.fasta с помощью программы needle. Результат сохранили в файле 1to2.needle.
  2. Затем построили локальное выравнивание последовательностей из myprot.fasta и secondprot.fasta с помощью программы water и сохранили результат в файле 1to2.water.
Результаты:
Общие параметры программ были заданы по умолчанию и мы видим, что они одинаковы. Мой белок не большой и с белком BIOD1_HAEIN имеет высокий процент сходства(39.5%), поэтому различий между локальным Cсылка на локальное выравнивание и глобальнымCсылка на глобальное выравнивание выравниванием не так много, но они все же есть. Во-первых, в локальном выравнивании выбран участок, который обладал максимальной гомологией ( понятно, что вес локального выравнивания всегда будет выше), поэтому в выравнивании не было первых 3 аминокислот моего белка и 3 BIOD1_HAEIN, а так же последних 7 аминокислот в моем и 16 в BIOD1_HAEIN белке. Во-вторых, не на много изменилось количество идентичных и схожих аминокислот (со 92 до 90 и с 137 до 134), при этом изменился процент идентичности, сходства и гэпов. Вместе со всем этим изменился и общий счет выравнивания (с 416.5 до 420.5), стал больше, так как не были учтены концы.

2. Выравнивание последовательностей, содержащих общие участки


  1. Аналогично предыдущему заданию построили глобальное выравнивание последовательностей из myprot.fasta и thirdprot.fasta с помощью программы needle. Результат сохранили в файле 1to3.needle, затем построили локальное выравнивание последовательностей из myprot.fasta и thirdprot.fasta с помощью программы water и сохранили результат в файле 1to3.water.
  2. Построили локальное выравнивание последовательностей из myprot.fasta и thirdprot.fasta с помощью программы matcher с выводом трех наилучших вариантов. Результат сохраните в файле 1to3.matcher. Результаты: Мы получили различные варианты построения выравнивания, при глобального выравнивании машина нашла один кусочек последовательности и второй кусок посчитала гомологичным рядом лежащему участку моего белка,Cсылка на выше описанное выравнивание и общий счет составил 51.0;во втором случае (локальное выравнивание)Cсылка на выше описанное выравнивание выровнялся только первый участок,видимо программа не заметила второй, т.к. он сильно отстоял от первого. В резулььтате мы получили счет 59. При выранивании с помощью программы matcher мы получили три наилучших локальных выравнивания: одно из них совпадало с локальным выравниванием через программу water, другое - второй выбранный мной кусок из моего белка, а третье выравнивание было сравнительно неудачным по сравнению с предыдущими (59, 49, Т.к. второй участок 10 а.о., а первый 12 а.о.; 15) и представляло случайное совпадение. Cсылка на выше описанное выравнивание

3. Параметры программ построения выравниваний

В эотм задании было построены глобальные выравнивания последовательностей из myprot.fasta и thirdprot.fasta с помощью программы needle при разных значениях параметра штрафа за открытие гэпа. Значение штрафа за продолжение гэпа установите равным 1. Полученные результаты находятся ниже.
Результаты:
Параметрами штрафа за открытие гэпа были выбраны чмсла 10, 5, 1. В первом случае (10), общий счет выравнивания составил 50.0, при этом выравниавние было сделано таким образом, что кусочки последовательности находились на небольшом расстоянии, дело в том, что я брал два куска лежащих на большом расстоянии, поэтому программа не поставила их в соответствие с местами, откуда они были взяты (будь это расстояние меньше, программа наверняка поставила бы их в соответствие), также надо добавить, что короткая последовательность все же была разделена на две части, так как оказалось, что помимо полного соответствия второго куска, для первого так же нашлось три одинаковые и две близкая аминокислоты, именно поэтому последовательности были разделены не смотря на большой штраф за гэп. Cсылка на выше описанное выравнивание
Во втором случае (5), общий счет выравнивания составил 60.0, выравнивание сделано так же как в предыдущем случае, Так как за открывающие гэпы снималось меньше то и счет оказаля больше.Cсылка на выше описанное выравнивание
В третьем случае (1), штрафы за гэп открывающий и продолжающий были равны, а соответственно программа построила просто выравнивание такое, чтобы как можно больше аминокислот совпадало, выравнивание изменилось несильно, его было тяжело улучшить за счет участков расположенных в окрестности, и счет (76) изменился в том числе и из-за того, что штраф за открывающий гэп был еще ниже.Cсылка на выше описанное выравнивание

4. Карта локального сходства

Построили карту локального сходства последовательностей из myprot.fasta и thirdprot.fasta с помощью программы dotmatcher, построения проводились при различных параметрах: размер окна, порог на суммарный вес. Результаты занесены в таблицу:
Размер окна Порог на суммарный вес Результаты
10 23 Первая карта была построена при стандартных условиях, в результате мы получили выравнивание последовательности, чтобы ее вес был не менее 23, а размер окна 10, то есть программа выравние проводилось по участкам в 10 аминокислот. Так же мы можем глядя на карту сказать, где расопложены совпадающие последовательности.
3 23 В результате мы ничего не получили, по-видимому, программа искала таким образом, чтобы порог счета за выравнивание по трем аминокислотам составлял не менее 23, а такого не могло быть, так как за суммарное совпадение давали меньше, для проверки этого предположения следует провести поиск с меньшим значением порога.
3 15 При данном значении порога программа вновь показывает выравнивание, поэтому сделанное предположение, по-видимому, верно, то есть мы видим участоки маинокислотных последовательностей, которые совпадают по тройкам, при которых значение Score для каждой тройки больше 15.
22 23 В данном случае мы сделали размер окна 22 и искали по последовательности такие участки, где счет более 23, программа выдала нам 2 участка по 22 аминокислоты, при этом мы знаем, что в этих участках всего по 11 совпадающих аминокислот, но так как размер окна 22, то нам и показывают весь участок в 22 аминокислоты.
23 23 Мы зашли за порог окна на экране, но программа продолжает показывать линии.
29 23 Это значение, начиная с которого программа выдает непонятную картину, которая к делу не относится.
12 50 Данные значения выбраны не случайно, 12 - число аминокислот полностью совпадающих,при этом мы видим два выравнивания.