Главная страница второго семестра

Программы построения выравниваний

Выравнивание последовательностей со схожей функцией

В задании требовалось сравнить выравнивания последовательностей двух белков (в моем случае aroG_Ecoli и Q9KU34_VIBCH).

В результате выравнивания(1) последовательностей программой Needle(глобального выравнивания) идентичность белков составила 49.9%, а выравнивания(2) программой Water(локального выравнивания) - 54.0%. Естественно вес выравнивания программой Water больше. По моему мнению это можно объяснить тем, что в программе Needle выравнивание начинается с первого аминокислотного остатка, а если начало одной белковой последовательности не совпадает с началом другой, то ставятся gaps, т.к. выравнивание происходит по алгоритму Нидельмана-Вунша, в то время как в программе Water выравнивание построено по алгоритму Смита-Ватермана и начинается с первых совпадающих аминокислотных остатков.

Выравнивание последовательностей, содержащих общие участки

Задание состояло в том, чтобы с помощью трех программ (Needle, Water и Matcher) создать выравнивая последовательности белка aroG_Ecoli и искусственно созданной последовательности аминокислот из двух кусков последовательности белка aroG_ecoli.

Программа Needle сравнивала всю огромную аминокислотную последовательность белка с искусственной последовательностью, поэтому в результате получилось очень невыгодное выравнивание(1), и идентичность составила 6.6%, но само выравнивание получилось верным, программа разбила искусственную последовательность на два куска и правильно нашла нужные участки. Используя программу Water, я получила выравнивание(2) куска последовательности белка, в котором нашлись совпадения с искусственной последовательностью, идентичность составила 22.1%, выравнивание тоже получилось верным. С помощью программы Matcher можно составлять много вариантов выравнивания(3) и находить наиболее выгодные, при этом программа сравнивает отдельные(как бы вырезанные) части последовательностей, между которыми не ставятся gaps, что я нахожу очень удобным; идентичность трех лучших вариантов составила 100%, 75% и 50%, два первых являются отрезками моего белка.

Параметры программ построения выравниваний.

Здесь нужно было сделать выравнивания тех же последовательностей, что и в предыдущем задании, программой Needle, но используя разные штрафы за открытие gap, результаты выравниваний сравнить.

Когда штраф за открытие gap составлял 10, то программа составила выравнивание(1), в котором последовательность белка была представлена без gaps, а искусственная последовательность только с начальными и конечными gaps, таким образом штраф за открытие gap получался всего 2 раза, но вес составил 60.0, а выравнивание, конечно, получилось неправильным. При выравнивании(2) последовательностей со штрафом за gap 5 программа Needle открыла gaps 5 раз, считая начальные и конечные, вес равен 65.0, а с штрафом за gap 1 выравнивание(3) содержало 8 открывающих gaps, и вес - 81.0. При обычном выравнивании программой Needle этих последовательностей вес составляет 70.5 и само выравнивание наиболее правильно. Можно сделать вывод, что в программе Needle выравнивание составляется так, чтобы оно имело наибольший вес, но в результате эти выравнивания не получаются правильными.

Карты локального сходства

Требовалось построить карты локальных сходств с помощью программы Dotmatcher при разном наборе параметров размера окна и порога на суммарный вес и сравнить.

Я сделала три карты локальных сходств. При наборе размера окна 7 и порога на суммарный вес 10 на карте обозначилось много штрихов разной длины, но не доходящих до границ прямоугольника (рис.1), когда параметр размер окна был равен 11, а порог на общий вес - 18, то получилось всего пять штрихов, не доходящих до границ прямоугольника (рис.2). В случае, когда размер окна был равен 20, а порог на общий вес - 13, на карте было всего 2 штриха, доходящих до границ прямоугольника (рис.3). Следовательно, при увелечении размера окна увеличивается длина штрихов, которые определяют количество аминокислот, а при увелечении порога общего веса уменьшается количество штрихов, которое отвечает за количество участков, при выравнивании имеющих вес больше, чем указанный параметр. Чтобы увидеть все выравнивания на карте, нужно ввести минимальный пороговый вес и размер окна, соответствующий наиболее короткому выравниванию, а чтобы найти какие-то конкретные выравнивания, нужно ввести конкретный размер окна.


©Надя Шашина