Учебный сайт Люды Андреевой


Работа в командной строке Linux

Рассмотрим некоторые команды, часто используемые в работе в командной строке Linux.

Стоит заметить, что для облегчения работы можно воспользоваться следующими клавишами:

Сравнение оптимальных глобального и локального выравниваний

Программы needle и water пакета Emboss позволяют построить оптимальные глобальное и локальное выравнивания аминокислотных последовательностей. В них также можно задать некоторые параметры выравнивания, а именно штраф за открытие нового гэпа (gap_penalty) и за последующие пробелы в гэпе (extend_penalty).
Мной выравнивались аминокислотные последовательности белков bioh_ecoli и bioh_neimb.

  1. Сравнение глобальных выравнваний
    При построении глобального выравнивания с помощью программы needle зададим два варианта параметров и получим два выравнивания, в первом из которых штраф за открытие гэпа равен 10, а за его продолжение - 0.5. Во втором же выравнивании увеличим эти параметры вдвое: gap_penalty=20, extend_penalty=1. Сравним получившиеся выравнивания. Рассмотрим первое из выраниваний:


    В нём легко обнаружить 4 гэпа, последовательности сильно сдвинуты друг относительно друга (особенно это заметно в начале выравнивания).
    Теперь посмотрим на выравнивание, характеризующееся вдвое большими значениями штрафов:


    Это выравнивание содержит лишь один короткий (2 символа) гэп, и последовательности практически просто "положены" друг под другом.
    На рисунках красным обозначены совпадения и положительные замены. Зелёным обведены участки, не совпадающие в выравниваниях.
    Как видно из рисунков, существует множество неодинаковых сопоставлений позиций аминокислот. Первое выравнивание можно представить себе как искажённое второе: в каких-то местах образуется гэп, сдвигающий позиции друг относительно друга, что приводит к необходимости поиска других совпадений и замен. Однако больше половины выравнивнивания совпадают в needle1 и needle2. Причём именно к этой большей части относятся наиболее продолжителные последовательности совпадений и положительных замен, которые могли бы свидетельствовать о схожих активных центрах белков. Таким образом, разные параметры выравнивания не сильно влияют на сопоставление наиболее схожих частей аминокислотных последовательностей.
  2. Сравнение локальных выравниваний
    С помощью программы water пакета Emboss построим локальные выравивания аминокислотных последовательностей белков bioh_ecoli и bioh_neimb. При этом зададим два варианта параметров, тех же, что и при построении глобалных выравниваний: шрафы за открытие гэпа и за его продолжение.
    В первом выравнивании примем автоматические значения (gap_penalty=10, extend_penalty=0.5), а во втором уменьшим значения вдвое (gap_penalty=5, extend_penalty=0.25).
    Рассмотрим первое выравнивание:


    Обратим внимание, что это выравнивание короче глобальных (части последовательностей в начале и в конце обрезаны). Кроме того, в нём присутствует только 2 гэпа.
    Рассмотрим теперь второе выравнивание:


    В нём присутствуют 26 небольших гэпов, и это гораздо больше, чем в первом выравнивании.
    На рисунках красным обозначены совпадения и положительные замены; зелёным обведены участки выравниванй, отличающиеся в water1 и water2. Из рисунков видно, что в выравниваниях water1 и water2 участвуют разные фрагменты исходных аминокислотных последовательностей, причём во втором выравнивании они длиннее (в water1 участвуют 231 аминокислота белка bioh_ecoli и 230 - белка bioh_neimb, а в water2 - 239 и 232 аминокислот соответственно). Очевидно, что одними и тем же позициям последовательности bioh_ecoli чуть больше, чем в половине случаев, соответсвуют одинаковые в обоих выравниваниях позиции последовательности bioh_neimb. В остальных же случаях наблюдаются вариации: определённой позиции bioh_ecoli в разных локальных выравниваниях сопоставляются либо разные позиции bioh_neimb, либо пробелы, ричём в примерно равных количествах. В итоге выравнивания сильно отличаются, при этом во втором выравнивании малый штраф за открытие гэпа позволяет найти больше положительных замен, и вес второго выравнивания (340,5) оказывается больше, чем первого (280).
    Однако стоит заметить, что участки рядом стоящих совпадений и положительных замен, длиной не менее трёх символов, одинаковы в обоих выравниваниях.
    Сравним теперь локальные выравнивания с соответствующими фрагментами глобальных выравниваний.
    Выравнивание water1 полностью идентично соответствующему участку needle1,в том числе и потому, что параметры, заданные для выравнианий, были одинаковы. По этой причине water1 отличается от needle2 только теми участками, что различны у needle1 и needle2(см. выше). Этим же объясняется тот факт, что различия между water2 и needle1 те же, что и между двумя локальными выравниваниями.
    Сравнивая water2 с needle2, можно заметить, что выравнивания сходны лишь в участках, характеризующихся большим числом подряд идущих совпадений и положительных замен (эти участки совпадают у всех представленных выше выравниваний). В остальном эти выравнивания совпадают мало, причём локальное выравнивание water2 характеризуется большим, чем needle2 количеством положительных замен, и, как следствие, большим, чем needle2 (229), весом выравнивания, равным 340.5.

Мной также были выполнены дополнительные задания.


©Andreeva_2008