Учебный сайт
Ромащенко Валерии


Работа в командной строке Linux


Смена активной директории и просмотр содержимого директорий.

1. Команда "ls" показывает все файлы и папки, которые находятся в активной директориию
2. Команда "ls .." отображает содержимое вышестоящей директории.
3. Команда "cd .." переносит меня в вышестоящую директорию.
4. Команда "pwd" указывает путь к активной лиректории.

Создание и просмотр файлов.

После выполнения команды seqret sw:p76344 -auto в моей директории появился файл yoda_ecoli.fasta. Команда more yoda_ecoli.fasta в окне putty отобразилось содержимое этого файла, а тоснее последовательность этого белка в формате fasta.
После выполнения команды entret sw:p76344 -auto в директории появился файл yoda_ecoli.entret. Новый файл содержит полную информацию о моем белке в формате UniProt.

Построить и сравнить оптимальные глобальное и оптимальное локальное выравнивание 2-х последовательностей.

Построить полное (глобальное) оптимальное выравнивание с помощью программы needle пакета EMBOSS.

1. Новый файл я назвала btw1.needle. в содержимом этого файла находятся две аминокислотные последовательности: моего белка Yoda_Ecoli и второго выданного мне для задания белка ADCA_STRP3. Но самое главное, данный файл содержит выравнивание двух полипептидных цепей и различную информацию о нем. В частности, это вес выравнивания, который равен 464, размер штрафа за гэпы (10), название последовательностей и по какой матрице считается вес выравнивания (EBLOSUM62). 2. При увеличении параметров выравнивания в двое я увеличила штраф за гэпы, поэтому второе выравнивание отличается по количеству гэпов, которых теперь стало меньше, но при этом уменьшился вес выравнивания и стал равным 422.

Голубым обозначены близкордственные замены.

Построить локальное (частичное) оптимальное выравнивание с помощью программы water пакета EMBOSS.

В программе water выравнивание дано только после самого большого гэпа, т.е. с того момента, где больше всего совпадений и меньше всего пропусков, тем самым получилось локальное выравниваниеюю Оно начинается с 32 АО в Yoda_Ecoli и c 328 в Adca_Strp3. После введения более строгих параметров (т.е. увеличения штрафов за гэпы) выравнивание совершенно не изменилось: программа не нашла варианта лучше, чем было предложено в первый раз. Вес выравнивания в обоих случаях составил 188 очков. При уменьшении строгости параметров в 2 раза выравнивание начинается с 3ей аминокислоты в yoda_ecoli и с 259 аминокислоты в белке Adca_Strp3. В данном выравнивании гораздо больше гэпов, но выравнивание все равно подобрано так, что оно имеет гораздо больший вес, а именно 514,75. Так же и файле ner1.water указана та же основная информация о выравнивании и его параметрах, что и в файле btw1.needle.

Сравнить полученные выравнивания.

1. Есть ли хотя бы один пример того, что одной и той же позиции первой последовательности в разных глобальных выравниваниях сопоставлены разные позиции второй последовательности?

В двух вариантах глобальных выравниваний последовательностей примера, где одной и той же позиции первой последовательности соответствуют разные позиции второй, не существует. При повышении штрафа за гэп программа needle выдала мне глобальное выравнивание, где был убран только один гэп из первой последовательности между 31 и 32 аминокислотным остатком(Yoda_Ecoli). Вторая же последовательность просто была сдвинута так, что 32-му АО остался соответствовать 328 АО, как это и было в первом выравнивании до повышения штрафов за гэпы.


K(лизин) - 31, P (пролин) - 32 (ярко-зеленый), P (пролин) - 328 (бирюзовый.)
2. Есть ли хотя бы один пример того, что одной и той же позиции первой последовательности в разных локальных выравниваниях сопоставлены разные позиции второй последовательности?

В первом локальном выравнивании выравнивание начинается с 32 АО в Yoda_Ecoli и с 328 в Adca_Strp3, оба остатка являются пролинами и следовательно соответствуют друг другу, но во втором локальном выравнивании были уменьшены штрафы за гэпы: количество пропусков увеличилось, и 32 АО стал соответствовать 289 пролин а последовательности Adca_Strp3.


Первая и вторая пары последовательностей - это соответственно первое и второе локальные выравнивания. Цветом обозначены те АО, которые поменяли свои позиции относительно друг друга. Во втором локальном выравнивании серьезная перестановка в совпадении АО в двух последовательностях идет с 3 по 41 АО, между 41 и 42 АО в Yoda_Ecoli идет большой пропуск, который приводит все совпадения АО в тот же вид, что и в первом локальном выравнивании.


3. Есть ли хотя бы один пример того, что в одном глобальном выравнивании какой-либо позиции первой последовательности сопоставлена некоторая позиция второй, а в другом выравнивании против той же позиции оказался пропуск?

В глобальном выравнивании, в котором параметры указаны по умолчанию позициям 325 (E - глутаминовая кислота), 326 (I - изолейцин), 327 (L - лейцин) в Adca_Strp3 соответствуют три пропуска в Yoda_Ecoli, когда во втором глобальном выравнивании, где завышены штрафы в два раза, этим трем АО в Adca_Strp3 соответствует три АО в Yoda_Ecoli. Они не являются совпадающими или даже близкородственными заменам - это 29 (H - гистидин), 30 (G - глицин), 31 (K - лизин).

4. Есть ли хотя бы один пример того, что в одном локальном выравнивании какой-либо позиции первой последовательности сопоставлена некоторая позиция второй, а в другом выравнивании против той же позиции оказался пропуск?

Аминокислотные остатки, например, три лизина в позициях 410, 411, 412 в первом локальном выравнивании, где параметры настроены по умолчанию, соответствуют пропускам во втором локальном выравнивании, где штраф за гэп уменьшен в два раза. Так же большие участки АО в первом выравнивании соответствуют пропускам во втором - это например АО в позициях с 328 по 337.

5. Соответствуют ли оптимальные локальные выравнивания, построенными с использованием разных параметров, одним и тем же фрагментам последовательностей?

Первое и второе выравнивание отличает большой пропуск в последовательности Yoda_Ecoli между 41 и 42 АО (обозначен темно-синим цветом на рисунке), который присутствует в выравнивании с меньшим штрафом за гэп. После этого пропуска участки последовательностей в совпадениях АО идентичны в обоих выравниваниях. Бирюзовым обозначены АО, между которыми стоит разрыв и соответствующие им АО во второй последовательности. Один АО не попал в первое выравнивание, но виден во втором, это глицин, стоящий на 301 позиции. Это опять же произошло из-за смены параметорв выравнивания.

6. Совпадают ли локальные выравнивания с соответствующими частями глобальных выравниваний?

Начиная с 32 АО у Yoda_Ecoli и 328 АО у Adca_Strp3, и, заканчивая из последними АО (216 и 515 гистидинами), совпадают оба глобальных и одно локальное выравнивание (это которое со стандартным штрафом за гэп). Локальное выравнивание с уменьшенным штрафом за гэп совпадает с остальными тремя, начиная с 114 (изолейцин) у Yoda_Ecoli и 413 (тимин) АО у Adca_Strp3.

Дополнительное задание.

Работа с программой matcher пакета EMBOSS

Первый мой запрос выглядел аналогично запросу в needle и water, т.е. вот так "matcher yoda_ecoli adca_strp3.fasta yoda_ecoli.matcher", воспользовавшись командой more, я открыла этот документ. Там было предложено локальное варавнивание, которое ничем не отличалось от выравнивания со стандартными параметрами в программе water, только штраф за гэп по умолчанию идет 14, а штраф за сплошные длинные гэпы 4. Далее я набрала команду "matcher -help", в этих подсказках была дана команда "-alternatives", вместе с который должно обязательно следовать число. В итоге мой запрос выглядел как "matcher yoda_ecoli adca_strp3.fasta yoda_ecoli.matcher -alternatives 3". программа нашла мне три варианта локального выравнивания с разным весом (463, 42, 35). Наиболее удачным и выравниванием, не совпадающим с выровненными фрагментами в оптимальном, оказалось то, чей вес равен 35. Вот само выравнивание

                                  80        90       100       110       120             
                      YODA_E KKADADKTKTFAEIKDYYHKGYATDIEMIGIEDGIVEFHRNNETTSCKYD
                             :. : : :   .. :             . .. :. .   :      .  
                      ADCA_S KELDKDYTAALSDAKQKSFVTQHAAFGYMALDYGLNQISINGVIPDAEPS
                                 200       210       220       230       240   
                                                                               
                           130       140       150       160                   
                      YODA_E YDGYKILTYKSGKKGVRYLFECKDPESKAPK                   
                                   :.    : :..:..  ..  ::  :                   
                      ADCA_S AKRIATLSKYVKKYGIKYIYFEENASSKVAK                   
                                 250       260       270     
                
Оно начинается с 81 АО у Yoda_Ecoli и с 192 у Adca_Strp3, а заканивается на 160 и 271 у соответственно Yoda_Ecoli и Adca_Strp3.


© Ромащенко 2008