Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2012

Задание

1.(1 балл) Напишите программу, которая читает файл в формате FASTA (имя файла может быть задано переменной в первых строках программы). Файл должен содержать нуклеотидные последовательности. Программа должна вычислить для них комплементарные и напечатать в другой файл в формате FASTA.

2.(1 балл) Скрипт получает на вход два файла. В одном ids.txt друг под другом указаны id-шники SwissProt белков, а во втором находится фрагмент банка SwissProt (6MB) в формате Stockholm. Нужно выбрать из файла с банком SwissProt последовательности для id-шников, которые перечислены в первом файле, и напечатать файл в fasta-формате

3.(2 балла) Прочитать файл в формате ClustalW. Построить матрицу N*N, где N - количество типов аминокислот, содержащую среднее количество замен аминокислоты A на аминокислоту B в колонке (гэп считать отдельной аминокислотой). Для этого в каждой колонке подсчитываем число пар аминокислот ( A, B ) и потом усредняем это число по всем колонкам (делим на количество колонок в выравнивании).

4.(2.5 балла) Прочитать файл в формате ClustalW. Построить матрицу замен средствами BioPython. Для этого придется почитать BioPython Tutorial :-)

Примеры множественных выравниваний в формате ClustAl (Берете файлы с расширением .clustalw)