Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2010

Простейшее редактирование текстов

Подсказка: вам потребуется документация про regex(7)1, cut, tr, getent.

  1. (0.8 балла) Команда getent passwd выдаёт таблицу данных про пользователей системы, в которой поля разделены через двоеточие. Получите из неё список полных имён людей. (Некоторые пользователи не являются людьми, а являются техническими. Людей проще всего отличить по тому, что их имя всегда пишется с заглавной буквы).

  2. (0.5 балла) Дан FASTA-файл с выравниванием. (Вот тут есть сколько-то произвольных примеров в файлах pairwise* и multiple*). Для того, чтобы его перевыровнять или использовать в качестве запроса в BLAST, из него нужно выкинуть гэпы (и не забыть убрать пустые строки, образовавшиеся после того, как вы убрали полную строку только из гэпов, так как некоторые из программ не допускают пустые строки в середине последовательности). Сделайте это в одну (составную) команду шелла.

  3. Ещё плюс (0.5 балла), если вы в одну (составную) команду шелла удалите все гэпы из всех файлов выравнивания в директории. (Это к слову о давно пройденном).

  4. (0.5 балла) сколько последовательностей из семейства HTH_1 (выравнивание в FASTA для него было в http://kodomo.fbb.msu.ru/FBB/year_10/term5/unix/6/PF00126_full.txt ) получены из разных штаммов E. Coli? (Это те, у которых имя организма начинается с ECO).

  1. Т.е. regex из 7-го раздела man; man 7 regex; см. man man (1)