Kodomo

Пользователь

Практикум по биоинформатике для студентов-вирусологов

Указания к заданиям по темам 1 и 2

  1. Работайте на сервере SRS на DKFZ: http://www.dkfz-heidelberg.de/srs/

На вкладке “Select Databanks” отметьте EMBL(Release) и перейдите на “Query form” В первой строке в разделе “Fields you can search” выберите “Data class” и напишите “STD”. Во второй строке выберите Organism и напишите название вируса (конкретного вируса, рода или семейства). Если затрудняетесь, напишите Viruses, а в третьей строке выберите “Sequence length” и напишите 3000:15000. Наконец, в ещё одной строке выберите Description и напишите “complete&genome”. Нажмите Search. Выберите в результирующей таблице приглянувшийся вам вирус.

  1. Найдя в таблице нужную запись, скопируйте её AC в окошко сервиса ENA http://www.ebi.ac.uk/ena/. Пройдя по нужным ссылкам можно получить как запись в EMBL-формате (“Text”), так и последовательность в fasta-формате (“Fasta”).

Можно скопировать текст из окошка браузера в текстовый редактор (если не владеете Far manager, используйте WordPad или Notepad+) и затем сохранить на диск. При сохранении из WordPad не забудьте выбрать опцию “Save as text document”, и в любом варианте следите за расширением имени файла (оно должно быть не .txt, а .fasta или .embl).

  1. Гены и белки описаны в поле FT полной записи.
  2. Найдите в описании белка в записи EMBL номер доступа (AC) банка Uniprot: он состоит из шести символов, первый из которых — заглавная буква.

Если AC записи Uniprot, к примеру, P00174, то полная запись находится по адресу http://www.uniprot.org/uniprot/P00174.txt, а последовательность в fasta-формате – по адресу http://www.uniprot.org/uniprot/P00174.fasta .

  1. Вернитесь на страницу “Select databanks” и отметьте галочкой SWISSPROT (Release) (не забудьте убрать галочку против EMBL). В одной строке выберите Organism и напишите название семейства, в другой — Description и название белка.

SRS на DKFZ, к сожалению, не настроен на сохранение находок в fasta-формате. Поэтому сохраните сначала список идентификаторов. Для этого отметьте галочками нужные белки и нажмите Save (слева), затем выберите в меню “Save with view:” Names only и Save. Скопируйте результат в WordPad и уберите начальное “SWISSPROT:” (удобно воспользоваться комбинацией клавиш <Ctrl+H>). Теперь откройте сайт Uniprot http://www.uniprot.org/ , на нём вкладку Retrieve, поместите список идентификаторов в окошко и нажмите кнопку Retrieve. Найдите, как скачать файл в fasta-формате.

Замечание: можно попробовать освоить “Advanced search” на сайте Uniprot, но там свои тонкости.