На главную
Третий семестр


Банк нуклеотидных последовательностей EMBL

Система SRS и банк EMBL

Последний проиндексированный в системе релиз EMBL (от 5 сентября 2008 года) содержит 92831733 записей.

Список классов (Data Class) банка EMBL:

ANN: Constructed sequence with annotation

CON: Constructed sequence

EST: Expressed Sequence Tag

GRV: Genome Reviews

GSS: Genome Survey Sequence

HTC: High Throughput cDNA sequencing

HTG: High Throughput Genome sequencing

MGA: Mass Genome Annotation

PAT: Patent

SET: Project set (EMBL WGS Masters only)

STD: Standard

STS: Sequence Tagged Site

TPA: Third Party Annotation

TSA: Transcriptome Shotgun Assembly

WGS: Whole Genome Shotgun

не проиндексирован

не проиндексирован

54868004 записей

не проиндексирован

24420981 записей

524114 записей

135664 записей

не проиндексирован

6175434 записей

не проиндексирован

5752704 записей

945908 записей

5919 записей

3005 записей

не проиндексирован

Список разделов (Divisions) банка EMBL:

ENV: Environmental Samples

FUN: Fungi

HUM: Human

INV: Invertebrates

MAM: Other Mammals

MUS: Mus musculus

PHG: Bacteriophage

PLN: Plants

PRO: Prokaryotes

ROD: Rodents

SYN: Synthetic

TGN: Transgenic

UNC: Unclassified

VRL: Viruses

VRT: Other Vertebrates

Образцы из окружающей среды

Грибы

Человек

Беспозвоночные

Другие млекопитащие

Домовая мышь

Бактериофаги

Растения

Прокариоты

Грызуны

Синтетичкие

Трансгенные

Неклассифицированные

Вирусы

Другие позвоночные

3614899 записей

2524681 записей

11540219 записей

13679938 записей

8686059 записей

7330487 записей

4896 записей

28334269 записей

675972 записей

1804253 записей

1500620 записей

265445 записей

2956530 записей

624900 записей

9288565 записей

Ген ATP6G из записи ВА000025

Поиск белка по кодирующему участку гена

  1. На kodomo-count выполняем команду seqret -sask.
  2. На запрос программы о входном файле вводим "BA000025.embl".
  3. На запрос программы "Begin at position [start]:" вводим "397455.
  4. На запрос программы "End at position [end]:" вводим "398602".
  5. На запрос программы "Reverse strand" вводим "n".
  6. Указываем имя выходного файла - ba000025
  7. Заходим на сайт http://blast.ncbi.nlm.nih.gov/.
  8. Проходим по ссылке blastX
  9. Вводим полученный ранее участок гена и запускаем поиск по Swiss Prot.

В результате данного поиска нашлось большое количество белков. Первым в выдаче был Q5TM18, выделенный из макаки (это может быть связано с тем, что данный экзон строго консервативен у человека и макаки). Участок с 62 по 118 аминокислотные остатки в точности соответствует экзону.

Содержание записей EMBL

Все 6 имеющиеся записи описывают генетическую информацию молекулы ДНК Escherichia colIi, принадлежат к классу данных STD раздела PRO.

©Третьякова Светлана, 2008