Банк нуклеотидных последовательностей EMBL


1. Последний релиз EMBL.
"The current release has 108577013 entries and was indexed 07-Sep-2009". (Последний релиз был проиндексирован 7 сентября 2009 года. В настоящий момент включает 108577013 записей).

Список классов банка EMBL:
* ANN: Constructed sequence with annotation
* CON: Constructed sequence
* EST: Expressed Sequence Tag
* GRV: Genome Reviews
* GSS: Genome Survey Sequence
* HTC: High Throughput cDNA sequencing
* HTG: High Throughput Genome sequencing
* MGA: Mass Genome Annotation
* PAT: Patent
* SET: Project set (EMBL WGS Masters only)
* STD: Standard
* STS: Sequence Tagged Site
* TPA: Third Party Annotation
* TSA: Transcriptome Shotgun Assembly
* WGS: Whole Genome Shotgun

Проиндексированные классы:
* EST: 62846990 записей
* GSS: 25905073 записей
* HTC: 549753 записей
* HTG: 142473 записей
* PAT: 10439165 записей
* STD: 7253026 записей
* STS: 1310171 записей
* TPA: 6520 записей
* TSA: 123842 записей


Список разделов банка EMBL:
* ENV: Environmental Samples (Образцы из окружающей среды): 4145029 записей
* FUN: Fungi (Грибы): 3942084 записей
* HUM: Human (Человек): 12841544 записей
* INV: Invertebrates (Беспозвоночные): 15518735 записей
* MAM: Other Mammals (Другие млекопитающие): 9429823 записей
* MUS: Mus musculus (Мышь): 7424621 записей
* PHG: Bacteriophage (Бактериофаги): 5865 записей
* PLN: Plants (Растения): 33806044 записей
* PRO: Prokaryotes (Прокариоты): 909986 записей
* ROD: Rodents (Грызуны): 2261678 записей
* SYN: Synthetic (Синтетические):2671622 записей
* TGN: Transgenic (Трансгенные): 265465 записей
* UNC: Unclassified (Неклассифицированные): 3945859 записей
* VRL: Viruses (Вирусы): 827405 записей
* VRT: Other Vertebrates (Другие позвоночные): 10581253 записей


2. Информация о гене HLA-54
Направление: обратное
Число кодирующих участков: 8
Длина первого кодирующего участка: 298 нуклеотидов
Длина последнего кодирующего участка: 71 нуклеотида
Длина первого интрона между кодирующими участками: 167 нуклеотидов
Длина последнего интрона между кодирующими участками: 124 нуклеотидов

3. Поиск белка по кодирующем участку гена
Был выбран третий участок (с 2053829 по 2054104 нуклеотиды).
С помощью команды "seqret -sask" получили файл ba000025.fasta
В программе blastx в поле "upload file" подаем наш файл. Выбираем среди "Database" SwissProt и ищем.
Было найдено несколько десятков белков, большинство из них является антигенами человека. E-value лучшей находки - 3e-29, худшей - 8e-17.
Белок HLAH_HUMAN (P01893) был первым в списке находок. Участки с 116 по 206 позиции соответствуют искомой последовательности экзона.

4. Записи EMBL, на которые ссылается запись P0AAJ3 банка SwissProt
Идентификатор записи EMBL Тип молекулы Класс данных Раздел EMBL Дата создания
документа
Описание Длина последовательности
AP009048 genomic DNA STD PRO 22.01.2006 Escherichia coli str. K12 substr. W3110 DNA, complete genome 4646332
M75029 linear genomic DNA STD PRO 14-NOV-1991 E.coli fdnGHI operon nucleotide sequence. 4981
U00096 genomic DNA STD PRO 23.02.2006 Escherichia coli str. K-12 substr. MG1655, complete genome 4639675

Все записи относятся к классу STD, из них две записи описывают полный геном E.coli.

На главную