Банк нуклеотидных последовательностей EMBL
 :Главная   :Семестры   :Сайт ФББ
Банк нуклеотидных последовательностей EMBL
I.Сведения о банке EMBL.
К сегодняшнему дню последний релиз проиндексирован 5 декабря 2008 года и включает 97659985 записей.

II.Список классов банка EMBL
ANN: Constructed sequence with annotation  класс не проиндексирован
CON: Constructed sequence                  класс не проиндексирован
EST: Expressed Sequence Tag                58422143 записей  
GRV: Genome Reviews                        класс не проиндексирован
GSS: Genome Survey Sequence                24604053 записей 
HTC: High Throughput cDNA sequencing       531057 записей 
HTG: High Throughput Genome sequencing     138136 записей 
MGA: Mass Genome Annotation                класс не проиндексирован 
PAT: Patent                                6175434 записей 
SET: Project set (EMBL WGS Masters only)   класс не проиндексирован
STD: Standard                              6098682 записей
STS: Sequence Tagged Site                  94590 записей 
TPA: Third Party Annotation                6012 записей 
TSA: Transcriptome Shotgun Assembly        3195 записей
WGS: Whole Genome Shotgun                  класс не проиндексирован 

III.Список разделов банка EMBL
ENV: Образцы из окружающей среды   3675528
FUN: Грибы                         2645486
HUM: Человек                       2645486
INV: Беспозвоночные  	           13983439
MAM: Другие млекопитающие  	   9074969
MUS: Домовая мышь                  7338348
PHG: Бактериофаги  	           4998
PLN: Растения  	                   31241789
PRO: Прокариоты  	           739235
ROD: Грызуны                       1920985
SYN: Синтетические  	           1613314
TGN: Трансгенные  	           265449
UNC: Неклассифицированные  	   3004383
VRL: Вирусы                        652031
VRT: Другие позвоночные            9800345

IV.Описание гена NG36
Направление гена относительно направления, выбранного для записи: прямое;
Число кодирующих участков: 4;
Длина первого кодирующего участка: 49;
Длина последнего кодирующего участка: 33;
Длина первого интрона: 98;
Длина последнего интрона: 2603.
V.Поиск белка по кодирующему участку гена NG36.
При помощи программы seqret с опцией sask был вырезан самый длинный кодирующий участок гена NG36.Далее этот участок был подан программе blastx (http://blast.ncbi.nlm.nih.gov)с поиском по базе последовательностей Swiss-Prot.(В поле upload file был указан путь к файлу с вырезанным участком).В результате были найдены белки,наиболее подходящим оказался белок человека Euchromatic histone-lysine N-methyltransferase 2.Экзону,по которому проводился поиск, соответствует участок белка 111-170.
VI.Характеристика записей EMBL
Идентификатор записи EMBL Тип молекулы Класс данных Раздел EMBL Дата создания
документа
Описание Длина последовательности
AP009048 genomic DNA STD PRO 22-JAN-2006 Escherichia coli str. K12 substr. W3110 DNA, complete genome. 4646332
U00096 genomic DNA STD PRO 23-FEB-2006 Escherichia coli str. K-12 substr. MG1655, complete genome. 4639675
U18997 genomic DNA STD PRO 30-DEC-1994 Escherichia coli K-12 chromosomal region from 67.4 to 76.0 minutes. 372438

Как видно из таблицы все записи стандартные,принадлежат к классу данных прокариоты, описывают геномную ДНК. Первая запись была сделана в 1994 году и содержала только часть,две остальных-полный геном.
©Кирилин Евгений,2007