- Используя систему SRS была найдена следующая информация
-
дата последнего проиндексированного релиза 05 Сентября 2008 года
количество записей в нём 92831733
-
ANN |
Constructed sequence with annotation |
54868004 |
CON |
Constructed sequence |
не проиндексирован |
EST |
Expressed Sequence Tag |
54868004 |
GRV |
Genome Reviews |
не проиндексирован |
GSS |
Genome Survey Sequence |
24420981 |
HTC |
High Throughput cDNA sequencing |
524114 |
HTG |
High Throughput Genome sequencing |
135664 |
MGA |
Mass Genome Annotation |
не проиндексирован |
PAT |
Patent |
6175434 |
SET |
Project set (EMBL WGS Masters only) |
не проиндексирован |
STD |
Standard |
5752704 |
STS |
Sequence Tagged Site |
945908 |
TPA |
Third Party Annotation |
5919 |
TSA |
Transcriptome Shotgun Assembly |
3005 |
WGS |
Whole Genome Shotgun |
не проиндексирован |
 
-
список разделов ("Divisions") банка EMBL
ENV |
Пробы окружающей среды |
3614899 |
FUN |
Грибы |
2524681 |
HUM |
Человек |
11540219 |
INV |
Беспозвоночные |
13679938 |
MAM |
Остальных млекопитающих |
8686059 |
MUS |
Мышь домовая |
7330487 |
PHG |
Бактериофаги |
4896 |
PLN |
Растения |
28334269 |
PRO |
Прокариоты |
675972 |
ROD |
Грызуны |
1804253 |
SYN |
Синтетические |
1500620 |
TGN |
Трансгенные |
265445 |
UNC |
Неклассифицированные |
2956530 |
VRL |
Вирусные |
624900 |
VRT |
Других позвоночных |
9288565 |
 
Количество стандартных записей в банке EMBL на март 2007/08 года в классах ENV, FUN и PRO
поступления в данные разделы увеличивается, но не одинаково. Также стоит отметить большой прирост в классе грибов
- Информация о гене G9B, описанного в записи EMBL с кодом доступа BA000025
направление гена относительно направления выбранного для записи - обратное
число кодирующих участков - 6
длина первого кодирующего участка - 105
длина последнего кодирующего участка - 61
длина первого интрона между кодирующими участками - 125
длина последнего интрона между кодирующими участками - 195
- Поиск белка по его кодирующему участку
Из записи EMBL BA000025 был верезан самый длинный экзон гена G9B
с помощью программы BLASTX был найден белок G6B,
предшественник белков G6b-A, G6b-F, G6b-B, G6b-C наиболее длинному экзону соответствует участок белка 22-136  
Инструкция как это можно сделать:
на сайте http://blast.ncbi.nlm.nih.gov перейти по ссылке BLASTX
в поле "Enter accession number, gi, or FASTA sequence" вбить последовательность в формате fasta,
нажать на кнопку BLAST - таким образом запустив поиск.
- Информация полученная с помощью SRS из банка данных EMBL о белке P00803
Идентификатор записи EMBL |
Тип молекулы |
Класс данных |
Раздел EMBL |
Дата создания документа |
Описание |
Длина последовательности |
AE014075 |
genomic DNA |
STD |
PRO |
25-JAN-2006 |
Escherichia coli CFT073, complete genome |
5231428 |
D64044 |
линейная геномная ДНК |
STD |
PRO |
27-NOV-1995 |
Escherichia coli K12 genes for MCLA protein, L-aspartate oxidase, uracil DNA glycosylase, putative ATP dependent RNA helicase,
GTP binding protein, recO protein, YFHB-ECOLI protein, YFHC-ECOLI protein, ribonuclease III, RNA polymerase sigma E,
hypothetical 67KD protein, signal peptidase I, lepA protein and hypothetical proteins, complete and partial cds. |
29254 |
AE005174 |
genomic DNA |
STD |
PRO |
08-DEC-2004 |
Escherichia coli O157:H7 EDL933, complete genome. |
5528445 |
AP009048 |
genomic DNA |
STD |
PRO |
22-JAN-2006 |
Escherichia coli W3110 DNA, complete genome. |
4646332 |
BA000007 |
genomic DNA |
STD |
PRO |
25-OCT-2004 |
Escherichia coli O157:H7 str. Sakai DNA, complete genome |
5498450 |
U00096 |
genomic DNA |
STD |
PRO |
23-FEB-2006 |
Escherichia coli str. K-12 substr. MG1655, complete genome |
4639675 |
Таким образом, все они кроме D64044 являются просто последовательностями полных геномов, для записи же D64044 приведена более подробная характеристика,
в которой приведены названия ~13 белков и указана возможность существования еще.
|
На главную
Третий семестр
|