|
- С помощью системы SRS (http://srs.ebi.ac.uk/) были получены следующие данные:
- дата последнего проиндексированного в системе релиза EMBL 7 сентября 2009 года.Количество записей в нём: 108577013
- список классов банка EMBL — их обозначения и описания, а также число записей каждого класса, проиндексированных SRS для последнего релиза EMBL:
класс |
описание |
число записей в последнем релизе |
ANN |
Constructed sequence with annotation |
- |
CON |
Constructed sequence |
- |
EST |
Expressed Sequence Tag |
62846990 |
GRV |
Genome Reviews |
- |
GSS |
Genome Survey Sequence |
25905073 |
HTC |
High Throughput cDNA sequencing |
549753 |
HTG |
HHigh Throughput Genome sequencing |
142473 |
MGA |
Mass Genome Annotation |
- |
PAT |
Patent |
10439165 |
SET |
set (EMBL WGS Masters only |
- |
STD |
Standard |
7253026 |
STS |
Sequence Tagged Site |
1310171 |
TPA |
Third Party Annotation |
6520 |
TSA |
Transcriptome Shotgun Assembly |
123842 |
WGS |
Whole Genome Shotgun |
- |
- список разделов ("Divisions") банка EMBLb[ описание по-русски и число записей в последнем релизе.
раздел |
описание |
число записей в последнем релизе |
ENV |
взятые из окружающей среды |
4145029 |
FUN |
Грибы |
3942084 |
HUM |
Человек |
12841544 |
INV |
бесчелюстные |
15518735 |
GSS |
Genome Survey Sequence |
25905073 |
MAM |
High Throughput cDNA sequencing |
549753 |
HTG |
другие млекопитающие |
9429823 |
MUS |
Patent Mus musculus (Мышь домовая) |
7424621 |
PHG |
бактериофаги |
5865 |
PLN |
Растения |
33806044 |
STS |
Sequence Tagged Site |
1310171 |
PRO |
Прокариоты |
909986 |
ROD |
грызуны |
2261678 |
SYN |
синтетические |
2671622 |
TGN |
трансгенные |
265465 |
UNC |
неклассифицированные |
3945859 |
VRL |
вирусы |
827405 |
VRT |
другие челюстноротые |
10581253 |
- С помощью расширенной формы запроса сформирован запрос (([embl-Class:std] & [embl-Division:hum]) & [embl-DateCreated#20080501:20080531]), ищущий в разделе hum стандартные записи, сделанные в мае 2008. ответ – 2815 записей EMBLE. Аналогично были сыормированы остальные запросы. получена диаграмма:
раздел |
май 2008 |
май 2009 |
hum |
2815 |
1317 |
вирусы |
10804 |
9736 |
pro |
6651 |
15056 |
Как мы видим, количество записей о вирусах и человеке незначительно уменьшилос, в то время, как количесвто сведений о прокариотах увеличилось более, чем в два раза
- Мне дан ген APOM. Он находится на комплементарной цепочке ДНК (выбрано обратное направление).В гене 6 кодирующих участков. Первый экзон комплиментарен участку 287948..288061, его длина 114 оснований. Последний экзон комплиментарен участку 285939..285964, его длина 26 оснований. Первый интрон длины 598 оснований, последний – 340.
- самый длинный участок комплементарен 287402..287556. длина – 155 оснований. Команда seqret –sask. Получаем выходной файл. (longexapom.fasta). подаем на запрос в blastx по банку SwissProt protein sequences. Смотрим белок с самым маленьким E-value. В моем случае это sp|O95445.2|APOM_HUMAN. Далее смотрим локальное выравнивание с этим белком и видим, что моему экзону соответствует участок белка с 39 по 89 остаток аминокислоты в белке.
- мой белок IHFA_ECOLI. Ссылки на EMBL
DR EMBL; K02844; AAA51471.1; -; Genomic_DNA.
DR EMBL; V00291; CAA23566.1; -; Genomic_DNA.
DR EMBL; U00096; AAC74782.1; -; Genomic_DNA.
DR EMBL; AP009048; BAA15480.1; -; Genomic_DNA.
DR EMBL; M14031; AAA23525.1; -; Genomic_DNA.
Идентификатор записи EMBL
|
Тип молекулы
|
Класс данных
|
Раздел EMBL
|
Дата создания
документа |
Описание
|
Длина последовательности
|
AP009048 |
genomic DNA |
STD |
PRO |
22-JAN-2006 |
Escherichia coli str. K12 substr. W3110 DNA, complete genome. |
4646332 |
K02844 |
genomic DNA |
STD |
PRO |
18-NOV-1986 |
E.coli infC, rplT, pheS, pheT and himA genes encoding initiation factor IF3, ribosomal protein L20, beta- and alpha-subunits of phenylalanyl-tRNA synthetase and the alpha-subunit of integration host factor, complete cds. |
5972 |
M14031 |
genomic DNA |
STD |
PRO |
19-SEP-1987 |
E.coli btuCED genes encoding vitamin B12 transport mechanisms, complete cds, ORF17 encoding a protein of unknown function, and himA gene encoding integration host factor (IHF) alpha-subunit, partial cds. |
3169 |
U00096 |
genomic DNA |
STD |
PRO |
23-FEB-2006 |
Escherichia coli str. K-12 substr. MG1655, complete genome. |
4639675 |
V00291 |
genomic DNA |
STD |
PRO |
13-JUL-1983 |
E.coli thrS, infC, rplT, pheS, pheT and himA genes encoding threonyl-tRNA synthetase, initiation factor IF3, ribosomal protein L20, phenylalanyl-tRNA synthetase and the alpha-subunit of the host integration factor. |
7784 |
|