EMBL

Знакомство со структурой банка EMBL посредством поисковой системы SRS


а. Последний релиз (№109) от 8 сентября 2011 года содержит 71833235 записей.
b.
Data class                                      Количество записей
CON: Constructed sequence                       *
EST: Expressed Sequence Tag                     * 
GRV: Genome Reviews                             *
GSS: Genome Survey Sequence                     32578894
HTC: High Throughput cDNA sequencing            533398
HTG: High Throughput Genome sequencing          145701
MGA: Mass Genome Annotation                     *
PAT: Patent                                     22346593
SET: Project set (EMBL WGS Masters only)        * 
STD: Standard                                   11737741
STS: Sequence Tagged Site                       1322285
TSA: Transcriptome Shotgun Assembly             3168623
WGS: Whole Genome Shotgun                       *
Примечание: *-класс данных не проиндексирован

c.
    Division                                              Количество записей
  env Environmental Samples Образцы из окружающей среды          6637887                                   
  fun 	Fungi Грибы                                               2219095                                                    
  hum 	Human Человек                                             10687844
  inv 	Invertebrates Беспозвоночные                              5906093
  mam 	Other Mammals Прочие млекопитающие                        5765536
  mus 	Mus musculus  Мышь                                        4779883
  phg 	Bacteriophage Бактериофаги                                8082
  pln 	Plants Растения                                           17132180
  pro 	Prokaryotes Прокариоты                                    1467025
  rod 	Rodents Грызуны                                           1265394
  syn 	Synthetic Искусственные                                   3632878
  tgn  Transgenic Трансгенные                                    265545
  unc 	Unclassified Некласифицированные                          7500493
  vrl 	Viruses Вирусы                                            1177936
  vrt 	Other Vertebrates Прочие позвоночные                      3387364

d.

В 2011 с января по март году в два раза увеличилось количество публикаций про растения вирусы, но уменьшилось про прокариот.

Описание гена ZNFB7 в записи банка EMBL


1)Направление гена обратно направлению записи.
2)Число кодирующих участков равно 7ми.
3)Длина первого участка 381, последнего 518.
4)Длина интронов 3110 и 823 соответственно.

Нахождение белка по фрагменту гена


Перейти по гиперссылке на blastx Search protein database using a translated nucleotide query.
В выпадающем списке выбрать банк SwissProt.
Выбрать генетический код standart1, т.к. мы работаем с ядерным геномом эукариот.
Был найден белок Zinc finger protein B7 (Q9C019.1). Первый экзон соответствует участку белка 3-129.

Записи EMBL, в которых описан ген белка OBG_BACSU


© Nikolay Kondratev