Московский Государственный Университет

Имени М.В.Ломоносова

Факультет Биоинженерии и Биоинформатики


Банк нуклеотидных последовательностей EMBL

  1. Используя систему SRS была найдена следующая информация
    • "банк EMBL"

      дата последнего проиндексированного релиза 05 Сентября 2008 года

      количество записей в нём 92831733

    • список классов ("Data Class") банка EMBL

      ANN Constructed sequence with annotation 54868004
      CON Constructed sequence не проиндексирован
      EST Expressed Sequence Tag 54868004
      GRV Genome Reviews не проиндексирован
      GSS Genome Survey Sequence 24420981
      HTC High Throughput cDNA sequencing 524114
      HTG High Throughput Genome sequencing 135664
      MGA Mass Genome Annotation не проиндексирован
      PAT Patent 6175434
      SET Project set (EMBL WGS Masters only) не проиндексирован
      STD Standard 5752704
      STS Sequence Tagged Site 945908
      TPA Third Party Annotation 5919
      TSA Transcriptome Shotgun Assembly 3005
      WGS Whole Genome Shotgun не проиндексирован

       

    • список разделов ("Divisions") банка EMBL

      ENV Пробы окружающей среды 3614899
      FUN Грибы 2524681
      HUM Человек 11540219
      INV Беспозвоночные 13679938
      MAM Остальных млекопитающих 8686059
      MUS Мышь домовая 7330487
      PHG Бактериофаги 4896
      PLN Растения 28334269
      PRO Прокариоты 675972
      ROD Грызуны 1804253
      SYN Синтетические 1500620
      TGN Трансгенные 265445
      UNC Неклассифицированные 2956530
      VRL Вирусные 624900
      VRT Других позвоночных 9288565

       

    • Количество стандартных записей в банке EMBL на март 2007/08 года в классах ENV, FUN и PRO

      поступления в данные разделы увеличивается, но не одинаково.
      Также стоит отметить большой прирост в классе грибов

  2. Информация о гене G9B, описанного в записи EMBL с кодом доступа BA000025
  3. направление гена относительно направления выбранного для записи - обратное

    число кодирующих участков - 6

    длина первого кодирующего участка - 105

    длина последнего кодирующего участка - 61

    длина первого интрона между кодирующими участками - 125

    длина последнего интрона между кодирующими участками - 195

  4. Поиск белка по его кодирующему участку
  5. Из записи EMBL BA000025 был верезан самый длинный экзон гена G9B
    с помощью программы BLASTX был найден белок G6B, предшественник белков G6b-A, G6b-F, G6b-B, G6b-C
    наиболее длинному экзону соответствует участок белка 22-136
     
    Инструкция как это можно сделать:
    на сайте http://blast.ncbi.nlm.nih.gov перейти по ссылке BLASTX
    в поле "Enter accession number, gi, or FASTA sequence" вбить последовательность в формате fasta,
    нажать на кнопку BLAST - таким образом запустив поиск.

  6. Информация полученная с помощью SRS из банка данных EMBL о белке P00803
  7. Идентификатор записи EMBL Тип молекулы Класс данных Раздел EMBL Дата создания документа Описание Длина последовательности
    AE014075 genomic DNA STD PRO 25-JAN-2006 Escherichia coli CFT073, complete genome 5231428
    D64044 линейная геномная ДНК STD PRO 27-NOV-1995 Escherichia coli K12 genes for MCLA protein, L-aspartate oxidase, uracil DNA glycosylase, putative ATP dependent RNA helicase, GTP binding protein, recO protein, YFHB-ECOLI protein, YFHC-ECOLI protein, ribonuclease III, RNA polymerase sigma E, hypothetical 67KD protein, signal peptidase I, lepA protein and hypothetical proteins, complete and partial cds. 29254
    AE005174 genomic DNA STD PRO 08-DEC-2004 Escherichia coli O157:H7 EDL933, complete genome. 5528445
    AP009048 genomic DNA STD PRO 22-JAN-2006 Escherichia coli W3110 DNA, complete genome. 4646332
    BA000007 genomic DNA STD PRO 25-OCT-2004 Escherichia coli O157:H7 str. Sakai DNA, complete genome 5498450
    U00096 genomic DNA STD PRO 23-FEB-2006 Escherichia coli str. K-12 substr. MG1655, complete genome 4639675

    Таким образом, все они кроме D64044 являются просто последовательностями полных геномов, для записи же D64044 приведена более подробная характеристика, в которой приведены названия ~13 белков и указана возможность существования еще.

На главную

Третий семестр

 
Copyright 2007

почта: sheikino_sunz22@mail.ru