Cтатистика Embl .

 

  1.  Система SRS (http://srs.ebi.ac.uk/):
    1. Дата последнего релиза:05-Sep-2008.Количество записей 92831733 .
    2. Список классов Пояснение Число записей
      ANN Constructed sequence with annotation Нет записей
      СON Constructed sequence Нет записей
      EST Expressed Sequence Tag 54868004
      GRV Genome Reviews Нет записей
      GSS Genome Survey Sequence 24420981
      High Throughput cDNA sequencing HTC 524114
      High Throughput Genome sequencing HTG 135664
      Mass Genome Annotation MGA Нет записей
      PAT Patent 6175434
      SET Project set (EMBL WGS Masters only) Нет записей
      STD Standard 5752704
      Sequence Tagged Site STS 945908
      TPA Third Party Annotation Нет записей
      TSA Transcriptome Shotgun Assembly 5919
      WGS Whole Genome Shotgun 3005
      Список разделов Пояснение Число записей
      ENV: Environmental Samples Образцы из окружающей среды 3614899
      FUN: Fungi Грибы 2524681
      HUM: Human Человек 11540219
      INV: Invertebrates Беспозвоночные 13679938
      MUS: Mus musculus Мышь домовая 7330487
      PHG: Bacteriophage Бактериофаги 4896
      PLN: Plants Растения 28334269
      PRO: Prokaryotes Прокариоты 6175434
      ROD: Rodents Грузуны 61804253
      SYN: Synthetic Синтетические 1500620
      TGN: Transgenic Трансгенные 265445
      UNC: Unclassified Неклассифицированное 2956530
      VRL: Viruses Вирусы 624900
      VRT: Other Vertebrates Другие позвоночные 9288565
    3. (*) Выбранные разделы банка EMBL: FUN, PLN, INV, VRL.
      Рассматриваемые месяцы: июнь 2007 и июнь 2008.

       
      Число записей в разделах FUN, PLN, VRL выросло за период июнь2007-июнь2008, а число записей в разделе INV наоборот уменьшилось.
  2. Имя гена, описанного в записи EMBL с кодом доступа BA000025 : DDAH
    Для этого гена :
    направление гена относительно направления, выбранного для записи прямое,
    число кодирующих участков - 6,
    длины первого и последнего кодирующих участков:297 и 117,
    длины первого и последнего интронов между кодирующими участками: 119 и 189
     
  3.  Самый длинный кодирующий участок в отдельный файл - 214868..215164(первый). При помощи программы seqret с опцией -sask). вырезаем исходный участок. На странице http://blast.ncbi.nlm.nih.gov/ выбираем программу blastx,которая позволяет найти белки,соответствующие данной нулеотидной последовательности. В поле upload file была подана исходная вырезанная последовательность ba000025.fasta, в поле database была выбрана база данных Swiss-Prot.
    Прогаммой blastx было найдено 14 белков, среди котрых был нужный белок O95865.1(DDAH2_HUMAN)( второй в списке выдачи).Участки этого белка с 1 по 99 аминокислотные остатки соответствует экзону.
  4.  Исходный белок - P0A7B8.
    Идентификатор записи EMBL Тип молекулы Класс данных Раздел EMBL Дата создания
    документа
    Описание Длина последовательности
    L19201 genomic DNA STD PRO 31-AUG-1993 E. coli chromosomal region from 87.2 to 89.2 minutes. 96484
    AP009048 genomic DNA STD PRO 22-JAN-2006 Escherichia coli W3110 DNA, complete genome. 4646332
    L14281 genomic DNA STD PRO 17-APR-1993 Escherichia coli cell division protein (ftsN) gene, complete cds. 1416
    U00096 genomic DNA STD PRO 23-FEB-2006 Escherichia coli str. K-12 substr. MG1655, complete genome. 4639675
    D89965 mRNA STD ROD 12-JAN-1997 Rattus norvegicus mRNA for RSS, complete cds. 448

    Первые четыре записи- молекулы ДНК из прокариот, последняя запись-молекула мРНК из Rattus norvegicus.Таким образом, в EMBL найдена ошибка, которая вероятнее всего связана с тем, что при секвенировании последовательности белка крысы в пробу попала ДНК E.coli, кроме того была взята неправильная рамка считывания.

    Главная страница

    Первый семестр

    Второй семестр

    Третий семестр

    ©Александра Литвинчук,2008