Банк нуклеотидных последовательностей EMBL

  1. Databank Information
  2.     Пользуясь системой SRS (http://srs.ebi.ac.uk/) я посмотрела на следующую информацию:
    1. Дата последнего релиза EMBL и количество записей: 05-Sep-2008, 92831733;
    2. Cписок классов ("Data Class") банка EMBL - их обозначения и описания (по-английски), а также число записей каждого класса, проиндексированных SRS для последнего релиза EMBL:
      * ANN: Constructed sequence with annotation    не проиндексирован
      * CON: Constructed sequence    не проиндексирован
      * EST: Expressed Sequence Tag (54868004)
      * GRV: Genome Reviews    не проиндексирован
      * GSS: Genome Survey Sequence (24420981)
      * HTC: High Throughput cDNA sequencing (524114)
      * HTG: High Throughput Genome sequencing (135664)
      * MGA: Mass Genome Annotation    не проиндексирован
      * PAT: Patent (6175434)
      * SET: Project set (EMBL WGS Masters only)    не проиндексирован
      * STD: Standard (5752704)
      * STS: Sequence Tagged Site (945908)
      * TPA: Third Party Annotation (5919)
      * TSA: Transcriptome Shotgun Assembly (3005)
      * WGS: Whole Genome Shotgun    не проиндексирован;
    3. Cписок разделов ("Divisions") банка EMBL. Для каждого раздела, кроме обозначения, приведtys его описание по-русски и число записей в последнем релизе:
      * ENV: Environmental Samples (природные образцы - 3614899)
      * FUN: Fungi (грибы - 2524681)
      * HUM: Human (человек - 11540219)
      * INV: Invertebrates (беспозвоночные - 13679938)
      * MAM: Other Mammals (другие млекопитающие - 8686059)
      * MUS: Mus musculus (мышь домовая - 7330487)
      * PHG: Bacteriophage (бактериофаги - 4896)
      * PLN: Plants (растения - 28334269)
      * PRO: Prokaryotes (прокариоты - 675972)
      * ROD: Rodents (грызуны - 1804253)
      * SYN: Synthetic (синтетические - 1500620)
      * TGN: Transgenic (трансгенные - 265445)
      * UNC: Unclassified (неклассифицированные - 2956530)
      * VRL: Viruses (вирусы - 624900)
      * VRT: Other Vertebrates (другие позвоночные - 9288565) .

  3. Работа с белком
    1. Направление гена относительно направления, выбранного для записи - прямое?;
    2. Число кодирующих участков - 16;
    3. Длины первого (233) и последнего (202) кодирующих участков;
    4. Длины первого (304) и последнего (85) интронов между кодирующими участками.

  4. Принадлежность белку
  5. Вырезаем самый длинный кодирующий участток гена (177253 - 177554) и загоняем его в blastx в результате был найден белок Q9Y334

  6. Описание белка
  7. Ссылки на EMBL:
    U00096; AAC73968.1; -; Genomic_DNA.
    AP009048; BAA35600.1; -; Genomic_DNA.
    Идентификатор записи EMBL Тип молекулы Класс данных Раздел EMBL Дата создания
    документа
    Описание Длина последовательности
    U00096 кольцевая молекула ДНК STD (Standard) PRO (Prokaryotes) 23-FEB-2006 Escherichia coli str. K-12 substr. MG1655, complete genome 4639675
    EMBL:AP009048 кольцевая молекула ДНК STD (Standard) PRO (Prokaryotes) 22-JAN-2006 Escherichia coli W3110 DNA, complete genome 4646332
    EMBLCDS:AAC73968 линейная молекула ДНК STD (Standard) PRO (Prokaryotes) даты нет Escherichia coli str. K12 substr. MG1655 regulatory protein for ClpA substrate specificity 321
    EMBLCDS:BAA35600 линейная молекула ДНК STD (Standard) PRO (Prokaryotes) даты нет Escherichia coli str. K12 substr. W3110 regulatory protein for ClpA substrate specificity 321


    Третий семестр
    Главная страница
    ©

    Гардиева Алиса,2007