учебный сайт Вероники Владыкиной

Проекты. Банк нуклеотидных последовательностей EMBL

на главную
1 семестр
2 семестр
3 семестр
проекты
официальный сайт ФББ
  1. С помощью системы SRS (http://srs.ebi.ac.uk/) были получены следующие данные:
    1. дата последнего проиндексированного в системе релиза EMBL 7 сентября 2009 года.Количество записей в нём: 108577013
    2. список классов банка EMBL — их обозначения и описания, а также число записей каждого класса, проиндексированных SRS для последнего релиза EMBL:
      класс описание число записей в последнем релизе
      ANN Constructed sequence with annotation -
      CON Constructed sequence -
      EST Expressed Sequence Tag 62846990
      GRV Genome Reviews -
      GSS Genome Survey Sequence 25905073
      HTC High Throughput cDNA sequencing 549753
      HTG HHigh Throughput Genome sequencing 142473
      MGA Mass Genome Annotation -
      PAT Patent 10439165
      SET set (EMBL WGS Masters only -
      STD Standard 7253026
      STS Sequence Tagged Site 1310171
      TPA Third Party Annotation 6520
      TSA Transcriptome Shotgun Assembly 123842
      WGS Whole Genome Shotgun -
    3. список разделов ("Divisions") банка EMBLb[ описание по-русски и число записей в последнем релизе.
      раздел описание число записей в последнем релизе
      ENV взятые из окружающей среды 4145029
      FUN Грибы 3942084
      HUM Человек 12841544
      INV бесчелюстные 15518735
      GSS Genome Survey Sequence 25905073
      MAM High Throughput cDNA sequencing 549753
      HTG другие млекопитающие 9429823
      MUS Patent Mus musculus (Мышь домовая) 7424621
      PHG бактериофаги 5865
      PLN Растения 33806044
      STS Sequence Tagged Site 1310171
      PRO Прокариоты 909986
      ROD грызуны 2261678
      SYN синтетические 2671622
      TGN трансгенные 265465
      UNC неклассифицированные 3945859
      VRL вирусы 827405
      VRT другие челюстноротые 10581253
    4. С помощью расширенной формы запроса сформирован запрос (([embl-Class:std] & [embl-Division:hum]) & [embl-DateCreated#20080501:20080531]), ищущий в разделе hum стандартные записи, сделанные в мае 2008. ответ – 2815 записей EMBLE. Аналогично были сыормированы остальные запросы. получена диаграмма:
      раздел май 2008 май 2009
      hum 2815 1317
      вирусы 10804 9736
      pro 6651 15056

      Как мы видим, количество записей о вирусах и человеке незначительно уменьшилос, в то время, как количесвто сведений о прокариотах увеличилось более, чем в два раза
  2. Мне дан ген APOM. Он находится на комплементарной цепочке ДНК (выбрано обратное направление).В гене 6 кодирующих участков. Первый экзон комплиментарен участку 287948..288061, его длина 114 оснований. Последний экзон комплиментарен участку 285939..285964, его длина 26 оснований. Первый интрон длины 598 оснований, последний – 340.
  3. самый длинный участок комплементарен 287402..287556. длина – 155 оснований. Команда seqret –sask. Получаем выходной файл. (longexapom.fasta). подаем на запрос в blastx по банку SwissProt protein sequences. Смотрим белок с самым маленьким E-value. В моем случае это sp|O95445.2|APOM_HUMAN. Далее смотрим локальное выравнивание с этим белком и видим, что моему экзону соответствует участок белка с 39 по 89 остаток аминокислоты в белке.
  4. мой белок IHFA_ECOLI. Ссылки на EMBL
    DR   EMBL; K02844; AAA51471.1; -; Genomic_DNA.  
    DR   EMBL; V00291; CAA23566.1; -; Genomic_DNA.  
    DR   EMBL; U00096; AAC74782.1; -; Genomic_DNA.  
    DR   EMBL; AP009048; BAA15480.1; -; Genomic_DNA.
    DR   EMBL; M14031; AAA23525.1; -; Genomic_DNA.  
    
    Идентификатор записи EMBL Тип молекулы Класс данных Раздел EMBL Дата создания
    документа
    Описание Длина последовательности
    AP009048 genomic DNA STD PRO 22-JAN-2006 Escherichia coli str. K12 substr. W3110 DNA, complete genome. 4646332
    K02844 genomic DNA STD PRO 18-NOV-1986 E.coli infC, rplT, pheS, pheT and himA genes encoding initiation factor IF3, ribosomal protein L20, beta- and alpha-subunits of phenylalanyl-tRNA synthetase and the alpha-subunit of integration host factor, complete cds. 5972
    M14031 genomic DNA STD PRO 19-SEP-1987 E.coli btuCED genes encoding vitamin B12 transport mechanisms, complete cds, ORF17 encoding a protein of unknown function, and himA gene encoding integration host factor (IHF) alpha-subunit, partial cds. 3169
    U00096 genomic DNA STD PRO 23-FEB-2006 Escherichia coli str. K-12 substr. MG1655, complete genome. 4639675
    V00291 genomic DNA STD PRO 13-JUL-1983 E.coli thrS, infC, rplT, pheS, pheT and himA genes encoding threonyl-tRNA synthetase, initiation factor IF3, ribosomal protein L20, phenylalanyl-tRNA synthetase and the alpha-subunit of the host integration factor. 7784
Владыкина 2008