На главную

Третий семестр

Занятие 2. Банк EMBL

  • Сравнение разных записей в EMBL
  • Идентификатор записи EMBL Тип молекулы
    Класс данных
    Раздел EMBL
    Дата создания
    документа
    Описание
    Длина последовательности
    M11843 геномная ДНК стандартные прокариоты 18-ноябрь-1986 Escherichia coli histidine-tRNA synthetase (hisS), complete cds 1679
    AP009048 геномная ДНК стандартные прокариоты 22-январь-2006 Escherichia coli W3110 DNA, complete genome 4646332
    U00096 геномная ДНК стандартные прокариоты 23-февраль-2006 Escherichia coli K12 MG1655, complete genome. 4639675

    Все записи относятся к стандартному классу данных. Одна из последовательностей ДНК была создана давно - в 1986 году - и является записью кода только для одного белка, поэтому короткая. Две другие записи - полные геномы, они соответственно, длиннее, чем ген белка, но разной длины. Записи созданы в 2006 году почти в одно время. Последовательность, кодирующая белок SYH_ECOLI, не отличается от последовательности полного гена (идентичность 100%).

    Выравнивание

    
    Program: needle
    Rundate: Wed 19 Sep 2007 08:29:59
    Commandline: needle
       [-asequence] SYH_ECOLI_gene1.fasta
       [-bsequence] SYH_ECOLI_gene2.fasta
       [-outfile] gene1-gene2.needle
       -auto
    Align_format: srspair
    Report_file: gene1-gene2.needle
    
    =======================================
    
    Aligned_sequences: 2
    1: M11843
    2: U00096
    Matrix: EDNAFULL
    Gap_penalty: 10.0
    Extend_penalty: 0.5
    
    Length: 1275
    Identity:    1275/1275 (100.0%)
    Similarity:  1275/1275 (100.0%)
    Gaps:           0/1275 ( 0.0%)
    Score: 6375.0
    
    
    =======================================
    
    M11843             1 gtggcaaaaaacattcaagccattcgcggcatgaacgattacctgcctgg     50
                         ||||||||||||||||||||||||||||||||||||||||||||||||||
    U00096             1 gtggcaaaaaacattcaagccattcgcggcatgaacgattacctgcctgg     50
    
    M11843            51 cgaaacggccatctggcagcgcattgaaggcacactgaaaaacgtgctcg    100
                         ||||||||||||||||||||||||||||||||||||||||||||||||||
    U00096            51 cgaaacggccatctggcagcgcattgaaggcacactgaaaaacgtgctcg    100
    
    M11843           101 gcagctacggttacagtgaaatccgcttgccgattgtagagcagaccccg    150
                         ||||||||||||||||||||||||||||||||||||||||||||||||||
    U00096           101 gcagctacggttacagtgaaatccgcttgccgattgtagagcagaccccg    150
    
    M11843           151 ctattcaaacgtgcgattggtgaagtcaccgacgtggttgaaaaagagat    200
                         ||||||||||||||||||||||||||||||||||||||||||||||||||
    U00096           151 ctattcaaacgtgcgattggtgaagtcaccgacgtggttgaaaaagagat    200
    
    M11843           201 gtacacctttgaggatcgcaatggcgacagcctgactctgcgccctgaag    250
                         ||||||||||||||||||||||||||||||||||||||||||||||||||
    U00096           201 gtacacctttgaggatcgcaatggcgacagcctgactctgcgccctgaag    250
    
    M11843           251 ggacggcgggctgtgtacgcgccggcatcgagcatggtcttctgtacaat    300
                         ||||||||||||||||||||||||||||||||||||||||||||||||||
    U00096           251 ggacggcgggctgtgtacgcgccggcatcgagcatggtcttctgtacaat    300
    
    M11843           301 caggaacagcgtctgtggtatatcgggccgatgttccgtcacgagcgtcc    350
                         ||||||||||||||||||||||||||||||||||||||||||||||||||
    U00096           301 caggaacagcgtctgtggtatatcgggccgatgttccgtcacgagcgtcc    350
    
    M11843           351 gcagaaagggcgttatcgtcagttccatcagttgggctgcgaagttttcg    400
                         ||||||||||||||||||||||||||||||||||||||||||||||||||
    U00096           351 gcagaaagggcgttatcgtcagttccatcagttgggctgcgaagttttcg    400
    
    M11843           401 gtctgcaaggtccggatatcgacgctgaactgattatgctcactgcccgc    450
                         ||||||||||||||||||||||||||||||||||||||||||||||||||
    U00096           401 gtctgcaaggtccggatatcgacgctgaactgattatgctcactgcccgc    450
    
    M11843           451 tggtggcgcgcgctgggtatttccgagcacgtaactcttgagctgaactc    500
                         ||||||||||||||||||||||||||||||||||||||||||||||||||
    U00096           451 tggtggcgcgcgctgggtatttccgagcacgtaactcttgagctgaactc    500
    
    M11843           501 tatcggttcgctggaagcacgcgccaattaccgcgatgcgctggtggcat    550
                         ||||||||||||||||||||||||||||||||||||||||||||||||||
    U00096           501 tatcggttcgctggaagcacgcgccaattaccgcgatgcgctggtggcat    550
    
    M11843           551 tccttgagcagcataaagaaaagctggacgaagactgcaaacgccgcatg    600
                         ||||||||||||||||||||||||||||||||||||||||||||||||||
    U00096           551 tccttgagcagcataaagaaaagctggacgaagactgcaaacgccgcatg    600
    
    M11843           601 tacactaacccgctgcgcgtgctggattcaaaaaatccggaagtgcaggc    650
                         ||||||||||||||||||||||||||||||||||||||||||||||||||
    U00096           601 tacactaacccgctgcgcgtgctggattcaaaaaatccggaagtgcaggc    650
    
    M11843           651 gcttctcaacgacgctccggcattaggtgactatctggacgaggaatctc    700
                         ||||||||||||||||||||||||||||||||||||||||||||||||||
    U00096           651 gcttctcaacgacgctccggcattaggtgactatctggacgaggaatctc    700
    
    M11843           701 gtgagcattttgccggtctgtgcaaactgctggagagcgcggggatcgct    750
                         ||||||||||||||||||||||||||||||||||||||||||||||||||
    U00096           701 gtgagcattttgccggtctgtgcaaactgctggagagcgcggggatcgct    750
    
    M11843           751 tacaccgtaaaccagcgtctggtgcgtggtctggattactacaaccgtac    800
                         ||||||||||||||||||||||||||||||||||||||||||||||||||
    U00096           751 tacaccgtaaaccagcgtctggtgcgtggtctggattactacaaccgtac    800
    
    M11843           801 cgttttcgagtgggtgactaacagtctcggctcccagggcaccgtgtgtg    850
                         ||||||||||||||||||||||||||||||||||||||||||||||||||
    U00096           801 cgttttcgagtgggtgactaacagtctcggctcccagggcaccgtgtgtg    850
    
    M11843           851 caggcggtcgttatgacggtcttgtggaacaactgggcggtcgtgcaaca    900
                         ||||||||||||||||||||||||||||||||||||||||||||||||||
    U00096           851 caggcggtcgttatgacggtcttgtggaacaactgggcggtcgtgcaaca    900
    
    M11843           901 ccggctgtcggttttgctatgggcctcgaacgtcttgtattgttagtaca    950
                         ||||||||||||||||||||||||||||||||||||||||||||||||||
    U00096           901 ccggctgtcggttttgctatgggcctcgaacgtcttgtattgttagtaca    950
    
    M11843           951 ggccgttaatccggaatttaaagccgatcctgttgtcgatatatacctgg   1000
                         ||||||||||||||||||||||||||||||||||||||||||||||||||
    U00096           951 ggccgttaatccggaatttaaagccgatcctgttgtcgatatatacctgg   1000
    
    M11843          1001 tggcttcaggtgctgatacacaatctgcggctatggcattagctgagcgt   1050
                         ||||||||||||||||||||||||||||||||||||||||||||||||||
    U00096          1001 tggcttcaggtgctgatacacaatctgcggctatggcattagctgagcgt   1050
    
    M11843          1051 ctgcgtgatgaattaccgggcgtgaaattgatgaccaaccacggcggcgg   1100
                         ||||||||||||||||||||||||||||||||||||||||||||||||||
    U00096          1051 ctgcgtgatgaattaccgggcgtgaaattgatgaccaaccacggcggcgg   1100
    
    M11843          1101 caactttaagaaacagtttgcccgtgctgataaatggggtgcccgcgttg   1150
                         ||||||||||||||||||||||||||||||||||||||||||||||||||
    U00096          1101 caactttaagaaacagtttgcccgtgctgataaatggggtgcccgcgttg   1150
    
    M11843          1151 ctgtggtgctgggtgagtctgaagtggctaacggcacagcagtagtgaag   1200
                         ||||||||||||||||||||||||||||||||||||||||||||||||||
    U00096          1151 ctgtggtgctgggtgagtctgaagtggctaacggcacagcagtagtgaag   1200
    
    M11843          1201 gatttgcgctctggtgagcaaacggcagttgcgcaggatagcgtagccgc   1250
                         ||||||||||||||||||||||||||||||||||||||||||||||||||
    U00096          1201 gatttgcgctctggtgagcaaacggcagttgcgcaggatagcgtagccgc   1250
    
    M11843          1251 gcatttgcgcacgttactgggttaa   1275
                         |||||||||||||||||||||||||
    U00096          1251 gcatttgcgcacgttactgggttaa   1275
    
    

  • Сравнение описаний гена Escherichia coli в двух разных записях EMBL
  • Последовательности, кодирующие белок SYH_ECOLI в двух записях банка EMBL

      I II
    ID записи M11843 U00096
    Начало гена в записи 204 2637323
    Конец гена в записи 1478 2638597
    Направление гена прямое обратное
    Примечания GTG старт-кодон; N-конец белка секвенирован гистидин т-РНКсинтетаза; рабочая среда - цитоплазма; функция: аминоацилирование тРНК для трансляции белков [goid 0006418]

    Последовательности совпадают на 100 %.

  • Знакомство с записью гена из эукариотического генома
  • Рассмотрим следующую запись: область Х хромосомы человека от гена филамина до глюкоза-6-фосфат-дегидрогеназа кодирующего гена. AC L44140, геномная ДНК, стандартный класс данных. Ген XAP-5.

    На главную


    © Даниленко Светлана