Идентификатор записи EMBL | Тип молекулы |
Класс данных
|
Раздел EMBL
|
Дата создания документа |
Описание
|
Длина последовательности
|
M11843 | геномная ДНК | стандартные | прокариоты | 18-ноябрь-1986 | Escherichia coli histidine-tRNA synthetase (hisS), complete cds | 1679 |
AP009048 | геномная ДНК | стандартные | прокариоты | 22-январь-2006 | Escherichia coli W3110 DNA, complete genome | 4646332 |
U00096 | геномная ДНК | стандартные | прокариоты | 23-февраль-2006 | Escherichia coli K12 MG1655, complete genome. | 4639675 |
Все записи относятся к стандартному классу данных. Одна из последовательностей ДНК была создана давно - в 1986 году - и является записью кода только для одного белка, поэтому короткая. Две другие записи - полные геномы, они соответственно, длиннее, чем ген белка, но разной длины. Записи созданы в 2006 году почти в одно время. Последовательность, кодирующая белок SYH_ECOLI, не отличается от последовательности полного гена (идентичность 100%).
Выравнивание
Program: needle Rundate: Wed 19 Sep 2007 08:29:59 Commandline: needle [-asequence] SYH_ECOLI_gene1.fasta [-bsequence] SYH_ECOLI_gene2.fasta [-outfile] gene1-gene2.needle -auto Align_format: srspair Report_file: gene1-gene2.needle ======================================= Aligned_sequences: 2 1: M11843 2: U00096 Matrix: EDNAFULL Gap_penalty: 10.0 Extend_penalty: 0.5 Length: 1275 Identity: 1275/1275 (100.0%) Similarity: 1275/1275 (100.0%) Gaps: 0/1275 ( 0.0%) Score: 6375.0 ======================================= M11843 1 gtggcaaaaaacattcaagccattcgcggcatgaacgattacctgcctgg 50 |||||||||||||||||||||||||||||||||||||||||||||||||| U00096 1 gtggcaaaaaacattcaagccattcgcggcatgaacgattacctgcctgg 50 M11843 51 cgaaacggccatctggcagcgcattgaaggcacactgaaaaacgtgctcg 100 |||||||||||||||||||||||||||||||||||||||||||||||||| U00096 51 cgaaacggccatctggcagcgcattgaaggcacactgaaaaacgtgctcg 100 M11843 101 gcagctacggttacagtgaaatccgcttgccgattgtagagcagaccccg 150 |||||||||||||||||||||||||||||||||||||||||||||||||| U00096 101 gcagctacggttacagtgaaatccgcttgccgattgtagagcagaccccg 150 M11843 151 ctattcaaacgtgcgattggtgaagtcaccgacgtggttgaaaaagagat 200 |||||||||||||||||||||||||||||||||||||||||||||||||| U00096 151 ctattcaaacgtgcgattggtgaagtcaccgacgtggttgaaaaagagat 200 M11843 201 gtacacctttgaggatcgcaatggcgacagcctgactctgcgccctgaag 250 |||||||||||||||||||||||||||||||||||||||||||||||||| U00096 201 gtacacctttgaggatcgcaatggcgacagcctgactctgcgccctgaag 250 M11843 251 ggacggcgggctgtgtacgcgccggcatcgagcatggtcttctgtacaat 300 |||||||||||||||||||||||||||||||||||||||||||||||||| U00096 251 ggacggcgggctgtgtacgcgccggcatcgagcatggtcttctgtacaat 300 M11843 301 caggaacagcgtctgtggtatatcgggccgatgttccgtcacgagcgtcc 350 |||||||||||||||||||||||||||||||||||||||||||||||||| U00096 301 caggaacagcgtctgtggtatatcgggccgatgttccgtcacgagcgtcc 350 M11843 351 gcagaaagggcgttatcgtcagttccatcagttgggctgcgaagttttcg 400 |||||||||||||||||||||||||||||||||||||||||||||||||| U00096 351 gcagaaagggcgttatcgtcagttccatcagttgggctgcgaagttttcg 400 M11843 401 gtctgcaaggtccggatatcgacgctgaactgattatgctcactgcccgc 450 |||||||||||||||||||||||||||||||||||||||||||||||||| U00096 401 gtctgcaaggtccggatatcgacgctgaactgattatgctcactgcccgc 450 M11843 451 tggtggcgcgcgctgggtatttccgagcacgtaactcttgagctgaactc 500 |||||||||||||||||||||||||||||||||||||||||||||||||| U00096 451 tggtggcgcgcgctgggtatttccgagcacgtaactcttgagctgaactc 500 M11843 501 tatcggttcgctggaagcacgcgccaattaccgcgatgcgctggtggcat 550 |||||||||||||||||||||||||||||||||||||||||||||||||| U00096 501 tatcggttcgctggaagcacgcgccaattaccgcgatgcgctggtggcat 550 M11843 551 tccttgagcagcataaagaaaagctggacgaagactgcaaacgccgcatg 600 |||||||||||||||||||||||||||||||||||||||||||||||||| U00096 551 tccttgagcagcataaagaaaagctggacgaagactgcaaacgccgcatg 600 M11843 601 tacactaacccgctgcgcgtgctggattcaaaaaatccggaagtgcaggc 650 |||||||||||||||||||||||||||||||||||||||||||||||||| U00096 601 tacactaacccgctgcgcgtgctggattcaaaaaatccggaagtgcaggc 650 M11843 651 gcttctcaacgacgctccggcattaggtgactatctggacgaggaatctc 700 |||||||||||||||||||||||||||||||||||||||||||||||||| U00096 651 gcttctcaacgacgctccggcattaggtgactatctggacgaggaatctc 700 M11843 701 gtgagcattttgccggtctgtgcaaactgctggagagcgcggggatcgct 750 |||||||||||||||||||||||||||||||||||||||||||||||||| U00096 701 gtgagcattttgccggtctgtgcaaactgctggagagcgcggggatcgct 750 M11843 751 tacaccgtaaaccagcgtctggtgcgtggtctggattactacaaccgtac 800 |||||||||||||||||||||||||||||||||||||||||||||||||| U00096 751 tacaccgtaaaccagcgtctggtgcgtggtctggattactacaaccgtac 800 M11843 801 cgttttcgagtgggtgactaacagtctcggctcccagggcaccgtgtgtg 850 |||||||||||||||||||||||||||||||||||||||||||||||||| U00096 801 cgttttcgagtgggtgactaacagtctcggctcccagggcaccgtgtgtg 850 M11843 851 caggcggtcgttatgacggtcttgtggaacaactgggcggtcgtgcaaca 900 |||||||||||||||||||||||||||||||||||||||||||||||||| U00096 851 caggcggtcgttatgacggtcttgtggaacaactgggcggtcgtgcaaca 900 M11843 901 ccggctgtcggttttgctatgggcctcgaacgtcttgtattgttagtaca 950 |||||||||||||||||||||||||||||||||||||||||||||||||| U00096 901 ccggctgtcggttttgctatgggcctcgaacgtcttgtattgttagtaca 950 M11843 951 ggccgttaatccggaatttaaagccgatcctgttgtcgatatatacctgg 1000 |||||||||||||||||||||||||||||||||||||||||||||||||| U00096 951 ggccgttaatccggaatttaaagccgatcctgttgtcgatatatacctgg 1000 M11843 1001 tggcttcaggtgctgatacacaatctgcggctatggcattagctgagcgt 1050 |||||||||||||||||||||||||||||||||||||||||||||||||| U00096 1001 tggcttcaggtgctgatacacaatctgcggctatggcattagctgagcgt 1050 M11843 1051 ctgcgtgatgaattaccgggcgtgaaattgatgaccaaccacggcggcgg 1100 |||||||||||||||||||||||||||||||||||||||||||||||||| U00096 1051 ctgcgtgatgaattaccgggcgtgaaattgatgaccaaccacggcggcgg 1100 M11843 1101 caactttaagaaacagtttgcccgtgctgataaatggggtgcccgcgttg 1150 |||||||||||||||||||||||||||||||||||||||||||||||||| U00096 1101 caactttaagaaacagtttgcccgtgctgataaatggggtgcccgcgttg 1150 M11843 1151 ctgtggtgctgggtgagtctgaagtggctaacggcacagcagtagtgaag 1200 |||||||||||||||||||||||||||||||||||||||||||||||||| U00096 1151 ctgtggtgctgggtgagtctgaagtggctaacggcacagcagtagtgaag 1200 M11843 1201 gatttgcgctctggtgagcaaacggcagttgcgcaggatagcgtagccgc 1250 |||||||||||||||||||||||||||||||||||||||||||||||||| U00096 1201 gatttgcgctctggtgagcaaacggcagttgcgcaggatagcgtagccgc 1250 M11843 1251 gcatttgcgcacgttactgggttaa 1275 ||||||||||||||||||||||||| U00096 1251 gcatttgcgcacgttactgggttaa 1275
I | II | |
ID записи | M11843 | U00096 |
Начало гена в записи | 204 | 2637323 |
Конец гена в записи | 1478 | 2638597 |
Направление гена | прямое | обратное |
Примечания | GTG старт-кодон; N-конец белка секвенирован | гистидин т-РНКсинтетаза; рабочая среда - цитоплазма; функция: аминоацилирование тРНК для трансляции белков [goid 0006418] |
Рассмотрим следующую запись: область Х хромосомы человека от гена филамина до глюкоза-6-фосфат-дегидрогеназа кодирующего гена. AC L44140, геномная ДНК, стандартный класс данных. Ген XAP-5.
..--[119119..119185]--...--[119322..119383]--...--[119650..119726]--.
..--[120110..120164]--...--[120312..120360]--...--[120458..120528]--.
..--[120638..120748]--...--[120853..121077]-->