Протокол занятия

Сравнение разных записей в EMBL

Идентификатор записи EMBL Тип молекулы Класс данных Раздел EMBL Дата создания документа Описание Длина последовательности
AP009048 genomic DNA STD PRO 22-JAN-2006 Escherichia coli W3110 DNA, complete genome 4646332
M32363 genomic DNA STD PRO 14-JUN-1990 E.coli agmatine ureohydrolase (speB) gene, complete cds 2458
U00096 genomic DNA STD PRO 23-FEB-2006 Escherichia coli K12 MG1655, complete genome 4639675
U28377 genomic DNA STD PRO 05-JUL-1995 Escherichia coli K-12 genome; approximately 65 to 68 minutes 141744
X68025 genomic DNA STD PRO 26-AUG-1992 E.coli tkt gene for transketolase 2441

В таблице указаны две записи полного генома двух разных штаммов E. Coli - W3110 DNA и K12 MG1655, причем длина первой последовательности на 6657 оснований больше
(обе были опубликованы зимой 2006 года).
А также два гена: ureohydrolase (speB) (точнее эта запись содержит несколько генов, причем моего tktA в ней не оказалось) и transketolase.

Сравнение описаний гена tkt из Escherichia coli в двух разных записях EMBL

I II
ID записи U28377 X68025
Начало гена в записи 34034 154
Конец гена в записи 36028 2148
Направление гена обратное прямое

Для сравнения мною был взят ген, кодирующий мой белок из записи, где содержится только нужный ген tkt (файл u28377_gene1.fasta), и также он же из записи неполного генома
Escherichia coli K-12 (файл x68025_gene2.fasta).
Получившийся процент идентичности составляет 100%, что подтверждает правильность выбора гена для сравнения (выравнивание последовательностей в файле u28377_gene1- x68025_gene2.fasta).

Знакомство с записью гена L44140 из генома человека


Ген /gene ="EMD" в записи банка EMBL - L44140.
Ген на прямой цепи: --[49883.. 50022]--...--[51338.. 51977]--->

121 экзон во всей записи, 6 экзонов в моем гене (EMD).
По данным записи, ген EMD содержит polyA_signal на участке 51956..51961, и далее polyA_site - 51977.
  • polyA_signal - recognition region necessary for endonuclease cleavage of an RNA transcript that is followed by polyadenylation; consensus=AATAAA [1]
  • polyA_site - site on an RNA transcript to which will be added adenine residues by post-transcriptional polyadenylation

Вернуться на главную страничку


© Головкина Мария Сергеевна