На главную
Term3

E M B L

Задание №1. Сравнение разных записей в EMBL

Цель: сравнить записи банка данных EMBL, полученные в ответ на запрос по accession number белка MALK_ECOLI.
Краткое описание работы: в работе использовался банк данных EMBL(SRS). На ввод были поданы AC's белка Malk_ecoli (malk_ecoli). Запрос производился по следующим полям: ID, Molecule, Data class, Division, Sequence Length, Entry Creation Date. Description. Полученные результаты были внесены в таблицу.
Результаты: полученные находки банка EMBL сведены в Таблицу1.

ID записи EMBL Тип молекулы
Класс данных
Раздел EMBL
Дата создания документа
Описание
Длина посл.
U00096 Геномная ДНК Стандарт Прокариоты 23 февраля 2006 Escherichia coli K12 MG1655, complete genome. 4639675
AP009048 Геномная ДНК Стандарт Прокариоты 22 января 2006 Escherichia coli W3110 DNA, complete genome. 4646332
J01648 Геномная ДНК Стандарт Прокариоты 02 апреля 1988 E.coli malB region promoter, malK-lamB and malEFG operons: including malE, malF, malG, malK, lamB, and molA genes coding for maltose binding and maltose uptake proteins and the lambda receptor protein. 6545
U00006 Геномная ДНК Стандарт Прокариоты 22 сентября 1993 E. coli chromosomal region from 89.2 to 92.8 minutes. 176195
V00303 Геномная ДНК Стандарт Прокариоты 03 ноября 1982 E. coli genes malK and malE N-terminal sequences. 600

Выводы: - Тип молекулы: геномная ДНК
- Класс данных: стандарт. Отнесение данных к такому классу говорит о том, что при получении данных были использованы стандартные методы, без каких-либо особенностей.
- Раздел EMBL: Т.к. все найденные записи содержат данные о ДНК прокариотныз организмов, они относятся к разделу "PRO".
- Дата создания документа: Видно (и вполне логично), что полный геном Escherichia coli был секвенирован гораздо позже, чем отдельные гены.
- Длина: Длина дана в парах оснований.
- Описание: в описании первых двух находок описан полный геном Escherichia coli K12 MG1655 и Escherichia coli W3110 DNA - просто разные штаммы организма. В третей находке описан оперон, гены malE, malF, malG, malK, lamB и molA, отвечающие за связывание с мальтозой и кодирующие белковый лямбда-рецептор. В четвертой находке описан участок кольцевой хромосомы Escherichia coli с 89.2 по 92.8 минуту. В описании последней находки написано следующее: N-концевые последовательности генов malK и malE организма Escherichia coli.Как мы знаем, в ДНК концы обозначаются как 5' и 3', а не как N и C. В данной ситуации возможны две ситуации: или авторы исследования имели в виду не гены ДНК, а белки, которые закодированы этими генами, или же они обозначили концы ДНК нестандартным образом - как N и C.

Задание №2. Сравнение описаний гена Escherichia coli в двух разных записях EMBL

Цель: сравнить описаний гена Escherichia coli в двух разных записях EMBL, полученных в первом задании.
Краткое описание работы: accession number, по которому был произведен поиск двух записей EMBL, был получен следующим образом:

entret embl:J01648 -auto
entret embl:U00006 -auto

Были получены файлы J01648.entret и U00006.entret, из которых потом были извлечены гены malk. Извлечение гена из записи EBML было произведено с помощью команды seqret: seqret j01648.entret -sask
seqret u00006.entret -sask
Для сравнения последовательностей использовалась команда needle:
needle j01648.fasta u00006.fasta j01648-u00006.needle -auto
Результаты: результаты были сведены в Таблицу2.

  I II
ID записи J01648 U00006
Начало гена в записи 3281 112026
Конец гена в записи 4393 113141
Направление гена прямое прямое
Примечания    

Выводы: Выводы: было выяснено, что поседовательности совпадают на 99.6%. Отличия обусловлены заменами, приведенными в Таблице3, а также вставками в позициях 657, 658 и 719 последовательности J01648, которые привели к сдвигу рамки и, соответственно, уменьшению веса выравнивания.

Позиция от начала кодир. посл. Нуклеотид из J01648 Нуклеотид из U00006 Позиция в кодоне: 1, 2, 3
305 с t 2
306 t g 3

Возникает вопрос: синонимична ли замена? Ответ: нет. Это обусловлено тем, что данные нуклеотиды составляют часть триплета, кодирующего одну аминокислоту - Пролин и Лейцин соответственно. Замена может оказаться критичной, т.к. эти аминокислоты достаточно сильно различаются по своим химическим свойствам.

Задание №3. Знакомство с записью гена из эукариотического генома

Цель: схематично изобразить структуру транслируемых участков гена gs19, определить общее число экзонов в гене, длину самого длинного и самого короткого интрона и экзона. Краткое описание работы: длина экзонов рассчитывалась по следующей формуле: l=x2-x1+1 , где х1 и х2 - первый и последний нуклеотид экзона соответственно.
Результат: схематичное изображение гена gs19:
--[224735..224850]--[226744..226816]--->
Общее число экзонов в гене - 2
Длина интрона - 1893 нт
Длина более длинного экзона - [224735..224850] - 116 нт
Длина более короткого экзона - [226744..226816] - 73 нт

Выводы: видно, что длина интрона превышает длину экзона более, чем в 16 раз. Скорее всего, это говорит о том, что большая часть генома эукариотического организма (как раз "интронные" промежутки, сильно превыщающие длину "экзонных") не является кодирующей.

Отчет в формате *.doc можно посмотреть здесь

© Pouliakhina
All rights reserved