Банк EMBL |
|
Идентификатор записи EMBL | Тип молекулы |
Класс данных
|
Раздел EMBL
|
Дата создания документа |
Описание
|
Длина последовательности
|
U00096 | Геномная ДНК (genomic DNA) |
стандартный (STD) | прокариоты (PRO) |
23 февраля 2006 | полный геном Escherichia coli MG1655 | 4639675 |
AP009048 |
Геномная ДНК (genomic DNA) |
стандартный (STD) | прокариоты (PRO) |
22 января 2006 | полный геном Escherichia coli W3110 DNA | 4646332 |
J01597 | Геномная ДНК (genomic DNA) |
стандартный (STD) | прокариоты (PRO) |
21 февраля 1991 | гены,
кодирующие Карбонил-фосфат
синтетазу субъединицы А (carA) и
карбонил-фосфат синтетазу
субъединицы В (carB) Escherichia coli (complete sds) ***подозрительно, не так ли*** |
5227 |
M10611 |
Геномная ДНК (genomic DNA) |
стандартный (STD) | прокариоты (PRO) |
2 июля 1986 | ген, кодирующий дигидродипиколинат редуктазу организма Escherichia coli (сomplete cds) | 1281 |
Среди данных БД для этих записей, выведенных по соответствующим критериям задания, отличаются для DAPB_ECOLI лишь идентификатором записи EMBL, датой создания документа, длиной последовательности и представляющим наибольшиц интерес описанием. Из которого следует, что первые две записи соответствуют полным геномам кишечной палочки, соответственно, длина последовательности, отличаются в силу того, что они принадлежат по, всей видимости, равзным штаммам. Остальные же две записи описывают конкретные гены или ген, которые кодируют рассматриваемый белок DAPB_ECOLI.
С помощью команд
Примечание: Интересно, что J0159
Несет информацию сразу о
двух генах, во время
выполнени 3го задания, я буду рассматривать
тот, что по размеру наиболее приближен к
гену в записи M10611. Очень подозрительная
запись. Проверял 6 раз - она действительно
есть в выборке. Поскольку записи были в
обной выдаче, я рискну и сделаю предложение,
что наиболее близкий по размерам будет
обладать большей идентичностью.
В ходе проверки я выяснил, что по размеру
наиболее приближена к DapB
ген CarA, нежели СarB. Ниже в таблице для записи J0159
рассматривается ген CarA.
I | II | |
ID записи |
J01597 |
M10611 |
Начало гена в записи | 374 | 48 |
Конец гена в записи | 1622 | 956 |
Направление гена | прямое | прямое |
Примечания* |
Есть 4 ссылки
на статьи. одна из них не опубликована
(Lusty C.J.). Указаны авторы и
названия статей. |
Есть одна ссылка на
статью. Указаны авторы и название
статьи. Bouvier J., Richaud C., Richaud F., Patte J.C., Stragier P.; Посмотрите на год
создания записи - 1986. 20 лет назад.
Поначалу можно было бы предположить,
что данные 20-ти летней давности могли
бы оказаться каким-то образом
неточными. Однако запись пбновлялась
в последний раз в 2004 году, что,
впринципе, относительно недавно. |
Далее было сделано выравнивание с помощью
программ needle и seqret.
Identity: 543/1483 (36.6%)
Разворачивал для обоих случаев цепи -
процент идентичности возростал, хотя
направления генов в обоих случаях точно
прямые. увеличение процента идентичности -
это очень подозрительно.
Идентичность
слишком мала. Но в этом нет ошибки. На
следующий день в самом первом задании при
нахождении информации о записях EMBL увидел
напротив записи J01597 дословно
следующее: -; NOT_ANNOTATED_CDS; А как оказывается,
эта запись либо имеет какое-либо косвенное,
либо вообще не имеет никакого отношения к
гену, кодирующему мой белок, но есть в
выдаче. Скорее всего сработал человеческий
фактор. то есть ошибка в базе данных.
Возможно опечатка.
Чтобы удостовериться я дополнительно
посмотрел файл J01597.entret в надежде найти SwissProt
идентификатор. я его нашел.
"UniProtKB/Swiss-Prot:P0A6F1 и UniProtKB/Swiss-Prot:P00968
соответственно для двух белков, которые
кодируют 2 гена этой записи.
в то время как идентификатор белка Dapb_ecoli
P04036.
Дополнительно смотрю файл dapb_ecoli.entret - DR
EMBL; J01597;-; NOT_ANNOTATED_CDS;
Сравниваю последовательности
из записей U00096 (полного генома) и M10611
Совпадение в конкретном участке гена в
геноме и самого гена идентичность (100%).
Всё верно.
***Я осмелился оставить все
данные, которые привели меня к нахождению
несоответствия в банке EMBL, поскольку это
было интересно и является частью моего
небольшого исследования.
Мой ген 1С7.
Для знакомства с записью гена из эукариотического генома было предложено изучить документ EMBL с идентификационным номером BA000025 .*** Расстояния
между экзонами: 306,344,107,335
Между интронами: 2553, 149, 295