Kodomo

Пользователь

Задание 1:

Старт-кодоны и частота их использования:

Последовательность 1:ATG 3883 ATT 4 CTG 2 GTG 334 TTC 1 TTG 78

Для данной последовательности характерно проявление альтернативных старт-кодонов (GTG, TTG и "слабые": ATT, CTG), появившихся из-за частичной комплементарности и кодона TTC, который, как я предполагаю, является мутацией кодона TTG.

Последовательность 2: ATG 1129 GTG 41 TCA 1 TCT 1 TTG 23 ACA 1

Данная последовательность также имеет альтернативные старт-кодоны (GTG,TTG), однако также имеет нехарактерные стартовые кодоны, это можно объяснить тем, что они находятся в начале последовательности псевдогена, для которых часто бывает характерна неправильная структура.

Последовательность 3: ATG 634 GTG 62 TTG 40 ACC 2 ATA 2 ATC 3 ATT 4 CTG 4 GTT 1 TTA 2

Для данной последовательности характерны оба признака: присутствие альтернативных кодонов (GTG,TTG,ACC(возможно мутация слабого кодона ACG),ATA,ATC(возможно мутация основного кодона ATG), ATT, CTG) , а также нехарактерных в началах последовательностей псевдогенов (GTT, TTA).


Задание 2:

lcl|U00096.3_cds_249 [gene=insN] [locus_tag=b4587]...[pseudo=true]...

(Псевдоген , также при помощи интернета получил информацию о том , что данный псевдоген является частью большей кодирующей цепочки, которая была оборвана внедрением стоп-кодона) информация о белке

lcl|U00096.3_cds_AAD13438.1_1457 ...[transl_except=(pos:586..588,aa:Sec)]

lcl|U00096.3_cds_AAD13456.1_3815 ...[transl_except=(pos:586..588,aa:Sec)]

lcl|U00096.3_cds_AAD13462.1_3987 ...[transl_except=(pos:418..420,aa:Sec)]

(для каждой из данных последовательностей указано , что процесс трансляции проходит на цепочке за исключением стоп кодона )


Задание 3:

Стоп-кодоны и их использование(нехарактерные стоп-кодоны псевдогенов не учитываются):

Последовательность 1:TAA 2755 TAG 303 TGA 1241

Последовательность 2:TAA 998 TAG 188

Последовательность 3:TAA 514 TAG 206

Для 2 и 3 последовательности стоп-кодон TGA не является стоп кодоном, и кодирует аминокислоты. подтверждение - "Inprokaryotes, Mycoplasma, and Spiroplasma have recoded the TGA stop codon totryptophan (W)... "


Задание 4:

последовательность 1:TTA 18484 TTG 18283 CTT 14719 CTC 14926 CTG 71198 CTA 5201

последовательность 2:TTA 14767 TTG 3237 CTT 9333 CTC 3968 CTG 1714 CTA 3357

последовательность 3:TTA 10302 TTG 5601 CTT 2798 CTC 3161 CTG 2473 CTA 2848

Конкретных предположений не имею , однако, исходя из данных, предположу, что для организма могут быть характерные кодоны кодирования аминокислоты , обычные и редко встречаемые ( в каждой последовательности мы можем встретить кодон, встречаемость которого резко выше чем у остальных , и кодон, встречаемость которого ниже. Так кодон CTG очень характерен для первой последовательности , TTA, TTG,CTT,CTC - средней встречаемости , а CTA - явно редко встречаемый)


Задание 5:

cumulative GC-skew = -9.241

Минимум соответствует началу репликации , максимум-концу.

По информации из формата genbank минимум cumulative GC-skew(3870000) не соответствует oriC(3925744..3925975), однако находится достаточно близко и скорее всего обнаруживается при использовании окна другого масштаба. Подтверждается прошлое утверждение строчкой "rep_origin". график

Users/abaukin/pr12 (последним исправлял пользователь abaukin 2022-02-03 13:39:34)