Kodomo

Пользователь

Практикум 12 (13)

Задание 1

Escherichia coli:

ATG – 3883

GTG – 334

TTG – 78

ATT – 4

CTG – 2

TTC – 1

Candidatus Gracilibacteria bacterium:

ATG – 1129

GTG – 41

TTG – 23

TCA – 1

TCT – 1

ACA – 1

Mycoplasma pneumoniae:

ATG – 634

GTG – 62

TTG - 40

ATT – 4

CTG – 4

ATC – 3

ATA – 2

ACC – 2

TTA – 2

GTT – 1

Все бактерии используют ATG в качестве старт-кодона, однако иногда его могут заменять другие кодоны. У вида Mycoplasma pneumoniae в 120 последовательностях наблюдаются иные старт-кодоны; чаще всего это GTG и TTG, гораздо реже встречаются остальные кодоны. У Candidatus Gracilibacteria bacterium число таких «отклонений» составляет 67; среди них также преобладают GTG и TTG, по одному разу встречаются TCA, ACA и TCT. Escherichia coli имеет отклонения в 419 последовательностях; помимо GTG и TTG среди них присутствуют ATT, TTC, CTG.

Наблюдаемое явление можно объяснить необходимостью в регуляции транскрипции гена (мРНК будет считываться реже, чем с типичным кодоном ATG), либо же способностью тРНК связываться с некоторыми альтернативными старт-кодонами ввиду их частичной комплементарности (в первую очередь с GTG и TTG).

Задание 2

Стоп-кодон TGA в срединном положении встречается в последовательностях 249, AAD13438.1_1457, AAD13456.1_3815, AAD13462.1_3987. В нетипичных случаях этот стоп-кодон кодирует аминокислоту селеноцистеин; на этот факт указывает графа (transl_except=(pos:..,aa:Sec)) в описаниях последних трёх последовательностей. Первая последовательность представляет собой псевдоген; вероятно, он утратил свою функцию в результате мутации, приведшей к образованию стоп-кодона.

>lcl|U00096.3_cds_249 [gene=insN] [locus_tag=b4587] [db_xref=ASAP:ABE-0285253,ECOCYC:G6130] [protein=CP4-6 prophage; IS911A regulator fragment] [pseudo=true] [location=join(270278..270540,271764..272190)] [gbkey=CDS]

>lcl|U00096.3_cds_AAD13438.1_1457 [gene=fdnG] [locus_tag=b1474] [db_xref=UniProtKB/Swiss-Prot:P24183] [protein=formate dehydrogenase N subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13438.1] [location=1547401..1550448] [gbkey=CDS]

>lcl|U00096.3_cds_AAD13456.1_3815 [gene=fdoG] [locus_tag=b3894] [db_xref=UniProtKB/Swiss-Prot:P32176] [protein=formate dehydrogenase O subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13456.1] [location=complement(4082772..4085822)] [gbkey=CDS]

>lcl|U00096.3_cds_AAD13462.1_3987 [gene=fdhF] [locus_tag=b4079] [db_xref=UniProtKB/Swiss-Prot:P07658] [protein=formate dehydrogenase H] [transl_except=(pos:418..420,aa:Sec)] [protein_id=AAD13462.1] [location=complement(4297219..4299366)] [gbkey=CDS]

Задание 3

Для E. coli частоты стоп-кодонов составляют:

TGA 1241

TAA 2756

TAG 303

Candidatus G. bacterium:

TGA 1

TAA 1000

TAG 188

M. pneumoniae:

TGA 0

TAA 531

TAG 210

Видно, что для второй и третьей бактерий характерно отсутствие стоп-кодона TGA в терминальном положении в последовательностях. Между тем, у Candidatus G. bacterium этот кодон 1089 раз встречается в последовательностях в срединном положении, а у M. pneumoniae – 532 раза. При сравнении нуклеотидных и аминокислотных последовательностей в них обнаруживаются расхождения. У бактерии Candidatus G. bacterium позиции, соответствующие кодону TGA, занимает аминокислота глицин, а у M. pneumoniae – триптофан. Эта переориентация стоп-кодона подтверждается в следующих исследованиях и объясняется наличием специальной тРНК с антикодоном UCA:

Inamine, J. M., K. C. Ho, S. Loechel, and P. C. Hu, 1990, Evidence that UGA is read as a tryptophan codon rather than as a stop codon by Mycoplasma pneumoniae, Mycoplasma genitalium, and Mycoplasma gallisepticum, J. Bacteriol.

Sieber, C., Paul, B. G., Castelle, C. J., Hu, P., Tringe, S. G., Valentine, D. L., Andersen, G. L., & Banfield, J. F., 2019, Unusual metabolism and hypervariation in the genome of a Gracilibacterium (BD1-5) from an oil-degrading community, mBio.

Задание 4

Escherichia coli:

TTA –18484

TTG – 18283

CTT – 14719

CTC – 14926

CTA – 5201

CTG – 71198

Candidatus Gracilibacteria bacterium:

TTA – 14767

TTG – 3237

CTT – 9333

CTC – 3968

CTA – 3357

CTG – 1714

Mycoplasma pneumoniae:

TTA – 10302

TTG – 5601

CTT – 2798

CTC – 3161

CTA – 2848

CTG – 2473

1. Разная частота используемости синонимичных кодонов обусловлена феноменом «предпочтения кодонов». На организменном уровне его можно объяснить несколькими факторами. Среди них – случайное распределение мутаций; корреляция с GC-составом на разных участках генома; зависимость частоты кодонов от встречаемости соответствующих тРНК.

2. На межвидовом уровне разница в используемости тех или иных кодонов, скорее всего, объясняется различным GC-составом, а также наличием различных комбинаций генов, имеющих разные кодонные предпочтения. Также не исключено, что совпадения в частотах встречаемости обусловлены одинаковыми или схожими генами/оперонами, а также присутствием общих профаговых элементов в геноме.

Задание 5

Минимум – 3 870 000, максимум – 1 513 000. Минимальное значение соответствует точке начала репликации (OriC), максимальное – точке завершения (терминации) репликации (ter).

По ссылке ниже – таблица зависимости локального и общего (кумулятивного) GC skew от позиции в геноме:

https://docs.google.com/spreadsheets/d/1VhfGTAuaaxEQGtzFJpEQGOGhHbp4yvxQV9C_rT_c0Dw/edit?usp=sharing

Задание 6

У Escherichia coli чаще всего встречаются такие 6-меры, как AAGGAG, AAGGAG, ATGAAA, GAAAAA, TGAAAA, AGGAGG, GGAGGA, GGAGGT, GAGGAG.

Эти последовательности нуклеотидов являются т.н. последовательностями Шайна-Дальгарно, которые обеспечивают связывание рибосомы с мРНК и дальнейшее протекание трансляции.

Users/vadim/pr13 (последним исправлял пользователь vadim 2021-12-19 20:53:53)