Kodomo

Пользователь

Отчет по практикуму 13

Задание 1. Старт кодоны

Escherichia coli

ATG 3890

ATT 4 (usual protein)

CTG 2 (usual protein)

GTG 338

TTC 1 (pseudogene LomR)

TTG 80

Candidatus Gracilibacteria bacterium

ACA 1 (pseudogene of hypothetical protein)

ATG 1129

GTG 41

TCA 1

TCT 1 (pseudogene)

TTG 23

Mycoplasma pneumoniae

AAA 1

ACA 1

ACT 1

ATA 3

ATC 1

ATG 627

ATT 7 (usual protein)

CAA 1

CAC 1

CTA 1

CTC 3

CTG 2

GAA 1

GTG 60

GTT 1

TCC 2

TCT 1

TGA 1

TTA 1

TTC 1

TTG 49

Можно заметить, что самым часто встречающимся старт-кодоном у анализируемых бактерий является всё-таки ATG (метионин). Довольно часто в начале последовательностей встречаются и кодоны GTG, TTG, отличающиеся от вышеуказанного кодона ATG одним нуклеотидом. Это явление объясняется единичными, точечными мутациями, которые не сильно влияют на выживаемость организма и сохраняются в ходе естественного отбора.

Стоит упомянуть, что использование отличных от ATG кодонов всё-таки свойственно бактериям и археям. [6]

Задание 2. Стоп кодоны не в конце последовательностей

Escherichia coli

lcl|U00096.3_cds_b4587_250 [gene=insN] [locus_tag=b4587] [db_xref=ASAP:ABE-0285253,ECOCYC:G6130] [protein=IS911A regulator fragment] [pseudo=true] [location=join(270278..270540,271764..272190)] [gbkey=CDS]

lcl|U00096.3_cds_AAD13438.1_1459 [gene=fdnG] [locus_tag=b1474] [db_xref=UniProtKB/Swiss-Prot:P24183] [protein=formate dehydrogenase N subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13438.1] [location=1547401..1550448] [gbkey=CDS]

lcl|U00096.3_cds_AAD13456.1_3824 [gene=fdoG] [locus_tag=b3894] [db_xref=UniProtKB/Swiss-Prot:P32176] [protein=formate dehydrogenase O subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13456.1] [location=complement(4082772..4085822)] [gbkey=CDS]

lcl|U00096.3_cds_AAD13462.1_3997 [gene=fdhF] [locus_tag=b4079] [db_xref=UniProtKB/Swiss-Prot:P07658] [protein=formate dehydrogenase H] [transl_except=(pos:418..420,aa:Sec)] [protein_id=AAD13462.1] [location=complement(4297219..4299366)] [gbkey=CDS]

В четырех последовательностях стоп-кодоны содержатся не только в конце. Первая - псевдоген. Эта последовательность - ген, утративший способность кодировать белок и не экспрессирующийся в клетке. Вероятно, произошли мутации и/или рамка считывания (ORF) была смещена, в результате чего кодон, ранее кодировавший аминокислоту, стал стоп-кодоном. Вторая, третья и четвертая последовательности кодируют субъединицы формиатдигидрогеназы (Fdh). Исследование 2003 года [2] показало, что Escherichia coli синтезирует три фермента формиатдегидрогеназы: Fdh-N, Fdh-H и Fdh-O. Синтез связанного с мембраной фермента Fdh-N максимален в условиях анаэробного роста клеток, когда присутствует нитрат; формиатдегидрогеназа H (Fdh-H) - селенополипептид, входит в состав комплекса формиат-водород-лиаза и либо находится в цитоплазме клетки, либо свободно связан с внутренней поверхностью цитоплазматической мембраны; третья формиатдегидрогеназа, формиатдегидрогеназа O (Fdh-O), связана с мембраной и структурно и иммунологически родственна Fdh-N [2].

У селеноцистеина нет своего кодона, и кодон TGA (с некоторой последовательностью после него), встречающийся в геноме, кодирует именно эту редко встречающуюся аминокислоту.

Задание 3. Частота встречаемости стоп кодонов

Escherichia coli

TGA 1251

TAA 2763

TAG 306

Candidatus Gracilibacteria bacterium

TGA 1

TAA 1000

TAG 188

Mycoplasma pneumoniae

TGA 0

TAA 526

TAG 220

"Пропавшим" стоп-кодоном у Candidatus Gracilibacteria bacterium и Mycoplasma pneumoniae является кодон TGA. Вероятно, в геноме этот триплет выполняет другую функцию, например, кодирует какую-то аминокислоту. Это можно подтвердить подсчетом общего количества кодонов: TGA довольно часто встречается в геноме и у первой, и у второй бактерии. Исследование 2014 года [3] свидетельствует о том же: предсказание о том, что TGA кодирует глицин в Gracilibacteria, было экспериментально подтверждено[4].

Известно, что TGA у Candidatus Gracilibacteria кодирует глицин [4], а у Mycoplasma pneumoniae - триптофан [7].

Задание 4. Лейцин

Escherichia coli

TTA 18505

TTG 18301

CTA 5203

CTC 14952

CTG 71305

CTT 14728

Candidatus Gracilibacteria bacterium

TTA 15077

TTG 8048

CTA 4861

CTC 4491

CTG 4147

CTT 8053

Mycoplasma pneumoniae

TTA 9246

TTG 6554

CTA 3505

CTC 2193

CTG 3054

CTT 4623

В большинстве случаев частота использования кодона связана с количеством соответствующей тРНК. Видно, что Escherichia coli "предпочитает" кодон, богатый C и G - СTG; две другие бактерии, напротив, отдают предпочтение кодонам с низким содержанием гуанина и цитозина, в их геномах преобладает TTA. GC-состав, таким образом, напрямую влияет на частоты встречаемости кодонов, являясь ключевым аспектом при обсуждении устойчивости белков к изменению (главным образом - повышению) температуры.

С другой стороны, причиной корреляции может являться естественный отбор.

Различия в частотах встречаемости кодонов внутри одного генома может объясняться химическими свойствами нуклеотидов, между разными видами бактерий - различиями в генетическом коде, образе жизни. Но не стоит забывать и о мутациях.

Задание 5. Cumulative GC-skew

Escherichia coli

График зависимости можно найти тут.

max - 1513000 bp - ter (терминация репликации)

min - 3870000 - oriC (инициация репликации)

Задание 6. 6-меры

Escherichia coli

AAGGAG 329

TAAGGA 282

AGGAGA 254

CAGGAG 255

AAGGAA 222

AGGAGT 215

Вышеуказанные 6-меры, вероятно, являются последовательностями Шайна-Дальгарно, влияющими на уровень экспрессии генов. Обычно они располагаются на расстоянии 10 нуклеотидов (это число может варьироваться) от старт-кодона. Такое обоснование согласуется с полученными результатами, есть учесть, в каком диапазоне производился поиск этих 6-меров.

Источники

[1] Xiongwen Cao, Sarah A. Slavoff. Non-AUG start codons: Expanding and regulating the small and alternative ORFeome // Experimental Cell Research. — 2020-06. — Vol. 391, iss. 1. — P. 111973. — doi:10.1016/j.yexcr.2020.111973.

[2] Wang H, Gunsalus RP. Coordinate regulation of the Escherichia coli formate dehydrogenase fdnGHI and fdhF genes in response to nitrate, nitrite, and formate: roles for NarL and NarP. J Bacteriol. 2003 Sep;185(17):5076-85. doi: 10.1128/JB.185.17.5076-5085.2003. PMID: 12923080; PMCID: PMC180993.

[3] Hanke A, Hamann E, Sharma R, Geelhoed JS, Hargesheimer T, Kraft B, Meyer V, Lenk S, Osmers H, Wu R, Makinwa K, Hettich RL, Banfield JF, Tegetmeyer HE, Strous M. 2014. Recoding of the stop codon UGA to glycine by a BD1-5/SN-2 bacterium and niche partitioning between Alpha- and Gammaproteobacteria in a tidal sediment microbial community naturally selected in a laboratory chemostat. Front Microbiol 5:231. doi: 10.3389/fmicb.2014.00231. [PMC free article] [PubMed] [CrossRef] [Google Scholar] [Ref list]

[4] Sieber CMK, Paul BG, Castelle CJ, Hu P, Tringe SG, Valentine DL, Andersen GL, Banfield JF. Unusual Metabolism and Hypervariation in the Genome of a Gracilibacterium (BD1-5) from an Oil-Degrading Community. mBio. 2019 Nov 12;10(6):e02128-19. doi: 10.1128/mBio.02128-19. PMID: 31719174; PMCID: PMC6851277.

[5] Riber L, Løbner-Olesen A. Coordinated replication and sequestration of oriC and dnaA are required for maintaining controlled once-per-cell-cycle initiation in Escherichia coli. J Bacteriol. 2005 Aug;187(16):5605-13. doi: 10.1128/JB.187.16.5605-5613.2005. PMID: 16077105; PMCID: PMC1196069.

[6] The Genetic Codes. Compiled by Andrzej (Anjay) Elzanowski and Jim Ostell at National Center for Biotechnology Information (NCBI), Bethesda, Maryland, U.S.A.; раздел 11.

[7] Inamine JM, Ho KC, Loechel S, Hu PC. Evidence that UGA is read as a tryptophan codon rather than as a stop codon by Mycoplasma pneumoniae, Mycoplasma genitalium, and Mycoplasma gallisepticum. J Bacteriol. 1990 Jan;172(1):504-6. doi: 10.1128/jb.172.1.504-506.1990. PMID: 2104612; PMCID: PMC208464.

Сопроводительные материалы

Скрипты можно найти тут.

Users/demenevauliana/pr13 (последним исправлял пользователь demenevauliana 2022-12-20 20:25:52)