Kodomo

Пользователь

ПРАКТИКУМ НОМЕР 13

Файл со скриптами: https://docs.google.com/document/d/1IJpXrR504vWfqR4PsE3a7XtZlXdCfT83Y9WYvgXRGMM/edit?usp=sharing

Для удобства обозначим следующие бактерии цифрами

1 - Escherichia coli

2 - Candidatus Gracilibacteria bacterium

3 - Mycoplasma pneumoniae

Задание номер 1

1

ATG: 3890

ATT: 4

CTG: 2

GTG: 338

TTC: 1

TTG: 80

2

ACA: 1

ATG: 1129

GTG: 41

TCA: 1

TCT: 1

TTG: 23

3

AAA: 1

ACA: 1

ACT: 1

ATA: 3

ATC: 1

ATG: 627

ATT: 7

CAA: 1

CAC: 1

CTA: 1

CTC: 3

CTG: 2

GAA: 1

GTG: 60

GTT: 1

TCC: 2

TCT: 1

TGA: 1

TTA: 1

TTC: 1

TTG: 49

Недавно было показано, что при определенных условиях для инициации трансляции в Escherichia coli может использоваться множество различных стартовых кодонов, хотя большинство из них используются редко, тогда как ATG, за которым следуют GTG, а затем TTG, остаются основными стартовыми сигналами. В соответствии с этим рейтингом стартовых кодонов гены, начинающиеся с ATG, в среднем экспрессируются на значительно более высоких уровнях, чем гены, которые начинаются с GTG, и последние экспрессируются на более высоких уровнях, чем гены, начинающиеся с TTG. Все стартовые кодоны, по-видимому, распознаются специальным инициатором N-формил метионил-тРНК с антикодоном CAT. Распознавание стартовых кодонов и дискриминация между тРНК инициатора и удлинения зависят от фактора инициации трансляции IF3, который помогает позиционировать правильный стартовый кодон в рибосомном Р-сайте до связывания аминоацил-тРНК. У прокариот стартовый кодон является одним из основных детерминант инициации трансляции: замена ATG альтернативным стартовым кодоном, таким как GTG, обычно приводит к многократному падению эффективности трансляции. Сообщается о корреляции между типом стартового кодона и наличием последовательности Шайн-Далгарно (SD): гены с запуском ATG с большей вероятностью обладают последовательностью SD, чем гены с альтернативными запусками. Но на основа проводимых испытаний выявилось, что гены, начинающиеся с GTG и TTG, обычно показывают более сильное сохранение последовательности Шайн-Далгарно по сравнению с генами с началом ATG [1].

По представленным выше данным не трудно заметить, что на первом месте по встечаемости находиться ATG, на втором - GTG, на третьем - TTG. Все остальные страт-кодоны встречаются гораздо реже. Нельзя не обратить внимание на количество страт-кодонов у Mycoplasma pneumoniae такое разнообразие можно объяснить только тем, что они являются псевдогенами.

Задание номер 2

только для 1

lcl|U00096.3_cds_b4587_250 [gene=insN] [locus_tag=b4587] [db_xref=ASAP:ABE-0285253,ECOCYC:G6130] [protein=IS911A regulator fragment] [pseudo=true] [location=join(270278..270540,271764..272190)] [gbkey=CDS]

lcl|U00096.3_cds_AAD13438.1_1459 [gene=fdnG] [locus_tag=b1474] [db_xref=UniProtKB/Swiss-Prot:P24183] [protein=formate dehydrogenase N subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13438.1] [location=1547401..1550448] [gbkey=CDS]

lcl|U00096.3_cds_AAD13456.1_3824 [gene=fdoG] [locus_tag=b3894] [db_xref=UniProtKB/Swiss-Prot:P32176] [protein=formate dehydrogenase O subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13456.1] [location=complement(4082772..4085822)] [gbkey=CDS]

lcl|U00096.3_cds_AAD13462.1_3997 [gene=fdhF] [locus_tag=b4079] [db_xref=UniProtKB/Swiss-Prot:P07658] [protein=formate dehydrogenase H] [transl_except=(pos:418..420,aa:Sec)] [protein_id=AAD13462.1] [location=complement(4297219..4299366)] [gbkey=CDS]

На основе описания можно понять, что первый ген является псевдогеном ( ген, который утратил свою функцию). Следовательно произошла мутация, из-за которой образовался стоп-кодон, но, как мы видим, это мутация не влияет на выживаемость.

Наиболее предпочтительным способом эффективного завершения трансляции для клетки было бы обладание неацилированными тРНК, антикодоны которых распознают три стоп-кодона TAA, TGA и TAG. Это, конечно, не так, но редко задают вопрос: почему бы и нет? По крайней мере, часть ответа заключается в том, что универсальный генетический код не совсем универсален; то есть стоп-кодоны не всегда кодируют «стоп». Например, TAA и TGA кодируют глютамин в некоторых реснитях (Preer et al., 1985), TGA кодирует цистеин в Euplotes octocarinatus (Meyer et al., 1991), а TGA кодирует триптофан в митохондриях (Macino et al., 1979) и селеноцистеин (Sec) в метазоанах, архебактериях и эубактерия[2].

В остальных 3 генах мы можем заметить, что в гене формиат дегидрогеназы TGA не является стоп-кодоном, а кодируется аминокислоту селеноцистеин.

Задание номер 3

1

TGA: 1246

TAA: 2761

TAG: 306

2

TGA: 1

TAA: 1000

TAG: 188

3

TGA: 0

TAA: 526

TAG: 220

Почему стоп-кодоны могут редко использовать? Скорее всего это связано с тем, что они выполняют другую функцию, если быть точнее, они кодируют каки-то аминокислоты.

у 2 и 3 бактерии TGA кодирует глицин и триптофан, именно поэтому они либо очень редко встречаются к конце, либо вообще не встречаются [2].

Задание номер 4

1

TTA 18505

TTG 18301

CTA 5203

CTC 14952

CTG 71305

CTT 14728

2

TTA 15077

TTG 8048

CTA 4861

CTC 4491

CTG 4147

CTT 8053

3

TTA 9246

TTG 6554

CTA 3505

CTC 2193

CTG 3054

CTT 4623

У одной и той же бактерии кодоны кодирующие лейцин встречаются с разной частотой, следовательно, в разных бактериях их частота будет отличаться. Это связано с распространенностью тРНК, взаимодействующих с кодонами, что может влиять на конформацию белка, т.е. происходит нехватка тРНК для, находящегося в конце участка белка, поэтому участок не успевает принять нужную конформацию.

Задание номер 5

только для 1

ссылка на расчеты и график: https://docs.google.com/spreadsheets/d/11NEoTzf37wkiaesAlNuD-1X7ApyRP6ZGOPRXXXcAzzY/edit?usp=sharing

Максимальное значение соответствует ориджину, а минимальное - концу репликации [3].

Задание номер 6

для 1

AAGGAG 183

TAAGGA 163

AGGAGA 129

AAGGAA 122

AAAGGA 120

CAGGAG 120

AGGAGT 113

GGAGAA 104

AGGAAA 101

ACAGGA 94

AAAAGG 87

для 2

AAATAA 115

AAAAAA 113

TAAAAA 111

TTTTTT 110

ATAAAA 107

AATAAA 104

ATTTTT 102

AAAAAT 97

TAATAA 93

AATAAT 89

для 3

AATTAA 44

TTTAAA 40

ATTAAA 37

TTAAAA 35

AAAGGA 33

ATTTAA 32

TAAAAA 29

AATTTA 28

AAGAAA 28

AAAAAG 27

Последовательности представленные выше скорее всего являются последовательностью Шайна-Дальгарно (их еще обозначают SD, они влияют на экспрессию генов и могут компенсировать мутации в старт-кодонах. SD обычно располагаются на расстоянии в 10 нуклеотидов от старт-кодона - это является местом посадки рибосом на мРНК.

Литература:

[1] Belinky, F., Rogozin, I.B. & Koonin, E.V. Selection on start codons in prokaryotes and potential compensatory nucleotides substitutions. Sci Rep 7, 12422 (2017). https://doi.org/10.1038/s41598-017-12619-6

[2]Copeland, P.R. Regulation of gene expression by stop codon recoding: selenocysteine. Gene Volume 312, Pages 17-25 (2003). https://doi.org/10.1016/S0378-1119(03)00588-2

[3]Jennifer, L., Steven, L.S. SkewIT: The Skew Index Test for large-scale GC Skew analysis of bacterial genomes. PLoS Comput Biol 16(12): e1008439 (2020). https://doi.org/10.1371/journal.pcbi.1008439 https://doi.org/10.1371/journal.pcbi.1008439

Users/alexrom/pr13 (последним исправлял пользователь alexrom 2022-12-20 14:27:34)