Kodomo

Пользователь

Задание 1.

Escherichia coli str. K-12 substr. MG1655

старт кодоны

их количество

ATG

3883

ATT

4

в каких последовательностях встретились

фактор инициации трансляции (IF-3), поли-А полимераза I, белок YmcF, белок YnfQ профага

CTG

2

кодируют: ингибитор реиинициации репликации ДНК, белок YfjD семейства UPF0053 внутренних мембранных белков

GTG

334

TTC

1

в каких последовательностях встретились

белок LomR_1 псевдогена lomR(белок профага)

TTG

78

что касается кодона ATT: YmcF, YnfQ- белки теплового шока, мутация старт кодона (ATG->ATT)не помешала экспрессии гена. Более того, при обратной замене (ATT->ATG)→ экспрессия YnfQ была прекращена; для поли-А полимеразы I (PAP I) "нетипичный" старт-кодон - механизм регуляции синтеза. PAP I - токсична для клетки в больших количествах, а данный кодон - позволяет регулировать ее синтез, изначально продуцировать PAP I в малых количествах. Аналогичный механизм работает и для синтеза IF3.[1]

Candidatus Gracilibacteria bacterium 28_42_T64

старт кодоны

их количество

ACA

1

в каких последовательностях встретились

гипотетический белок псевдогена

ATG

1129

GTG

41

TCA

1

в каких последовательностях встретились

серин-треониновая киназу, белок псевдогена

TCT

1

TTG

23

в каких последовательностях встретились

в основном - гипотетический протеин

в основном последовательности с редкими старт-кодонами кодируют псевдогены и гипотетические белки.

Mycoplasma pneumoniae M29

старт кодоны

их количество

ACC

2

в каких последовательностях встретились

белки клеточной адгезии семейства MgpС (белки псевдогена)

ATA

2

в каких последовательностях встретились

белки клеточной адгезии семейства MgpС (белки псевдогена)

ATC

3

в каких последовательностях встретились

белок, содержащий домен DUF16; гипотетический протеин; белок, содержащий домен DUF237

ATG

634

ATT

4

в каких последовательностях встретились

белок P80 семейства липопротеинов; белок R-субъединицы рестрикции эндонуклеазы; белок, содержащий домен DUF240; белок MPN647 семейства липопротеинов

CTG

4

в каких последовательностях встретились

белок S-субъединицы рестрикции эндонуклеазы; белок семейства MgpC белков клеточной адгезии (белок псевдогена), белок семейства DUF31; транспортный белок (MFS transporter)

GTG

62

GTT

1

в каких последовательностях встретились

белок семейства MgpC белков клеточной адгезии (белок псевдогена)

TTA

2

в каких последовательностях встретились

гипотетический протеин

TTG

40

Mycoplasma pneumoniae M29 имеет ряд генов отвечающих за синтез белков клеточной адгезии и липопротеинов, но некоторая часть из них, как видно из таблицы - в своей кодирующей последовательности имеет "нетипичный" старт-кодон и может быть псевдогеном. можно предположить что, такие старт-кодоны нужны также для регуляции синтеза соответственных белков; “предпочтение” отдается синтезу белков клеточной адгезии и липопротеинов с нормальными старт-кодонами.[2]

Вывод: -нетипичные старт-кодоны могут быть результатом нейтральных мутаций, не влияющих на синтез -или могут быть механизмом регуляции трансляции

Задание 2.lcl|U00096.3_cds_249 [gene=insN] [locus_tag=b4587] [db_xref=ASAP:ABE-0285253,ECOCYC:G6130] [protein=CP4-6 prophage; IS911A regulator fragment] [pseudo=true] [location=join(270278..270540,271764..272190)] [gbkey=CDS] ген является псевдогеном , “доставшимся” от профага; этот ген - лишь часть более длинной кодирующей последовательности lcl|U00096.3_cds_AAD13438.1_1457 [gene=fdnG] [locus_tag=b1474] [db_xref=UniProtKB/Swiss-Prot:P24183] [protein=formate dehydrogenase N subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13438.1] [location=1547401..1550448] [gbkey=CDS]

lcl|U00096.3_cds_AAD13456.1_3815 [gene=fdoG] [locus_tag=b3894] [db_xref=UniProtKB/Swiss-Prot:P32176] [protein=formate dehydrogenase O subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13456.1] [location=complement(4082772..4085822)] [gbkey=CDS]

lcl|U00096.3_cds_AAD13462.1_3987 [gene=fdhF] [locus_tag=b4079] [db_xref=UniProtKB/Swiss-Prot:P07658] [protein=formate dehydrogenase H] [transl_except=(pos:418..420,aa:Sec)] [protein_id=AAD13462.1] [location=complement(4297219..4299366)] [gbkey=CDS]

последние три последовательности, кодируют субъединицы формиатдегидрогеназы, (функция которой состоит в том, чтобы катализировать окисление формиата до со2). В них кодон TGA считывается не как стоп-кодон, а как кодон, отвечающий за синтез селеноцистеина, благодаря специфичной последовательности после него.[3]

Задание 3.

Escherichia coli str. K-12 substr. MG1655

TGA

1241

TAA

2756

TAG

303

other

2

ATA, GAA

Candidatus Gracilibacteria bacterium 28_42_T64

TGA

1

TAA

1000

TAG

188

other

7

TCT-2, TTA-1, AAA-1, CTT-1, ACA-1, GAA-1

Mycoplasma pneumoniae M29

TGA

0

TAA

531

TAG

210

other

13

GTT -1, ACT-1, GTG -1, AAT-2 TTT-1, GAT-1, GGC -2, TAC-1, CGG-1, GGG-1, AAA-1

у Candidatus Gracilibacteria bacterium кодон TGA - кодирует глицин[4] у Mycoplasma pneumoniae – триптофан.[5]

Задание 4.

Escherichia coli str. K-12 substr. MG1655

CTA

5201

CTC

14926

CTG

71198

CTT

14719

TTA

18484

TTG

18283

Candidatus Gracilibacteria bacterium 28_42_T64

CTA

4861

CTC

4491

CTG

4147

CTT

8053

TTA

15077

TTG

8048

Mycoplasma pneumoniae M29

CTA

3619

CTC

2168

CTG

3220

CTT

5267

TTA

8959

TTG

6679

Для разных организмов, разные синонимические кодоны являются превалирующими. Это можно связать с разным количеством соответствующих т-РНК в клетке, произошедшими мутациями. Может быть, таким образом регулируется скорость трансляции.

Задание 5.

график

минимум cumulative GC-skew в точке 1513000 - соответствует точке начала репликации. максимум cumulative GC-skew в точке 3870000 - соответствует точке терминации репликации. что приблизительно соответствует данным со страницы бактерии : 3925744..3925975 - расположение точки начала репликации

источники:

  1. Comparative Proteomics Enables Identification of Nonannotated Cold Shock Proteins in E. coli Nadia G. D’Lima, Alexandra Khitun, Aaron D. Rosenbloom, Peijia Yuan, Brandon M. Gassaway, Karl W. Barber, Jesse Rinehart, and Sarah A. Slavoff Journal of Proteome Research 2017 16 (10), 3722-3731 DOI: 10.1021/acs.jproteome.7b00419
  2. Ralf Himmelreich, Helmut Hilbert, Helga Plagens, Elsbeth Pirkl, Bi-Chen Li, Richard Herrmann, Complete Sequence Analysis of the Genome of the Bacterium Mycoplasma Pneumoniae, Nucleic Acids Research, Volume 24, Issue 22, 1 November 1996, Pages 4420–4449, https://doi.org/10.1093/nar/24.22.4420

  3. Yoshizawa S, Böck A. The many levels of control on bacterial selenoprotein synthesis. Biochim Biophys Acta. 2009;1790(11):1404-1414. doi:10.1016/j.bbagen.2009.03.010
  4. Hanke A, Hamann E, Sharma R, Geelhoed JS, Hargesheimer T, Kraft B, Meyer V, Lenk S, Osmers H, Wu R, Makinwa K, Hettich RL, Banfield JF, Tegetmeyer HE, Strous M. Recoding of the stop codon UGA to glycine by a BD1-5/SN-2 bacterium and niche partitioning between Alpha- and Gammaproteobacteria in a tidal sediment microbial community naturally selected in a laboratory chemostat
  5. Su C. J., Tryon V. V., Baseman J. B. Cloning and sequence analysis of cytadhesin P1 gene from Mycoplasma pneumoniae //Infection and immunity. – 1987. – Т. 55. – №. 12. – С. 3023-3029.

Users/es-pesk/pr12 (последним исправлял пользователь es-pesk 2022-02-03 23:25:09)