Kodomo

Пользователь

НЕЗАВЕРШЕННЫЙ ВАРИАНТ!!!

Задание 1

Таблица 1 . Встречаемость стоп-кодонов в исследуемых бактериях

Кодоны

Бактерия Candidatus Gracilibacteria 28_42_T64

Escherichia coli str. К-12 подл. MG1655

Mycoplasma pneumoniae M29

ACC

2

ATA

2

ATC

3

ACA

1

ATT

4

4

ATG

1129

3883

634

CTG

2

4

GTG

41

334

62

GTT

1

TTA

2

TTG

23

78

40

Из таблицы замечаем, что наиболее часто встречаемый кодон - ATG, что соответствует ожиданиям. Однако существуют и другие кодоны, встреченные не единично: GTG, TTG. Они отличаются от старт-кодона только первым нуклеотидом. Можно предположить, что ключевыми для распознавания РНК-полимеразой являются второй и третий нуклеотид (включая другие участки в некодирующей области), поэтому последовательность с измененным первым нуклеотидом также способную функционирование.

Задание 2

Были найдены последовательности E.coli, в которых встречается стоп-кодон встречается не только в конце. Их четыре: 1 псевдоген и три субъединицы фермента формиат дегидрогеназа. В описании указано, что в белке на позиции, соответствующей стоп-кодону, присутствует неканоническая аминокислота, селеноцистеин.

Задание 3

Таблица 2 . Встречаемость стоп-кодонов в геномах исследуемых бактерий

Candidatus Gracilibacteria 28_42_T64

Escherichia coli str. К-12 подл. MG1655

Mycoplasma pneumoniae M29

TGA

1

1241

0

TAA

1000

2756

531

TAG

188

303

210

Из литературных данных известно, что у C.gracilibacteria TGA кодирует глицин, а не является стоп-кодоном, кроме единственного гена, являющегося псевдогеном (molecular chaperone DnaJ). У M.pneumoniae стоп-кодон TGA кодирует триптофан [1].

Задача 4

Таблица 3. Частота встречаемости кодонов, кодирующих лейцин

Кодон, кодирующий лейцин

Candidatus Gracilibacteria bacterium 28_42_T64

Escherichia coli str. K-12 substr. MG1655

Mycoplasma pneumoniae M29

CTA

0.109

0.036

0.121

CTC

0.101

0.105

0.073

CTG

0.093

0.499

0.108

CTT

0.180

0.103

0.1761

TTA

0.338

0.129

0.300

TTG

0.180

0.128

0.223

Заметим, что у каждой из бактерий наблюдается преобладание одного кодона. Могу предположить, что возникновение предпочтения того или иного кодона возникает случайно и закрепляется в ходе эволюции, которая у бактерий, как у ярко выраженных r-стратегов, проходит быстрее, чем у большинства организмов.

Задание 5

С помощью средств Python и Excel построен график cumulative_GC_skew для E.coli: https://docs.google.com/spreadsheets/d/1uwsPrDxDI1rKFbr0iQ9d5sMtsctgSuzwlhRq_Xd0Lto/edit#gid=762678221.

Рисунок 1. График cumulative GC-skew в зависимости от текущей позиции

https://sun9-24.userapi.com/impg/2WXOtZIsG_J4innn_C9Hi1jPINdVZoCGqcWzaA/b09QyEOxscA.jpg?size=1296x774&quality=96&sign=dde78af42f99e0908fc720af3f76e602&type=album

Минимальное значение равно -28.33 и соответствует позициям 3,868,000..3,872,000. Максимальное значение равно 47.73 и соответствует позициям 1,511,000..1,516,000.

Координаты OriC из GenBank: 3,925,744..3,925,975. Нетрудно заметить, что они приблизительно соответствуют позициям для минимума GC_skew. Максимум GC_skew соответствует точке конца репликации.

Задание 6

С использованием координат кодирующих последовательностей в формате GenBank были найдены 6-меры в последовательностях длины 20, расположенных до кодирующей области.

Источники:

[1] https://www.ncbi.nlm.nih.gov/Taxonomy/Utils/wprintgc.cgi#SG4

[2] Vimberg, V., Tats, A., Remm, M. et al. Translation initiation region sequence preferences in Escherichia coli. BMC Molecular Biol 8, 100 (2007). https://doi.org/10.1186/1471-2199-8-100

Программы и их выдачи будут доступны по ссылке: (или не будут)...

Users/epep/last_task (последним исправлял пользователь epep 2021-12-20 17:47:27)