Задание 1.
Escherichia coli. K-12 substr. MG1655
Старт-кодоны:
1) ‘ATG’: 3883
2) ‘ATT’: 4
3) ‘CTG’: 2
4) ‘GTG’: 334
5) ‘TTC’: 1
6) ’TTG’: 78
Самый редкий старт-кодон ‘TTC’ – псевдоген.
Candidatus Gracilibacteria bacterium 28_42_T64
Старт-кодоны:
1) ‘ACA’: 1
2) ‘ATG’: 1129
3) ‘GTG’; 41
4) ‘TCA’: 1
5) ‘TCT’: 1
6) ‘TTG’: 23
Самые редкие старт-кодоны (‘ACA’, ‘TCA’, ‘TCT’) также являются псевдогенами.
Mycoplasma pneumoniae M29
Старт-кодоны:
1) ‘ACC’: 2
2) ‘ATA’: 2
3) ‘ATC’: 3
4) ‘ATG’: 634
5) ‘ATT’: 4
6) ‘CTG’: 4
7) ‘GTG’: 62
8) ‘GTT’: 1
9) ‘TTA’: 2
10) ‘TTG’: 40
Одни из редчайших старт-кодонов (‘ACС’, ‘ФЕФ’, ‘GTT’) вновь являются псевдогенами.
Вывод:
1) Первый нуклеотид не всегда важен в определении старт-кодона, поэтому довольно распространены старт-кодоны GTG и TTG. Замена А на G – не что иное, как замена пурина на пурин, она происходит чаще, поэтому GTG встречается чаще.
2) Редко встречающиеся кодоны ‘ATT’, ‘ATC’ кодируют функциональные белки. Эта мутация - нейтральная, так как пиримидин, в итоге, меняется на пиримидин.
Задание 2.
Escherichia coli str. K-12 substr. MG1655
lcl|U00096.3_cds_249 [gene=insN] [locus_tag=b4587] [db_xref=ASAP:ABE-0285253,ECOCYC:G6130] [protein=CP4-6 prophage; IS911A regulator fragment] [pseudo=true] [location=join(270278..270540,271764..272190)] [gbkey=CDS]
Псевдоген.
lcl|U00096.3_cds_AAD13438.1_1457 [gene=fdnG] [locus_tag=b1474] [db_xref=UniProtKB/Swiss-Prot:P24183] [protein=formate dehydrogenase N subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13438.1] [location=1547401..1550448] [gbkey=CDS]
lcl|U00096.3_cds_AAD13456.1_3815 [gene=fdoG] [locus_tag=b3894] [db_xref=UniProtKB/Swiss-Prot:P32176] [protein=formate dehydrogenase O subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13456.1] [location=complement(4082772..4085822)] [gbkey=CDS]
lcl|U00096.3_cds_AAD13462.1_3987 [gene=fdhF] [locus_tag=b4079] [db_xref=UniProtKB/Swiss-Prot:P07658] [protein=formate dehydrogenase H] [transl_except=(pos:418..420,aa:Sec)] [protein_id=AAD13462.1] [location=complement(4297219..4299366)] [gbkey=CDS]
Во всех трех вышеперечисленных случаях - ген формиат дегидратазы, содержащей селеноцистеин, кодируемый особым стоп-кодоном при наличии после него специальной последовательности.
Задание 3.
Escherichia coli str. K-12 substr. MG1655
TGA 1241
TAA 2756
TAG 303
Candidatus Gracilibacteria bacterium 28_42_T64
TGA 1
TAA 1000
TAG 188
Mycoplasma pneumoniae M29
TGA 0
TAA 531
TAG 210
Выводы:
TGA у второй и третьей бактерии кодирует кодирует определенную распространенную аминокислоту, о чем можно говорить на основании того факта,что TGA может кодировать глицин.
Задание 4.
Escherichia coli str. K-12 substr. MG1655
1) ‘TTA’: 18484
2) ‘TTG’: 18283
3) ‘CTT’: 14719
4) ‘CTC’: 14926
5) ‘CTA’: 5201
6) ‘CTG’: 71198
Candidatus Gracilibacteria bacterium 28_42_T64
1) ‘TTA’: 14767
2) ‘TTG’: 3237
3) ‘CTT’: 9333
4) ‘CTC’: 3968
5) ‘CTA’: 3357
6) ‘CTG’: 1714
Mycoplasma pneumoniae M29
1) ‘TTA’: 10302
2) ‘TTG’: 5601
3) ‘CTT’: 2798
4) ‘CTC’: 3161
5) ‘CTA’: 2848
6) ‘CTG’: 2473
Задание 5.