Kodomo

Пользователь

Практикум !2

Задание №1

старт-кодоны:

ATG 3890

GTG 338

TTG 80

ATT 4

CTG 2

TTC 1

Можно заметить, что варьируется, в основном, только одна позиция. Это значит, что взаимодействия между рибосомой и старт-кодоном слабее, но тоже наблюдаемы. Много встречается кодон GTG, за счет более прочной связи G-C.

старт-кодоны:

ATG 1129

GTG 41

TTG 23

TCT 1

ACA 1

TCA 1

старт-кодоны:

ATG 627

GTG 60

TTG 49

ATT 7

ATA 3

CTC 3

TCC 2

CTG 2

GAA 1

ATC 1

CAC 1

CAA 1

TCT 1

GTT 1

TTA 1

ACA 1

AAA 1

TTC 1

ACT 1

CTA 1

TGA 1

У нее больше представлены редкие кодоны - может быть следствием малоспецифичного связывания рибосомы.

Задание №2

Для E. coli:

1. lcl|U00096.3_cds_250 [gene=insN] [locus_tag=b4587] [db_xref=ASAP:ABE-0285253,ECOCYC:G6130] [protein=IS911A regulator fragment] [pseudo=true] [location=join(270278..270540,271764..272190)] [gbkey=CDS]

- Это псевдоген некого регуляторного белка, в его последовательность инсерцирован мобильный генетический элемент.

2. lcl|U00096.3_cds_AAD13438.1_1459 [gene=fdnG] [locus_tag=b1474] [db_xref=UniProtKB/Swiss-Prot:P24183] [protein=formate dehydrogenase N subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13438.1] [location=1547401..1550448] [gbkey=CDS]

- Formate dehydrogenase, nitrate-inducible, major subunit - содержит селеноцистеин, стоп-кодон маркирует место его вставки.

3. lcl|U00096.3_cds_AAD13456.1_3824 [gene=fdoG] [locus_tag=b3894] [db_xref=UniProtKB/Swiss-Prot:P32176] [protein=formate dehydrogenase O subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13456.1] [location=complement(4082772..4085822)] [gbkey=CDS]

Тоже содержит селеноцистеин

4. lcl|U00096.3_cds_AAD13462.1_3997 [gene=fdhF] [locus_tag=b4079] [db_xref=UniProtKB/Swiss-Prot:P07658] [protein=formate dehydrogenase H] [transl_except=(pos:418..420,aa:Sec)] [protein_id=AAD13462.1] [location=complement(4297219..4299366)] [gbkey=CDS]

Содержит селеноцистеин

У Candidatus Gracilibacteria bacterium таких последовательностей 1089.

Задание №3

TGA 2380

TAA 3322

TAG 521

TGA 592

TAA 1456

TAG 448

TGA 250

TAA 817

TAG 386

Задание №4

TTA 20308 0.0151

TTG 22788 0.0170

CTT 14598 0.0109

CTC 12050 0.0090

CTA 8908 0.0066

CTG 37912 0.0283

TTA 12489 0.0316

TTG 8503 0.0215

CTT 6743 0.0170

CTC 3946 0.0100

CTA 4388 0.0111

CTG 4151 0.0105

TTA 8557 0.0328

TTG 6145 0.0236

CTT 5510 0.0211

CTC 2085 0.0080

CTA 3562 0.0137

CTG 2938 0.0113

Задание №5

Для полной последовательности генома график GC-skew: GC-skew для полной п-ти

Для генов количество G всегда больше, чем C, что отражается в прямой без изломов на графике GC-skew для кодирующей ДНК

Так происходит, потому что С более склонны к мутациям. Они элиминируются с отстающей цепи и в некодирующих последовательностях (там больше нестабильность генома).

Задание №6

Больше всего встречаются поли-А и поли-Т последовательности

TTTTTT 511 AAAAAA 469 ATTTTT 360 TAAAAA 306 TTTTTA 303 CATTTT 282 TCATTT 262 TTAAAA 257 TTATTT 256 AAAAAT 254 ATTTTA 240 TATTTT 235 TTCATT 235 AAATAA 233 TTTAAA 232 TTTTAA 227 AAAATA 227 ATAAAA 225 TTTTAT 223 TTTATT 214 AAAATT 207 ATAATT 193 AATAAA 193 TAAAAT 191 AAATTT 187 AATTTT 180 TTCATA 179 TAATTT 170 ATATTT 168 ATTTAA 160 AATTTA 159 TAAATT 158 ATTAAA 157 AAATTA 156 TGTTTT 154 GTTTTT 150 ATTATT 145 TCATAA 138 ATTTAT 136 ATAAAT 136 TATTTA 136 AATTAA 136 TTGTTT 136 CATAAT 134 TTTTTG 130 TATAAA 128 AATTAT 124 TTAATT 124 AAACAA 124 TAATTA 122 AAAAAC 118 TTTATA 118 TTTGTT 117 CAAAAA 116 TAAATA 114 AAAACA 112 TTTAAT 112 TTTTGT 112 TTAAAT 111 TTATAA 110 AAATAT 109 AATATT 107 AACAAA 105 AATAAT 104 ACAAAA 104 TATATT 98 CATATT 96 ATTATA 94 CTAAAA 93 TCATAT 92 CATAAA 90 TTATTA 89 TATTAT 88 ATATAA 86 ATATTA 83 ATTAAT 77 TATTAA 76 ATAATA 75 AATATA 74 ATTTGT 73 TTCATG 73 TAAAAC 72 TTTTAG 72 TTATAT 72 ATGTTT 72 ATTTTG 70 TCAAAA 69 CATTAT 67 TCATTA 67 TATAAT 67 TAATAT 66 ATCATT 66 CAAAAT 66 ATATAT 64 TAATAA 63 ACTAAA 63 ACAAAT 62 TTAATA 61 CTTTTT 61 ACATAA 61 ACATTT 61 ATTGTT 60 AAAATC 59 CCATTT 58 TTTGTA 58 CATTTA 58 TACAAA 58 AAACTA 58 ACTTTT 57 TTTAGA 57 TTCAAA 56 CCATAA 56 AACTAA 56 AAAACT 56 CAAATA 55 TTTCTT 53 TATTTG 51 TAAACA 51 TTTTGA 51 AACATA 51 TCATGT 50 ATCATA 50 TGTAAA 50 TCCATA 49 GTTTTA 49 TTCTTT 48 TTTTTC 48 TTTTCT 48 TACTTT 48 CTCATT 47 TATATA 47 AAAAAG 47 CAAATT 47 TTTTAC 47 AACATT 46 CATTAA 46 AACAAT 46 TTTAAG 46 CTTTTA 45 CATATA 45 TTTAGT 45 TTAAAC 45 AGTTTT 45 CATTTG 45 TTTGAA 45 ATTTAG 45 AAAACC 44 TCATTG 44 CATGTT 44 GTAAAA 43 ATCTTT 43 GATTTT 43 CTTTAA 43 AAATCA 43 TCTTTT 42 CATTGT 42 TTACAA 42 ATCAAA 42 TTCATC 41 TCAAAT 41 AGAAAA 41 TGATTT 41 TGTTTA 41 TTGTTA 40 TTGTAA 40 CTTAAA 40 TTGTAT 40 GAAAAA 40 TCATGA 40 TCCATT 40 GTCATT 40 CATAGT 39 AAGAAA 39 TTGAAA 39 TCTAAA 39 TAGTTT 39 GCCATT 38 AATACA 38 AAAAGA 38 CATCTT 38 GGTTTT 38 ATTTTC 38 TTTACA 38 TAGATT 37 TTAGTT 37 AAATCT 37 TTTAAC 37 ACTTTA 36 ATTTCT 36 TAATTG 36 AATCTA 36 ATAGTT 36 TAACAA 36 AAACAT 36 AATCAA 36 TATTGT 36 CAATTT 35 TCAATT 35 GTTTAA 35 TGTTAT 34 TCTTAA 34 AATTTG 34 ATTGTA 34 AATTGT 34 TTTCAA 34 CCAAAA 34 ATAAAC 34 CATTTC 34 ATGATT 34 ACAATA 34 CAATAA 34 ATCTTA 33 AACTTT 33 TGGTTT 33 CTCATA 33 AAATAG 33 TTAAGT 33 TTAGAA 33 GCATTT 33 CATGAT 33 AAAGAA 33 TGCATT 33 ACAATT 32 AATTGA 32 ATAACA 32 AACACA 32 CTAATT 32 ATTTCA 32 CTAAAT 32 ATCAAT 32 CAATTA 31 GTAAAT 31 TGAAAA 31 TCATAG 31 CCATAT 31 ATTAGT 31 ATACAA 30 AATTAC 30 AAAATG 30 AATTAG 30 AGATTT 30 CATAAC 30 ATTATC 30 TTACTT 30 TGAATT 30 AAATTG 30 AAACCA 29 AAATAC 29 GTTATT 29 TACATA 29 ACACAA 29 ACATAT 29 TTTGCA 29 AATAAC 29 TTCAAT 29 ATTGAA 29 ATCTAA 29 ATAATC 29 ATACTT 29 ATTTGA 29 AACTTA 29 ACTTAA 29 AAAGTA 29 ACATTA 29 AACAAC 29 AAGTTT 29 GATTTA 29 GCATAA 29 TTATTG 29 TTTTGC 29 GTATTT 28 TCATCT 28 TGTATT 28 AAACAC 28 AAAAGT 28 TATCAA 28 CCTAAA 28 TACATT 28 GAAATT 27 TTTTGG 27 TTTATC 27 AAATTC 27 CATAAG 27 TTGCAA 27 AAACTT 27 AATAGT 27 CTATTT 27 ACAACA 27 ACAAAC 27 CTCATG 27 TTTGAT 27 ATATTG 27 GAATTT 27 CAACAA 27 GATAAA 27 TAAGAA 26 GCAAAA 26 ATTCAA 26 ATTTAC 26 AGAATT 26 TGCATA 26 ATTACA 26 AATTTC 26 TAAACT 26 CAAAAC 26 TGTGTT 26 AACCTA 26 TAGTAT 25 AAATGT 25 TTAGAT 25 TGTTTG 25 AATTCA 25 GATAAT 25 AGTAAA 25 GTTAAA 25 AACTAT 25 TAATAC 25 AGTTTA 25 TTAAGA 25 CCATTA 25 GACATT 25 TAACTT 25 TTATCA 25 CATATC 25 TTAACT 25 TTAGTA 25 CTTATT 25 GACATA 24 ATAGTA 24 TAAAAG 24 TCTTTA 24 TAGTTA 24 TTAACA 24 CTTTAT 24 AAGATT 24 TTTTCA 24 GAAAAT 24 AAGTAA 24 ATAACT 24 AAACCT 24 TTTGTG 24 GATTAT 24 CATACT 24 GCCATA 24 AACCAA 24 AAGAAT 24 TATCTT 24 GTATAA 24 TAAGTT 24 TCAATA 24 TAACTA 23 TGTAAT 23 TCATGG 23 CATGGT 23 TAAATC 23 AATCTT 23 TAATCT 23 GAATAA 23 GCATTA 23 TTGTGT 23 CTATTA 23 ATACTA 23 TAGAAA 23 TTTGGT 23 TTTCTA 23 GTTATA 22 TTCTTA 22 TATTTC 22 TGCAAA 22 ATAAAG 22 GTAATT 22 TCTATT 22 ATTAAG 22 ATTAGA 22 TTAAAG 22 AATAGA 22 TTGGTT 22 TTGATA 22 ATTACT 22 TGATAA 22 ACTATT 22 AATACT 22 AAACGA 21 AATGTT 21 CTCAAA 21 TTCTAA 21 ATGGTT 21 ATGTAA 21 ATAATG 21 TATAAC 21 TCATAC 21 ACCAAA 21 GTTTAT 21 AGAATA 21 CAATAT 21 TTATAC 21 ATATCT 21 TAAAGT 21 TTTATG 21 GTGTTT 21 GTTTTG 21 ATTGAT 21 GCTTTT 21 CTTAAT 21 TGTATA 20 TGAAAT 20 ATAAGA 20 AATGAA 20 TGTTAA 20 TAATAG 20 ACTAAT 20 AGCATT 20 ATCTAT 20 CAAACA 20 AGTTAT 20 ACCATA 20 TTAACC 20 TTACAT 20 GTCATA 20 TTGAAT 20 TTATCT 20 AATATC 20 TTGATT 20 GCTAAA 20 ATATCA 20 TATTAG 20 AATGTA 19 TGCTTT 19 AGTTAA 19 AATCAT 19 TACAAT 19 TGTTGT 19 TAATGA 19 ATGAAA 19 TATACT 19 AGAAAT 19 ATAAGT 19 CAAAAG 19 TGTACT 19 TCATCA 19 CTTTTG 19 TATGTT 19 ATTCTT 19 CACAAA 19 AAATGA 18 GTTGTT 18 AAAGAT 18 AATAAG 18 TTAATC 18 TAAGAT 18 TAAAGA 18 GAAAAC 18 CTATAA 18 ATTATG 18 TGATTA 18 TACTAA 18 ATAGAA 18 AAAGTT 18 CCTTTT 18 CATTAC 18 CATCAA 18 TAGAAT 18 TCTTAT 18 GTATAT 18 CACTTT 17 AGTATT 17 ACAACT 17 GTTTGT 17 AGATTA 17 GAATTA 17 CAAATC 17 CTAATA 17 ACTATA 17 TCTTTG 17 ACCTAA 17 TTTACT 17 TATTCT 17 CTTTGT 16 ATATAC 16 ATTTGC 16 GGTAAA 16 ATGAAT 16 AACGAA 16 TAACCT 16 TTTCTG 16 AAGTAT 16 GCATAT 16 TTATGT 16 AAAACG 16 TACTTA 16 GAAATA 16 TTGCTT 16 CAGAAA 16 CTAAAC 16 TCATTC 16 AGTATA 16 ATAGAT 16 AGCATA 16 ATATTC 16 TTCTAT 16 AATGAT 15 TAATGT 15 CCCAAA 15 TATACA 15 CAACTT 15 ATTCTA 15 AATTCT 15 ACACAC 15 GAATAT 15 GTTAAT 15 AGATAA 15 GATTAA 15 GACAAA 15 TATGTA 15 GTAATA 15 TAATTC 15 CCATCT 15 TACTAT 15 ATTAAC 15 ATCGTA 14 ATTGTG 14 ATACAT 14 TAACAT 14 TAATCA 14 TTGTTG 14 TCTTTC 14 TAAGTA 14 AAGATA 14 TTTCAT 14 GTATTA 14 GTGTAA 14 TTATAG 14 CTGTTT 14 ACATAG 14 TTATGA 14 TATTGA 14 TGTGTG 14 GAAACA 14 CGTTTT 14 AGTAAT 14 GTACTT 14 ATTGCA 14 CATTAG 14 TATAAG 14 TTATTC 14 AAAAGG 14 CATTGA 14 AGGTTT 14 GATATT 13 TTAATG 13 AACGAT 13 TCATCG 13 CAACTA 13 AACTAC 13 TGAATA 13 AAAGCA 13 ACAATC 13 AACCTT 13 CCTTAA 13 GCAAAT 13 ACGAAA 13 TATTAC 13 AAGTTA 13 TTTCCT 13 ACAGAA 13 CAAATG 13 CTTACA 13 TAGTAA 13 ACTTAT 13 TTTTCG 13 CACAAT 13 ATGATA 13 CCTAAT 13 AAACAG 12 ATGTAT 12 GATATA 12 AATTCG 12 GTTGTA 12 TCCAAA 12 TAAACG 12 CGATAA 12 AGCAAA 12 CGAAAA 12 TAAACC 12 TCCTTT 12 TTCCTT 12 ATCGTT 12 CTTCAA 12 TCACTT 12 TACACA 12 AATCCT 12 GTCAAA 12 CTTTGC 12 TTGTAC 12 TTTGCC 12 ATTCGT 12 CACATT 12 GAAAGT 12 TGGTTA 12 ATCATG 12 CAATAC 12 TTGTAG 12 TCTAAT 12 TGATAT 12 TTTGCT 12 AACCCA 12 AAACCC 12 CTATAT 12 TATAGT 12 ATGTTA 11 TTGTCT 11 TTTGTC 11 TTGTCA 11 CTACAA 11 AGGTAA 11 CACTAA 11 AATCCA 11 ATTCCT 11 AAAGGA 11 GGCTAA 11 CCAAAT 11 ATTTGG 11 TCGTTT 11 CAAGAA 11 TACAAC 11 ATGTGT 11 TAGTGA 11 ATAGTG 11 AGAAAC 11 ATATAG 11 ACTTTG 11 TTATGG 11 AATACC 11 TTTAGC 11 TTAAGG 11 GGCATT 11 TATCTA 11 GTGTGT 11 TTAGTG 11 CAAACT 11 TATCAT 11 TATGAT 11

Users/vor_na/pr12 (последним исправлял пользователь vor_na 2022-12-20 13:26:32)