Учебный сайт
Главная Семестры Проекты Обо мне RUS/ENG

На сервере MEME был выполнен поиск общего мотива среди последовательностей из файла. Поиск осуществлялся со следующими параметрами:
  • распределение количества встреч каждого мотива: "Zero or one per sequence"
  • максимальная и минимальная длина мотива: по 16 (поиск мотивов со строго заданной длиной)
  • число различных мотивов: 1

В результате были получены:
1. LOGO

2. PSSM (Position-Specific Scoring Matrix)
позиция в мотиве A C G T нуклеотиды с положительным вкладом в вес
1 165 -1023 -50 -1023 A
2 -67 82 9 -67 S
3 -1023 -149 196 -1023 G
4 -1023 196 -149 -1023 C
5 192 -1023 -1023 -1023 A
6 179 -1023 -1023 -167 A
7 92 -50 -1023 33 W
8 -1023 209 -1023 -1023 C
9 -1023 -149 196 -1023 G
10 -167 -149 196 -1023 G
11 -1023 -1023 -1023 192 T
12 -1023 -1023 -1023 192 T
13 -67 -1023 -149 150 T
14 -167 196 -1023 -1023 C
15 -167 82 82 -167 S
16 -67 9 -1023 114 Y

3. Таблица найденных мотивов
название цепь начало мотива
purE + 163
purL + 158
codB - 167
cvpA + 178
purR + 189
purA - 128
pyrC - 183
purM - 170
guaB + 181
folD - 271
glnB + 167
rpiA - 122

4. Исходные последовательности с подчеркнутыми мотивами
>codB
tacggacctgaaccgtaggtcggataaggcgctcgcgtcgcatccgacaccatgctcagatgcctgatgcgacgctgacg
cgtcttatcaggcctacccactgtttttacaccgataatttttcccccacctttttgcactcattcatataaaaaatata
tttccccacgaaaacgattgctttttatcttcagatgaatagaatgcggcggattttttgggtttcaaacagcaaaaagg
gggaatttcgtgtcgcaagataacaactttagccaggggccagtcccgcagtcggcgcgg

>purE
tcgcccggcggtgcatgaacttatcgccaatcagcaacctgcttttcgcgtggtactgggtgcctggcatacggaaggtt
caatggtgaaagtcacggcggatgacgttgagctgattcattttccgttttaaaaaacccgcaactttgctgatttcaca
gccacgcaaccgttttccttgctctctttccgtgctattctctgtgccctctaaagccgagagttgtgcaccacaggagt
tttaagacgcatgtcttcccgcaataatccggcgcgtgtcgccatcgtgatggggtccaa

>pyrC
gaaccaggcattacgcaattactttaaccagcaacctgcttacgtcctgcgcgaagatggcagccagggcgaagcaatgg
cgaaaaaactggcgaaaggcattgaagtgaagccaggcgaaattgtcattccatttactgattaatcacgagggcgcatt
cgcgccctttatttttcgtgcaaaggaaaacgtttccgcttatcctttgtgtccggcaaaaacatcccttcagccggagc
atagagattaatgactgcaccatcccaggtattaaagatccgccgcccagacgactggca

>purR
ttacacactgtgatgaaaaaatctcccgtcatttataatgataagtgtttttaccacttccccttttcgtcaagatcggc
caaaattccacgcttacactatttgcgtactggccattgaccccttcctgacgctccgtgtcgtttttccggcgtaccgc
aacacttttgttgtgcgtaaggtgtgtaaaggcaaacgtttaccttgcgattttgcaggagctgaagttagggtctggag
tgaaatggaatggcaacaataaaagatgtagcgaaacgagcaaacgtttccactacaact

>cvpA
tgcctgatgcgacgctggcgcgtcttatcaggcctacgcaggggtagaaccgtaggtcggataaggcgtttacgccgcat
ccgacacgcattgcccgatgccgcaaaggcataaaaagtcgatggcgttgaatattttttcagcgccatttttattgatg
cgcgggaaggaaatccctacgcaaacgttttctttttctgttagaatgcgccccgaacaggatgacagggcgtaaaatcg
tgggacacatatggtctggattgattacgccataatcgcggtgattgctttttcctctct

>purM
ttttcgttgactttagtcaaaatgataacggtttgagataaagttattttatattcagatggttatgaaagaagattatt
ccatccgaaaactaacctttaccctggcacaagtcttctttcgccgcgcgcctggggaaaagacgtgcaaaaaggttgtg
taaagcagtctcgcaaacgtttgctttccctgttagaattgcgccgaattttatttttctaccgcaagtaacgcgtgggg
acccaagcagtgaccgataaaacctctcttagctacaaagatgccggtgttgatattgac

>guaB
acctgtcccatctcatgctcaagcagcagacgaaccgtttgattcaggcgactaacggtaaaaattgcaggggattgaga
aggtaacatgtgagcgagatcaaattctaaatcagcaggttattcagtcgatagtaacccgcccttcggggatagcaagc
attttttgcaaaaaggggtagatgcaatcggttacgctctgtataatgccgcggcaatatttattaaccactctggtcga
gatattgcccatgctacgtatcgctaaagaagctctgacgtttgacgacgttctcctcgt

>glnB
gggtgaaaatacggcgctgccaacctttgttgaggcacgtaatcagtttgaactcaactatttgcgtaagctgctgcaaa
tcaccaaaggcaacgtcacccacgcggcgagaatggcggggcgcaaccggacagaattttataaactgctttcccgacac
gagctggatgcaaacgatttcaaggaatgaattggcgttatgtgttacgtttagcagatcaaaagacaggcgaccttttc
aaggaatagcatgaaaaagattgatgcgattataaaacccttcaagctggacgatgtccg

>purL
attctctgtgtcgtgcgcgtcccagcttgaaaaaacgtaataatagtgaaaggtttactcataaatgagcggcattttgc
gtaaacctgcgccagatggcaacttattacagccattggcggcacgcgttgctaattcacgatggtgattttatttccac
gcaaacggtttcgtcagcgcatcagattctttataatgacgcccgtttcccccccttgggtacaccgaaagcttagaaga
cgagagacttatgatggaaattctgcgtggttcgcctgcactgtcggcattccgaatcaa

>purA
tagggccgatgctttacccgaaggcatggaagaagatgatctctgcgatgaccaatttgcccgataatattttacgtcgt
tttggcggtggacttgtggttgcgggcgttgtggtctactacatgttgaggaaaacgattggctgaacaaaaaacagact
gatcgaggtcatttttgagtgcaaaaagtgctgtaactctgaaaaagcgatggtagaatccatttttaagcaaacggtga
ttttgaaaaatgggtaacaacgtcgtcgtactgggcacccaatggggtgacgaaggtaaa

>folD
aaattctttttatattgtcaggtatttcttaaattatcttaatccttagacaaggaaataaatcagttccagatttacaa
cgccatcatggacgaaaaatgaagctttcagtctcagcgacggtgcgcctcaccttcgcaagaggtcgcttcacgcgata
aatctgaaacgaaacctgacagcgcgccccgcttctgacaaaataggcgcatccccttcgatctacgtaacagatggaat
cctctctctgatggcagcaaagattattgacggtaaaacgattgcgcagcaggtgcgctc

>rpiA
ttgaatggcgtggcgttattgcctcaatttgcctgtaaacaggggcttgcgaacggtgaactggtgcgcctgtttgcacc
gtggagcggcatacccagaccgttgtatgctttatttgcggggcgaaaggggatgcctgccattgcgcgatattttatgg
atgagttaaccacgcggcttgccaacggggtctgaatcgctttttttgtatataatgcgtgtgaaatttcataccacagg
cgaaacgatcatgacgcaggatgaattgaaaaaagcagtaggatgggcggcacttcagta
Сравнение результатов работы MEME с рельными мотивами - сайтами узнавания PurR.
С помощью МЕМЕ были найдены мотивы во всех 12 последовательностях. Среди 10 последовательностей с реальными сигналами (отсутствуют последовательности folD и rpiA) во всех, кроме purA, сигналы совпали с предсказанными мотивами. Таким образом:
число реальных сайтов: 10
число правильных предсказаний: 9
общее число предсказаний: 12.
чувствительность: 9/10=0,9
специфичность: 9/12=0,75.

© Яшина 2009