На сервере MEME был проведён поиск с указанными параметрами:

В результате мною было получено LOGO (матрица, показывающая возможность появления определенного буквы в поределенной позиции на протяжении всего мотива, чем больше вероятность, тем больше буква):

PSSM (позиционно-специфичная матрица)
Позиция мотива A C G T нуклеотиды, дающие положительный вклад
1 -1010 165 -35 -156 C
2 -1010 -135 197 -1010 G
3 -56 123 -135 -56 C
4 190 -1010 -1010 -1010 A
5 190 -1010 -1010 -1010 A
6 102 -35 -135 -56 A
7 -156 197 -1010 -1010 C
8 -1010 -1010 211 -1010 G
9 -56 -1010 -35 125 T
10 -1010 -1010 -1010 190 T
11 -1010 -1010 -1010 176 T
12 -1010 -1010 123 76 K (G или T)
13 -1010 211 -1010 -1010 C
14 -56 65 -135 44 Y (C или T)
15 -1010 -1010 -1010 190 T
16 -1010 97 -1010 102 Y (C или T)
Таблица найденных мотивов
Имя последовательности цепь, на котороый найден мотив координата первого нуклеотида P-value
purM + 121 8.98e-10
cvpA + 129 1.94e-09
purE + 114 7.22e-09
pyrC - 132 2.46e-08
purR - 138 5.45e-08
codB + 118 6.20e-08
purL + 109 6.75e-08
guaB - 130 2.87e-07
purA - 77 5.18e-07
glnB - 116 6.39e-07
folD + 86 1.77e-06
Исходные последовательности с подчёркнутыми найденными мотивами.

>codB
catgctcagatgcctgatgcgacgctgacgcgtcttatcaggcctacccactgtttttacaccgataatttttcccccaccttttt
gcactcattcatataaaaaatatatttccccacgaaaacgattgctttttatcttcagatgaatagaatgcggcggattttttggg
tttcaaacagcaaaaagggggaatttcg

>purE
tggtactgggtgcctggcatacggaaggttcaatggtgaaagtcacggcggatgacgttgagctgattcattttccgttttaaaaa
acccgcaactttgctgatttcacagccacgcaaccgttttccttgctctctttccgtgctattctctgtgccctctaaagccgaga
gttgtgcaccacaggagttttaagacgc

>pyrC
gcgaagatggcagccagggcgaagcaatggcgaaaaaactggcgaaaggcattgaagtgaagccaggcgaaattgtcattccattt
actgattaatcacgagggcgcattcgcgccctttatttttcgtgcaaaggaaaacgtttccgcttatcctttgtgtccggcaaaaa
catcccttcagccggagcatagagatta

>purR
ttaccacttccccttttcgtcaagatcggccaaaattccacgcttacactatttgcgtactggccattgaccccttcctgacgctc
cgtgtcgtttttccggcgtaccgcaacacttttgttgtgcgtaaggtgtgtaaaggcaaacgtttaccttgcgattttgcaggagc
tgaagttagggtctggagtgaaatggaa

>cvpA
cgtaggtcggataaggcgtttacgccgcatccgacacgcattgcccgatgccgcaaaggcataaaaagtcgatggcgttgaatatt
ttttcagcgccatttttattgatgcgcgggaaggaaatccctacgcaaacgttttctttttctgttagaatgcgccccgaacagga
tgacagggcgtaaaatcgtgggacacat

>purM
atattcagatggttatgaaagaagattattccatccgaaaactaacctttaccctggcacaagtcttctttcgccgcgcgcctggg
gaaaagacgtgcaaaaaggttgtgtaaagcagtctcgcaaacgtttgctttccctgttagaattgcgccgaattttatttttctac
cgcaagtaacgcgtggggacccaagcag

>guaB
actaacggtaaaaattgcaggggattgagaaggtaacatgtgagcgagatcaaattctaaatcagcaggttattcagtcgatagta
acccgcccttcggggatagcaagcattttttgcaaaaaggggtagatgcaatcggttacgctctgtataatgccgcggcaatattt
attaaccactctggtcgagatattgccc

>glnB
aactcaactatttgcgtaagctgctgcaaatcaccaaaggcaacgtcacccacgcggcgagaatggcggggcgcaaccggacagaa
ttttataaactgctttcccgacacgagctggatgcaaacgatttcaaggaatgaattggcgttatgtgttacgtttagcagatcaa
aagacaggcgaccttttcaaggaatagc

>purL
aggtttactcataaatgagcggcattttgcgtaaacctgcgccagatggcaacttattacagccattggcggcacgcgttgctaat
tcacgatggtgattttatttccacgcaaacggtttcgtcagcgcatcagattctttataatgacgcccgtttcccccccttgggta
caccgaaagcttagaagacgagagactt

>purA
accaatttgcccgataatattttacgtcgttttggcggtggacttgtggttgcgggcgttgtggtctactacatgttgaggaaaac
gattggctgaacaaaaaacagactgatcgaggtcatttttgagtgcaaaaagtgctgtaactctgaaaaagcgatggtagaatcca
tttttaagcaaacggtgattttgaaaaa

>folD
caaggaaataaatcagttccagatttacaacgccatcatggacgaaaaatgaagctttcagtctcagcgacggtgcgcctcacctt
cgcaagaggtcgcttcacgcgataaatctgaaacgaaacctgacagcgcgccccgcttctgacaaaataggcgcatccccttcgat
ctacgtaacagatggaatcctctctctg
Сравним результаты с реальными сайтами узнавания PurR

Почти все мотивы, найденные MEME, совпали, или, по крайней мере, очень похожи:
>codB мотив, выданный MEME сдвинут на один нуклеотид вправо по сравнению с экспериментальными данными
>purE мотив, выданный MEME сдвинут на один нуклеотид вправо по сравнению с экспериментальными данными
>pyrC мотив, выданный MEME сдвинут на один нуклеотид влево по сравнению с экспериментальными данными
>purR мотив, выданный MEME сдвинут на один нуклеотид влево по сравнению с экспериментальными данными
>cvpA мотив, выданный MEME сдвинут на один нуклеотид вправо по сравнению с экспериментальными данными
>purM мотив, выданный MEME сдвинут на один нуклеотид вправо по сравнению с экспериментальными данными
>guaB мотив, выданный MEME сдвинут на один нуклеотид влево по сравнению с экспериментальными данными
>glnB мотив, выданный MEME сдвинут на один нуклеотид влево по сравнению с экспериментальными данными
>purL мотив, выданный MEME сдвинут на один нуклеотид вправо по сравнению с экспериментальными данными
>purA неверные координаты мотива
>folD ложная находка
Чуствительность = число правильно предсказанных / число правильных = 9/10 = 0.9 Специфичность = число правильно предсказанных / всего предсказанных = 9/11 = 0.818

Назад