Создание паттерна по выравниванию семейства белков.

В моем белке нашелся один паттерн (PDOC00310) - [RKN]-x-[LIVM]-x-G-[ST]-x(2)-[SNQ]-[LIVM]-G-x-{M}-[LIVM]-x(0,1)-[DENG]. Он называется Ribosomal protein L11 signature, или характерная последовательность рибосомального белка L11.
По данному паттерну находятся 3 лишние последовательности и не находятся 2 последовательности. Если просто вбить этот паттерн, то по всем белкам находится 700 последовательностей.

Precision (true hits / (true hits + false positives)): 99.57 %
Recall (true hits / (true hits + false negatives)): 79.43 %


В качестве таксона я выбрала порядок Bacillales. В нем по данному профилю находится 39 белков.

Полное выравнивание.





Первоначально полученный мною паттерн - [KR]-[IM]-[ILV]-E-G-[ST]-A-R-[NS]-M-G-[ILV]-[ESDIV]-[IV]-[EAKV]-[KDEG]
Всего по моему паттерну находится 61 последовательность, из них 23 - белки моего подсемейства. Остальные 38 белков - неверные находки.
Таким образом, селективность моего паттерна = 0,38, а чувствительность = 0,59.

©