Простейший профиль: частотная матрица.

  1. Создание матрицы
    Файл с матрицей.
    По-видимому, prophecy создает на основе выравниванию частотную матрицу и также подбирает по нему консенсусную последовательность.
  2. Поиск схожих участков в белках БД Swiss-Prot
    Файл с выдачей программы.
    Программа profit обрабатала последовательности из БД ориентируясь частотной матрицей (полученной ранее).
    Excel-файл с обработанными результатами.
    Находок всего - 61516 (51816 после учета совпадений)
    Находок со счетом больше 40: 1307
    Находок со счетом больше 50: 773
    Находок со счетом больше 60: 735
    ROC-кривая:

    Верных находок профиля - 151, ложных - 51665.
    Число ненайденных белков подсемейства - 0.
    Чувствительность профиля - 1.
    Селективность - 0,0029.
    При повышении порога отбора результатов до 80 теряются 18 правильных находок, суммарно же остается 155 находок:
    Точность: 0,88
    Селективность : 0,85
    При установлении порога, где точность обоих поисков совпадалет, селективность результатов поиска с помощью профиля становится меньше, чем у поиска по паттерну, т.е. последний работает лучше.
    ©Турал Я.Я.