Простейший профиль: частотная матрица.

На страничку четвертого семестра



  1. Задание 1

  2. Участок выравнивания:

    Выравнивание в msf формате

    prophecy:
    В файле, выданном программой, содержится длина выравнивания, максимальный счет, порог, конценсус и часотная матрица.


  3. Задание 2

  4. Файл, выданный программой profit
    Файл Exсel с полученными находками.
    Общее число находок: 492025
    Число находок со счетом от 40: 26512
    Число находок со счетом от 50: 1550
    Число находок со счетом от 60: 494


  5. Задание 3

  6. *в задании рассматриваются находки со счетом от 45 , таких находок 6834.
    При проверке на наличие двух подходящих участков в одном белке количество находок уменьшилось до 6691.
    В Prosite найдено 129 белков подсемейства с помощью полученного паттерна.

    1) True positive hits, TP: 136.
    2) False positive hits, FP (ошибки первого рода): 6555.
    3) False negatives, FN (ложноотрицательные результаты, ошибки второго рода): 1.
    4) Чувствительность: 0,9999.
    5) Селективность: 0,0203.


    Чувствительность профиля =0,9999, что лучше чувствительности паттерна (88%).
    Для того, чтобы селективность профиля была близка к селективности паттерна (95%) необходимо брать порог 89. При этом пороге чувствительность немного снижается (0,9887).
    Таким образом, профиль работает лучше, чем паттерн.

    © Karavaeva Julia 2009