На главную страницу
На страницу четвёртого семестра

Простейший профиль: частотная матрица.

Задание 1

Построение частотной матрицы (профиля) по участку выравнивания программой prophecy

В выходном файле программы мы видим частотную матрицу встречаемости аминокислот в позициях выравнивания в виде таблицы с аминокислотами по столбцам и номерами позиций по строкам. Выводится консенсусная последовательность LALITGQKPLITKAKKSIAGFRLREGMPIGAKVTLRGERMYEFLD.
Ссылка на выходной файл: otr.prophecy

Задание 2

Поиск в бактериальных белках из Swiss-Prot участков, дающих счёт выше 30 при сравнении с созданным профилем


Всего с помощью программы profit получено 869 находок, у 743 счёт выше 40 и 50, у 742 - выше 60.
Ссылка на файл Excel tr.xlsx

Задание 3

Анализ списка найденных белков и сравнение его со списком всех белков подсемейства


Характеристика списка найденных белков.

Число верных находок ("True positive hits", TP) -155
Число ложных находок ("False positive hits", FP) -713
Число ненайденных белков подсемейства (ложноотрицательных результатов, "False negatives" FN) -0
Чувствительность TP/(TP+FN) -1
Селективность TP/(TP+FP) - 0,179

Характеристики паттерна, созданного на прошлом занятии:

TP- 155
FP - 12
FN - 0
Чувствительность - 1
Селективность - 0,928
Наш профиль имеет наиболее сходные с паттерном характеристики, при пороге - 86. (Чувствительность- 0,77; Селективность -0,9)


© Zhuravleva Katya, 2009