PSI-BLAST

Поиск гомологов с использованием позиционно-специфичной матрицы в PSI-BLAST ( http://blast.ncbi.nlm.nih.gov/Blast.cgi ), по базе данных Swiss-Prot

ID белка AC белка Число итераций Для первой итерации Для последней итерации
Число находок выше порога (0,005) Худшее E-value выше порога Лучшее E-value ниже порога Число находок выше порога (0,005) Худшее E-value выше порога Лучшее E-value ниже порога
MINC_ECOLI P18196 5, не сходится 126 0.004 (MINC_BACP2) 0.005 (MINC_LISIN) 239 0.003 (ADH1_GEOKN) 0.007 (SYFA_METJA)
SSRP_ECOLI P0A832 2, сходится 449 3e-10 (SSRP_MYCS5) 5.0 (RS9_VIBVU) 449 8e-31 (SSRP_MYCS5) 0.62 (HMH2_DUGTI)
NUSB_ECOLI P0A780 4, сходится 327 0.003 (RSMB_SYNY3) 0.008 (NUSB_RICBR) 388 2e-12 (RSMB_COXBU) 0.031 (SYL_METKA)
CISY_ECOLI P0ABH7 3, сходиться 110 0.001 (ACLY_BOVIN) 0.099 (HEMH_RICPR) 114 4e-3 (ACL1_SCHPO) 1.3 (PYRG_SULTO)

На каждой итерации PSI-BLAST создает новую матрицу (позиционно-специфичную) для подсчета веса выравнивания, следущее выравнивание делает по этой матрице, первое же выравнивание - по стандартной (усредненной) матрице BLOSUM62. При этом E-value лучшей находки увеличивается от итерации к итерации (например для P18196 E-value менялся от 1 к 5 итерации: 4e-134, 2e-92, 2e-82, 4e-79, 2e-77), для первой итерации лучшая находка соответсвует заданному белку, однако затем меньшее E-value может набирать другой белок, (например для P0A780: на первой итерации E-value P0A780 - 5e-76, а на 5 итерации - 7е-48, в то время как найденный Q9HWX6 - 3e-50, имевший на первой итерации 7e-37).

Сходимость последовательностей

Если изменить порог с 0.005 до 0.001 для P18196, то поиск сходится на 3-ей итерации. Возможно, это связано с появлением на 3й итерации со стандартным порогом белка P39450, "размывавшего" выборку. При понижении порога этот белок не включался в список, и итерации сошлись довольно быстро.
ID белка AC белка Число итераций Для первой итерации Для последней итерации
Число находок
выше порога
Худшее E-value
выше порога
Лучшее E-value
ниже порога
Число находок
выше порога
Худшее E-value
выше порога
Лучшее E-value
ниже порога
MINC_ECOLI P18196 3 120 9x10-4 (MINC_PROMP) 0.001 (MINC_SYNY3) 147 7x10-10 (MINC_HELPJ) 0.011 (SECA_ANADF)

назад