Программа Blastp
 :Главная   :Семестры   :Сайт ФББ
Программа Blastp
   Для поиска сходных последователностей для белка с ID hslo_yerpe, являющегося гомологом моего белка (ID hslo_ecoli), была использована программа blastp (адрес к web-интерфейсу-http://www.ncbi.nlm.nih.gov/blast/).Поиск был проведён по банку swissprot.В результате:

1) Для поданного на вход белка: порядковый номер-1, 606 bits (1563), E-Value=4e-173
2) Для моего белка: порядковый номер-4, Score= 450 bits (1157), E-Value=4e-126.

   Последним в выдаче явлется белок hslo_strp9,который имеет порядковый номер-100,относительно низкое значение Score=89.4 bits (220) и относительно(по сравнению с первым) высокое E-Value=2e-17.
   Количество находок можно регулировать,изменяя такие параметры в строке "Algorithm parameters", как:
1) Максимальное количество выдаваемых находок
2) Порог значения E-Value
3) Используемая матрица (по умолчанию Blosum62)
4) Штраф за открытие и продолжение участка гэпов (по умолчанию 11 и 1)
5) Также есть различные фильтры

   С тем же запросом был проведён поиск по банку PDB. Среди его находок первой оказалась находка с pdb кодом- 1I7F, цепь A.Для неё значения Score=427 bits (1098), E-Value=2e-120, процент идентичности=70%, начало и конец выравнивания во входной последовательности - 4-293,то же самое,но для находки- 4-292.Среди находок оказалась и та, с которой я работал в первом семестре,её порядковый номер-2,значения Score=394 bits (1012), E-Value=2e-110.Хотя это не является неожиданностью, ведь поданный на вход белок-гомолог моего белка hslo_ecoli, одна из цепей которого и описана в этой записи PDB.
   При повторном поиске по Swiss-Prot, подав на вход не всю последовательность, а первую её треть, были обнаружены следующие результаты: исходная последовательность была первой в списке находок,но значения Score и E-Value были значительно ниже (201 bits (512) и 5e-52 соответственно), т.к. эти значения зависят от количества совпадений в выравнивании (по сравнению с полным выравниванием).

   При сравнении выравниваний,выданных программой BLASTP, с оптимальным глобальным и локальным выравниваниеми было выбрано выравнивание с моим же белком hslo_ecoli (Identities=71%).Глобальное и локальное выравнивание было выполнено программами needle и water (а также matcher,выравнивания были практически одинаковыми,было только одно интересное различие:в одной последовательности два g остатка шли друг за другом и один сопоставлялся с другим g остатком противоположной цепи, причём water сопоставлял его с первым g остатком, а matcher со вторым)и выравнивания,выполненные этими программами, практически ничем друг от друга не отличаются.При сравнении оказалось, что выравнивания,выданные BLASTP, и глобальное (локальное) на всём протяжении однаковые,т.е. выравнивание,выданное BLASTP, включающее остатки 1 до 293 в последовательности hslo_yerpe и остатки от 1 до 292 в последовательности hslo_ecoli, содержит в этом диапазоне те же сопоставления, что и выравнивание,выданное программой needle (water или matcher), которое включает остатки 1 до 293 в последовательности hslo_yerpe и остатки от 1 до 292 в последовательности hslo_ecoli.НО ЗНАЧЕНИЯ SCORE разные: 1157 для BLASTP и 1128 для needle (water или matcher).Причина этого пока непонятна, хотя в выдаче needle (water или matcher) указана матрица EBLOSUM62, в отличие от BLOSUM62 для BLASTP.Может это две разновидности одной матрицы?
©Кирилин Евгений,2007