BLAST - инструмент для быстрого поиска последовательностей в банках данных по гомологии


Работа с прoграммами:

  1. FAR manager
  2. Microsoft Word
  3. Blastp (адрес входной страницы в Интернете: http://www.ncbi.nlm.nih.gov/BLAST/...)




Поиск белка RL25 по фрагменту его аминокислотной последовательности

Поиск производился по банку данных Swiss-Prot.


Был проведен поиск для трех последовательностей:

  1. случайно выбранного участка длиной 30 аминокислот последовательности белка RL25
  2. того же самого участка, с внесенными в него тремя заменами (также произвольно выбранными)
  3. случайно выбранного участка длиной 10 аминокислот



Результаты поиска (значения величин, отвечающих белку RL25 при поиске)


Последовательность, для которой проводился поиск

Порядковый номер хита

Процент совпадающих остатков в выравнивании

Вес выравнивания

E-value

30 аминокислот (GKGASRRLRAANKFPAIIYGGKEAPLAIEL)

1

100%

60

1e-09

30 аминокислот с 3 заменами (GKGASRRLRAAWKFPAIIYGGWEAWLAIEL)

1

90%

54

6e-08

10 аминокислот (KVKAQDVQRH)

3

 

 

3175

10 аминокислот (NKFPAIIYGG)

1

 

 

11



Как и следует ожидать, случайная замена трех аминокислот на другие не сильно влияет на результаты поиска. Белки, найденные при первом поиске, найдены также при втором, где к ним добавляются и другие белки. Кроме того результаты рознятся порядком следования хитов. Цена выравнивания введенных последовательностей с найденной последовательностью моего белка при первом поиске - 60, при втором - 54. Большое различие в этих значениях объясняется тем, что были проведены замены аминокислот на далекие.



При проведении поиска гомологов последовательности из десяти аминокислот (KVKAQDVQRH) со значением порога E-value 10000 мой белок приводится третьим в списке из 11 хитов, причем в списке нет больше ни одного рибосомного белка L25 из других организмов и вместо них представлены белки, никак с моим не связанные.

Если для этой же операции использовать другой участок белковой последовательности (участок NKFPAIIYGG из 10 аминокислот), будут получены иные результаты. При E-value 10000 выводятся 25 хитов. Первым в списке значится искомый белок. Далее следуют гомологи и посторонние белки вперемежку.

Результаты говорят о том, что первая последовательность из 10 остатков не является специфичной для моего белка и его гомологов, тогда как вторая, очевидно, является (возможно, благодаря наличию сдвоенных изолейцинов и двух глицинов, также стоящих вместе).





Является ли BLAST инструментом для поиска ортологов?

BLAST не является инструментом для поиска ортологов. При проведения поиска по банку данных Swiss-Prot для репрессора рибозного оперона RbsR из Bacillus subtilis в числе первых двадцати записей, в названии которых встречалось слово RbsR (т.е. которые потенциально являются ортологами исходного белка) было обнаружено:

  1. несколько белков из самого Bacillus subtilis с другими функциями (т.е. не ортологи по определению);
  2. белки из других организмов, но также с иными функциями (в то время как для ортологов характерно сохранение функции);
  3. белки из других организмов с той же функцией, т.е. возможные ортологи нашего.

Вывод: BLAST не осуществляет сортировку последовательностей на возможные ортологи и неортологи введенной последовательности, в связи с чем для поиска ортологов его использовать неудобно.

Главная страница