Создание выборки белков с одинаковыми функциями


BLAST - инструмент для быстрого поиска последовательностей в банках данных по гомологии


Работа с прoграммами:

  1. FAR manager
  2. Microsoft Word
  3. Blastp (адрес входной страницы в Интернете: http://www.ncbi.nlm.nih.gov/BLAST/ )




Поиск белка TolB по фрагменту его аминокислотной последовательности

Поиск производился по банку данных Swiss-Prot.


Был проведен поиск для трех последовательностей:

  1. случайно выбранного участка длиной 30 аминокислот последовательности белка TolB
  2. того же самого участка, с внесенными в него тремя заменами (также произвольно выбранными)
  3. случайно выбранного участка длиной 10 аминокислот



Результаты поиска (значения величин, отвечающих белку TolB при поиске)


Последовательность, для которой проводился поиск

Порядковый номер хита

Процент совпадающих остатков в выравнивании

Вес выравнивания

E-value

30 аминокислот (MKQALRVAFGFLILWASVLHAEVRIVIDSG)

1

100%

50

1e-06

30 аминокислот с 3 заменами (MKQAGRVAFGFLILGASVLGAEVRIVIDSG)

1

90%

50

1e-06

10 аминокислот (RVAFGFLILW)

3

 

 

2850



Cлучайная замена трех аминокислот на другие не сильно влияет на результаты поиска. Белки, найденные при первом поиске, найдены также при втором, где к ним добавляются ещё один белок. Цена выравнивания введенных последовательностей с найденной последовательностью моего белка при первом поиске - 50, при втором - 50, что достаточно удивительно, ведь, казалось бы, после 3-х замен стоимость выравнивания с тем же белком должна бы уменьшиться. Большое различие в этих значениях объясняется тем, что были проведены замены аминокислот на далекие.



При проведении поиска гомологов последовательности из десяти аминокислот (RVAFGFLILW) со значением порога E-value 10000 мой белок приводится третьим в списке из 14 хитов, причем в списке только три белка со схожей функцией из других организмов, в остальном представлены белки, никак с TolB не связанные.

Видимо, что последовательность из 10 остатков является в некоторой мере специфичной для моего белка и его гомологов, однако похожие встречаются и у других белков.





Является ли BLAST инструментом для поиска ортологов?

BLAST не является инструментом для поиска ортологов. При проведения поиска по банку данных Swiss-Prot для репрессора рибозного оперона RbsR из Bacillus subtilis в числе первых двадцати записей, в названии которых встречалось слово RbsR (т.е. которые потенциально являются ортологами исходного белка) было обнаружено:

  1. белки из самого Bacillus subtilis с другими функциями (т.е. не ортологи по определению);
  2. белки из других организмов, но с иными функциями (в то время как для ортологов характерно сохранение функции);
  3. белки из других организмов с той же функцией, т.е., вероятно, ортологи нашего.

Вывод: BLAST конечно же не является прямым инструментом для поиска ортологов. Его задача - поиск гомологии, однако кроме ортологов существуют и другие широкие классы гомологии (например, паралоги), а специальных механизмов для автоматической классификации классов гомологии в данной системе не существует. Поэтому для ответа на поставленный вопрос совершенно не обязательно было проводить исследование на конкретном белке - ответ и так в достаточной мере понятен. Естественно, BLAST может использоваться для поиска ортологов нахождением гомологов и какой-либо дальнейшей их классификации.





Переход на главную страничку здесь.