Ha главную страницу четвертого семестра

Анализ базы данных Secreted protein database (SPD)

В базе данных представлены белки, секретируемые клетками через внешнюю мембрану в межклеточное пространство. Все представленные белки были взяты из протеомов трех организмов: человека, мыши и крысвы. Данные в этой БД были получены на основе последовательностей из таких банков как SwissProt, Trembl, Ensembl.
В базе данных содержится информация по 18152 белкам. Все белки разделили на 14 функциональных категорий, например, группы цитокинов, протеаз, антибиотиков и др.Данный сервис предоставляет организация Center of Bioinformatics, Peking University

Стартовая страница содержит такие разделы как:

Browse - позволяет искать белки в соответствии с положением в хромосоме или функциональной классификации.

Search - поиск белков по ID, ключевым словам, описанию или последовательности.

Download - позволяет загрузить различную информацию о белках . Есть несколько файлов. Например, spd.all.gz содержит все последовательности в fasta-формате, также в нем содержатся ID белков, если есть, то описание, видовая принадлежность, длина и т.д. spd.classes.domain.gz - файл, содержащий название белка, доменная структура (перечисление доменов), тип белка по их классификации.

Data statistics - статистические данные, представлена информация о том, в какой БД сколько содержится описанных белков в данном виде.

Help - ответы на наиболее часто задаваемые вопросы по БД.

Publication - в этом разделе представлены различные статьи, так или иначе связанные с БД (о самой БД,статьи, из которых берется информация и т.д.)

На стартовой странице имеется быстрый поиск для нахождения секретируемых белков или групп этих белков. В окно поиска можно написать название группы белков, ID номер, AC номер, вид организма, в котором найден этот белок или описание этого белка.

Страница поиска содержит несколько полей:

- Search terms:как оказалось, просто термин, по которому ведется поиск (это может быть и ID, и описание, и AC);

- Species: человек, крыса, мышь или все;

- Protein length: различают последовательности меньше 30, 30-100, 100-500, 500-1000, больше 1000 а.о. и любой длины.

- Source: к какой БД ищется белок - Swiss-Prot, Refseq, Ensembl, Trembl, все.

- Также можно искать по fasta-последовательности.

Чтобы изучить возможности этого ресурса, мы решили найти все фосфолипазы А2, длина которых 100-500.
Запрос выглядел так: Search terms:PLA2; Protein length: 100;500; Species:Human Выдались ссылки на файлы и описание находок.
Если нажать на названия нужного белка, то можно узнать его название, длину, источник, даются ссылки на описание этого белка в различных БД.
Результат можно посмотреть по этой ссылке

Эта база данных составлена экспертами. Мы считаем, что такая БД могла бы быть полезной, но количество информации в ней явно не хватает, можно добавить данные по другим организмам кроме имеющихся. Эта база данных либо заброшена, либо очень редко обновляется, так как последнее обновление было сделано 30 ноября 2004 года, что, как мы считаем, очень давно, так как данная наука сейчас очень быстро развивается и за последнее время появилось много новой информации.

БД содержит описания около 18000 секреторных белков. Тут представленна в виде ссылок почти вся информация об этих белках. По идее, ресурс должен быть довольно мощным, но из-за странного интерфейса, странной системе поискаи использования непонятных терминов, кажется, что гораздо легче найти все это через SRS. И полученной информации будет не меньше, и удобнее все это понять и воспринять. В целом, единственная необычная опция - посмотреть какой белок находится в определенной позиции какой-нибудь хромосомы. Этого в SRS нет.


© Yuminova Alina aka Melli, 2006