Программа BLASTP

Поиск гипотетических гомологов изучаемого белка в разных БД

На сервере NCBI: http://www.ncbi.nlm.nih.gov/blast/ в разделе Basic BLAST перехожу по гиперссылке "protein blast". Помню об необходимости указывать нужный банк для поиска!

Таблица 1. Результаты поиска гипотетических гомологов белка Syc_Ecoli

  Поиск по БД Swiss-Prot Поиск по БД PDB Поиск по БД "nr"
1. Лучшая находка (в принципе должна соответствовать заданному белку)
Идентификатор БД sp|P21888.2|SYC_ECOLI pdb|1LI5|A, pdb|1LI5|B, pdb|1LI7|A, pdb|1LI7|B, pdb|1U0B|B. ref|NP_415059.1|
E-value 0.0 0.0 0.0
Вес (в битах) 964 964 964
% идентичности 100% 100% 100%
Найдены ли другие белки с теми же значениями E-value и веса в битах?
Если найдены, то укажите общее число и приведите один идентификатор (любой, но желательно Swiss-Prot ID)
Были найдены белки с теми же E-value,но вес в битах не совпадает Да,еще 4 записи:  pdb|1LI5|B, pdb|1LI7|A, pdb|1LI7|B, pdb|1U0B|B. Да, еще 3 записи: ref|YP_001729429.1|, ref|AP_001173.1|, emb|CAA39691.1|.
2. Сколько хороших кандидатов в гомологи найдено? (число находок в списке описаний, Descriptions, с E-value<=1E-10) 506 1 1715
2. "Худшая" находка (последняя в выдаче с E-value<=1.0)
Номер находки в списке описаний (Descriptions) 1000; 12 1000
Идентификатор БД sp|Q1MS17.1|SYL_LAWIP pdb|1QQT|A gb|ACM36063.1|, ref|YP_002549069.1|.
E-value 0.26 0.036 1e-89
Вес (в битах) 37.0 35.8 334
% идентичности 29% 31% 45%
% сходства 52% 53% 62%
Длина выравнивания 67 69 383
Координаты выравнивания (номера первых и последних а.о.) 255-320 с 576-642 224-292 с 291-358  2-362 с 47-428
% гэпов 1% 1% 6%

Я смогла найти свой белок в банках данных Swiss-Prot и "nr", а также его структуру в PDB. Мой белок в сравнении с самим собой дал 100% сходство в разных банках данных. Число потенциальных гомологов в банках Swiss-Prot и "nr" примерно одинаково, а вот в PDB их число значительно меньше. Различие заключается в том, что за каждая запись в банке PDB является проверяемой, за нее несут ответственность кураторы, то есть содержится проверенная информация. Самая хорошая «худшая» находка это из банка PDB, тк в ней гепов 1%,а длина выравнивания 69. Находки не совпадают, тк базы данных не связаны друг с другом, возможно так же разница заключается в разнице подсчетов E-value.

Поиск гипотетических гомологов изучаемого белка с фильтром по таксонам

Homo sapiens:

Номер находки Идентификатор E-value Вес (в битах) % идентичности % сходства Длина выравнивания Координаты выравнивания % гэпов
1 sp|Q9HA77.1|SYCM_HUMAN 3e-68 255 35% 50% 487 2-450 c 52-524 10%
2 sp|P49589.3|SYCC_HUMAN 2e-50 196 42% 59% 233 94-312 c 221-452 6%

Vibrionaceae:

таблица

Поиск белка по его фрагменту

С помощью putty нахожу аминокислотную последовательность SYC_BLOFL в формате FASTA. Её SWISS-Prot ID - SYC_BLOFL и AC - Q7VRB4. Разница в весах выравнивания из-за того, что вес выравнивания складывается из веса замены аминокислот по матрице BLOSUM62, поэтому есть существенное различие в весах. Из-за этого различия и разницы в длинне различаются и E-value.

Таблица 2. Результаты поиска белка в Swiss-Prot по фрагменту последовательности

  Поиск по фрагменту Поиск по полной
последовательности
АС лучшей находки sp|Q7VRB4.1|SYC_BLOFL sp|Q7VRB4.1|SYC_BLOFL
E-value 4e-15 0.0
Вес (в битах) 78.3 982
Найдены ли другие белки с теми же значениями E-value и веса в битах?
нет нет

Выравнивание с моим белком (SYC_ECOLI)

Мое пробное выравнивание совпадает с выравниванием с помощью BLASTP:

Оно соответствует участку 241-262 в Query и 241- 263 в Sbjct.

Сравнение выравниваний, выданных программой BLASTP, с оптимальными глобальным и локальным выравниваниями.

Выравнивание локальное с помощью water:

Выравнивание глобальное с помощью needle:

Выравнивание с использованием BLASTP представлено раньше.

Сравним выравнивания:

1.Длина выравнивания.

В BLASTP – 472

В локальном выравнивании - 472

В глобальном выравнивании – 474

2.Процент идентичности.

В BLASTP – 52%

В локальном выравнивании – 53%

В глобальном выравнивании – 52.7%

3.Вес выравнивания.

В BLASTP – 1296

В локальном выравнивании – 1280

В глобальном выравнивании – 1278

4.Процент сходства.

В BLASTP – 68%

В локальном выравнивании – 68.6%

В глобальном выравнивании – 68.4%

Все выравнивания имеют между собой различия. Сравнение глобального и локального выравнивания в прошлой работе. Сравнение глобального и BLASTP- выравнивания – разница заключается только в разнице длин выравнивания:

В BLASTP:

B глобальном выравнивании:

Сравнение локального и BLASTP- выравнивания – это два одинаковых выравнивания, разница в цифрах заключается в типе написания цифр в BLASTP(цифры после запитой эта программа не пишет). Разница в весах (не смотря на подстановку параметров в water и needle) все равно остается.


Второй семестр
На начальную страницу


©Пискунова Юлия 2008