На сервере NCBI: http://www.ncbi.nlm.nih.gov/blast/ в разделе Basic BLAST перехожу по гиперссылке "protein blast". Помню об необходимости указывать нужный банк для поиска!
Поиск по БД Swiss-Prot | Поиск по БД PDB | Поиск по БД "nr" | |
1. Лучшая находка (в принципе должна соответствовать заданному белку) | |||
Идентификатор БД | sp|P21888.2|SYC_ECOLI | pdb|1LI5|A, pdb|1LI5|B, pdb|1LI7|A, pdb|1LI7|B, pdb|1U0B|B. | ref|NP_415059.1| |
E-value | 0.0 | 0.0 | 0.0 |
Вес (в битах) | 964 | 964 | 964 |
% идентичности | 100% | 100% | 100% |
Найдены ли другие белки с теми же значениями E-value и веса в битах? Если найдены, то укажите общее число и приведите один идентификатор (любой, но желательно Swiss-Prot ID) |
Были найдены белки с теми же E-value,но вес в битах не совпадает | Да,еще 4 записи: pdb|1LI5|B, pdb|1LI7|A, pdb|1LI7|B, pdb|1U0B|B. | Да, еще 3 записи: ref|YP_001729429.1|, ref|AP_001173.1|, emb|CAA39691.1|. |
2. Сколько хороших кандидатов в гомологи найдено? (число находок в списке описаний, Descriptions, с E-value<=1E-10) | 506 | 1 | 1715 |
2. "Худшая" находка (последняя в выдаче с E-value<=1.0) | |||
Номер находки в списке описаний (Descriptions) | 1000; | 12 | 1000 |
Идентификатор БД | sp|Q1MS17.1|SYL_LAWIP | pdb|1QQT|A | gb|ACM36063.1|, ref|YP_002549069.1|. |
E-value | 0.26 | 0.036 | 1e-89 |
Вес (в битах) | 37.0 | 35.8 | 334 |
% идентичности | 29% | 31% | 45% |
% сходства | 52% | 53% | 62% |
Длина выравнивания | 67 | 69 | 383 |
Координаты выравнивания (номера первых и последних а.о.) | 255-320 с 576-642 | 224-292 с 291-358 | 2-362 с 47-428 |
% гэпов | 1% | 1% | 6% |
Я смогла найти свой белок в банках данных Swiss-Prot и "nr", а также его структуру в PDB. Мой белок в сравнении с самим собой дал 100% сходство в разных банках данных. Число потенциальных гомологов в банках Swiss-Prot и "nr" примерно одинаково, а вот в PDB их число значительно меньше. Различие заключается в том, что за каждая запись в банке PDB является проверяемой, за нее несут ответственность кураторы, то есть содержится проверенная информация. Самая хорошая «худшая» находка это из банка PDB, тк в ней гепов 1%,а длина выравнивания 69. Находки не совпадают, тк базы данных не связаны друг с другом, возможно так же разница заключается в разнице подсчетов E-value.
Номер находки | Идентификатор | E-value | Вес (в битах) | % идентичности | % сходства | Длина выравнивания | Координаты выравнивания | % гэпов |
1 | sp|Q9HA77.1|SYCM_HUMAN | 3e-68 | 255 | 35% | 50% | 487 | 2-450 c 52-524 | 10% |
2 | sp|P49589.3|SYCC_HUMAN | 2e-50 | 196 | 42% | 59% | 233 | 94-312 c 221-452 | 6% |
С помощью putty нахожу аминокислотную последовательность SYC_BLOFL в формате FASTA. Её SWISS-Prot ID - SYC_BLOFL и AC - Q7VRB4. Разница в весах выравнивания из-за того, что вес выравнивания складывается из веса замены аминокислот по матрице BLOSUM62, поэтому есть существенное различие в весах. Из-за этого различия и разницы в длинне различаются и E-value.
Поиск по фрагменту | Поиск по полной последовательности |
|
АС лучшей находки | sp|Q7VRB4.1|SYC_BLOFL | sp|Q7VRB4.1|SYC_BLOFL |
E-value | 4e-15 | 0.0 |
Вес (в битах) | 78.3 | 982 |
Найдены ли другие белки с теми же значениями E-value и веса в битах? |
нет | нет |
Оно соответствует участку 241-262 в Query и 241- 263 в Sbjct.
В BLASTP – 472
В локальном выравнивании - 472
В глобальном выравнивании – 474
В BLASTP – 52%
В локальном выравнивании – 53%
В глобальном выравнивании – 52.7%
В BLASTP – 1296
В локальном выравнивании – 1280
В глобальном выравнивании – 1278
В BLASTP – 68%
В локальном выравнивании – 68.6%
В глобальном выравнивании – 68.4%
Все выравнивания имеют между собой различия. Сравнение глобального и локального выравнивания в прошлой работе. Сравнение глобального и BLASTP- выравнивания – разница заключается только в разнице длин выравнивания:Сравнение локального и BLASTP- выравнивания – это два одинаковых выравнивания, разница в цифрах заключается в типе написания цифр в BLASTP(цифры после запитой эта программа не пишет). Разница в весах (не смотря на подстановку параметров в water и needle) все равно остается.
Второй семестр