На главную
Term3

Н Е К О Д И Р У Ю Щ И Е
П О С Л Е Д О В А Т Е Л Ь Н О С Т И

Задание №1. Определить, какая тРНК была (скорее всего) использована рибосомой при присоединении 4-ого аминокислотного остатка к растущей цепи белка Malk_ecoli.

Цель: определить, какая тРНК была (скорее всего) использована рибосомой при присоединении 4-ого аминокислотного остатка к растущей цепи белка Malk_ecoli; привести результаты команд grep и информацию о выбранной тРНК из файла ecoli.embl.
Краткое описание работы: исходя из содержания файлов MALK_ECOLI.fasta и gen_malk.fasta был сделан вывод, что 4 аминокислота Malk_ecoli - валин. Был выявлен соответствующий кодон (5'-GTA-3'), идеальный антикодон (5'-CAU-3') и вырожденная позиция (CAU). По данным записи EMBL, описывающей полный геном E.coli K-12, было определено, сколько тРНК для данного аминокислотного остатка (Val) имеется в геноме E.coli и информация об одной из тРНК.

Команда, использованная для поиска всех валиновых тРНК в геноме:
grep "anticodon.*valine" ecoli.embl>result.txt

Команда, использовавшаяся для извлечения последвательности тРНК из записи EMBL:
seqret ecoli.embl -sbegin 225381 -send 225457
Результаты: Содержание файла, полученного командой grep:
FT /anticodon=(pos:780021..780023,aa:Val)
FT /anticodon=(pos:780324..780326,aa:Val)
FT /anticodon=(pos:1744493..1744495,aa:Val)
FT /anticodon=(pos:1744574..1744576,aa:Val)
FT /anticodon=(pos:2518986..2518988,aa:Val)
FT /anticodon=(pos:2519106..2519108,aa:Val)
FT /anticodon=(pos:2519228..2519230,aa:Val)

Содержание описания тРНК в ecoli.embl:

FT tRNA 779988..780063
FT /gene="valT"
FT /locus_tag="b0744"
FT /product="tRNA-Val"
FT /anticodon=(pos:780021..780023,aa:Val)
FT /note="codons recognized: GUD; anticodon: UAC valine tRNA1;
FT go_component: cytoplasm [goid 0005737]; go_process: tRNA
FT metabolism [goid 0006399]"

Результаты поиска и исследования тРНК, использованной рибосомой при присоединении 4-го аминокислотного остатка к растущей цепи Malk_ecoli сведены в Таблицу 1.

Таблица 1

Аминокислотный остаток в 4-ой позиции белка MALK_ECOLI Val
Соответствующий кодон 5'-GTA-3'
Идеальный антикодон 5'-UAC-3'
Сколько можно было бы ожидать разных ТРНК для остатка Val (опираясь на генетический код)? 4
Сколько ТРНК для остатка Val аннотировано в геноме кишечной палочки? 7
Характерискики, выбранные для дальнейшего изучения ТРНК:  
- Название гена valT
- Координаты выравнивания в записи EMBL 780021..780023
- Антикодон UAC

Задание №2. Поиск гомологичных тРНК в геноме архебактерии

Цель: найти в геноме архебактерии последовательность, наиболее похожую на отобранную в упр. 1 последовательность тРНК из E.coli. valT с координатами 780021..780023 (см. Таблицу1)
Краткое описание работы: поиск проводился в геноме архебактерии Sulfolobus solfataricus (файл ss_genome.fasta) с помощью 4-х разных программ, предназначенных для быстрого поиска сходных нуклеотидных последовательностей: BLASTN, MegaBLAST, FastA и Discontigous MegaBLAST. Список команд, использовавшихся для получения результатов:
- для создания базы данных по геному Sulfolobus solfataricus:

formatdb -i ss_genome.fasta -n ss -p F

- для получения данных работы программы BLASTN:

blastall -p blastn -d ss -i tRNK.fasta -o blastn.fasta
(файл blastn.fasta)

- для получения данных работы программы MEGABLAST:

megablast -d ss -i tRNK.fasta -o megablast1_res.txt -e 10 -D 2 -W4
(файл megablast1_res.txt)

- для получения данных работы программы discontiguous MEGABLAST:

megablast -d ss -i tRNK.fasta -o dmegablast.txt -e 10 -D 2 -W 11
(файл dmegablast.txt)

- для получения данных работы программы fasta35

fasta35 tRNK.fasta ss_genome.fasta
(файл fasta_result.txt )


Результаты: результаты по исследованиям четырех программ поиска сведены в Таблицу2. Примечание: при поиске программой MegaBLAST использовалась длина слова 4 bp, при этом результаты абсолютно совпадали с результатами при поиске программой BLASTN и DiscontigousMegaBLAST. При длине слова 28bp поиск не дал результатов.

Таблица 2

Программа FastA BLASTN MegaBLAST Discontigous
MegaBLAST
Число находок с Е-value < 0,001 0 0 0 0
Характеристика лучшей находки:
E-value находки 0.013 2.3 2.3 -
AC соответствующей записи EMBL AE006707 AE006789 AE006789 -
координаты выравнивания в записи EMBL 7341-7401 1269 - 1281 1269 - 1281 -
Аннотация лучшей находки по EMBL tRNA-Arg dTDP-Glucose 4,6-dehydratase (rfbB-3) dTDP-Glucose 4,6-dehydratase (rfbB-3) -


Выводы: поиск гомологов валиновой тРНК бактерии Escherichia coli в геноме Sulfolobus solfataricus не дал удовлетворяющих результатов. Это неудивительно, т.к. ни одна из представленных в этой работе программ BLAST и программа fastA не предназначены для этого. Они работают со словами большой длины, не имеют матриц замен (за исключением fastA), что осложняет поиск гомологичных нуклеотидных последовательностей. Еще больше задача осложнялась тем, что поиск проводился в геноме архебактерии.

FastA
Программа FastA дала наилучший результат выравнивания по сравнению с BLASTN, MegaBLAST, Discontigous MegaBLAST. Скорее всего это связано со следующими фактами. Во-первых, FastA использует для выравнивания самое короткое слово - 6 н.о. Это позволяет уменьшить специфичность поиска. Во-вторых, FastA - единственная из четырех данных программ, в которой есть матрица замен.

BLASTN
Одним из главных недостатков BLASTN для поиска гомологичных нуклеотидных последовательностей является длина слова - 11 но. Ведь BLASTN нашел всего 9 гомологов, из которых длина каждого не сильно превышает длину 11 но. Отсюда можно сделать вывод, что такая длина слова слишком большая для работы с нуклеотидными последовательностями. Не учитываются вероятные замены н.о. в вырожденной позиции кодона.

MegaBLAST
В программе MegaBLAST длина слова по умолчанию задана 28. При проведении поиска с этой длиной слова не было найдено ни одного гомолога. При уменьшении длины слова в 2 раза было найдено меньше десяти гомологов. Вероятно, изначально MegaBLAST создавался с такой большой длиной слова для того, чтобы искать идентичные белковые последовательности, но не нуклеотидные.

Discontigous MegaBLAST
При работе с программой Discontigous MegaBLAST не было найдено ни одного гомолога. Это обусловлено не только отсутствием матрицы замен, но и механизмом работы Discontigous MegaBLAST , отличающимся от предыдущих программ. Поиск в Discontigous MegaBLAST задается с помощью трех параметров: W - длина значащих позиций в паттерне, -t - длина паттерна, -N - расположение позиций в выравнивании. К сожалению, принцип работы так и не удалось узнать, потому что не было найдено ни одного гомолога.

Итог:
Исходя из полученных результатов, можно сделать вывод, что ни одна из предложенных программ (BLASTN, MegaBLAST, discontiguous MegaBlast, fastA) не предназначена для поиска близких гомологов нуклеотидных последовательностей.

Отчет в формате *.doc можно посмотреть здесь

© Pouliakhina
All rights reserved