| ||
  |   |
Занятие 4.1. Построение дерева по нуклеотидным последовательностямНеобходимо построить филогенетическое дерево бактерий, используя последовательности РНК малой субъединицы рибосомы (16S rRNA).Нужные РНК-последовательности были извлечены из записей EMBL и сохранены в файле rnaseqs.fasta. Затем они были выровнены при помощи программы muscle. Файл с выравниванием: rnaseqs_al.fasta. Для построения филогенетического дерева воспользуемся программами пакета PHYLIP (fdnaml, fdnapars, fdnadist; матрица расстояний подавалась на вход программам fneighbor, ffitch и fkitsch.) Все деревья, построенные этими программами, совпали между собой и с правильным. Приведем пример дерева, полученного fdnapars: +-----NEIMA +--6 | +---BURCA +---5 | | +---RHIEC | +-----4 | +---BRAJA | | +YERPS | +--3 1--2 +YERPE | | | +-ECOLI | +---VIBFMВ отличие от дерева, построенного по выравниванию белковых последовательностей программой fprotpars, это дерево совпадает с правильным. Таким образом, в этом случае качество реконструкции по ДНК выше, чем по белкам. Программа fkitsch выдала укорененное дерево: +---NEIMA +--7 ! +---BURCA ! +-6 +YERPS ! ! +-3 ! ! +-2 +YERPE ! ! ! ! --4 +---1 +ECOLI ! ! ! +--VIBFM ! ! +--RHIEC +---5 +--BRAJAЭто укоренение (в нетривиальную ветвь {RHIEC,BRAJA} против {BURCA,NEIMA,VIBFM,ECOLI,YERPS,YERPE} совпадает с укоренениями, сделанными ранее. 2. Построение и анализ дерева, содержащего паралогиНеобходимо найти в исследуемых бактериях достоверные гомологи белка FTSH_ECOLI. Для этого нужно получить последовательность этого белка:seqret sw:ftsh_ecoliЗатем по файлу proteo.fasta создаем базу данных для поиска гомологов программой blastp: formatdb -i proteo.fasta -n db_proteo -p Tи осуществляем поиск гомологов: blastall -p blastp -d db_proteo -i ftsh_ecoli.fasta -e 0.0001 -o homologs.out -m 8Файл с выдачей: homologs.out; файл с последовательностями белков нужных бактерий: homologs_m.fasta. Теперь выровняем белки программой muscle, полученное выравнивание подадим на вход программе fprotdist, чтобы получить матрицу расстояний. По ней при помощи fneighbor получаем дерево: +--HSLU_VIBFM +-3 ! ! +-HSLU_ECOLI ! +-2 ! ! +HSLU_YERPE ! +-1 ! +HSLU_YERPS ! ! +----------------------------Q89KG3_BRAJA ! ! ! ! +---------------------------Q89BR3_BRAJA ! ! +--7 4------------------6 ! ! +---------------B5FCR8_VIBFM ! ! ! +----------5 ! ! ! +----------Q8KKT3_RHIEC ! ! ! ! +---------8 +-----------Q1BNJ2_BURCA ! ! ! ! ! ! +-----A1IR46_NEIMA ! ! ! +-13 ! ! ! ! +-----Q1BXC9_BURCA ! +-----14 +-15 ! ! ! ! +--B5FA73_VIBFM ! ! ! +-11 ! ! ! ! +FTSH_ECOLI ! ! ! +-10 ! +-16 ! +Q0WBE7_YERPE ! ! +-9 ! ! +Q66F66_YERPS ! ! ! ! +---Q2K4M2_RHIEC ! +-12 ! +---Q9XBG5_BRAJA ! +------HSLU_BRAJAДерево считаем реконструированным верно. Ортологи - гомологичные белки, возникшие в результате видообразования. Примеры ортологов: HSLU_VIBFM, HSLU_ECOLI, HSLU_YERPE и HSLU_YERPS (узел 3), A1IR46_NEIMA и Q1BXC9_BURCA (узел 13). Паралоги - гомоличные белки в одном организме. Примеры паралогов: Q89KG3_BRAJA и Q89BR3_BRAJA, Q1BNJ2_BURCA и Q1BXC9_BURCA. Заметим, что в данном случае нет ни одной пары паралогов, составляющих узел из двух листьев. Назад |