LOCUS EDN62595 354 aa linear PLN 13-JUL-2007

農学部3年　情報生物学実習（2009年6月1日）

２．１　配列解析

１．例題にならって、次に与えられた課題配列のアミノ酸配列をターゲット配列として、相同アミノ酸の検索（ここではBLAST検索）を行い、そのアミノ酸配列はどのような生物種由来のアミノ酸配列（もしくは同定されているタンパク質）と考えられるのか、また、相同性の高いタンパク質にはどのような機能を持つタンパク質があると予測されるのかを調べる。

例題(185)　　例題を使った配列解析の流れ

課題配列(491)

本実習では下記に上げたサイトからDNA Data Bank of Japan (DDBJ)を利用するが、興味がある人は時間がある時に他のサイトも利用してみてください。

・DNA Data Bank of Japan (DDBJ)

http://www.ddbj.nig.ac.jp/Welcome-j.html

Blast + ClustalW(ただしTreeViewをインストールする)

（Blastの結果の生物種がわかりにくい）

・Expert Protein Analysis System (ExPASy)

　　　http://www.expasy.org/

　　　Blast + ClustalW

　　　Phylogenetic analysis →　Web or e-mail servers

→　Basic GeneBee ClustalW 1.83

・National Center for Biotechnology Information（NCBI）

　　　http://www.ncbi.nlm.nih.gov/

Blast + Distance tree

（Blastの結果の生物種はGraphic viewでわかりやすいが、blastと連携してない）

上記のサイトにターゲット配列を入力し、プログラムは「blastp」を選択する。

アミノ酸配列データベースは「アミノ酸配列デフォルトデータ」を使用する。

BLAST検索の結果より、相同なタンパク質は機能が類似している場合が多いことから、検索を行ったアミノ酸配列が示すタンパク質の機能が不明であっても、相同性の高いタンパク質と同様な機能を持つことが予想される。

２．BLASTの結果において、少なくとも計１０以上の相同性の高いアミノ酸配列を選択する（可能であれば様々な生物種に属する相同性の高いアミノ酸配列（タンパク質）を選び出す）。

様々な生物種を選択するとき、下記のような例を参考にしてください。

（1）Animalia ( Apis (Honey bee), Danio (Zebra fish), Drosophila (fruit fly), ..... )

（1-1）Mammalia ( Bos (Bovine), Gallus (Bird), Human, Mouse, Rat, ..... )

（2）Plantae ( Arabidopsis, Oryza sativa (Rice) ..... )

（3）Fungi (Aspergillus, Candida, ..... )

（3-1）Yeast ( Pichia, Saccharomyces, ..... )

（4）Bacteria

( Acidobacteria, Burkholderia, Clostridium, Pseudomonas, Streptomyces, ..... )

（5）Archaea (Halobacteria, Pyrococcus, Thermococcus, ..... )

選んだアミノ酸配列を用いてマルチプルシークエンスアライメントを行う。ここでは広く使用されているプログラム、ClustalWを用いる。

GO TO CLUSTALW　→　入力内容の送信　→　View Result

結果はquery.aln以下に表示される。

（query.alnをデスクトップなどに一時的に保存してダウンロードし、WordPadで開いたものをレポートの結果として貼り付ける）

３．ClustalWの結果から、相同性のあるタンパク質とのアミノ酸配列の比較を行ったときに、どのようなアミノ酸残基が保存されているのかを調べる。タンパク質の機能に重要なアミノ酸は生物種を超えて保存されていることが多い。

４．ClustalWの結果を利用し、ターゲット配列と相同性のあるタンパク質と間の進化的距離を計算した系統樹を作成する。

ClustalWの結果後半に示されている計算結果（query.ph）をTreeViewにより表示する。

query.phをデスクトップなどに一時的に保存してダウンロードし、ファイルを開く。

（系統樹はFileからsave as graphicとして一時的に保存し、その図を結果としてレポートに貼り付ける。）

＜query.phが開けない場合＞

・自分のPCにフリーソフトTreeViewをインストールする場合

TreeView（http://taxonomy.zoology.gla.ac.uk/rod/treeview.html）サイトにいき、プログラムをdownloadしインストールする。

ClustalWの結果後半に示されている計算結果（query.ph）をTreeViewにより表示することができる。

・自分のPCにフリーソフトをインストールしたくない場合

GeneBeeのサイトのプログラム（http://www.genebee.msu.ru/clustal/）を用いて、系統樹を作成する。

この際、２．で行ったClustalWの送信画面で表示される全配列をコピーして入力し、再度ClustalWを行うと同時に進化系統樹の結果も得られる。

５．BLAST検索画面（http://blast.ddbj.nig.ac.jp/top-j.html）に戻り、次は使用するアミノ酸配列データベースを「PDB」に選択して、同様なBLAST検索を行う。

PDB（Protein Data Bank）は3次元構造が決定されているタンパク質の座標情報が登録されているデータベースであり、PDBに登録されているタンパク質との相同性を調べることにより、どのような機能を示すタンパク質の構造と相同性があるのかを類推する。

６．レポート提出（次回の講義の前に提出）

A4で1,2枚程度。できれば両面印刷で1枚程度。

1枚目の右上に学籍番号と氏名を明記すること。

レポートの内容 →　レポートの例

（１）課題のアミノ酸配列はどのようなタンパク質、もしくはどのような機能を示すタンパク質であると類推されたか。

（２）マルチプルアライメントの結果（ClustalWの結果）を示す。相同性のあるタンパク質とのアミノ酸配列の比較を行ったときに、生物種を超えて保存されているアミノ酸残基があったか、また、そのアミノ酸残基はどのような役割があると考えられるか、保存アミノ酸残基が集中している場所があるか等、気がついた点や考察を書く。

（３）系統樹の結果を示す。　また、結果をもとに考察を書く。

（４） 3次元構造が決定されているタンパク質のデータベース（PDB）を使用するとどのような結果が得られたか。100％であれば与えられたアミノ酸配列を示すタンパク質の構造は決定されている。100％でなければ、構造が解明されているどのような生物種のタンパク質と類似性があると考えられたか。