1

角丸四角形: Step１
遺伝子予測ツールの予備知識

１．１遺伝子予測ツールとは？

◎ 遺伝子予測ツールについての基本的な説明です。

◇ 遺伝子予測ツールの機能。

ほとんどの遺伝子予測ツールは、ゲノムの配列断片中に存在するエキソン部分を発見する遺伝子発見プログラムです。DNA配列を入力すると、その配列にコードされている遺伝子構造を予測し、出力します。

◇ 遺伝子予測ツールの利用にあたって

学術的な利用には無料で配布されているものが多く、コンピュータ上にインストールすることもできますが、一般的には大学や研究所が提供しているサーバにアクセスして利用します。

１．２遺伝子予測ツールの利用に必要なコンピュータ環境

◎遺伝子予測ツールを利用する前に、必要な環境を確認しましょう。

◇ ブラウザ（インターネットエクスプローラー、ネットスケープナビゲーターなど）

ブラウザが必要です。遺伝子予測ツールのホームページにアクセスして遺伝子予測ツールを利用します。

◇ インターネット接続

インターネットが使用可能な状態になっていることが前提です。また、メールアドレスを所有していれば、予測結果をEメールで配信してもらうことができるツールもあります。

１．３いろいろな遺伝子予測ツール

◎ 遺伝子予測ツールを紹介します。

GENSCAN
対象とする生物種	◇ 脊椎動物（Vertebrate） ◇ トウモロコシ（Maize） ◇ シロイヌナズナ（Arabidopsis）
バージョン	1.0 （2001年6月現在）
入力	DNA配列（制限：塩基数100万個（1Mbp））
入力形式	◇ HTMLフォーム ◇ テキストファイル ◇ Eメール
出力形式	◇ ブラウザ上の出力 ◇ 画像（PDF、ポストスクリプト） ◇ Eメール
使用アルゴリズム	隠れマルコフモデル
サービスを提供しているサーバ	◇ マサチューセッツ州工科大学（アメリカ）http://genes.mit.edu/GENSCAN.html ◇ パスツール研究所（フランス）http://bioweb.pasteur.fr/seqanal/interfaces/genscan.html

GRAIL
対象とする生物種	◇ ヒト（human） ◇ マウス（mouse） ◇ シロイヌナズナ（Arabidopsis） ◇ Drosophila（キイロショウジョウバエ属） ◇ E.coli（大腸菌）
バージョン	Version1.3 （2001年6月現在）
入力	DNA配列（制限：塩基数20万個（200kbp））
入力形式	◇ HTMLフォーム ◇ テキストファイル
出力形式	◇ ブラウザ上の出力 ◇ テキストファイル
使用アルゴリズム	ニューラルネット
サービスを提供しているサーバ	◇ オークリッジ国立研究所（アメリカ）http://compbio.ornl.gov/Grail-1.3/ ◇ 東京大学医科学研究所（日本）http://grail.genome.ad.jp/

GeneMark
対象とする生物種	◇ 大腸菌（E.coli） ◇ 枯草菌（S.cerevisiae） ◇ T4ファージ（Phage_T4） ◇ ヒト（H.sapiens）など多くの生物種に対応する
バージョン	Version2.4 （2001年6月現在）
入力	DNA配列（制限：塩基数100万個（1Mbp））
入力形式	◇ HTMLフォーム ◇ テキストファイル
出力形式	◇ ブラウザ上の出力
使用アルゴリズム	隠れマルコフモデル
サービスを提供しているサーバ	◇ ジョージア工科大学（アメリカ）http://genemark.biology.gatech.edu/GeneMark/ ◇ 欧州分子生物学研究所（フランス）http://www.ebi.ac.uk/genemark/

角丸四角形: Step２
GENSCANの利用法

２．１ GENSCANのホームページに移動

◎ まず、インターネットエクスプローラー（Internet Explorer）を使ってGENSCANにアクセスしましょう。

① ［スタート］－［プログラム］－［Internet Explorer］をクリックする。

② アドレスの入力欄にGENSCANを提供しているサイトのURL

http://genes.mit.edu/GENSCAN.html

を入力します。

③ Enterキーを押すと、GENSCANのホームページが表示されます。

遺伝子予測ツールを提供しているホームページ

２．２ DNA配列の入力

◎ 遺伝子構造予測を行うDNA配列を入力しましょう。

① スクロールバーを使って、DNA配列入力フォームを表示させます。

DNA配列入力フォーム

② フォームにDNA配列を入力します（コピー＆ペーストで入力します）。

ここでは、「Homo sapiens endothelial nitric oxide synthase（ヒト一酸化窒素合成酵素、ACCESSION ID: D26607）」のDNA塩基配列を使って試してみます。ゲノムネット（先の実習を参考）などのデータベースで検索してください。

DNA配列が入力されたフォーム

２．３各オプションの設定

◎ GENSCANの実行オプションを設定します。

入力フォームの各オプション

◇各オプションの説明

(1) Organism:	入力したDNA配列の生物種を選択します。 ◇ Vertebrate（脊椎動物） ◇ Maize（トウモロコシ） ◇ Arabidopsis（シロイヌナズナ）
(2) Suboptimal exon cutoff (optional):	（省略可）準候補の回答がほしい場合、この値を低く設定します。
(3) Sequence name (optional):	（省略可）シークエンスの名前を入力します。
(4) Print options:	◇ Predicted peptides only 予測された遺伝子のアミノ酸配列を表示させます。 ◇ Predicted CDS and peptides 予測された遺伝子の塩基配列とアミノ酸配列を表示させます。
(5) Upload your DNA sequence file (one-letter code, upper or lower case, spaces/numbers ignored):	（省略可）自分のパソコン上にあるDNA配列のファイルを指定することができます。
(6) Or paste your DNA sequence here (one-letter code, upper or lower case, spaces/numbers ignored):	入力フォームにDNA配列を入力します。DNA配列は1文字表記（A,T,G,C）である必要があります。また、大文字と小文字の区別はなく、配列中にスペースや数字が挿入されていても無視されます。
(7) To have the results mailed to you, enter your email address here (optional):	（省略可）フォームにEメールアドレスを入力すると、結果がEメールで送信されます。

① 今回は、対象がヒトの酵素であるため、

・ (1) Organism → Vertebrate（脊椎動物）

のオプションを選択し、

・ (3) Sequence name → D26607（ACCESSION ID）

を補足情報として入力しましょう。

２．４実行と結果の表示

◎ 実行ボタンを押して実行します。

実行ボタン

角丸四角形: Step３
結果の解釈

３．１遺伝子の予測結果

◎ GENSCAN実行後に出力される結果を一項目ずつ見てみましょう。

予測されたエキソン

◇各項目の説明

(1) Gn.Ex	遺伝子の識別番号
(2) Type	◇ Init = Initial exon 開始コドンとドナー部位で挟まれるエキソン。 ◇ Intr = Internal exon アクセプター部位とドナー部位で挟まれるエキソン。 ◇ Term = Terminal exon アクセプター部位とストップコドンで挟まれるエキソン。 ◇ Single-exon gene イントロンのない遺伝子。（Init + Intr + Term = Single-exon gene） ◇ Prom = Promoter プロモーター。転写が始まるDNA上の領域。 ◇ PlyA = poly-A signal ポリA配列。真核生物のmRNA3’末端に普遍的に存在する配列。
(3) S	鎖の側
(4) Begin	エキソンの開始位置
(5) End	エキソンの終了位置
(6) Len	エキソンの長さ
(7) Fr	翻訳時の読み枠
(8) Ph	読み枠のずれ具合（エキソン長を3で割った余り）
(9) I/Ac	3‘末端側境界の得点
(10) Do/T	5‘末端側境界の得点
(11) CodRg	エキソンの得点
(12) P….	エキソンの確率
(13) Tscr..	エキソン単独の得点（Len, I/Ac, Do/T, CodRgの値で算出されます）

予測結果から

◇ Gn.Ex 1.01～1.27の27個所のエキソンが予測されています。

◇ Type欄から予測されたエキソンの種類を判別します。

今回の結果では開始コドンは含まれておらず、26断片のエキソンと１断片の終止コドンを含むエキソンが予測されています。

◇ エキソンの存在確率は軒並み高いものですが、Gn.Ex 1.02と1.26の予測エキソンでは確率が0.5台と他の予測エキソンよりも低くなっています。

３．２図の表示

◎ 結果をわかりやすい図で見ることができます。

◇ PDFファイル

◇ PostScriptファイル

の2種類があります。ここではPDFファイルを表示してみましょう。

（PDFファイルの表示にはAdobe Acrobat Readerが必要です。）

① PDFファイルへのリンクをクリックしてPDFファイルを表示する。

出力されたPDFファイル

◇ Key一覧

PDFファイル中の表示	Key:	Keyの意味
	Initial exon	開始コドンとドナー部位で挟まれるエキソン
	Internal exon	アクセプター部位とドナー部位で挟まれるエキソン
	Terminal exon	アクセプター部位とストップコドンで挟まれるエキソン
	Single-exon gene	イントロンのない遺伝子
	Optional exon	エキソンの準候補オプション｢Suboptimal exon cutoff｣を低く設定すると表示される。
	Suboptional exon	エキソンの準々候補オプション｢Suboptimal exon cutoff｣を低く設定すると表示される。

３．１の結果と照らし合わせて見てみましょう。

◇ 27本のエキソンが青い四角で表示されています。

◇ 末端（22.0kb付近）のエキソンだけがTerminal exonとしてホームベース型の図で表示されています。

３．３アミノ酸配列の出力

◎ 予測されたエキソンを翻訳したアミノ酸配列が出力されます。

参考文献

・ Burge, C. and Karlin, S. (1997) Prediction of complete gene structures in human genomic DNA. J. Mol. Biol. 268, 78-94.

・ Burge, C. B. (1998) Modeling dependencies in pre-mRNA splicing signals. In Salzberg, S., Searls, D. and Kasif, S., eds. Computational Methods in Molecular Biology, Elsevier Science, Amsterdam, pp. 127-163.

・ Burge, C. B. and Karlin, S. (1998) Finding the genes in genomic DNA. Curr. Opin. Struct. Biol. 8, 346-354.

・ The New GENSCAN Web Server at MIT（http://genes.mit.edu/GENSCAN.html）

・岩波生物学辞典第4版

GENSCAN

GRAIL

GeneMark