角丸四角形: Step1
遺伝子予測ツールの予備知識

 


1.1 遺伝子予測ツールとは?

    遺伝子予測ツールについての基本的な説明です。

 

 

遺伝子予測ツールの機能。

ほとんどの遺伝子予測ツールは、ゲノムの配列断片中に存在するエキソン部分を発見する遺伝子発見プログラムです。DNA配列を入力すると、その配列にコードされている遺伝子構造を予測し、出力します。

 

 

遺伝子予測ツールの利用にあたって

学術的な利用には無料で配布されているものが多く、コンピュータ上にインストールすることもできますが、一般的には大学や研究所が提供しているサーバにアクセスして利用します。

 


 

1.2 遺伝子予測ツールの利用に必要なコンピュータ環境

◎遺伝子予測ツールを利用する前に、必要な環境を確認しましょう。

 

 

ブラウザ(インターネットエクスプローラー、ネットスケープナビゲーターなど)

ブラウザが必要です。遺伝子予測ツールのホームページにアクセスして遺伝子予測ツールを利用します。

 

    インターネット接続

インターネットが使用可能な状態になっていることが前提です。また、メールアドレスを所有していれば、予測結果をEメールで配信してもらうことができるツールもあります。


 

1.3 いろいろな遺伝子予測ツール

    遺伝子予測ツールを紹介します。

 

 

GENSCAN

対象とする生物種

    脊椎動物(Vertebrate

    トウモロコシ(Maize

    シロイヌナズナ(Arabidopsis

バージョン

1.0 20016月現在)

入力

DNA配列(制限:塩基数100万個(1Mbp))

入力形式

    HTMLフォーム

    テキストファイル

    Eメール

出力形式

    ブラウザ上の出力

    画像(PDF、ポストスクリプト)

    Eメール

使用アルゴリズム

隠れマルコフモデル

サービスを提供しているサーバ

    マサチューセッツ州工科大学(アメリカ)http://genes.mit.edu/GENSCAN.html

    パスツール研究所(フランス)http://bioweb.pasteur.fr/seqanal/interfaces/genscan.html

 

 

GRAIL

対象とする生物種

    ヒト(human

    マウス(mouse

    シロイヌナズナ(Arabidopsis

    Drosophila(キイロショウジョウバエ属)

    E.coli(大腸菌)

バージョン

Version1.3 20016月現在)

入力

DNA配列(制限:塩基数20万個(200kbp))

入力形式

    HTMLフォーム

    テキストファイル

出力形式

    ブラウザ上の出力

    テキストファイル

使用アルゴリズム

ニューラルネット

サービスを提供しているサーバ

    オークリッジ国立研究所(アメリカ)http://compbio.ornl.gov/Grail-1.3/

    東京大学医科学研究所(日本)http://grail.genome.ad.jp/

 

 

GeneMark

対象とする生物種

    大腸菌(E.coli

    枯草菌(S.cerevisiae

    T4ファージ(Phage_T4

    ヒト(H.sapiens

など多くの生物種に対応する

バージョン

Version2.4 20016月現在)

入力

DNA配列(制限:塩基数100万個(1Mbp))

入力形式

    HTMLフォーム

    テキストファイル

出力形式

    ブラウザ上の出力

使用アルゴリズム

隠れマルコフモデル

サービスを提供しているサーバ

    ジョージア工科大学(アメリカ)http://genemark.biology.gatech.edu/GeneMark/

    欧州分子生物学研究所(フランス)http://www.ebi.ac.uk/genemark/

 


 

角丸四角形: Step2
GENSCANの利用法

 


2.1 GENSCANのホームページに移動

まず、インターネットエクスプローラー(Internet Explorer)を使ってGENSCANにアクセスしましょう。

 

@    [スタート]−[プログラム]−[Internet Explorer]をクリックする。

A    アドレスの入力欄にGENSCANを提供しているサイトのURL

http://genes.mit.edu/GENSCAN.html

を入力します。

B    Enterキーを押すと、GENSCANのホームページが表示されます。

 

遺伝子予測ツールを提供しているホームページ


 

2.2 DNA配列の入力

遺伝子構造予測を行うDNA配列を入力しましょう。

 

 

@    スクロールバーを使って、DNA配列入力フォームを表示させます。

 

DNA配列入力フォーム


A    フォームにDNA配列を入力します(コピー&ペーストで入力します)。

ここでは、「Homo sapiens endothelial nitric oxide synthase(ヒト一酸化窒素合成酵素、ACCESSION ID: D26607」のDNA塩基配列を使って試してみます。ゲノムネット(先の実習を参考)などのデータベースで検索してください。

 

DNA配列が入力されたフォーム

 


 

2.3 各オプションの設定

    GENSCANの実行オプションを設定します。

 

 

入力フォームの各オプション

 

 

◇各オプションの説明

(1) Organism:

入力したDNA配列の生物種を選択します。

    Vertebrate(脊椎動物)

    Maize(トウモロコシ)

Arabidopsis(シロイヌナズナ)

(2) Suboptimal exon cutoff (optional):

(省略可)準候補の回答がほしい場合、この値を低く設定します。

(3) Sequence name (optional):

(省略可)シークエンスの名前を入力します。

(4) Print options:

    Predicted peptides only

予測された遺伝子のアミノ酸配列を表示させます。

    Predicted CDS and peptides

予測された遺伝子の塩基配列とアミノ酸配列を表示させます。

(5) Upload your DNA sequence file (one-letter code, upper or lower case, spaces/numbers ignored):

(省略可)自分のパソコン上にあるDNA配列のファイルを指定することができます。

(6) Or paste your DNA sequence here (one-letter code, upper or lower case, spaces/numbers ignored):

入力フォームにDNA配列を入力します。DNA配列は1文字表記(A,T,G,C)である必要があります。また、大文字と小文字の区別はなく、配列中にスペースや数字が挿入されていても無視されます。

(7) To have the results mailed to you, enter your email address here (optional):

(省略可)フォームにEメールアドレスを入力すると、結果がEメールで送信されます。

 

 

@    今回は、対象がヒトの酵素であるため、

        (1) Organism Vertebrate(脊椎動物)

のオプションを選択し、

        (3) Sequence name D26607ACCESSION ID

を補足情報として入力しましょう。

 

 


 

2.4 実行と結果の表示

実行ボタンを押して実行します。

 

 

実行ボタン


 

角丸四角形: Step3
結果の解釈

 


3.1 遺伝子の予測結果

    GENSCAN実行後に出力される結果を一項目ずつ見てみましょう。

 

予測されたエキソン

 

 

◇各項目の説明

(1) Gn.Ex

遺伝子の識別番号

(2) Type

    Init = Initial exon

開始コドンとドナー部位で挟まれるエキソン。

    Intr = Internal exon

アクセプター部位とドナー部位で挟まれるエキソン。

    Term = Terminal exon

アクセプター部位とストップコドンで挟まれるエキソン。

    Single-exon gene

イントロンのない遺伝子。(Init + Intr + Term = Single-exon gene

    Prom = Promoter

プロモーター。転写が始まるDNA上の領域。

    PlyA = poly-A signal

ポリA配列。真核生物のmRNA3’末端に普遍的に存在する配列。

(3) S

鎖の側

(4) Begin

エキソンの開始位置

(5) End

エキソンの終了位置

(6) Len

エキソンの長さ

(7) Fr

翻訳時の読み枠

(8) Ph

読み枠のずれ具合(エキソン長を3で割った余り)

(9) I/Ac

3‘末端側境界の得点

(10) Do/T

5‘末端側境界の得点

(11) CodRg

エキソンの得点

(12) P….

エキソンの確率

(13) Tscr..

エキソン単独の得点(Len, I/Ac, Do/T, CodRgの値で算出されます)

 

予測結果から

    Gn.Ex 1.011.2727個所のエキソンが予測されています。

    Type欄から予測されたエキソンの種類を判別します。

今回の結果では開始コドンは含まれておらず、26断片のエキソンと1断片の終止コドンを含むエキソンが予測されています。

    エキソンの存在確率は軒並み高いものですが、Gn.Ex 1.021.26の予測エキソンでは確率が0.5台と他の予測エキソンよりも低くなっています。


 

3.2 図の表示

    結果をわかりやすい図で見ることができます。

    PDFファイル

    PostScriptファイル

2種類があります。ここではPDFファイルを表示してみましょう。

PDFファイルの表示にはAdobe Acrobat Readerが必要です。)

 

@    PDFファイルへのリンクをクリックしてPDFファイルを表示する。

 

 


出力されたPDFファイル

 

 

Key一覧

PDFファイル中の表示

Key:

Keyの意味

Initial exon

開始コドンとドナー部位で挟まれるエキソン

Internal exon

アクセプター部位とドナー部位で挟まれるエキソン

Terminal exon

アクセプター部位とストップコドンで挟まれるエキソン

Single-exon gene

イントロンのない遺伝子

Optional exon

エキソンの準候補

オプション「Suboptimal exon cutoff」を低く設定すると表示される。

Suboptional exon

エキソンの準々候補

オプション「Suboptimal exon cutoff」を低く設定すると表示される。

 

 

3.1の結果と照らし合わせて見てみましょう。

    27本のエキソンが青い四角で表示されています。

    末端(22.0kb付近)のエキソンだけがTerminal exonとしてホームベース型の図で表示されています。

 


 

3.3 アミノ酸配列の出力

    予測されたエキソンを翻訳したアミノ酸配列が出力されます。

 

 

 

 


 

参考文献

    Burge, C. and Karlin, S. (1997) Prediction of complete gene structures in human genomic DNA. J. Mol. Biol. 268, 78-94.

    Burge, C. B. (1998) Modeling dependencies in pre-mRNA splicing signals. In Salzberg, S., Searls, D. and Kasif, S., eds. Computational Methods in Molecular Biology, Elsevier Science, Amsterdam, pp. 127-163.

    Burge, C. B. and Karlin, S. (1998) Finding the genes in genomic DNA. Curr. Opin. Struct. Biol. 8, 346-354.

    The New GENSCAN Web Server at MIThttp://genes.mit.edu/GENSCAN.html

    岩波 生物学辞典 4