スライド 1 - SFC Bio | Systems Biology Project, KEIO

5/21~6/11
担当講師 柘植謙爾(つげ けんじ) [email protected]
(6)第4章 ゲノム配列の解析
日時:5/21 9:25-10:55
内容:様々な塩基配列の決定法の原理を概説し、その情報を統合してゲノム全体の塩基配列
を得る「ゲノムプロジェクト」の方法論を解説する。
(7)第5章前半 遺伝子の機能を調べる 1
日時:5/28 9:25-10:55
内容:ゲノム中の遺伝子の位置を決める具体的な実験手法について解説する。
(8)第5章後半 遺伝子の機能を調べる 2
日時:6/4 9:25-10:55
内容:遺伝子の機能を調べるための、(1)コンピューターによる機能解析、 (2)実際の遺伝子の
不活性化による機能解析、について概説する。
(9)第6章 ゲノムがどのようにして機能するかを理解する
日時:6/11 9:25-10:55
内容:ゲノムのタンパク質をコードしている遺伝子から生じたRNA分子の集合体である「トラン
スクリプトーム」とその翻訳産物の集合体の「プロテオーム」ついてそれぞれの研究方法を概説
する。
4.3 ヒトゲノムプロジェクト
・アメリカ主導で1990年に開始 15年計画
・世界中の20の公的研究機関が参加
・クローンコンティグを作成し、塩基配列決定した
・1998年設立のアメリカのセレラ・ジェノミクス社(クレイグ・ベンター
が所属)が商業的ヒトゲノムプロジェクトを全ゲノムショットガン法で
行っていることが発覚し、プロジェクトが加速した
・2000年6月 2つのプロジェクト(公的・商業)のドラフト塩基配列が発表
これらは全体の90%で大方の遺伝子領域(ユークロマチン)を網羅
・2003年 完成版(高精度の塩基配列)が発表される
(名目上 ワトソン・クリックのDNA二重らせん構造発表の50周年を記念)
(当初の計画が2年前倒しされた)
ヒトゲノムプロジェクトためのマッピング
ヒトゲノム 2,850Mb
1980年代
RFLP(制限断片長多型)マッピング
約10 Mbに1つの密度
SSLP(単純配列長多型 STSの一種)マッピング
約1 Mbに1つの密度
1990年代
YAC(人工酵母染色体)ライブラリー
平均長約0.9 Mb(のちに問題が明らかに)
STS(配列タグ部位)マッピング
約0.2 Mbに1つの密度
1995年
EST(発現配列タグ)を含むSTSマッピング
約0.1 Mbに1つの密度
統合地図(遺伝地図+物理地図)の完成→塩基配列決定
ライブラリーのベクターの交換
YACライブラリーの挫折
図4.19
YACはヒトゲノムの異なる部分からのDNA断片を含むものが多く使えなかった
BAC(大腸菌の人工染色体)ライブラリーへの方向転換
ヒトゲノムプロジェクトの将来
有用性
比較ゲノム 重要な機能を持つと思われる保存された共通の特徴を同定できる
他人と自分(個性を決める遺伝子の探索)
ヒトとチンパンジー・マウス(霊長類・哺乳類を決める遺伝子)
解決すべき問題
●DAN配列の私有財産化
・決定された配列は誰のもの(提供者、決定者、出資者など)?
・現状、資源(サンプルやお金など)を提供した個人が必ずしもいつも利益を
共有する集団に属しているわけではない→利益分配
●ヒトゲノム配列の公共性についての問題
・“標準と異なる配列“を持つ人が差別される危険
遺伝病のリスクのある変異を持つ人→保険料が高くなる可能性
“人種” 判断の一義的な基準の提供→差別の誘発
●サンプル提供者の匿名性の確保
・サンプル提供者からの同意の必要
・目的以外の使用の禁止
ゲノム配列を理解する
5
本章のねらい
●コンピュータを使ったゲノム配列解析と実験によるゲノム配列解析の長所と
短所を述べる․
第
章
●オープンリーディングフレーム(ORF)スキャンの基本原理を理解し‚ 真核生物
ゲノムで遺伝子の位置を決める際‚ なぜこの方法ではうまくいかないことがあるか
を説明する․
●ゲノム配列中で機能性RNA遺伝子の位置を決める方法を説明する․
5.1
●“相同性”という用語を定義し‚ 相同性と比較ゲノム学によってゲノム配列中で
の遺伝子の位置を決める方法を説明する․
ゲノム配列中の遺伝子の
位置を決める
●RNA分子を指定するゲノム配列の場所を同定するのに用いられるさまざまな実
験について概説する․
5.2
遺伝子の機能を調べる
●遺伝子の機能を同定するのに用いられる相同性検索の利点と限界について評
価する․
●酵母と哺乳類において遺伝子の不活性化と過剰発現させる方法を述べ‚ これを
用いてどのように遺伝子の機能を動的できるか説明する․
●未知の遺伝子がコードするタンパク質の活性を詳しく調べるための技法につい
て概説する․
●出芽酵母ゲノムの塩基配列のアノテーションについて‚ 用いた方法とこれまでの
成果をまとめる․
5.3
ケーススタディー:出芽酵
母ゲノムの塩基配列のア
ノテーション
5.1 ゲノム配列中の遺伝子の位置を決める
前章で説明した手法によりDNAの塩基配列が得られた場合に
どのように遺伝子の位置を決定するか?
2つの方法がある
1.バイオインフォマティックス (ドライ)
コンピュータを用いて遺伝子に特異的な塩基配列の特徴を探す
●ORFスキャン
●相同性検索
●ゲノムの自動アノテーション
●機能性RNAの予測
●比較ゲノム学
2.実験 (ウエット)
DNAの塩基配列を実験的に解析することで遺伝子の位置を決定
●ノーザンハイブリダイゼーション ●ズーブロット法
●RACE法
●ヘテロ二本鎖解析
●逆転写PCR
●エキソントラップ法
1. バイオインフォマティックス
タンパク質をコードする遺伝子トリプレットコドンから
なるオープンリーディングフレームからなる
開始コドン
終止コドン
(ORF)
二本鎖DNA分子には6種類の読み枠がある
3
2
1
開始コドン ATG(メチオニンコドンと同じ配列)をコード
バクテリアでは稀にCTG, GTG, TTGも開始コドンを
コードしている場合がある。
-1
-2
-3
終止コドン TAA, TAG, TGA
ORFスキャンの考え方
塩基組成に偏りがなければ、ある一つのフレームに終止コドン
(TAA, TAG, TGA)は、それぞれは64(=4×4×4)塩基に一か所の
頻度で出現し、全体では約21(=64÷3)塩基に一か所の高頻度で
出現してもおかしくない。
タンパク質コード領域の平均長
大腸菌(原核生物)
317コドン(951塩基)
出芽酵母(真核生物)
483コドン(1449塩基)
ヒト(真核生物)
約450コドン(1350塩基)
長いORF候補、例えば100コドン(300塩基)以上のORF候補は
タンパク質コード遺伝子の可能性を考慮する。
注:実際には50コドン以下の短いタンパク質コード遺伝子はいくらでもある!!
ORFスキャン バクテリアで有効
50コドン以上の長さのORF候補に下線
赤 本物のORF(lacZとlacY)
橙 疑似のORF
図5.3
ORFスキャン(枯草菌ゲノムの実際)
遺伝子解析ソフト GENETYX を使用
:開始コドン候補
0kb
:終止コドン候補
10kb
3
2
1
-1
-2
-3
枯草菌ゲノムの遺伝子配置(例)
枯草菌ゲノムアノテーションサイト BSORF( http://bacillus.genome.jp/ )より
rrn -5S, -16S, -23S
5S, 16S, 23SリボソーマルRNA遺伝子
trn-Ala, -Ile
アラニン, イソロイシンtRNA遺伝子
ゲノム起点から
10kb
20kb
機能性RNA遺伝子
開始コドンと終止コドンは
全く関係ない
タンパク質コード遺伝子
開始コドンと終止コドンで
ORFが定義される
ORFスキャンは高等真核生物に不向き
ORFスキャンはイントロンがある遺伝子の場合、誤る危険が高い
バイオインフォマティックスによる
真核生物のORFスキャンの改良点
●コドンの偏りの考慮
真のエキソンには使用コドンに生物種ごとの偏りが存在する
無作為に選んだ一連のトリプレットには偏りなし
●エキソンーイントロン境界
コンセンサス配列(次ページ)
エキソンーイントロン(5’-AG↓GTAAGT-3’)
イントロンーエキソン(5’PyPyPyPyPyPyNCAG↓-3’)
●上流調節配列
遺伝子の発現に関与するDNA結合タンパク質に対する認識配列と
して働き、特徴的な配列を持っている。
例 脊椎動物のCpGアイランド
注:これらの改良をもっても真核生物のORFスキャンは難しい
上流エキソンーイントロン境界のコンセンサス配列
多数決配列
機能性RNA遺伝子
●機能性RNAの多くは、tRNAやrRNAに代表されるように一
本のポリヌクレオチド鎖の異なる部分で塩基対を形成すると
いう、分子内塩基対形成により、特徴的な二次構造を形成す
る場合が多い。
●機能性RNA遺伝子に関係する調節配列の検索も可能
●小型ゲノム(原核と下等真核生物など)の場合、タンパク質
をコードしていない領域が続くと機能性RNA遺伝子の可能性
がある。
機能性RNA遺伝子の例 tRNA
tRNAのクローバー
リーフ構造
際立った特徴
(クローバー葉(リーフ)構造)
を有する
↓
予測が可能
実際のDNA配列(大腸菌のLeuのtRNA)
RNAの典型的なステムループ構造
ループ(loop)
ステム(stem)
“茎”の意
ステムループ構造は、
DNA配列から予測可能
RNAでは、
A-U、C-G塩基対以外に
G-U塩基対も可能
(この例にはない 図13.11参照)
相同性検索(ホモロジー検索)と
比較ゲノム
ORFスキャンソフトの限界
コード領域の95%ぐらいまで。
(外部のデータに全く頼らずに予測する限界)
外部のデーターに頼る
相同性検索 (ホモロジー検索)
既に知られている遺伝子(あるいは配列)と
似たものがないかどうかを検索し、得られた
情報を遺伝子予測に用いる。
(全生物を対象に遺伝子単位で)
比較ゲノム
既に知られている近縁種のゲノムと
複数の遺伝子に渡る似た領域を検索し、
得られた情報を遺伝子予測に用いる。
(近縁種とゲノム単位で)
近縁種生物にはゲノムに類似性がある
近縁種は共通の祖先のゲノムから分かれて間もないためある程度ゲノムが似ている
A欠損
C完全欠損
A欠損
シンテニー
(遺伝子の並び順が保存されていること)
シンテニーを利用することで近縁種ゲノムの相同遺伝子が存在
しているかどうかをある程度判断することができる。
典型的なアノテーションシステムのディスプレイ
いろいろなプログラムにより導き出されたデータが表示されている
(真核生物の場合)DNA塩基配列データだけで予測することは困難
ESTデーターやタンパク質のアミノ酸配列などの情報と併せて判断
2.実験
DNA分子を直接調べるのではなく、遺伝子から転写されたRNA分子の探索による
●アガロースゲル電気泳動
二次構造をとらないように変性剤(ホルムアミド等)を入れて電気泳動すると
大きさに依存して分離することができる。
●ノーザンハイブリダイゼーション
サザンハイブリダイゼーションのRNA版 プローブには、標識RNA分子、標識
DNA分子のいずれも使えるが、一般にRNAプローブの方が感度が高い。
●標識RNA分子
バクテリオファージT7あるいはSP6のプロモーターを上流に持つ遺伝子断片を
作成し、試験管内でこれらファージのRNAポリメラーゼにより合成する。
●ポリメラーゼ連鎖反応(逆転写PCR reverse transcriptase-PCR )
一旦DNAに逆転写してから通常のPCRを行う。RACE法に用いられる。
●RNAの塩基配列決定法
DNAの化学分解法に似た、配列特異的エンドヌクレアーゼを用いることで可能。
●スペシャリスト法
RNA分子のDNA塩基配列中の位置をマッピングする手法。たとえば、
RACE法、S1ヌクレアーゼマッピング、エキソントラップ法
RNAのアガロースゲル電気泳動の例
原核・真核を問わず全ての生物からとられた全RNAには
数多くのrRNA(リボソーマルRNA)が含まれている
枯草菌の全RNAのアガロースゲル電気泳動
臭化エチジウム(エチジウムブロミド)で視覚化
見えない部分にもmRNAなどのRNA
が大量に存在している。
23S rRNA
16S rRNA
二次構造をとる
ので臭化エチジ
ウムで染色され
やすい
二本鎖DNA・RNAの視覚化
臭化エチジウム(エチジウムブロミド)が
よく用いられる
臭化エチジウム
の構造
エチジウムブロマイドの2本鎖DNAへの
インターカレーションにより蛍光を持つ
サザンハイブリダイゼーション(復習)
(A)ブロッティング(DNAの膜への転写)
(B)ハイブリダイゼーション(特定DNAの検出)
図2.11
ちなみにRNAのブロッティングを
ノーザン・ブロット、タンパク質の
ブロッティングをウエスタン・ブロット
という
ズーブロット(相同性検索の実験版と言える)
各生物のゲノムDNAを
制限酵素で切断して
電気泳動で分離
ヒトの遺伝子断片をプローブ
としてサザンハイブリダイゼーション
ヒト遺伝子と相同する
遺伝子が存在することが
わかる
検出されたバンドの大きさ
に違い
対象遺伝子周辺で
制限酵素地図に違いが
あることがわかる
ノーザンハイブリダイゼーション
サザンハイブリダイゼーションのRNA版
サザンハイブリダイゼーション(Southern hybridization)
電気泳動したDNAを膜にブロッティングしたのち
標識したDNAプローブとハイブリダイゼーション。
ハイブリダイズしたDNAの大きさの情報が得られる。
サザンさんが開発(図2.11参照)
ノーザンハイブリダイゼーション(northern hybridization)
電気泳動したRNAを膜にブロッティングしたのち
標識したRNAあるいはDNAプローブとハイブリ
ダイゼーション。ハイブリダイズしたRNAの大きさ
の情報が得られる。洒落で命名
ウエスタンブロッティング(western blotting)
電気泳動したタンパク質を膜にブロッティングした
のち抗体で特定のタンパク質を検出。検出されたタ
ンパク質の大きさの情報が得られる。洒落で命名
RACE(cDNA末端高速増幅)
特に5’-RACEといわれる方法
内部配列が少しでも
判っていないとプライ
マーは設計できない
3’-RACE法
真核生物のmRNAにはポリAが付加することを利用して
mRNAの3’末端側をクローニングする方法
ポリA
mRNA 5’-
AAAAAAAAAAAAAAAAAAAAAA -3’
TTTTTTTTTT
逆転写
5’-
ポリT
AAAAAAAAAAAAAAAAAAAAAA
TTTTTTTTTT
遺伝子内部の
配列を参考に
プライマーを
作成
RNaseHで
mRNAを分解
TTTTTTTTTT
PCRにより増幅
二本鎖DNA
-3’
ヘテロ二本鎖解析 S1ヌクレアーゼマッピング
mRNAの5’末端(即ち転写開始点)を決めるのによく用いられる
5’-3’
S1ヌクレアーゼ
一本鎖DNAとRNA
部分を全て分解
mRNAの3’末
端決定にも用
いられる
エキソントラップ法
ミニ遺伝子
ミニ遺伝子のイントロン中に
エキソンが入っていると考え
られるDNA断片を導入したベ
クターを目的の宿主中で転
写とスプライシングさせて得
られたmRNAの塩基配列を
決定することで境界を決定
DNAに変換後
塩基配列決定