Partek Genomics Suite:MeDIP

技術情報
ゲノムデータ解析ソフトウェア
Genomics Suite: MeDIP-seqデータ解析
Partek Genomics Suiteは次世代シーケンサーとマイクロアレイの両方のデータ解析が可能なソフトウェアで
す。ゲノム/トランスクリプトーム/エピゲノムのさまざまなアプリケーションに対応した解析ができます。次
世代シーケンサーを用いて、遺伝子発現を制御する代表的なエピジェネティクスであるDNAメチル化を解析
する手法の1つがMeDIP-seqです。今回はGenomics Suiteを用いたMeDIP-seqデータ解析について紹介しま
す。
■ MeDIP-seqとは
メチル化 DNA 免疫沈降法
(MeDIP)は、染色体 DNA の
よるメチル化領域の解析結果とRNA-seq による遺伝子発
現の解析結果を統合できます。
中でメチル化したシトシン (mC) を含む領域を同定する手
法です。染色体 DNA を断片化した後に、抗 mC 抗体を使っ
て DNA 断片を免疫沈降します。
■ ヒルベルト曲線
染色体ごとのメチル化状態を概観するためにヒルベル
MeDIP-seq は、MeDIPと次世代シーケンサーを組み合
ト曲線による表示が可能です。ヒルベルト曲線は染色体
わせてゲノムワイドにエピゲノム情報を取得する手法です。
の始点が長方形の左下、セントロメアが中央、終点が右下
MeDIPとタイリングアレイを使った解析やバイサルファ
に位置するように長方形を充填したフラクタル図形です。
イト処理と次世代シーケンサーを組み合わせた Bisulfite-
染色体上で近い位置にある塩基はヒルベルト曲線内で近
seqと並んでさまざまな生物で転写制御メカニズムの理
傍に位置します。ヒルベルト曲線内で赤く表示された部分
解に大きく貢献しています。
が染色体上でメチル化している領域に対応しています。
■ Genomics Suiteで実現できるデータ解析
Genomics Suite は、MeDIP-seq のデータ解析を行うた
めにワークフローを提供しています。MeDIP-seq 用のワー
クフローでは次のような解析を行うことができます。
■ ピークの検出
指定したサイズのウインドウに染色体を分割して、各ウ
インドウに含まれるフラグメントの数をカウントします。カ
ウントしたフラグメント数は、ゼロ打ち切り負の二項分布
図1 MeDIPサンプルとmockサンプルのヒルベルト曲線
(ZTNB)に当てはめてピークを検出します。ウインドウサイ
ズはピーク検出の結果に大きく影響しますので、解析対象
のサンプルに応じて調節します。
■ メチル化が変化した領域の検出
染 色体を指定したサイズに分割して、ウインドウごと
検出したピークに対して、マン・ホイットニィ U 検定の p
に全リード数または最大深度を指標にして 2 サンプル間
値および対照サンプルに対する二項検定の p 値が算出さ
の Fold Changeと二 項 検 定 の p 値 を算 出しま す。Fold
れます。マン・ホイットニィ U 検定の p 値は順鎖と逆鎖の
Change はサンプルごとの全リード数で補正されます。p
ピークが二峰性を示すことを判定するための評価基準と
値が閾値より小さいウインドウをメチル化が変化した領
なります。対照サンプルに対する二項検定の p 値は PCR バ
域として検出します。この解析ではピークの検出とは異な
イアスや抗体の非特異的結合などに起因する偽陽性を判
り、解析結果は指定したサイズのウインドウで出力されま
定するための評価基準となります。
す。そのため、あらかじめピーク検出を行ってメチル化領
域がどれくらいの大きさかを確認してからメチル化が変
■ 遺伝子との相関
化した領域の検出を行います。
検出されたピークを RefSeq や Ensembl Transcripts な
どのトランスクリプトームデータベースと比較して、各ピー
クが近傍の遺伝子とどのような位置関係にあるかを確認
できます。遺伝子ごとに重複するピークの転写開始点から
の距離、重複する割合、重複する領域
(プロモーター、5’UTR、CDS、3’-UTR、イントロン)を出力します。
ピークと重複する遺伝子のリストは、GO Enrichment 解
析やパスウェイ解析などを行うことができます。また、同じ
サンプルで RNA-seq を行っている場合は、MeDIP-seq に
図2 メチル化が変化した領域の検出結果
9