技術情報 ゲノムデータ解析ソフトウェア Genomics Suite: MeDIP-seqデータ解析 Partek Genomics Suiteは次世代シーケンサーとマイクロアレイの両方のデータ解析が可能なソフトウェアで す。ゲノム/トランスクリプトーム/エピゲノムのさまざまなアプリケーションに対応した解析ができます。次 世代シーケンサーを用いて、遺伝子発現を制御する代表的なエピジェネティクスであるDNAメチル化を解析 する手法の1つがMeDIP-seqです。今回はGenomics Suiteを用いたMeDIP-seqデータ解析について紹介しま す。 ■ MeDIP-seqとは メチル化 DNA 免疫沈降法 (MeDIP)は、染色体 DNA の よるメチル化領域の解析結果とRNA-seq による遺伝子発 現の解析結果を統合できます。 中でメチル化したシトシン (mC) を含む領域を同定する手 法です。染色体 DNA を断片化した後に、抗 mC 抗体を使っ て DNA 断片を免疫沈降します。 ■ ヒルベルト曲線 染色体ごとのメチル化状態を概観するためにヒルベル MeDIP-seq は、MeDIPと次世代シーケンサーを組み合 ト曲線による表示が可能です。ヒルベルト曲線は染色体 わせてゲノムワイドにエピゲノム情報を取得する手法です。 の始点が長方形の左下、セントロメアが中央、終点が右下 MeDIPとタイリングアレイを使った解析やバイサルファ に位置するように長方形を充填したフラクタル図形です。 イト処理と次世代シーケンサーを組み合わせた Bisulfite- 染色体上で近い位置にある塩基はヒルベルト曲線内で近 seqと並んでさまざまな生物で転写制御メカニズムの理 傍に位置します。ヒルベルト曲線内で赤く表示された部分 解に大きく貢献しています。 が染色体上でメチル化している領域に対応しています。 ■ Genomics Suiteで実現できるデータ解析 Genomics Suite は、MeDIP-seq のデータ解析を行うた めにワークフローを提供しています。MeDIP-seq 用のワー クフローでは次のような解析を行うことができます。 ■ ピークの検出 指定したサイズのウインドウに染色体を分割して、各ウ インドウに含まれるフラグメントの数をカウントします。カ ウントしたフラグメント数は、ゼロ打ち切り負の二項分布 図1 MeDIPサンプルとmockサンプルのヒルベルト曲線 (ZTNB)に当てはめてピークを検出します。ウインドウサイ ズはピーク検出の結果に大きく影響しますので、解析対象 のサンプルに応じて調節します。 ■ メチル化が変化した領域の検出 染 色体を指定したサイズに分割して、ウインドウごと 検出したピークに対して、マン・ホイットニィ U 検定の p に全リード数または最大深度を指標にして 2 サンプル間 値および対照サンプルに対する二項検定の p 値が算出さ の Fold Changeと二 項 検 定 の p 値 を算 出しま す。Fold れます。マン・ホイットニィ U 検定の p 値は順鎖と逆鎖の Change はサンプルごとの全リード数で補正されます。p ピークが二峰性を示すことを判定するための評価基準と 値が閾値より小さいウインドウをメチル化が変化した領 なります。対照サンプルに対する二項検定の p 値は PCR バ 域として検出します。この解析ではピークの検出とは異な イアスや抗体の非特異的結合などに起因する偽陽性を判 り、解析結果は指定したサイズのウインドウで出力されま 定するための評価基準となります。 す。そのため、あらかじめピーク検出を行ってメチル化領 域がどれくらいの大きさかを確認してからメチル化が変 ■ 遺伝子との相関 化した領域の検出を行います。 検出されたピークを RefSeq や Ensembl Transcripts な どのトランスクリプトームデータベースと比較して、各ピー クが近傍の遺伝子とどのような位置関係にあるかを確認 できます。遺伝子ごとに重複するピークの転写開始点から の距離、重複する割合、重複する領域 (プロモーター、5’UTR、CDS、3’-UTR、イントロン)を出力します。 ピークと重複する遺伝子のリストは、GO Enrichment 解 析やパスウェイ解析などを行うことができます。また、同じ サンプルで RNA-seq を行っている場合は、MeDIP-seq に 図2 メチル化が変化した領域の検出結果 9
© Copyright 2024 ExpyDoc