Partek Flow 3.0リリース - 菱化システム

新製品情報
次世代シーケンサーデータ解析ソフトウェア
Partek Flow 3.0リリース
2014年夏にPartek Flow(以下、Flow)の新バージョン3.0がリリースされました。Flowは次世代シーケン
サーデータ解析ソフトウェアです。次世代シーケンサーから出力されたリード配列の参照ゲノム配列への
マッピング、マッピング済み配列から遺伝子ごとの発現量の定量と遺伝子発現解析、マッピング済み配列
の 一塩基変 異や挿入 欠 失および 融合 遺伝 子の検出など様々な解 析機能を搭載しています。今回は新
バージョンでの新機能や変更点を含めたFlowの機能の概要について紹介します。
■ 製品概要
データノードを選択すると、データの種類に応じた解
FlowはWebブラウザーを介して利用する次世代シー
析メニューが自動的に表示されます。例えば、図1のよう
ケン サー デ ー タ解 析ソフトウェア で す 。ユーザー は
にFASTQファイルを選択すると、QA/QCレポートの作成、
Google ChromeなどのWebブラウザーでFlowがインス
前処理、参照ゲノム配列へのマッピングといった解析項
トールされたサーバーにアクセスして、データのアップ
目が表示されます。
ロードやダウンロード、参照ゲノム配列へのマッピングの
複数の解析ノードから構成される一連の解析内容を
設定や実行、遺伝子発現解析や変異解析、ゲノムビュー
パイプラインとして保存できます。例えば、Pre-Alignment
アーで の 解 析 結 果 の 表 示 などを行 います 。そのため 、
QA /QCレポートの作成、クオリティ値の低い塩基の除
WindowsやMacなど様々なOSのマシンでFlowを利用
去、Bowtie 2での参照ゲノム配列へのマッピング、Post-
できます。
Alignment QA/QCレポートの作成、遺伝子ごとの発現
FlowはLinuxマシンにのみインストールできます。新
量の定量、遺伝子ごとの発現解析の6つの解析ノードをパ
バージョンからLinuxのパッケージインストールに対応し
イプラインとして保存すると、FASTQファイルのデータ
たため、ソフトウェアのインストールやアップデートが簡
ノードに 対してこのパイプラインを 選 択 するだ けで
単にできるようになりました。また、クラスター環境に対
RNA-seqデータ解析が実行できます。新バージョンでは
応したため、複数のLinuxマシンにFlowをインストールし
パイプラインのインポートおよびエクスポートが可能にな
て解析作業を割り振ることで解析時間の短縮が図れま
りました。Partek社のWebサイト1)では様々なパイプライ
す。クラウドサービスと組み合わせることで、データ量に
ンが公開されているため、目的に応じて活用できます。
応じて解析能力を柔軟に調節できます。
ライフテクノロジーズジャパン株式会社のIon Torrent
■プロジェクトとタスク
次世代シーケンサーをご利用の場合は、Torrent Suiteの
Flowではデータや解析内容をプロジェクト単位で管
専 用プラグイン をインストールすることで To r r e n t
理します。プロジェクトを作成したユーザーは共同研究
ServerからFlowに直接データをアップロードできます。
者を登録することで、他のユーザーがそのプロジェクト
■ ワークフローとパイプライン
のデータを閲覧したり解析を実行したりすることを許可
できます。
Flowは解析内容を図1のようなワークフローとして表
ユーザーがワークフローに追加した解析ノードは、プ
示します。円形のデータノードはFASTQファイルやBAM
ロジェクトごとのタスクキューにタスクとして登録されま
ファイルなどのデータを、長方形の解析ノードは参照ゲノ
す。Flowでは全てのプロジェクトのタスクキューに登録さ
ム配列へのマッピング、QA/QCレポートの作成、遺伝子
れたタスクを登録順に実行します。ユーザーはFlowにロ
ごとの発現量の定量、SNVの検出などの解析を表します。
グインすると図2のホーム画面やタスクキューで、プロ
ワークフロー機能により解析内容全体を一目で把握で
ジェクトや現在のタスクの状況、実行が完了したタスク
きます。
などを一覧できます。新バージョンでは管理者がタスク
を実行する優先順位をプロジェクトごとに設定できるよ
うになりました。
図2 左:ホーム画面、右:タスクキュー
図1 ワークフロー
4
次 世 代シーケンサーデータ解 析ソフトウェア
■ FASTQファイルの解析
マッピングに変換、複数のBAMファイルの結合が実行で
FASTQファイルを選択すると、QA/QCレポートの作成、
きます。BAMファイルは、指定したマッピングクオリティ
前処理、参照ゲノム配列へのマッピングの3種類の解析
値やミスマッチ塩基数でリード配列をフィルタリングで
メニューが選択できます。QA/QCレポートの結果を確認
きます。
して、必要に応じて前処理を行うとマッピング結果の改
■ 遺伝子ごとの発現量の定量
善に寄与します。
BAMファイルからRefSeqやEnsemblといったトランス
■ QA/QCレポートの作成
クリプトームデータベースを使って遺伝子や転写産物ご
FastQCプログラムによるQA/QCレポート、外部RNA
との発現量をカウントします。Flowでは、Partekの期待
コントロールによるQA/QCレポート(ERCCレポート)を
値最大化(E/M)アルゴリズムあるいはオープンソースの
作成できます。QA/QCレポートの結果に応じて、クオリ
RNA-seqデータ解析ツールであるCufflinksの2つのツー
ティ値の低い塩基を除去するとマッピング結果が改善
ルを使って発現量をカウントできます。
します。
遺伝子や転写産物ごとの発現量をカウントした後、サ
■ 前処理
ンプルに設定した実験条件に沿って発現解析を行いま
塩基の除去、アダプター配列の除去、リード配列の部
す 。遺伝 子 発 現 解 析 の詳 細については 、昨 年 の記 事
分抽出を実行できます。塩基は、5’末端あるいは3’末端
(2014年1月号7ページ)をご覧下さい。新バージョンでは、
から指定した長さ、または指定したクオリティ値より低
遺伝子発現解析を行う際の標準化の手法が改善され、
い塩基を除去できます。
発現量が低い遺伝子や転写産物をフィルタリングする
■ 参照ゲノム配列へのマッピング
最小カバレッジオプションが追加されました。また、解
次世代シーケンサーに付属するシステムソフトウェア
析結果のレポートの書式も改善されています。
を使って、FASTQファイルを参照ゲノム配列にマッピン
■ 変異解析
グすることもできますが、リード配列の長さや解析の目
BAMファイルを選択して一塩基変異や挿入欠失あるい
的に応じて様々なオープンソースのマッピングツールが
は融合遺伝子を検出します。一塩基変異の場合、Flowで
開発されています。
Flowでは、
Bowtie、
TopHat、
Bowtie 2、
はPar tekのSNV Callerあるいはオープンソースの解析
TopHat 2、BWA、TMAP、SHRiMP 2、GSNAP、STARの9つ
ツールであるSamtoolsの2つのツールを使って検出でき
のマッピングツールを利用できます。
ます。挿入欠失は、Samtoolsを使って検出できます。融
オープンソースのマッピングツールを単体で利用する
合遺伝子の場合、Partekの融合遺伝子検出アルゴリズム
場合、様々なパラメーターを設定したコマンドを入力す
あ るい は オープ ンソースのマッピ ング ツールであ る
る必要があります。しかし、FlowではパラメーターをWeb
TopHatまたはSTARの3つのツールを使って検出できます。
ブラウザー内のプルダウンメニューやチェックボックスな
検出した一塩基変異は、トランスクリプトームデータ
どで設 定できるため非常に簡便です。また、ワークフ
ベースを使って図3のようにミスセンス変異やナンセンス
ローのレイヤー機能により同じマッピングツールをパラ
変異などのアノテーション情報を付加できます。
メーターだけ変更して複数回実行できるため、パラメー
ターの調節にかかる時間を短縮できます。新バージョン
で は 、一 部 のパラメーターの 初 期 値 が 変 更されたり 、
STARのsparsityパラメーターが追加されたりしています。
■ BAMファイルの解析
BAMファイルを選択すると、QA /QCレポートの作成、
前処理、遺伝子ごとの発現量の定量、変異解析の4種類
の解析メニューが選択できます。
■ QA/QCレポートの作成
FastQCプログラムによるQA/QCレポート、カバレッジ
図3 一塩基変異のアノテーション
■ご評価
Flowは無償トライアルにより4週間ご評価いただけま
レポートを作成できます。QA/QCレポートの結果を確認
す。Partek Genomics Suiteをご利用のお客様だけでな
して、必要に応じてマッピングツールやパラメーターを変
く、Partek社製品は初めての方もぜひお試し下さい。ト
更して再び参照ゲノム配列へのマッピングを実行します。
ライアルをご希望の方は弊社Webサイトよりお問い合わ
■ 前処理
せ下さい。
BAMファイルのフィルタリング、トランスクリプトーム
にマッピングしたBAMファイルを参照ゲノム配列への
1)http://www.partek.com/pipelines
5