未知 RNAウイルスを培養なしで検出および同定

Application Note: Sequencing
未知 RNA ウイルスを培養なしで検出および同定
MiSeq® システムおよび TruSeq® テクノロジーを使用した、臨床サンプルからの RNA ウイルスの同定
はじめに
大量並列シーケンスおよびインフォマティクスの進歩により、病
原性微生物の検出および同定を行うアッセイの検出感度の見直し
が必要となってきています。従来の RT-PCR、キャピラリー電気
泳動法によるシーケンスおよびアレイハイブリダイゼーション法に
はいくつかの制約があります。例えば、多検体処理に限界があり、
DNA 配列情報が予備知識として必要であり、さらなる変異検出
およびハイブリダイゼーションの迅速化に対応するために常に改
良を加えていくことが必要とされます。またこれらの方法は、
十分な量の出発物質を単離、培養または濃縮する必要がありま
す。このアプリケーションノートでは、臨床サンプル中に存在す
るすべての RNA ウイルスを培養なしでシーケンスするための概
要を示します。ここでは、タイにある米国陸軍医科学研究所
(AFRIMS)が開発した、インフォマティクスワークフローを含む
既知病原体を迅速に同定する方法を示します。このワークフロー
をさらに別のアルゴリズムと組み合わせることにより、サンプル
中の新規または予期せぬウイルス種の同定および特徴付けが可
能となります。この方法は、疾患の監視および迅速な臨床および
診断への応用を可能とする、新しいパワフルなツールとなります。
図 1:TruSeq RNA v2 サンプル調製ワークフロー
A.Poly A 精製、断片化およびランダムプライマーを用いた cDNA 合成
B.2 本鎖の DNA 合成
C.末端修復およびリン酸付加
方法
サンプル調製
トータル RNA は、QlAamp Viral RNA Mini Kit(QlAGEN)を
使用して、患者の鼻咽頭スワブおよび同検体から培養して得られ
た ウ イ ル ス 分 離 株 から 抽 出しました 1。 抽 出した RNA は、
TruSeq RNA v2 Sample Preparation Kit を使用してイルミナ
シーケンス用ライブラリーを調製しました(図 1)。インデックス
を付けたサンプルをプールし、MiSeq システム上で 150bp x 2
のペアエンドリードでシーケンスを行いました。
D.A テール付加
インデックス
データ解析
産 出されたデータは、2 ステップの 解 析を行 います( 図 2)。
第 1 ステップの解析では、シーケンスリードを、既知の呼吸器病
原体だけが含まれるカスタムのウイルスデータベースに対してアラ
インメントを行います。病原体の同定は、
アラインメントされたリー
ドの頻度結果から推定します。
第 2 ステップの解析では、Trinity と呼ばれるアラインメントソフト
ウェアを使用してリードの de novo アセンブリ 2 を行いその後、
生 成したコンティグを標 準 的 なローカルアラインメント検 索
ツール 3(BLASTN)により解析することで、第 1 ステップの解
析では見つけられなかったウイルスの同定が可能になります。
この 2 ステップのアプローチにより、参照データベースを用いた
既知のウイルスの迅速なスクリーニング、および参照データベー
ス内に存在しないウイルスの ex situ 同定が可能となることが示
されています。
インデックス
インデックス
E.インデックスアダプターのライゲーション
DNA インサート
インデックス
F.最終生成物取得のための変性および増幅
シーケンスライブラリーは、TruSeq RNA v2 Sample Preparation Kit を
使用して調製しました。ウイルス RNA を断片化し、逆転写後 P5 および
P7 アダプターにライゲートし、MiSeq システムでシーケンスを行いました。
Application Note: Sequencing
図 2:解析ワークフローの概要
プールされたシーケンスリー
ド
Sequence
read pool
第 1 ステップの解析
第 2 ステップの解析
1 バッチ当たり約 1 時間
1 サンプル当たり約 1 時間
リード深度
リファレンスカバレッジ
Yes
変異プロファイル
病原体参照配列への
アラインメント
No
De novo アセンブリ
Yes
病原体 ID?
参照配列に追加
No
BLASTN 検索
Yes
ヒット
無
ヒット
新規ウイルス?
新規参照配列
ウイルスの迅速な診断
MiSeq Reporter の Resequencing 検索ワークフローを使用した、第 1 ステップの解析が左側に示してあります。リードの de novo アセンブリおよび BLASTN
検索を含む第 2 ステップの解析は右側に示してあります。
図 3:臨床サンプルおよび培養分離株のカバレッジプロファイル
A
B
リファレンスカバレッジプロット(緑色)およびミスマッチ配列(赤色)は、MiSeq Reporter の Resequencing ワークフローを使用して作成しました。
“臨床サン
プル”
(A)は一次検体から直接精製された RNA を示し、
“培養分離株”
(B)は同一検体を in vitro 培養して単離したウイルスを示します。いずれのサンプルか
らも同様のマッピング結果が得られていることから、検体中から H3N2 ウイルスが同定された強いエビデンスが提供されます。
Application Note: Sequencing
表 1:De Novo アセンブリしたコンティグに関する BLASTN 検索結果
検体 1(臨床サンプル)
BLASTN ヒット
同定率(%)
カバレッジ(%)
92
100
インフルエンザ A ウイルス(H3N2)、PB1 遺伝子
100
99
5,974
インフルエンザ A ウイルス(H3N2)、PB2 遺伝子
100
99
2,237
5,710
インフルエンザ A ウイルス(H3N2)、PA 遺伝子
100
99
5
1,770
4,552
インフルエンザ A ウイルス(H3N2)、HA 遺伝子
99
99
6
1,549
3,819
インフルエンザ A ウイルス(H3N2)、NP 遺伝子
100
99
7
1,484
3,735
インフルエンザ A ウイルス(H3N2)、NA 遺伝子
100
99
8
1,011
2,449
インフルエンザ A ウイルス(H3N2)、M 遺伝子
100
98
100
98
100
92
同定率(%)
カバレッジ(%)
100
100
コンティグ
コンティグ長(塩基対)
リード深度
1
1,610
8,764
16S リボソーム RNA 遺伝子、部分配列
2
2,328
5,915
3
2,323
4
9
873
2,134
10
5,386
739
コンティグ長(塩基対)
リード深度
インフルエンザ A ウイルス(H3N2)、
NEP 遺伝子および NS1 遺伝子
ヘリコバクターピロリ全ゲノム配列
検体 1(培養分離株)
コンティグ
1
869
5,622
BLASTN ヒット
インフルエンザ A ウイルス(H3N2)、
NEP 遺伝子および NS1 遺伝子
60S リボソームタンパク質、L23a 様、mRNA
2
681
8
97
100
3
2,323
15,952
インフルエンザ A ウイルス(H3N2)、PB2 遺伝子
100
99
4
2,404
14,361
インフルエンザ A ウイルス(H3N2)、PB1 遺伝子
100
99
5
2,218
14,651
インフルエンザ A ウイルス(H3N2)、PA 遺伝子
100
99
6
1,775
11,926
インフルエンザ A ウイルス(H3N2)、HA 遺伝子
100
99
7
1,545
12,986
インフルエンザ A ウイルス(H3N2)、NP 遺伝子
100
99
8
1,006
7,711
インフルエンザ A ウイルス(H3N2)、M 遺伝子
100
98
9
1,505
7,672
インフルエンザ A ウイルス(H3N2)、NA 遺伝子
100
97
10
994
106
92
97
サテライト DNA、クローン D254YB6
De novo アセンブリしたコンティグを、公共の参照データベースに対して検索しました。 BLASTN 検索結果は、リファレンスゲノムに対するカバレッジの割合が
高い順に並べました。ここには、参照ゲノムと比較してカバレッジの割合が高い上位 10 例の結果が示してあります。これらの結果の中で、同定されたインフルエン
ザウイルスを強調表示してあります。
結果
RNA ウイルスを直接同定することが可能となることが示されます。
MiSeq システムでサンプルのシーケンスが行われ、それぞれ約
100 万リードが産出されました。臨床サンプルおよび同一検体由
来の培養分離株サンプルのいずれにおいても、MiSeq Reporter
臨床サンプルおよび培養分離株中に存在する、新規または予想
外のウイルスの特徴付けを行うために、第 2 ステップの解析には
リードの de novo アセンブリが含まれています。第 1 ステップの
解析に使用されるカスタム化されたウイルスリファレンスは、既
知の呼吸器病原体に限られたデータベースであるため、データ
ベース内に存在しないウイルスを同定するために、アセンブルさ
れたコンティグを BLASTN で検索を行いました。検索結果から
ウイルス配列にヒットしたものだけを抽出しました。
ソフトウェアを使用することにより、第1ステップの解析からのイン
フルエンザ A ウイルス H3N2 サブタイプの同定に成功しました。
図 3A には、臨床サンプルに関して、それぞれ最低 300x の平均
カバレッジを有する 8 つの H3N2 ウイルスセグメントにおけるカ
バレッジプロファイルが示されています。マッピングカバレッジが
高いことから、臨床検体からウイルスを同定するのに十分な判断
材料が提供されています。
ペアとなっている培養分離株に関しても同様の解析を行いまし
た。解析時間は、MiSeq Reporter の Resequencing ワークフ
ローを使用して約 1 時間です。この解析では、各リファレンスセ
グメントに対して 900x の 平 均カバレッジが得られました( 図
3B)。臨床サンプルおよび培養分離株のいずれにおいても同様
のアラインメント結果が得られたことから、H3N2 の同定に強い
エビデンスが提供されました。
この情報およびインフルエンザ H3N2 ウイルスのすべてのセグ
メントに関して得られたカバレッジプロットから、MiSeq システム
により、ウイルス培養を行わなくても、臨床検体中に存在する
これらのコンティグに対する BLASTN 結果から、公共データベー
ス中に非常に類似している配列が存在することが明らかとなりま
した。表 1 に示すように、de novo アセンブリにより、臨床検体
および培養分離株のいずれにおいても、H3N2 ウイルスはすべ
てのセグメントのコンティグが生成されました。生成されたすべ
てのウイルスコンティグは、高い一致率とカバレッジで、H3N2
ウイルスのリファレンスセグメントと一致しました。リードをコン
ティグに対して再度アセンブリを行い、アセンブルされたウイルス
セグメントそれぞれに関して、カバレッジ品質およびリード深度を
評価しました。
Application Note: Sequencing
アセンブルされたウイルスコンティグはすべてリード深度が高いこ
とから(表 1)、アセンブリの精度と信頼性が高いことが示されま
す。ウイルスリファレンスとの高いリード深度とカバレッジは、
MiSeq Reporter ソフトウェアを使用して第 1 ステップの解析で
生成されたアラインメントカバレッジプロットの結果と一致してい
ます。さらに、de novo アセンブルされたコンティグの BLASTN
検索からは、追加の既知呼吸器病原体は報告されませんでした
(表 1)。この結果から、臨床サンプルおよびペアの培養分離株
のいずれにおいても H3N2 ウイルスを同定するのに高い特異性
と精度が示されました。
この 2 ステップのインフォマティクスアプローチは、臨床サンプ
ル中に存在するウイルスを検出して、妥当な識別要素の特徴付
けが実現可能であることを示すものです。 De novo アセンブリお
よびローカル BLASTN 解析は、16 コアの 2.93 GHz CPU の
Intel Xeon CPU X7350 および Red Hat4.1.2-52 オペレーティン
グシステムを使用して 1 時間で完了します。
参考文献
1. Rutvisuttinunt W, Chinnawirotpisan P, Simasathien S, Shrestha SK,
Yoon IK, et al. Simultaneous and complete genome sequencing of
influenza A and B with high coverage by Illumina MiSeq platform. J
Virol Meth (2013) 193:394–404.
2. Grabherr MG, Haas BJ, Yassour M, Levin JZ, Thompson DA, et al.
(2011) Full-length transcriptome assembly from RNA-Seq data
without a reference genome. Nat Biotechnol 29: 644–652
3. Basic Local Alignment Search Tool, blast.ncbi.nlm.nih.gov
4. Nextera XT DNA Sample Preparation Kit,
www.illumina.com/products/nextera_xt_dna_sample_prep_kit.ilmn
図 4:Nextera XT Sample Preparation Kit を
使用したワークフローの概要
トータル DNA また RNA の抽出
結論
RNA および一本鎖 DNA の二本鎖
DNA への変換
この方法は、実績のある TruSeq サンプル調製法と MiSeq シス
テムの高い出力を組み合わせることにより、既知および未知の
RNA ウイルスを臨床サンプルから直接同定することを可能としま
す。この方法はさらに、MiSeq Reporter ソフトウェアを使用した、
簡単で効率的なインフォマティクスワークフローにより、同一サン
プルからの複数の未知ウイルスを迅速に同定かつ特徴付けするた
めのダウンストリームパイプラインを提供します。さらに、イルミ
ナの Nextera® XT Sample Preparation Kit を使用することによ
り、ワークフローをさらに改良することも可能です 4。このキット
を使用することにより、ワークフロー全体(サンプルから解析デー
タまで)を約 36 時間で完了することが可能です(図 4)。
詳細
デスクトップシーケンスの革新に関する詳細は、
www.illumina.com/miseq をご参照ください。
Nextera XT ライブラリーの調製
ライブラリーのノーマライズ
およびプーリング
MiSeq システム上での自動クラスター生成
およびシーケンスの実行
このアプリケーションノートに記載された方法で
データ解析を実行
Nextera XT Sample Preparation キットを使用することにより、シー
ケンス用のライブラリー調製に必要とされるハンズオン時間および労
力が大幅に低減します。このワークフローと自動解析とを組み合わせ
ることにより、サンプルの迅速なターンアラウンドが可能となります。
イルミナ株式会社
代理店
〒108 - 0014
東京都港区芝 5 - 36 -7 三田ベルジュビル 22 階
Tel ( 03 ) 4578 -2800 Fax ( 03 ) 4578 -2810
www.illuminakk.co.jp
本製品の使用目的は研究に限定されます。
© 2014 Illumina, Inc. All rights reserved.
Illumina, IlluminaDx, BaseSpace, BeadArray, BeadXpress, cBot, CSPro, DASL, DesignStudio, Eco, GAIIx, Genetic Energy, Genome Analyzer,
GenomeStudio, GoldenGate, HiScan, HiSeq, Infinium, iSelect, MiSeq, Nextera, NuPCR, SeqMonitor, Solexa, TruSeq, TruSight, VeraCode,
the pumpkin orange color, and the Genetic Energy streaming bases design は Illumina, Inc の商標または登録商標です。
その他の会社名や商品名は、各社の商標または登録商標です。予告なしに仕様を変更する場合があります。
Pub. No. 1270-2013-J007 08OCT2014