カスタムSeqCap デザイン結果確認ガイド_(日本語版)

Guide to Reviewing and Approving Custom
Designs
Roche NimbleGen SeqCap Custom Designs
SeqCap 製品のChoiceあるいはDeveloper Library (Enrichment Kit) は、お客様の要望に従ってプローブデザインし製造
するカスタム製品です。Roche NimbleGenデザイン担当者またはNimbleDesignソフトウェアから提案されたカスタムデザイン
結果を確認し承認いただくプロセスが、全ての新規のご注文で必要です。ご承認いただくまでプローブの製造は開始されま
せん。
このドキュメントではカスタムデザイン結果を確認・承認する方法について記載しています。ターゲットとして指定した領域が
適切にプローブでカバーされ、実験の目的に合うデザインであるかをご確認ください。ご提案結果が適切ではない場合には、
デザインの修正と確認のプロセスを繰り返します。
1.
1.1.
①
デザインの流れについて
デザインの流れと用語
お客様の指定された「ターゲット領域」は「インプット領域」として編集され、primary_target.bed が作成されます。
互いに重なり合う領域をターゲットとして指定した場合は、その重なり合いを無視します(コンソリデーション)。
SeqCap EZ と SeqCap Epi の場合、100bp以下のサイズのターゲットに対しては、キャプチャー効率を上げる
ために、その前後配列を含めた100bpに対してプローブの設計を行います(パディング)。 SeqCap RNAの場合
には、50bpが最少の長さとなるようパディングを行います。必要であればもう一度コンソリデーションを実施しま
す。
条件によっては「ターゲット領域」と「インプット領域」は同一である場合があります。一方、最終的に全くプローブ
が設計できなかったフラグメントが除外されるため、インプット領域とprimary_target.bedは一致しない場合があ
ります。
Guide to Reviewing and Approving Custom Designs: Roche NimbleGen SeqCap EZ Designs v3.0
(J) 2015.02
②
リファレンスシークエンスからプローブが設計され、そのうち「インプット領域」をカバーするプローブが選択されます。「プロ
ーブカバー領域(capture_targets.bed)」が作成されます。
効率的なキャプチャーのためにプローブはお互いに重なり合うように設計していますが、少なくとも1つのプローブで
カバーされる領域をプローブカバー領域と定義します。
実験の目的により、「プローブのユニーク性」と、「プローブカバレージ」 のバランスを考慮する必要があります。こ
のバランスは、以下のように大別され、それぞれ異なる特徴を持ちます。
■ プローブのユニーク性を重視したデザイン: 特異的なプローブのみを使用しています。プローブカバレージは
低くなる可能性がありますが、特異的なハイブリダイゼーションが期待できます。unique_designとして提案さ
れる場合があります。
■ プローブカバレージを重視したデザイン: プローブのユニーク性スレッシュホールドを下げたデザインです。プロ
ーブカバレージが上がり、シークエンス目的領域全体に渡り取りこぼしなくデータを得ることができると期待できま
す。一方でデータ解析の際にはマッピングパラメーターの最適化が必要となるかもしれません。relaxed_design
として提案される場合があります。
ターゲット領域以外の配列をキャプチャーする可能性を下げるために、低複雑性領域や高リピート領域のプロー
ブの設計を避けるアルゴリズムを採用しています。
③
「プローブカバー領域」から「シークエンシング予測領域」が作成されます。
シークエンスキャプチャーでは、プローブとハイブリダイゼーションするゲノム断片の位置関係により、プローブカバー
領域の外側もシークエンスされると予測されます。プローブカバー領域の外側が両端100bpずつシークエンスされ
ると仮定してシークエンシング予測領域が算出されます。この仮定(両端100bpずつ)は、典型的なライブラリ長
(約200bp)をIllumina社のペアエンドシークエンシングをする際には有効ですが、ライブラリ長が異なる場合やシ
ングルエンドシークエンシングを実施する場合には妥当ではない可能性があります。
Guide to Reviewing and Approving Custom Designs: Roche NimbleGen SeqCap EZ Designs v3.0
(J) 2015.02
2.
2.1.
①
デザイン結果概要の確認
デザイン全体の数値的な確認
coverage_summary ファイル (TXT) を Microsoft Excel などで開き、ターゲット領域のカバー率や総サイズなどを確
認します。
特にこれらの値を
確認します
■ Genome build: リファレンスシークエンス(データベース)
■ Number of regions: インプット領域数
■ Length of regions: インプット総塩基数
■ Probe_Coverage 列:
インプット領域内のプローブカバー領域
■ Estimated_Coverage 列:
インプット領域内のシークエンシング予測領域
・ Target bases covered: インプット領域内のカバーされる総塩基数 (②表の F 列または H 列の総和)
・ Percent target bases covered:
・ Targets with no coverage:
インプット領域内のカバーされる塩基の割合(%)
インプット領域内のカバーされない領域(フラグメント)数 (②表の G 列
または I 列が 0 であるフラグメントの数)
・ Target Bases Not Covered: インプット領域内のカバーされない塩基数 (②表の J 列または M 列の総和)
・ Percent Target Bases Not Covered:
- Due to N's :
インプット領域内のカバーされない塩基の割合(%)
リファレンスシークエンスのターゲット領域内の N
- Due to repeats :
などの不明瞭な塩基による
リファレンスシークエンスのターゲット領域内の低複雑性あるいは高リピート配列による
■ Total capture targets: プローブでカバーされる総フラグメント数(capture_target.bed ファイルの行数)
■ Total capture space (bp):
プローブでカバーされる総塩基数(capture_target.bed ファイルから計算した
総塩基数)。この数値はインプット領域(primary_target.bed)から大きく離れた値となる場合がありますので、
検体あたりどのくらいのシークエンシングデータが必要となるかを試算するためにはこの値を利用します。
Guide to Reviewing and Approving Custom Designs: Roche NimbleGen SeqCap EZ Designs v3.0
(J) 2015.02
②
coverage ファイル (TXT または Zipped TXT) を Microsoft Excel などで開き、ターゲット領域のフラグメントごとのカバ
ー率を確認します。
A
B
C
D
E
CHROMO
START
SOME
STOP
chr1:45794977-45795109
chr1:45796187-45796229
chr1:45796853-45797006
chr1:45797091-45797228
chr1:45797332-45797521
chr7:6042083-6042267
chr7:6043320-6043423
chr7:6043602-6043689
chr7:6045522-6045662
chr1
chr1
chr1
chr1
chr1
chr7
chr7
chr7
chr7
45795109
45796258
45797006
45797228
45797521
6042267
6043423
6043696
6045662
J
K
B ASES_
BASES_
W_NO_
W_NO_
PROBE_COV_
PROBE_COV
DUE_TO_N
0
0
0
0
0
116
33
27
64
0
0
0
0
0
0
0
0
0
G
H
I
FRAC_
BASES_
FRAC_
BASES_
ESTIMATED_ ESTIMATED_
PROB E_
LENGTH PROB E_
COVERAGE COVERAGE COVERAGE COVERAGE
REGION_NAME
45794977
45796158
45796853
45797091
45797332
6042083
6043320
6043596
6045522
F
L
M
B ASES_
W_NO_
BASES_
PROBE_COV_ W_NO_
DUE_TO_
EST_COV
REPEATS
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
132
100
153
137
189
184
103
100
140
132
100
153
137
189
68
70
73
76
N
O
B ASES_
BASES_
W_NO_
W_NO_
EST_COV_
EST_COV_
DUE_TO_
DUE_TO_N
REPEATS
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
1
1
1
1
0.37
0.68
0.73
0.543
132
100
153
137
189
184
103
100
140
1
1
1
1
1
1
1
1
1
必要であれば
フィルタリングや並べ替え
などを行います
■ A 列 REGION_NAME: ターゲット領域のフラグメント名
■ B 列 CHROMOSOME:
染色体番号(リファレンスとする配列により
コンティグ名などで表記される場合があります)
■ C 列 START:
■ D 列 STOP:
■ E 列 LENGTH:
開始位置
終了位置
そのフラグメントの長さ
■ F 列 BASES_PROBE_COVERAGE:
■ G 列 FRAC_PROBE_COVERAGE:
そのフラグメント内のプローブでカバーされる塩基数
そのフラグメント内でのプローブでカバーされる塩基の割合
■ H 列 BASES_ESTIMATE_COVERAGE:
そのフラグメント内の、シークエンスされると予測される塩基数
■ I 列 FRAC_ESTIMATED_COVERAGE:
そのフラグメント内での、シークエンスされると予測される塩基の割合
Guide to Reviewing and Approving Custom Designs: Roche NimbleGen SeqCap EZ Designs v3.0
(J) 2015.02
■ J 列 BASES_W_NO_PROBE_COV:
そのフラグメントのプローブでカバーされない塩基数
■ K 列 BASES_W_NO_PROBE_COV_DUE_TO_N: リファレンスシークエンスのターゲット領域内の
N などの不明瞭な塩基の存在によりプローブでカバーされない塩基数
■ L 列 BASES_W_NO_PROBE_COV_DUE_TO_REPEATS:
リファレンスシークエンスのターゲット領域内の
低複雑性あるいは高リピート配列によりプローブでカバーされない塩基数
■ M 列 BASES_W_NO_EST_COV:
そのフラグメントの、シークエンスされるとは予測されない塩基数
■ N 列 BASES_W_NO_EST_COV_DUE_TO_N:
リファレンスシークエンスのターゲット領域内の
N などの不明瞭な塩基の存在によりシークエンスされるとは予測されない塩基数
■ O 列 BASES_W_NO_EST_COV_DUE_TO_REPEATS:
リファレンスシークエンスのターゲット領域内の
低複雑性あるいは高リピート配列によりシークエンスされるとは予測されない塩基数
条件によりJ列からO列のデータは作成されない場合があります。
③
(オプショナル) Design Summary File (PDF) または Probe Set Report (PDF) を PDF viewer で開き、プローブ設計
条件や結果概要を確認します。
条件によりこのファイルは提供されない場合がありますが、coverage_summaryファイル (TXT)で同等の情報を
得ることができます。
Guide to Reviewing and Approving Custom Designs: Roche NimbleGen SeqCap EZ Designs v3.0
(J) 2015.02
2.2.
個々の領域についての視覚的な確認方法
2.2.1. BED ファイルについて
BED (.bed) ファイルは、UCSC ゲノムブラウザや Broad Institute の IGV (Integrative Genomics Viewer) などの様々なゲノ
ムブラウザや、Roche NimbleGen の提供する SignalMap ソフトウェアで開くことができます。これらのソフトウェアで開くことで、
ターゲット領域やプローブ設計領域を視覚的に確認することができます。このドキュメントでは、2.2.2 章で UCSC ゲノムブラウ
ザ、2.2.3 章で SignalMap ソフトウェアの使い方を概説しています。
BED ファイルはタブ区切り形式のテキストファイルであり、位置情報を BED フォーマットで(ヘッダなしの 3 列または 4 列で)保
存しています。BED フォーマットについては http://genome.ucsc.edu/FAQ/FAQformat.html#format1 をご参照ください。
■ capture_targets.bed:
プローブカバー領域。各領域は、少なくとも 1 つ以上のプローブでカバーされています。
■ primary_targets.bed:
インプット領域(お客様が指定したターゲット領域に、パディングおよびコンソリデーションの処理を施した領域)から、少
なくとも 1 つ以上のプローブが存在する領域のみに編集されています。
■ predicted_no_coverage_regions.bed (predicted_uncovered_targets.bed):
シークエンスされないと予測される領域。プローブの前後 100bp に入らない primary_targets.bed 上の塩基位置を示
しています。
条件により、1つのファイルに複数のトラック情報が保存されたファイルが提供される場合があります。また、
predicted_no_coverage_regions.bedファイルは提供されない場合があります。
2.2.2. UCSC ゲノムブラウザを利用した視覚的な確認方法
①
http://genome.ucsc.edu を開き、Genome Browser リンクをクリックします。ゲノムブラウザゲートウェイページが開き
ますので、group、genome と assembly リストボックスから、デザインをご依頼いただいた生物種とそのデータベースのバ
ージョンを選択し、add custom tracks ボタンをクリックします。
ゲートウェイページでmanage custom tracksボタンが表示されている場合には、Click here to resetをクリ
ックするとadd custom tracksボタンが表示されます。
Guide to Reviewing and Approving Custom Designs: Roche NimbleGen SeqCap EZ Designs v3.0
(J) 2015.02
②
カスタムトラックの追加設定ページで、Browse ボタンから BED ファイルを選択して Submit ボタンをクリックし、BED フ
ァイルをアップロードします。カスタムトラックの設定ページで、go to genome browser ボタンをクリックすると下記の様
な画面が表示されます。
ヘッダが残ったBEDファイルはアップロードエラーとなる場合があります。
複数のBEDファイルをアップロードする場合、トラック名「User Track」を適宜編集してください。
アノテーション情報で検索し、
特定の領域を確認します
2 つの BED ファイルを
アップロードしています
③
UCSC ゲノムブラウザの機能を利用してデザインの確認を行います。ポジティブコントロール領域や必要な領域がカバー
でされていない場合には、パラメーターを変更して再デザインを行う必要があります。
■ 特定のゲノム位置を表示:
上部テキストボックスにゲノム位置やキーワード等を入力してgoボタンをクリックします。
■ その他のアノテーション情報の表示・非表示:
ページ下部に表示されるそれぞれのアノテーション情報のリストボックスでそれぞれの項目の表示・非表示を選択して、
refreshボタンをクリックします。
■ 拡大縮小:
zoom in とzoom out ボタンで1.5-, 3-, 10-倍に拡大・縮小表示できます。
■ 表示位置の移動:
move ボタンをクリックして左右に画面をスクロールします。
Guide to Reviewing and Approving Custom Designs: Roche NimbleGen SeqCap EZ Designs v3.0
(J) 2015.02
primary_targetトラックでは一続きのボックスとして表示されるにも関わらずcapture_targetトラックでは間が空い
て見える領域(ギャップ)および、predicted_no_coverage_regionsにボックスとして表示される領域に注目してく
ださい。
2.2.3. SignalMap ソフトウェアを利用した視覚的な確認方法
①
SignalMap ソフトウェアを起動し、File -> New からいずれかの BED ファイルを開きます。複数の BED ファイルを一つ
の画面で表示したい場合には File -> Import から残りの BED ファイルを開きます。
SignalMapソフトウェアは http://www.nimblegen.com/signalmap から無料でダウンロードできます。
このような領域が、どこに
どのように存在するかを
確認します
Guide to Reviewing and Approving Custom Designs: Roche NimbleGen SeqCap EZ Designs v3.0
(J) 2015.02
②
ソフトウェアの下記のような機能を使用してデザインを確認します。primary_target トラックでは一続きのボックスとして
表示されるにも関わらず capture_target トラックでは間が空いて見える領域(ギャップ)および、
predicted_no_coverage_regions にボックスとして表示される領域に注目してください。ポジティブコントロール領域や
必要な領域がカバーでされていない場合には、パラメーターを変更して再デザインを行う必要があります。ソフトウェアの
使用方法の詳細は SignalMap User’s Guide をご参照ください。
■ 染色体(領域・区画)表示の切り替え:
SignalMapの横軸(x軸)は染色体(領域・区画)単位での位置情報を表示しています。
ツールバーのpane selector fieldから特定の染色体(領域)表示に切り替えてください。
■ ズームイン、ズームアウト:
ツールバーの虫眼鏡ボタンをクリックしてズ
ームモードにし、ウインドウ内の任意の位
クリック
置でクリックするか、拡大したいゲノム領
域をドラッグ選択します。ズームアウトする
には、ズームモード時にCtrlキーを押して
コントロールキー
+
クリック
任意の位置をクリックしてください(ポイン
タの虫眼鏡が+表示
から - 表示
に切り替わります)。
■ 特定のゲノム位置の表示:
View -> Go to position を選択して、染色体番号、開始位置、終了位置を
入力してください。
アノテーションファイル (BED形式またはGFF形式) を開いておくと、Edit ->
Searchで、アクセッション番号などの任意のキーワードで遺伝子等を検索
することができます。
■ トラック表示位置アレンジ:
移動させたいトラックを選択し、ドラッグしたままカーソ
ルを移動させたい位置に移動させます。カーソル表示
が灰色の点線表示になった位置でドラッグを解消す
移動したい位置までド
ラッグする(点線が表
示されます)
るとトラックが移動します。
■ カーソルの固定:
フラグメント単位で表示を切り替えたい場合にはこの機能を利用すると便利です。基本となるトラックを選択し、右クリ
ックからCursor -> Attach Cursorを設定します。ゲノム上の次の領域へはキーボードの矢印キー[ ← → ]を押す
ことで移動できます。設定を解消するには、Cursor -> Detach Cursorを設定します。
Guide to Reviewing and Approving Custom Designs: Roche NimbleGen SeqCap EZ Designs v3.0
(J) 2015.02
3.
①
デザイン結果の承認
「自分の狙った領域がどのくらいプローブでカバーされているか」や「絶対に読みたいという(ポジコンなどの)一部の特定
の領域がある場合、その領域がきちんとプローブでカバーされているか」などをチェックした結果、満足の得られるデザイ
ンではなかった場合には、下記のように対応してください。

NimbleDesign を利用の場合: パラメーターを再設定してもう一度デザインを作成してください。

NimbleGen デザイン担当者によるデザインの場合: その旨を [email protected] までご連絡くださ
い。
ご承認いただけるまで、デザインの修正と確認のプロセスを繰り返します。
パラメーターを変更してもデザイン結果に差が出ない場合がございます。
ご要望内容によってはNimbleDesignでは対応できない場合がございますので、NimbleGenデザイン担当者に
よるデザインに変更してください。
通常のRoche NimbleGenのデザインでは、ゲノム中に2∼5回出現するような低コピーリピート領域に対しても
プローブは設計されません。そのような領域もキャプチャー&シークエンスする必要がある場合には、その旨をお
知らせいただくと、厳密性を下げた基準で再設計を行います。しかし、そのような場合には、プローブのカバー率
は上がりますが、ターゲット以外のリードが多数出現してしまうためキャプチャー効率は低下すると予想されます。
②
提案されたデザインで問題が無い(提案された複数のデザインから1つのデザインを選択する)場合には、下記のように
対応してください。

NimbleDesign を利用の場合: デザインを Approve し、Transmit をクリックしてください。同時に、代理店様へ
ご注文ください。

NimbleGen デザイン担当者によるデザインの場合: その旨を [email protected] までご連絡くださ
い。
この最終のご連絡が無い場合には、実際のプローブ製造プロセスには進めませんのでご注意ください。
R ロシュ・ダイアグノスティックス株式会社
〒105-0014 東京都港区芝 2-6-1
TEL: 03-5443-5287
Guide to Reviewing and Approving Custom Designs: Roche NimbleGen SeqCap EZ Designs v3.0
(J) 2015.02