2トランスクリプトミクス

2
トランスクリプトミクス
トランスクリプトームシーケンス解析
TruSeq(微量)トランスクリプトームシーケンス解析
RNA-Seq (Quantification) 解析
Small RNA 解析
FFPE RNA-Seq トランスクリプトーム解析
MicroRNA および mRNA の統合解析
Long Non-Coding RNA シーケンス解析
トランスクリプトームシーケンス解析
製品概要
トランスクリプトームは次世代ハイスループットシーケンシングで、特定の状況下において、ある生物種の特定組
織や器官のすべての転写配列情報を網羅的かつ迅速に得ることができます。既に基礎研究・臨床診断・創薬などの
トランスクリプトミクス
Ⅱ
分野で利用されています。
技術特長
•
•
•
•
生物種制限なしの全トランスクリプトームの解析:特異的なプローブの事前のデザインが不要。生物種の遺伝子
やゲノム情報なしで生物種を直接かつ網羅的に解析可能
高カバー率:デジタル信号・生体内の全転写物のほぼ全てを直接解析可能
高解像度:遺伝子ファミリーの中で似ている遺伝子や、選択的スプライシングが起きる SNP を検出可能
広検出範囲:コピーしたリードを数個から数十万個まで精確に計算可能
ワークフロー
真核生物
Oligo (dT) を利用して
原核生物
トータル RNA
mRNA を単離
ライブラリー作製
シーケンシング
生データ
品質管理
• Contig の長さの分布
• Unigene の長さの分布
クリーンデータ
可視化
Unigene アセンブリー
Differentially expressed genes
生物学解析
(DEGs) スクリーニング
Unigene 機能アノテーション
• Gene Ontology (GO) アノテーション
• GO/KEGG/COG アノテーション
• Pathway enrichment 解析
• CDS 予測
De novo トランスクリプトームシーケンス解析
- 24 -
rRNA の除去
Oligo (dT) を利用して
真核生物
トータル RNA
原核生物
rRNA の除去
mRNA を単離
ライブラリー作製
シーケンシング
Ⅱ
トランスクリプトミクス
生データ
品質管理
• アライメント統計
• ランダム性評価
クリーンデータ
• リード分布
可視化
リファレンスによるアライメント
• Alternative Splicing (AS) 同定
• SNP 解析
• 遺伝子構造の改良
アノテーション
• 新たな転写物の予測
• 遺伝子発現解析
・新規スプライス部位の検出
DEGs スクリーニング
生物学解析
• GO アノテーション
• Pathway enrichment 解析
リファレンスゲノムが存在するトランスクリプトームシーケンス解析
ライブラリーの種類
標準ライブラリー・DSN 均一化ライブラリー・Strand-specific ライブラリー
データ解析
(1)De novo トランスクリプトームシーケンス解析
標準データ解析
•
•
•
•
•
•
生データからアダプター配列・コンタミネーション・
低品質リードを除去
統計解析・データ評価・アセンブリー結果の解析
Unigene 機能アノテーション
Clusters of Orthologous Groups of proteins (COG) 分
•
•
•
Unigene 発現差異解析
差次的発現 unigene の GO 分類・pathway エンリッ
チメント解析
SNP 解析・SSR マーカーの開発・プライマーの設計
カスタマイズ
•
お客様のご要望に合わせ、データ解析をカスタマイ
ズします。
類・GO 分類
Unigene の代謝経路解析
タンパク質翻訳領域 (CDS) の予測
- 25 -
•
•
•
(2)リファレンスゲノム配列が存在するトランス
クリプトーム
標準データ解析
•
•
新たな転写産物の予測
SNP 解析
カスタマイズ
•
低品質リードを除去
シーケンシングの評価
お客様のご要望に合わせ、データ解析をカスタマイ
ズします。
遺伝子の発現解析・アノテーション
遺伝子発現差異解析
DEG の発現パターン解析・GO 解析・pathway エンリッ
チメント解析
遺伝子構造の最適化(真核生物のみ)
技術パラメーター
1. サンプル要件
DNase 処理後の RNA(タンパク質の混入なし)
サンプル
植物と真菌
サンプル量
動物
≧ 20μg
≧ 250ng/µL
サンプル濃度
サンプル純度
28S:18S ≧ 1.0、RIN ≧ 6.5
原核生物
ヒト、ラット、マウス
その他
≧ 5μg
≧ 10μg
≧ 65ng/µL
≧ 150ng/µL
28S:18S ≧ 1.0、RIN ≧ 7.0
≧ 5μg
≧ 65ng/µL
23S:16S ≧ 1.0, RIN ≧ 6.0
OD260/280 ≧ 1.8, OD260/230 ≧ 1.8
※ライブラリー作製が困難と判断される場合がありますので、予備のサンプルの同梱を推奨しています。
2. シーケンス解析:91PE
3. 推奨ライブラリーサイズ:200bp
納品物
1. シーケンシング結果 (clean data) は FASTQ ファイルで納品
2. 納品データ例
● De novo トランスクリプトームシーケンス解析
100
995
278
219
197
1000
180
149
18211
10000
11230
7068
4997
3965
3130
2707
2231
1976
1716
1576
1396
1199
1012
889
809
721
653
505
485
454
378
312
100000
10
1
200
300
400
500
600
700
800
900
1000
1100
1200
1300
1400
1500
1600
1700
1800
1900
2000
2100
2200
2300
2400
2500
2600
2700
2800
2900
3000
>3000
Number of All-Unigene
トランスクリプトミクス
Ⅱ
•
•
•
•
生データからアダプター配列・コンタミネーション・
選択的スプライシングの同定(真核生物のみ)
Sequence size(nt)
図1
- 26 -
すべての Unigene の長さの分布
図2
COG 分類
●リファレンスゲノム配列が存在するトランスクリプトームシーケンス解析
表1
アライメントの統計
Map to Genome
Stat. of Map to Gene
Reads number Percentage (%)
Reads number Percentage (%)
100.00
Total Reads
5723472
100.00
4565112480
100.00
Total BasePairs
4565112480
100.00
Total Mapped Reads
34741646
68.49
Total Mapped Reads
28039137
55.28
Perfect match
13039750
25.71
Perfect match
11432658
22.54
≦ 5bp mismatch
21701896
42.78
≦ 5bp mismatch
16606479
32.74
Unique match
32662568
64.39
Unique match
23144279
45.63
Multi-position match
2079078
4.10
Multi-position match
4894858
9.65
Total Unmapped Reads
15981826
31.51
Total Unmapped Reads
22684335
44.72
Total BasePairs
~62%
~2%
~4%
~4%
~8%
~5% ~4%
図3
~4%
~4%
~4%
90%-100% (18743)
80%-90% (2510)
70%-80% (1519)
60%-70% (1284)
50%-60% (1125)
40%-50% (1148)
30%-40% (1134)
20%-30% (1182)
10%-20% (1171)
0%-10% (523)
20000
Ⅱ
トランスクリプトミクス
50723472
Number of Gene
Total Reads
Map to Gene
20000
10616
10000
3442
2095 2504
4864
4531
6049
0
on
Ex
遺伝子カバー率の統計
g
Sk
in
ipp
on
r
Int
図4
on
ti
ten
Re
e
Alt
ve
ti
rna
5'
6724
ng
S
i
plic
e
Alt
ve
ti
rna
3'
ng
10000
0
S
i
plic
選択的スプライシング
納期
ライブラリー作製・シーケンシング・標準データ解析:約 50 営業日
- 27 -
Number of AS Event
Stat. of Map to Genome
TruSeq(微量)トランスクリプトーム解析
製品概要
次世代シーケンサーによるトランスクリプトーム解析(RNA-Seq)は、精確な転写産物の情報を得られ、多様な研
究に応用できます。しかし、一般的なトランスクリプトーム解析では、1 つのライブラリーの作製に 5µg 以上のサン
トランスクリプトミクス
Ⅱ
プルが必要であり、ナノグラムという少量のサンプルには応用できません。
TruSeq トランスクリプトーム解析は、Illumina® TruSeqTM RNA Sample Prep Kit を用い、ヒト・マウス・ラットでは
200ng のサンプル量でライブラリーが作製できます。また、ヒトでは SMARTerTM PCR cDNA Synthesis Kit を利用し
て、30ng のサンプルでも解析できます。これにより、トランスクリプトーム解析の応用範囲が大きく広がることが
期待されています。
技術特長
•
•
•
Illumina® TruSeqTM RNA Sample Prep Kit を用いた、高品質なシーケンス解析データ
少量のサンプルでライブラリーの作製が可能
ビーズ精製および試薬のミックスを使用し、短時間でライブラリー作製が可能
表 1 一般的な RNA-Seq 解析および TruSeq 解析の比較
サービス名 項目
ライブラリー作製:予備を含めた
トータル RNA の量
精製方法
一般的な RNA-Seq 解析
TruSeq 解析
ヒト・マウス・ラット≧ 5µg
植物と真菌≧ 20µg
その他≧ 10µg
ヒト・マウス・ラット≧ 200ng
(ヒト≧ 30ng でも解析可能)
その他≧ 1µg
カラム精製
ビーズ精製
ゲル抽出の有無
あり
なし
適応範囲
De novo / リシーケンシング
トランスクリプトーム
De novo / リシーケンシング
トランスクリプトーム
ワークフロー
品質検査
TruSeq ライブラリー作製(Illumina® TruSeqTM RNA Sample Prep Kit)
シーケンシング
データ解析
- 28 -
技術パラメーター
1. サンプル要件
サンプル
サンプル量
タンパク質を除去・DNase を処理したトータル RNA
ヒト・マウス・ラット
ヒト
その他
≧ 200ng
≧ 30ng でも解析可能
≧ 1µg
5ng/µL
サンプル濃度
RNA の純度
≧ 20ng/µL
動物(昆虫以外)
植物・真菌
昆虫
RIN ≧ 7.0、28S/18S ≧ 1.0
RIN ≧ 6.5、28S/18S ≧ 1.0
RIN および 28S/18S の要求なし
トランスクリプトミクス
※ライブラリー作製が困難と判断される場合がありますので、予備のサンプルの同梱を推奨しています。
2. シーケンス解析:91 PE
納期
ライブラリー作製・シーケンシング・標準データ解析:約 50 営業日
製品の応用
•
希少サンプルや微量組織サンプルに応用
(レーザーキャプチャー顕微解剖(LCM)サンプル、フローサイトメトリーサンプルなど)
• 高度なトランスクリプトームのシーケンス解析品質を求められた場合に応用
•
•
•
•
新規転写産物の検知・遺伝子構造の最適化
スプライスジャンクションの発見・Fusion Gene の解析
SSR・SNP の開発
遺伝子発現差異の解析
BGI の実績およびアドバンテージ
•
200 例以上の TruSeq 解析プロジェクト:
•
ヒト・マウス・ラット・ブタ・モグラ・ショウジョウバエ・シロイヌナズナ・ジャガイモ・真菌
De novo TruSeq トランスクリプトーム解析は total length および N50 などの重要なパラメーターで
Ⅱ
一般的な RNA-Seq 解析よりメリットがあります
- 29 -
RNA-Seq (Quantification) 解析
製品概要
次世代シーケンシング技術に基づいた RNA-Seq (Quantification) は、近年、遺伝子発現プロファイリングの新たな方
法になりました。発現レベルにおいて、数万個の転写物の測定が精確に行えます。RNA-Seq (Quantification) は高感度・
トランスクリプトミクス
Ⅱ
高精度・検出範囲が広いといった特徴を持っており、疾患研究・バイオマーカーの同定・創薬・分子育種・個人医
療などの分野に応用されています。
技術特長
•
•
•
•
•
バックグラウンドノイズのないデジタル信号
高精度・高再現性・高感度
広範囲の遺伝子発現
RNA の使用量が少ない(ヒトのサンプルの場合:100ng)
Reads per kilobase of exon model per million mapped reads (RPKM) 方法による、遺伝子発現レベルの計算
ワークフロー
Oligo (dT) を利用して
原核生物
真核生物
トータル RNA
mRNA を単離
rRNA の除去
ライブラリー作製
シーケンシング
• シーケンシングの飽和度解析
生データ
• カバー率の解析
• リードの分布解析
品質管理
実験の再現性解析
クリーンデータ
可視化
リファレンス配列とのアライメント
アノテーション
遺伝子発現量の統計 (RPKM)
DEGs スクリーニング
生物学解析
• GO 解析
• Pathway enrichment 解析
• 差異発現パターンのクラスター分析
• タンパク質間相互作用の解析
- 30 -
データ解析
納品物
1. シーケンシング結果 (clean data) は FASTQ ファイル
1. 標準データ解析
•
•
低品質リードを除去
シーケンシングの評価
2. 納品データ例
表1
遺伝子発現アノテーション
遺伝子発現差異の解析
Map to Gene
DEG の発現パターン解析
Total Reads
DEG の GO エンリッチメント解析
Total BasePairs
DEG の pathway エンリッチメント解析
GO 分類(Web Gene Ontology Annotation Plot :
WEGO 解析)
タンパク質間相互作用の解析
2. カスタマイズ
•
で納品
遺伝子アライメントの統計図
Reads number Percentage (%)
6246382
100.00
306072718
100.00
Total Mapped Reads
4957931
79.37
lperfect match
4064918
65.08
≦ 2bp mismatch
893013
14.30
Unique match
4000400
64.04
Multi-position match
957531
15.33
Total Unmapped Reads
1288451
20.63
お客様のご要望に合わせ、データ解析をカスタマイ
Coverage log2(ReadsNumber)
ズします。
1. サンプル要件
サンプル
DNase 処理後の RNA(タンパク質の混入無し)
ヒト、ラット、マウス その他
サンプル量
サンプル
濃度
トータル RNA ≧ 2µg トータル RNA ≧ 5µg
≧ 80ng/μL
≧ 200ng/μL
動物
サンプル
純度
RIN ≧ 7.0
植物と真菌
RIN ≧ 6.5
GeneNumber
2.0
技術パラメーター
0
0.3
0
27.0
0
chr7 (317642 nt/window, 500 windows)
図1
OD260/280 ≧ 1.8、OD260/230 ≧ 1.8、28S:18S > 1.0
リファレンスゲノムにおけるリードの分布
※ライブラリー作製が困難と判断される場合がありますので、
予備のサンプルの同梱を推奨しています。
2. シーケンス解析:50SE
~17%
3. 推奨ライブラリーサイズ:約 200bp
~23%
90%-100% (9978)
80%-90% (7507)
70%-80% (5775)
60%-70% (4820)
~13%
50%-60% (3857)
~2%
納期
ライブラリー作製・シーケンシング・標準データ解析:
約 30 営業日
~4%
~11%
~7%
40%-50% (3205)
30%-40% (3081)
20%-30% (3241)
10%-20% (1748)
0%-10% (996)
~7%
~9%
~7%
図2
遺伝子カバレッジの統計
- 31 -
Ⅱ
トランスクリプトミクス
•
•
•
•
•
•
•
生データからアダプター配列・コンタミネーション・
Small RNA 解析
製品概要
次世代シーケンシング技術に基づいた Small RNA シーケンシングは、microRNA・siRNA・piRNA などの small
RNA の同定と検出において最も信頼できる方法です。特に microRNA は細胞の成長・発展・分化・死亡に決定的な
トランスクリプトミクス
Ⅱ
役割を果たすので、microRNA のシーケンシングにより制御因子を全般的に見られ、疾患メカニズムをよりよく理解
できます。生体分子研究分野において、Small RNA シーケンシングはバイオマーカーと薬物ターゲット研究のため
によく使われる手段です。
技術特長
•
•
•
•
単一塩基解像度で microRNA の SNP を検出
コピー数が 2 ~数十万までの small RNA を幅広く検出可能
既知と未知の microRNAs を検出
即時更新のデータベース
ワークフロー
トータル RNA
ライブラリー作製
50SE シーケンシング
生データ
• アライメント
• ランダム検査
品質管理
可視化
クリーンデータ
• リードの分布
アノテーション
既知 piRNA・siRNA・
既知 microRNA
rRNA など
エクソンでまだアノテー
ションを行わないリード
新たな microRNA の予測
生物学解析
ファマリー解析
• 差異発現解析
• クラスター分析
• 標的遺伝子の予測
• 標的遺伝子のアノテーション
• Small RNA を元にした情報編集
データ解析
1. 標準データ解析
•
•
•
•
生データからアダプター配列・コンタミネーション・
低品質リードを除去
small RNA の長さの分布の統計 (18~30 nt)
サンプル間にある共通配列と特異配列の分析
選ばれたリファレンスゲノムで small RNA 分布の探索
- 32 -
•
•
•
•
Rfam と Genbank データベースをアライメントし、
rRNAs・tRNAs・snRNAs・snoRNAs などを同定
small RNAs と反復配列を同定
small RNAs とエクソン・イントロンを同定
small RNAs と miRBase で 指 定 し た 範 囲 の 既 知
miRNAs を同定
•
•
•
•
small RNAs の分類アノテーション
Mireap プログラムでの新規 miRNAs の予測とその二
次構造の作成
既知 miRNAs の発現パターンの解析
発現変動 miRNA の標的遺伝子の予測
発現変動 miRNA の標的遺伝子解析・GO アノテーショ
既知 miRNAs の家系解析
3. カスタマイズ
•
既知・新規 miRNA の標的遺伝子の予測
お客様のご要望に合わせ、データ解析をカスタマイ
ズします。
miRNA の標的遺伝子の GO アノテーションと KEGG
Ⅱ
経路解析
既知 miRNA の Base editing 解析
トランスクリプトミクス
•
miRNA の発現差異解析とクラスター分析
ンと KEGG 経路解析
2. オプションデータ解析
•
•
•
•
•
技術パラメーター
1. サンプル要件
トータル RNA ( タンパク質の混入無し )
サンプル
サンプル量
mirVana ™ miRNA Isolation Kit で分離、200nt 以下
普通
≧ 10μg
≧ 1μg
サンプル濃度
≧ 200ng/μL
≧ 20ng/μL
サンプル純度
28S:18S ≧ 1.5 ( 昆虫以外 )、RIN ≧ 8.0
※ライブラリー作製が困難と判断される場合がありますので、予備のサンプルの同梱を推奨しています。
2. シーケンス解析:50SE
Scatter plot (control:x | treatment:y)
1000000
3. 推奨ライブラリーサイズ:18~30nt
100000
納期
up-expressed miRNA
down-expressed miRNA
equally-expressed miRNA
Expression level (6A)
10000
ライブラリー作製・シーケンシング・標準データ解析:
約 30 営業日
納品物
1. シーケンシング結果 (clean data) は FASTQ ファイル
1000
100
10
1
0.1
で納品
2. 納品データ例
0.1
1
10
100
1000
10000
100000 1000000
Expression level (7A)
図2
57.92
差異発現解析
50%
40%
100
30%
20%
16.29
10.33
10%
0
Percent(%)
Frequence percent
60%
10
11
0.01 0.02
0.08
12 13 14
4.92
1.91 2.37 2.65
0.45 0.68 1.17
15
16
17 18
19
20
21 22
23
1.01 0.14 0.03
0.01
24 25
26
60
40
20
0
1
27 28
長さの分布
2
3
4
5
6
7
8
9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
nt
Position
Length (nt)
図1
G
C
A
U
80
図3
各部位における miRNA のヌクレオチドバイアス
- 33 -
FFPE RNA-Seq トランスクリプトーム解析
製品概要
現在、腫瘍サンプルの約 90%はホルマリンで固定し、パラフィンで包埋 (FFPE) されたサンプルであり、バイオマー
カーの発見、新薬の開発、疾病の診断および治療などについて豊富な情報を持っています。
トランスクリプトミクス
Ⅱ
しかし、FFPE サンプルは、希に核酸の分解と塩基変化を起こすため、組織から完全な情報を取得するのは困難です。
現在のところ、FFPE サンプルの核酸情報の取得はマイクロアレイやプロテオミクス技術が利用されていますが、次
世代シーケンス解析の利用はごくわずかです。
最近、BGI の研究開発グループは FFPE サンプルの完全なトランスクリプトーム情報をシーケンス解析する新しい
方法を開発しました。この方法を評価するため、同じ腫瘍組織の FFPE サンプルと新鮮凍結 (FF) サンプルによるシー
ケンス解析のデータを比較しました。その結果、新しいシーケンス解析方法は FFPE サンプルの遺伝子発現のプロファ
イリング研究に適応することが明らかになりました。
技術特長
•
•
•
•
•
DSN 均一化ライブラリー
サンプルの量が少ない場合(最低 200ng)でも解析可能
ハイスループット
FFPE サンプルの専門的なバイオインフォマティクス解析
マルチオミクス技術を利用した全面的・系統的な解析
ワークフロー
精製したトータル RNA
RNA 断片化
cDNA 合成
アダプターのライゲーション &PCR
DSN 均一化
技術パラメーター
• RNA 抽出キット
®
Ambion
RecoverAllTM Total Nucleic Acid Isolation Kit •
サンプルの要件
トータル RNA ≧ 200ng
- 34 -
•
シーケンス解析
Illumina HiSeq 2000・91 PE
• データ量
約 2Gb clean data
BGI の実績
・サンプル情報
表 1 同じ腫瘍組織からの FFPE 腫瘍サンプルと新鮮凍結 (FF) サンプルの情報
FF
Donor ID
FFPE
T2
T3
N
T1
T2
T30
N0
3.0
1.5
1.0
0.2
3.0
1.5
1.0
0.2
RIN
7.5
4.8
6.4
2.6
2.4
2.4
2.4
2.4
28S:18S
1.0
1.0
0.8
1.4
0.5
0
0
0
(Years)
0
T:腫瘍サンプル、N:コントロール、1-3:癌のサブタイプ
図 1 T30 サンプルの RNA 分析結果(Agilent 2100)
RNA は顕著に分解されていました。
・納品データ例
表 2 FF サンプルおよび FFPE サンプルのアライメントデータ
Items
FF
Average
FFPE
Average
Donor ID11
T1
T2
T3
N
T10
T20
T30
N0
Total Reads(G)
2.2
2.2
2.2
2.2
2.2
2.2
2.2
2.2
Detected Gene Number
17150
17095
17517
16637
17382
17420
17766
16637
%Mapped to
hg19
92.20
91.34
93.13
88.81
91.37
87.24
81.39
86.64
84.73
85.00
%Uniquely
mapped to hg19
72.49
58.60
66.26
66.57
65.98
72.80
55.61
74.45
67.85
67.68
%Mapped to
RefSeq
27.08
18.67
25.49
12.51
20.94
23.40
20.36
22.84
19.11
21.43
%Uniquely
mapped to
RefSeq
17.34
12.76
16.17
8.32
13.65
14.98
13.36
14.48
11.83
13.66
11.85
15.66
14.27
26.10
16.97
5.65
5.77
4.48
9.21
6.28
Map to
Genome
hg19
Mapped to
RefSeq
%Ribosome
リボソーム比率では、FFPE サンプルは FF サンプルより低かったですが、ヒト参照ゲノム hg19 と RefSeq では、
FF サンプルと FFPE サンプルのマッピング比率に有意差はありませんでした。
- 35 -
Ⅱ
トランスクリプトミクス
T1
Block Age
0
表 3 FFPE サンプルと FF サンプルの遺伝子発現の相関解析
Correlations
T1
T10
spearman R = 0.9453
Pearson R = 0.9302
T20
T30
T2
T3
spearman R = 0.9046
Pearson R = 0.8948
spearman R = 0.9035
Pearson R = 0.8905
spearman R = 0.8374
Pearson R = 0.8449
N0
トランスクリプトミクス
Ⅱ
N
RPKM 計算の結果、FFPE サンプルと FF サンプルの遺伝子発現量に高い相関性が確認されました。
(Pearson R>0.84)
図 2 FFPE サンプルと FF サンプルの相関解析
- 36 -
MicroRNA および mRNA の統合解析
製品概要
現在、機能ゲノミクス分野において、マイクロ RNA(miRNA)とメッセンジャー RNA(mRNA)の研究が注目され
ています。Small RNA シーケンシング、RNA-Seq(トランスクリプトーム)と RNA-Seq(定量)の登場後、BGI は
先駆者として、microRNA および mRNA の統合解析の発展に注力しています。
BGI は異なる RNA シーケンス解析法を効果的に融合し、より多くのハイスループットデータを簡単に処理・探索で
きるようになりました。
技術特長
•
•
次世代シーケンシング(NGS)データとマイクロアレイデータを含むハイスルプットデータの統合解析を実施
データの利用率の向上、標的遺伝子予測の改善
ワークフロー
miRNA の発現情報
miRNA 差異解析
遺伝子の発現情報
miRNA 標的遺伝子の予測
miRNA と遺伝子の共発現解析
遺伝子差異解析
標的遺伝子のスクリーニング
制御ネットワークの作成
相関解析
遺伝子の機能アノテーション
Pathway ネットワークの作成
MicroRNA と mRNA 統合解析内容
•
•
•
•
•
•
•
miRNA と遺伝子の発現差異解析
miRNA 標的遺伝子の予測
miRNA と遺伝子の共発現解析
miRNA と遺伝子の相関解析
発現相違の miRNA および遺伝子の調製ネットワーク
KEGG と GO 解析
Gene-miRNA-GO と Gene-miRNA-KEGG の結果分類
納期
約 15 営業日(サンプル数が 20 以下の場合)
- 37 -
Ⅱ
トランスクリプトミクス
MicroRNA および mRNA の統合解析は発生生物学、機能ゲノミクスと疾患進行などの領域で応用することができます。
BGI の実績
患者の microRNA-mRNA の統合解析は、疾患診断および予後のバイオマーカーのスクリーニングに多大な影響を与
えました。
研究目的
サンプル選択
実験手順
・疾病の診断
・疾病の予測
・血清
・組織
・ライブラリー作製
・シーケンシング
データ解析
フォローアップ検証
・有病率
・生物機能解析
・発現差異
・標的予測
Normal adjacent
tissues
ccRCC
miRNAs up-regulated
miRNAs down-regulated
mRNAs up-regulated
mRNAs down-regulated
8000
150
6000
100
4000
50
2000
0
K1 K2 K3 K6
K7
K27 K39 K38
K44 K55
0
mRNAs differentially espressed
200
miRNAs differentially expressed
トランスクリプトミクス
Ⅱ
A. 健常者と比較し、淡明型腎細胞癌(ccRCC)患者の特異的
に発現する miRNA および mRNA の数(P<0.01,FDR ≦ 0.001)
※ K1 ~ K55 は患者の No.
4
48
(7.14%)
4
(7.14%)
B. 異なる組織で観察された新規 miRNA 候補
Normal adjacent
tissues
ccRCC
18
(3.07%)
562
6
(1.02%)
C. 異なる組織で観察された新規 mRNA 候補
図 1 淡明型腎細胞癌(ccRCC)患者の miRNA および mRNA の発現情報
Zhou L, Chen J, Li Z, Li X, Hu X, et al. Integrated profiling of microRNAs and mRNAs: microRNAs located on Xq27.3
associate with clear cell renal cell carcinoma. PLoS ONE . 2010, 5(12): e15224.
- 38 -
Long Non-Coding RNA シーケンス解析
製品概要
長鎖非コード RNAs(Long non-coding RNAs, Lnc RNAs)はタンパク質へ翻訳されていない 200nt 以上の長さの
RNAs (rRNA を含まない ) を言い、ポリ A の有無を問わず、非コード RNAs(non-coding RNAs, ncRNAs)内で大き
な割合を占め、エピジェネティック制御、転写調節と転写後調節などで遺伝子発現を調節し、生命活動に重要な役
Lnc RNAs シーケンス解析(LncRNA-seq)は特定方法(例えば、Ribo-ZeroTM キット)を利用してサンプル中の
rRNA の存在量を減らし、濃縮された RNA を Illumina HiSeq2000 プラットフォームでシーケンシングし、LncRNA
の鑑定、予測と差異分析を行います。迅速で精確な、特定生物学過程或いは疾患関連の LncRNA 情報の研究方法です。
技術特長
•
•
•
シーケンスカバー率が高く、データ量を変更でき、ほぼすべての転写物をカバー
高精度、大量の配列情報を獲得
既知 LncRNA の鑑定と未知 LncRNA の予測のほか、mRNA データと組み合わせての共発現の注釈
ワークフロー
技術応用
トータル RNA
参考ゲノムがある場合
参考ゲノムがない場合
rRNA の除去
rRNA および poly-A RNA の除去
RNA 断片
•
•
•
•
•
既知 LncRNA の鑑定
未知 LncRNA の発見
LncRNA ファミリーの予測分類
LncRNA 定量と差異分析
疾患マーカーの探索
ランダムプライマー (6 量体 ) を用い cDNA を合成
サイズの選択および PCR 増幅
Illumina シーケンス解析
技術パラメーター
1. サンプル要件
サンプル
サンプル量
タンパク質を除去・DNase を処理したトータル RNA
rRNA のみを除去したトータル RNA
rRNA および polyA RNA を除去したトータル RNA
≧ 5µg
≧ 20µg
サンプル濃度
≧ 80ng/µL
サンプル純度
RIN ≧ 7.0
※ライブラリー作製が困難と判断される場合がありますので、予備のサンプルの同梱を推奨しています。
2. シーケンス解析:Illumina HiSeq 2000・91 PE/101 PE
- 39 -
Ⅱ
トランスクリプトミクス
割を果たしています。