CUI - 株式会社コングレ

HSS 次世代シーケンス解析セミナー
「エクソーム解析の実際;原因遺伝子の探索」
Illumina Inc.
MiSeq
Illumina Inc.
454 Life Sciences (Roche diagnostics)
HiSeq 2500
Genome Sequencer FLX
北海道システム・サイエンス株式会社
技術営業部 岡田 宰
2014年3月1日
北海道システム・サイエンス株式会社
Hokkaido System Science Co.,Ltd.
会 社 概 要
設
立
1988年(昭和63年)9月1日
所 在 地
札幌市北区新川西2条1丁目2-1
本社
•所在地:札幌市北区
•本社、製造、受託解析、営業
充実した
サポート体制!
関西リサーチセンター
•所在地:大阪府豊中市
•営業所
つくばリサーチセンター
•所在地:茨城県つくば市
•営業所
東京リサーチセンター
福岡リサーチセンター
•所在地:福岡県福岡市
•営業所
北海道システム・サイエンス株式会社
Hokkaido System Science Co.,Ltd.
•所在地:東京都千代田区
•営業所
羽田核酸製作所
•所在地:東京都大田区羽田空港
•製造
2
事 業 内 容
北海道システム・サイエンス株式会社
Hokkaido System Science Co.,Ltd.
Whole Genome Sequencing (WGS)
Genomic DNA
Fragmentation
Sequencing
AGTGCGAGGC・・・
TGCAGTTTGA・・・
TGCCATACCC・・・
CCCAGGATAG・・・
GGTCAGTGCG・・・
TACCCAAGTC・・・
・・・・・・
・・・・・・
北海道システム・サイエンス株式会社
Hokkaido System Science Co.,Ltd.
Analysis
Whole Exome Sequencing (WES)
Genomic DNA
Fragmentation & Enrichment
Probes
Sequencing
AGTGCGAGGC・・・
TGCAGTTTGA・・・
TGCCATACCC・・・
CCCAGGATAG・・・
GGTCAGTGCG・・・
TACCCAAGTC・・・
・・・・・・
・・・・・・
北海道システム・サイエンス株式会社
Hokkaido System Science Co.,Ltd.
Analysis
Illumina HiSeq2500
Length/Read
WGS: 6 individuals/Run
x30 coverage
WES:150 individuals/Run
x80/x50 coverage
(Raw/On-target)
50/100bp (High-output mode)
50/100/150bp (Rapid-run mode)
[Single-Read/Paired-End]
Number of Reads
~3,000,000,000
(High-output mode)
~600,000,000
(Rapid-run mode)
Total Bases/Run
~600Gb (High-output mode)
~180Gb (Rapid-run mode)
Lanes / Areas
16(8×2) / 4(2×2)
Principle
Sequencing by Synthesis
Feature
Huge Number of Reads
北海道システム・サイエンス株式会社
Hokkaido System Science Co.,Ltd.
取得データの解析
Mapping
Sequence Read Data
(Reference Genome
へのAlignment)
AGTGCGAGGC・・・
TGCAGTTTGA・・・
TGCCATACCC・・・
CCCAGGATAG・・・
GGTCAGTGCG・・・
TACCCAAGTC・・・
・・・・・・
・・・・・・
Variant Analyses
SNV / MNV
Insertion/Deletion
Structural Variation
Assembly
(Read Data同士の
Alignment)
北海道システム・サイエンス株式会社
Hokkaido System Science Co.,Ltd.
FASTQ形式ファイル
フォーマット:@(配列ID)
(塩基配列)
+
(クオリティ) クオリティ値を対応するASCIIコードで表記
@ILLUMINA-HSS:SRR512907:FCD0E3EABXX:3:1101:1444:1987 1:N:ATGATG
NGATGATGAAGAATAACGTTGCCAGCAGCGCCGTCATGCGGGTCATGAAGTTACCAGAACCACTTGAACCAAACAGCGTAGCGGAAGCGC
+
#66888<<:9DDD@DDDDDBDDDDDDDDDDDDB@DD@DDD@DDDD<@@@@DDDDDDD@=DDDDDDD@=DD@BD@DD@B=@<???7?<=??
@ILLUMINA-HSS:SRR512907:FCD0E3EABXX:3:1101:3422:1990 1:N:ATGATG
NGAGGTTCAGCCCGGTCCGTGGCGTAAACGCTATATACTGGCACATTCGATGGGCGGTGCGATCTCCACATTATTTCTGCAACGCCATCC
+
#36354788<DDDDD@@@@@?7?=?DDDD@DD@D@D@DDD@D@@=D9DDDD9DDD;666??;??=@@@@@DD==D76DDDDDD=D@@DD9
@ILLUMINA-HSS:SRR512907:FCD0E3EABXX:3:1101:7998:1987 1:N:ATGATG
NCCCGCAGCATCGGCATAACGCCACGTTTGCGCCAGATTTGCCGATAACCATCGAACTCTTCGACTACCACATCCCACGCATGTTCGTCA
+
#998<9:9;<DDDDDDDDDDD@D@=D@DD==DDDDD=DD<DD@D=@DDD=D==D;D6;D<???=?<9=??D=DBD???<?.:>>:=@@D@
@ILLUMINA-HSS:SRR512907:FCD0E3EABXX:3:1101:9880:1988 1:N:ATGATG
NAATATCAGCGTTGTTTATTTTACGTCCAACGTGCGAAGCAAATTAACGTTATGAATAGCTGTAAGAAAAAATCCCTCATCGTCATCACC
+
#<<<8<>>>>DDDDDD:6D:::7DDD@DDDD@DDBDDDDD@DDDDDDDDDD@D@DDDD@DD@D@@DDD76766DDDDDDDDDDDDBDDBB
北海道システム・サイエンス株式会社
Hokkaido System Science Co.,Ltd.
マッピング~変異検出
☆SNV・MNV/Short InDel検出
A
T
T
T
T
GG
GAG
GAG
GAG
GAG
SNV?
Insertion?
Reference
:Paired-End Read (Green:Read1/Blue:Read2)
北海道システム・サイエンス株式会社
Hokkaido System Science Co.,Ltd.
マッピング~変異検出
☆Structural Variant検出 ex) inversion(逆位)
Reference
?
Inverted
Sample
北海道システム・サイエンス株式会社
Hokkaido System Science Co.,Ltd.
Linux OS CUI環境での解析作業
Gbp単位のテキストデータ
⇒GBytesの巨大なテキストファイル
★Linux OSのCUI環境での作業
○解析ソフトの多くはLinuxのCUIでの使用を前提としている
○膨大なテキストデータの高速処理・任意の加工が可能
北海道システム・サイエンス株式会社
Hokkaido System Science Co.,Ltd.
Linux OS CUI環境での解析作業
CUI(Character-based User Interface)操作
情報の表示にグラフィックを利用し、マウスを主体として操作する
GUI (Graphical User Interface) に対し、キーボードを主体として
情報の表示・命令を文字だけで操作する。
北海道システム・サイエンス株式会社
Hokkaido System Science Co.,Ltd.
CUI上でのフリーウェアを用いた解析ライン例
BWA
SAMtools
■BWA (Burrows-Wheeler Aligner)■
◆ゲノム・エクソーム解析で広く使われている。
◆SAM形式アラインメントファイルを出力。
■Samtools■
◆SAM⇒BAM(Binary圧縮)変換
◆ゲノム上の位置ごとに並べ替え
■GATK■
◆変異箇所(SNP・Ins/Del)抽出
◆アノテーション(dbSNP等)
■SnpEff■
◆アノテーション(アミノ酸置換等の検出)
■BreakDancer■
◆変異候補(Structural Variants)抽出
北海道システム・サイエンス株式会社
Hokkaido System Science Co.,Ltd.
※Free Ware
CUI上でのフリーウェアを用いた出力例
Alignment data (SAM format)
SNP/Short InDel
detect
Structural Variant
detect
北海道システム・サイエンス株式会社
Hokkaido System Science Co.,Ltd.
CUI上でのフリーウェアを用いた出力例
Alignment data visualization (Integrative Genomics Viewer)
北海道システム・サイエンス株式会社
Hokkaido System Science Co.,Ltd.
CUI+各種ソフトウェア環境
△初期導入コスト
(高スペックのサーバ・ワークステーション)
△CUI操作
△セットアップ
○フリーウェア利用可能
・Johns Hopkins University
・BROAD Institute
・Wellcome Trust Sanger Institute
etc.
○Flexibility(任意のデータ解析・加工・抽出)
○大量データ処理
北海道システム・サイエンス株式会社
Hokkaido System Science Co.,Ltd.
本日の実習
collaborate with DNAnexus Inc.
クラウドコンピューティングを利用したデータ解析
URL: https://classic.dnanexus.com/features
若しくはGoogleで”DNAnexus classic”と検索下さい
北海道システム・サイエンス株式会社
Hokkaido System Science Co.,Ltd.
SeqNovaTM CS 概要
HSS
DNAnexus
Researchers
北海道システム・サイエンス株式会社
Hokkaido System Science Co.,Ltd.
ログイン後のホーム
北海道システム・サイエンス株式会社
Hokkaido System Science Co.,Ltd.
Samplesページ:マッピングが完了したサンプル
北海道システム・サイエンス株式会社
Hokkaido System Science Co.,Ltd.
Analysesページ:解析(変異抽出等)まで完了したサンプル
北海道システム・サイエンス株式会社
Hokkaido System Science Co.,Ltd.
マッピング結果閲覧
北海道システム・サイエンス株式会社
Hokkaido System Science Co.,Ltd.
SNPテーブルのブラウザ上での表示・ダウンロードが可能
北海道システム・サイエンス株式会社
Hokkaido System Science Co.,Ltd.
△SNV・MNV / Short InDelのみ対応
(構造変異未対応)
△Flexibility(任意のデータ解析・加工・抽出)
△大量データ(>100万行)
○マシンスペック・ストレージ不要
○User Friendly
○複数の研究者間のデータ共有
北海道システム・サイエンス株式会社
Hokkaido System Science Co.,Ltd.
それでは、実習編です
北海道システム・サイエンス株式会社
Hokkaido System Science Co.,Ltd.