HSS 次世代シーケンス解析セミナー 「エクソーム解析の実際;原因遺伝子の探索」 Illumina Inc. MiSeq Illumina Inc. 454 Life Sciences (Roche diagnostics) HiSeq 2500 Genome Sequencer FLX 北海道システム・サイエンス株式会社 技術営業部 岡田 宰 2014年3月1日 北海道システム・サイエンス株式会社 Hokkaido System Science Co.,Ltd. 会 社 概 要 設 立 1988年(昭和63年)9月1日 所 在 地 札幌市北区新川西2条1丁目2-1 本社 •所在地:札幌市北区 •本社、製造、受託解析、営業 充実した サポート体制! 関西リサーチセンター •所在地:大阪府豊中市 •営業所 つくばリサーチセンター •所在地:茨城県つくば市 •営業所 東京リサーチセンター 福岡リサーチセンター •所在地:福岡県福岡市 •営業所 北海道システム・サイエンス株式会社 Hokkaido System Science Co.,Ltd. •所在地:東京都千代田区 •営業所 羽田核酸製作所 •所在地:東京都大田区羽田空港 •製造 2 事 業 内 容 北海道システム・サイエンス株式会社 Hokkaido System Science Co.,Ltd. Whole Genome Sequencing (WGS) Genomic DNA Fragmentation Sequencing AGTGCGAGGC・・・ TGCAGTTTGA・・・ TGCCATACCC・・・ CCCAGGATAG・・・ GGTCAGTGCG・・・ TACCCAAGTC・・・ ・・・・・・ ・・・・・・ 北海道システム・サイエンス株式会社 Hokkaido System Science Co.,Ltd. Analysis Whole Exome Sequencing (WES) Genomic DNA Fragmentation & Enrichment Probes Sequencing AGTGCGAGGC・・・ TGCAGTTTGA・・・ TGCCATACCC・・・ CCCAGGATAG・・・ GGTCAGTGCG・・・ TACCCAAGTC・・・ ・・・・・・ ・・・・・・ 北海道システム・サイエンス株式会社 Hokkaido System Science Co.,Ltd. Analysis Illumina HiSeq2500 Length/Read WGS: 6 individuals/Run x30 coverage WES:150 individuals/Run x80/x50 coverage (Raw/On-target) 50/100bp (High-output mode) 50/100/150bp (Rapid-run mode) [Single-Read/Paired-End] Number of Reads ~3,000,000,000 (High-output mode) ~600,000,000 (Rapid-run mode) Total Bases/Run ~600Gb (High-output mode) ~180Gb (Rapid-run mode) Lanes / Areas 16(8×2) / 4(2×2) Principle Sequencing by Synthesis Feature Huge Number of Reads 北海道システム・サイエンス株式会社 Hokkaido System Science Co.,Ltd. 取得データの解析 Mapping Sequence Read Data (Reference Genome へのAlignment) AGTGCGAGGC・・・ TGCAGTTTGA・・・ TGCCATACCC・・・ CCCAGGATAG・・・ GGTCAGTGCG・・・ TACCCAAGTC・・・ ・・・・・・ ・・・・・・ Variant Analyses SNV / MNV Insertion/Deletion Structural Variation Assembly (Read Data同士の Alignment) 北海道システム・サイエンス株式会社 Hokkaido System Science Co.,Ltd. FASTQ形式ファイル フォーマット:@(配列ID) (塩基配列) + (クオリティ) クオリティ値を対応するASCIIコードで表記 @ILLUMINA-HSS:SRR512907:FCD0E3EABXX:3:1101:1444:1987 1:N:ATGATG NGATGATGAAGAATAACGTTGCCAGCAGCGCCGTCATGCGGGTCATGAAGTTACCAGAACCACTTGAACCAAACAGCGTAGCGGAAGCGC + #66888<<:9DDD@DDDDDBDDDDDDDDDDDDB@DD@DDD@DDDD<@@@@DDDDDDD@=DDDDDDD@=DD@BD@DD@B=@<???7?<=?? @ILLUMINA-HSS:SRR512907:FCD0E3EABXX:3:1101:3422:1990 1:N:ATGATG NGAGGTTCAGCCCGGTCCGTGGCGTAAACGCTATATACTGGCACATTCGATGGGCGGTGCGATCTCCACATTATTTCTGCAACGCCATCC + #36354788<DDDDD@@@@@?7?=?DDDD@DD@D@D@DDD@D@@=D9DDDD9DDD;666??;??=@@@@@DD==D76DDDDDD=D@@DD9 @ILLUMINA-HSS:SRR512907:FCD0E3EABXX:3:1101:7998:1987 1:N:ATGATG NCCCGCAGCATCGGCATAACGCCACGTTTGCGCCAGATTTGCCGATAACCATCGAACTCTTCGACTACCACATCCCACGCATGTTCGTCA + #998<9:9;<DDDDDDDDDDD@D@=D@DD==DDDDD=DD<DD@D=@DDD=D==D;D6;D<???=?<9=??D=DBD???<?.:>>:=@@D@ @ILLUMINA-HSS:SRR512907:FCD0E3EABXX:3:1101:9880:1988 1:N:ATGATG NAATATCAGCGTTGTTTATTTTACGTCCAACGTGCGAAGCAAATTAACGTTATGAATAGCTGTAAGAAAAAATCCCTCATCGTCATCACC + #<<<8<>>>>DDDDDD:6D:::7DDD@DDDD@DDBDDDDD@DDDDDDDDDD@D@DDDD@DD@D@@DDD76766DDDDDDDDDDDDBDDBB 北海道システム・サイエンス株式会社 Hokkaido System Science Co.,Ltd. マッピング~変異検出 ☆SNV・MNV/Short InDel検出 A T T T T GG GAG GAG GAG GAG SNV? Insertion? Reference :Paired-End Read (Green:Read1/Blue:Read2) 北海道システム・サイエンス株式会社 Hokkaido System Science Co.,Ltd. マッピング~変異検出 ☆Structural Variant検出 ex) inversion(逆位) Reference ? Inverted Sample 北海道システム・サイエンス株式会社 Hokkaido System Science Co.,Ltd. Linux OS CUI環境での解析作業 Gbp単位のテキストデータ ⇒GBytesの巨大なテキストファイル ★Linux OSのCUI環境での作業 ○解析ソフトの多くはLinuxのCUIでの使用を前提としている ○膨大なテキストデータの高速処理・任意の加工が可能 北海道システム・サイエンス株式会社 Hokkaido System Science Co.,Ltd. Linux OS CUI環境での解析作業 CUI(Character-based User Interface)操作 情報の表示にグラフィックを利用し、マウスを主体として操作する GUI (Graphical User Interface) に対し、キーボードを主体として 情報の表示・命令を文字だけで操作する。 北海道システム・サイエンス株式会社 Hokkaido System Science Co.,Ltd. CUI上でのフリーウェアを用いた解析ライン例 BWA SAMtools ■BWA (Burrows-Wheeler Aligner)■ ◆ゲノム・エクソーム解析で広く使われている。 ◆SAM形式アラインメントファイルを出力。 ■Samtools■ ◆SAM⇒BAM(Binary圧縮)変換 ◆ゲノム上の位置ごとに並べ替え ■GATK■ ◆変異箇所(SNP・Ins/Del)抽出 ◆アノテーション(dbSNP等) ■SnpEff■ ◆アノテーション(アミノ酸置換等の検出) ■BreakDancer■ ◆変異候補(Structural Variants)抽出 北海道システム・サイエンス株式会社 Hokkaido System Science Co.,Ltd. ※Free Ware CUI上でのフリーウェアを用いた出力例 Alignment data (SAM format) SNP/Short InDel detect Structural Variant detect 北海道システム・サイエンス株式会社 Hokkaido System Science Co.,Ltd. CUI上でのフリーウェアを用いた出力例 Alignment data visualization (Integrative Genomics Viewer) 北海道システム・サイエンス株式会社 Hokkaido System Science Co.,Ltd. CUI+各種ソフトウェア環境 △初期導入コスト (高スペックのサーバ・ワークステーション) △CUI操作 △セットアップ ○フリーウェア利用可能 ・Johns Hopkins University ・BROAD Institute ・Wellcome Trust Sanger Institute etc. ○Flexibility(任意のデータ解析・加工・抽出) ○大量データ処理 北海道システム・サイエンス株式会社 Hokkaido System Science Co.,Ltd. 本日の実習 collaborate with DNAnexus Inc. クラウドコンピューティングを利用したデータ解析 URL: https://classic.dnanexus.com/features 若しくはGoogleで”DNAnexus classic”と検索下さい 北海道システム・サイエンス株式会社 Hokkaido System Science Co.,Ltd. SeqNovaTM CS 概要 HSS DNAnexus Researchers 北海道システム・サイエンス株式会社 Hokkaido System Science Co.,Ltd. ログイン後のホーム 北海道システム・サイエンス株式会社 Hokkaido System Science Co.,Ltd. Samplesページ:マッピングが完了したサンプル 北海道システム・サイエンス株式会社 Hokkaido System Science Co.,Ltd. Analysesページ:解析(変異抽出等)まで完了したサンプル 北海道システム・サイエンス株式会社 Hokkaido System Science Co.,Ltd. マッピング結果閲覧 北海道システム・サイエンス株式会社 Hokkaido System Science Co.,Ltd. SNPテーブルのブラウザ上での表示・ダウンロードが可能 北海道システム・サイエンス株式会社 Hokkaido System Science Co.,Ltd. △SNV・MNV / Short InDelのみ対応 (構造変異未対応) △Flexibility(任意のデータ解析・加工・抽出) △大量データ(>100万行) ○マシンスペック・ストレージ不要 ○User Friendly ○複数の研究者間のデータ共有 北海道システム・サイエンス株式会社 Hokkaido System Science Co.,Ltd. それでは、実習編です 北海道システム・サイエンス株式会社 Hokkaido System Science Co.,Ltd.
© Copyright 2024 ExpyDoc