JGA アクセス制限データベース

Japanese Genotype-phenotype Archive
児玉 悠一
Kodama Yuichi, Ph.D
DDBJ センター、アノテータ
DDBJ center, annotator
DDBJ センターが運営するデータベース
アクセス制限データベース
JGA
個人レベルの遺伝型と表現型
アノテーション
DDBJ
ヒトデータ審査委員会
アセンブリ
BioProject
BioSample
アライメント
DRA
リード
Quality value
INSDC: オープンアクセスデータベース
2015年6月12日
第31回 DDBJing 講習会 (JST東京)
1
DDBJ と NBDC の役割分担
http://trace.ddbj.nig.ac.jp/jga/submission.html
 利用制限が必要な個人由来の遺伝型・表現型情報を受付・保存・提供
 原則として匿名化されたメタデータを受付
 データ提供と利用を NBDC ヒトデータ共有ガイドラインに従って審査
2015年6月12日
第31回 DDBJing 講習会 (JST東京)
2
NBDC での審査のポイント
「提供」申請審査
 インフォームドコンセントにおいて「データの共有」が示されているか?
 「データを共有すること」が倫理審査をパスしているか?
 申請されたデータの内容と倫理審査の内容が合致しているか?
「利用」申請審査
 研究責任者はこの分野で経験があるか?
 施設のセキュリティ対策は適切か?
 研究内容は倫理審査をパスしているか?
 データの提供者が示すデータ利用の際の制限事項に合致した申請内容か?
(研究分野の限定やデータの保管方法など)
NBDC ヒトデータ共有ガイドライン
http://humandbs.biosciencedbc.jp/guidelines/data-sharing-guidelines
ヒトデータ審査委員会 (隔週で開催)
http://humandbs.biosciencedbc.jp/dac
2015年6月12日
第31回 DDBJing 講習会 (JST東京)
3
アクセス制限データベース
JGA
dbGaP
Database of Genotype and Phenotype
Japanese Genotype-phenotype Archive
EGA
European Genome-phenome Archive
 JGA と EGA は SRA をベースにした同様のデータモデルを使用
 dbGaP と EGA はサマリー情報を交換
 INSDC ではない
2015年6月12日
第31回 DDBJing 講習会 (JST東京)
4
JGA データモデル
JGA データモデル
Submission
JGA
Study
Sample 1
Study
JGAS
Experiment
JGAX
Experiment 1
Data 1
Sample
JGAN
Analysis 2
Data
JGAR
Analysis
JGAZ
Analysis 1
Sample 2
Experiment 2
Data set 1
Data set
JGAD
Data 2
Policy
JGAP
Policy 1
アクセッション番号プレフィックス
 SRA データモデルを改変
2015年6月12日
第31回 DDBJing 講習会 (JST東京)
6
JGA Submission
Submission
JGA
Study
Sample 1
Study
JGAS
Experiment
JGAX
Experiment 1
Data 1
Sample
JGAN
Analysis 2
Data
JGAR
Analysis
JGAZ
Analysis 1
Sample 2
Experiment 2
Data set 1
Data set
JGAD
Data 2
Policy
JGAP
Policy 1
 登録のためだけのオブジェクト
 名前や連絡先などの登録者情報と提供開始日
2015年6月12日
第31回 DDBJing 講習会 (JST東京)
7
JGA Study
Submission
JGA
Study
Sample 1
Study
JGAS
Experiment
JGAX
Experiment 1
Data 1
Sample
JGAN
Analysis 2
Data
JGAR
Analysis
JGAZ
Analysis 1
Sample 2
Experiment 2
Data set 1
Data set
JGAD
Data 2
Policy
JGAP
Policy 1
 トップレベルのオブジェクトで研究内容・研究費・論文情報を含む
 データ提供開始後、研究概要を示すために内容は一般に公開される
2015年6月12日
第31回 DDBJing 講習会 (JST東京)
8
JGA Experiment
Submission
JGA
Study
Sample 1
Study
JGAS
Experiment
JGAX
Experiment 1
Data 1
Sample
JGAN
Analysis 2
Data
JGAR
Analysis
JGAZ
Analysis 1
Sample 2
Experiment 2
Data set 1
Data set
JGAD
Data 2
Policy
JGAP
Policy 1
 実験手順・質問票・ライブラリー情報や使用した実験機器など
 1つの Sample と複数の Data オブジェクトを連結
2015年6月12日
第31回 DDBJing 講習会 (JST東京)
9
JGA Sample
Submission
JGA
Study
Sample 1
Study
JGAS
Experiment
JGAX
Experiment 1
Data 1
Sample
JGAN
Analysis 2
Data
JGAR
Analysis
JGAZ
Analysis 1
Sample 2
Experiment 2
Data set 1
Data set
JGAD
Data 2
Policy
JGAP
Policy 1
 Sample ≧ 個人
 匿名化されたドナー ID = 個人、表現型 (性別、年齢や病態など)
2015年6月12日
第31回 DDBJing 講習会 (JST東京)
10
JGA Data
Submission
JGA
Study
Sample 1
Study
JGAS
Experiment
JGAX
Experiment 1
Data 1
Sample
JGAN
Analysis 2
Data
JGAR
Analysis
JGAZ
Analysis 1
Sample 2
Experiment 2
Data set 1
Data set
JGAD
Data 2
Policy
JGAP
Policy 1
 個人に対応する (生) データファイル (fastq, bam, アレイデータ) を格納
2015年6月12日
第31回 DDBJing 講習会 (JST東京)
11
JGA Analysis
Submission
JGA
Study
Sample 1
Study
JGAS
Experiment
JGAX
Experiment 1
Data 1
Sample
JGAN
Analysis 2
Data
JGAR
Analysis
JGAZ
Analysis 1
Sample 2
Experiment 2
Data set 1
Data set
JGAD
Data 2
Policy
JGAP
Policy 1
 複数の Data もしくは Sample を解析したデータを格納
例: 変異データ (vcf) や表現型をまとめた表
2015年6月12日
第31回 DDBJing 講習会 (JST東京)
12
JGA Dataset
Submission
JGA
Study
Sample 1
Study
JGAS
Experiment
JGAX
Experiment 1
Data 1
Sample
JGAN
Analysis 2
Data
JGAR
Analysis
JGAZ
Analysis 1
Sample 2
Experiment 2
Data set 1
Data set
JGAD
Data 2
Policy
JGAP
Policy 1
 Policy が適用される Data と Analysis をまとめる (データ提供の単位)
 データ提供開始後、データの概要を示すために内容は一般に公開される
2015年6月12日
第31回 DDBJing 講習会 (JST東京)
13
JGA Policy
Submission
JGA
Study
Sample 1
Study
JGAS
Experiment
JGAX
Experiment 1
Data 1
Sample
JGAN
Analysis 2
Data
JGAR
Analysis
JGAZ
Analysis 1
Sample 2
Experiment 2
Data set 1
Data set
JGAD
Data 2
Policy
JGAP
Policy 1
 Dataset に適用される利用制限事項
独自の利用制限事項 (例: 特定の研究のみ) を NBDC ガイドラインに追加したい場合に作成
2015年6月12日
第31回 DDBJing 講習会 (JST東京)
14
JGA データ構成の例
JGA データ 例1: シンプルなケース
NBDC ガイドラインのみが
適用される場合、作成する必要はない
 Experiment-Sample-Data セットが「個人データ」に対応
 Data: 生データ、Analysis: 解析したデータ
2015年6月12日
第31回 DDBJing 講習会 (JST東京)
16
JGA データ 例2: NGS とアレイデータ
2015年6月12日
第31回 DDBJing 講習会 (JST東京)
17
JGA データ 例3: 異なる利用制限事項
健常者
患者
NBDC ガイドライン
特定の研究目的に利用を制限
 患者由来の個人レベルデータの利用を特定の研究目的に制限する場合
NBDC ガイドライン + 独自の利用制限事項
2015年6月12日
第31回 DDBJing 講習会 (JST東京)
18
JGA へのデータ登録
JGA へのデータ登録
http://trace.ddbj.nig.ac.jp/jga/submission.html
 NBDC にデータ提供を申請
 承認されると有効期限付きのアップロードアカウントが発行される
 メタデータは登録用エクセルに記入、JGA で XML を作成
2015年6月12日
第31回 DDBJing 講習会 (JST東京)
20
JGA へのデータアップロード
メタデータ XML と
データファイルを選択
JGA 登録を選択
データファイル
メタデータ XML
アップロードアカウント
にログイン
Encrypt & Upload で
暗号化 & アップロード
 JGA 専用ツールでログイン
 データファイルが暗号化され、メタデータ XML とともに SSH でサーバにアップロードされる
 メタデータの整合性、データファイルの存在と md5 値がチェックされる
2015年6月12日
第31回 DDBJing 講習会 (JST東京)
21
JGA アクセッション番号
プレフィックス
メタデータオブジェクト
数字の桁数
例
JGA
Submission
11
JGA00000000001
JGAS
Study
11
JGAS00000000001
JGAN
Sample
11
JGAN00000000001
JGAX
Experiment
11
JGAX00000000001
JGAR
Data
11
JGAR00000000001
JGAZ
Analysis
11
JGAZ00000000001
JGAD
Data set
11
JGAD00000000001
JGAP
Policy
11
JGAP00000000001
 JGA メタデータオブジェクトに対してアクセッション番号を発行
JGAS 番号の論文での引用を推奨
2015年6月12日
第31回 DDBJing 講習会 (JST東京)
22
JGA データの利用
利用可能な JGA データ一覧
http://humandbs.biosciencedbc.jp/data-use/all-researches-jp
https://ddbj.nig.ac.jp/jga/viewer/view/studies
2015年6月12日
第31回 DDBJing 講習会 (JST東京)
24
JGA データの利用
http://trace.ddbj.nig.ac.jp/jga/submission.html
 NBDC にデータ利用を申請
 承認されると有効期限付きのダウンロードアカウントが発行される
2015年6月12日
第31回 DDBJing 講習会 (JST東京)
25
JGA データのダウンロード
ローカルの保存場所を選択
JGA データセットを選択
Download をクリックし、
ダウンロード & 復号化
ダウンロードアカウント
にログイン
 JGA 専用ツールでログイン
https://ddbj.nig.ac.jp/jga/viewer/view/studies
 ダウンロード権限が付与されている Data set をリストから選択
 Data set をダウンロードし、復号化する
 メタデータはウェブサイトにログインして閲覧
2015年6月12日
第31回 DDBJing 講習会 (JST東京)
26
JGA ウェブサイト
http://trace.ddbj.nig.ac.jp/contact.html?db=jga
 登録について問い合わせる場合には登録者とデータの ID をお知らせください
2015年6月12日
第31回 DDBJing 講習会 (JST東京)
27