「CDISC概説」

「CDISC概説」
2015/4/15
北海道大学病院
臨床研究開発センター
生物統計部門
大野浩太
はじめに
• CDISC標準はいくつもありますが、主にCDASH、
SDTM、ADaMについて説明します。
• CDISCについてよく聞く意見とそれに対する個人的
な不満・意見も含まれています。
• 現状のアカデミア?の課題も示します。
目次
•
•
•
•
•
•
•
•
•
•
CDISCとは?
規制当局への電子データ提出
標準化って何?
CDASH
SDTM
ADaM
Define.XML
よく聞く意見とそれに対する個人的見解
アカデミアの課題
今後進めるべき(?)こと
CDISCとは?
• CDISC is a global, open, multidisciplinary, nonprofit organization that has established
standards to support the acquisition, exchange,
submission and archive of clinical research data
and metadata. The CDISC mission is to develop
and support global, platform-independent data
standards that enable information system
interoperability to improve medical research and
related areas of healthcare. CDISC standards
are vendor-neutral, platform-independent and
freely available via the CDISC website.
http://www.cdisc.org/
CDISCとは?
• すなわち…
• 臨床試験データとメタデータの収集・共有の標準
– メタデータとは、データを説明するデータのこと
– 例1:変数SUBJIDのラベルはSubject Identifier
• ラベルは変数のメタデータ
– 例2:検査項目コードWBCは「白血球数」を意味する
• 「白血球数」はWBCのメタデータ
– 例3:YouTubeのタグ
CDISCとは?
• CDASH
→データ収集標準
• SDTM
→データ一覧標準
• ADaM
→解析データ標準
• Define.XML
→定義書標準
• Therapeutic…
→疾患領域標準
• Controlled…
→データ値標準
規制当局への電子データ提出
• FDA(米国規制当局)は2004年からCDISC準拠の
電子データ提出を要求(義務ではない)
– SDTM・ADaM及び関連ファイル
– 2014/12に関連ガイダンス発出
– 2年後より完全義務化予定(2016/12~?)
• FDAは2017年までに約50の疾患領域ごとのCDISC
標準を構築すると宣言
http://www.fda.gov/forindustry/datastandards/studydatastandards/default.htm
http://www.fda.gov/Drugs/DevelopmentApprovalProcess/FormsSubmissionReq
uirements/ElectronicSubmissions/ucm287408.htm
規制当局への電子データ提出
• PMDA(日本規制当局)は2016/10からCDISC準拠
の電子データ提出を要求(義務ではない)
– SDTM・ADaM及び関連ファイル
– 4年後より完全義務化予定(2020/4~)
• ※医薬品のみ
– 医療機器や再生医療は対象外
• ※医師主導治験も例外ではない
http://www.pmda.go.jp/review-services/drug-reviews/about-reviews/pdrugs/0003.html
規制当局への電子データ提出
• ということもあり…
• 製薬業界(特に内資)はCDISCで戦々恐々となって
います。
• 2015/4/9にPMDAからアカデミアへの説明会があ
りましたが、「これはやばいな~」という印象です。
– アカデミアはパイロットに参加していないし…
– 「アカデミアの課題」部分
標準化とは?
• 辞書上の意味
1. 標準に合わせること。また、標準に近づくこと。
2. 工業製品などの質・形状・大きさなどについて標準を設け、
それに従って統一すること。
デジタル大辞林
• 臨床試験で言えば、
–
–
–
–
手順書やマニュアルを作成し、それに則って業務を行う
仕様書に従った成果物を作成する
等
※手順書や仕様書が標準に相当する
標準化とは?
• 標準化によって得られること
– 手順書や仕様書に従えば、誰でも統一された品質の業務
遂行、成果物作成が可能となる
– 教育しやすくなる
– 知識を継承できる
• 標準化は常に更新し続けなければならない
– 完璧な標準は存在しない
– 標準を盲信してはいけない
– 「何のための標準化か?」を常に考え、適宜標準を変更し
ていく必要がある
– ※標準の管理は大変…
CDASH
• データ収集のCDISC標準
– データ収集項目の標準
– データ収集に関するベストプラクティス
• CRFのレイアウトの標準ではない
– 例示は示されている
• 各項目はドメインという単位(有害事象、人口統計
学的特性、等)にまとめられて規定されている
• 後述するSDTMへのマッピングについても示されてい
る
http://www.cdisc.org/cdash
CDASH
CDASHで規定されているドメイン
※疾患領域ごとの標準では、疾患領域特有のCDASHの例示も示されている。
CDASH
有害事象ドメインの「有害事象名」の例
HR:収集を強く推奨する(実質必須)
定義:有害事象の医師記載名を入れる
変数名:AETERM(SDTMと同様)
※CRF入力の手引きも書かれている
CDASH
• CDASH準拠のCRF見本
– あくまで例示
– CDASH User Guide又はLibrary of CDASH CRF
Examples参照
http://www.cdisc.org/cdash
• CDASHではデータベース構造について1つに定めて
いない
– 次々スライドのように、縦型データベースにするなら、該当
変数はCDASHで規定した変数名にしましょう、という程度
• 当局には提出しない
CDASH
• 横型データベース(検査項目が横に並ぶ)
• 多くの人が慣れ親しんだ構造
• 多くのEDCやDMシステムはこの形でデータが出力さ
れる
• データ管理はしにくい?
• SDTMへ変換する時は大変?
– 単位等の変数(メタデータ)が含まれていないことも理由の
1つ
CDASH
• 縦型データベース(検査項目が縦に並ぶ)
• 多くのEDCやDMシステムは横型でデータが出力され
るため、この形への変換が大変
• データ管理はしやすい?
• SDTMへ変換する時は横型よりは苦労しない?
– そもそもこの形に変換するのが大変か…
SDTM
• データ一覧のCDISC標準
– 臨床試験の情報はすべてこの標準に集約される
•
•
•
•
規制当局はSDTMを元にデータレビューを行う
後述するADaMはSDTMから作成しなければならない
各データはドメインという単位で分割される
Classという大まかなデータセットの型がある
– Special, Interventions, Events, Findings等
http://www.cdisc.org/sdtm
SDTM
• 新規ドメインは随時
追加される
• 疾患領域標準のド
メインも存在する
SDTM
• 非常に厳密なルールが多く、全容を把握してルール
を守るのが大変(以下はその一部)
– 各ドメインに含めてよい変数は決まっている
– 変数名、変数長、変数ラベルやデータ型は決まっている
– 格納してよい値が決まっている変数がある
• Controlled Terminologyに従う
– 変数ごとの重要度がある
• 必須なら欠測も許容しない
–
–
–
–
変数の並びも規定されている
Day 0は許容しない
データセット間のリンクが必要な場合がある
英数字と一部の記号のみ使用できる
• PMDAは上記と日本語も含まれたものの2種類を提出するよう求め
る予定
SDTM Controlled Terminology
※Questionnaireの標準もあるので注意
(右記下)
http://www.cdisc.org/terminology
http://www.cdisc.org/ft-and-qt
SDTM DM
Special型のDM(人口統計学的特性)データセット。1被験者1行。
SDTM CM
Interventions型のCM(試験薬以外の薬剤)データセット。1被験者1薬剤(用法等ごと)1行。
SDTM AE
Events型のAE(有害事象)データセット。1被験者1イベント1行。
SDTM VS
Findings型のVS(バイタルサイン)データセット。1被験者1Visit1項目1行。
SDTM
• SDTM作成にはSDTMに精通していることが必要
• 厄介なことに、SDTM上の重要度が「任意」でも規制
当局の通知上「should」となっているものがある
– 規制当局の通知も確認が必要
• SDTM作成の大変さは実際に関連文書を読んで作
成を試みれば分かります
– ここでは言い尽くせません…
– そもそもCDISC以前の問題であることが多いですが…
– 「なんちゃってSDTM」は楽です
ADaM
• 解析用データのCDISC標準
• 今回は割愛します
• イメージは、SDTMのルールをゆる~くして解析に特
化した標準です
• ADaM準拠のデータセットを使ってみれば分かります
が、非常に使いやすいです
http://www.cdisc.org/adam
Define.XML
• SDTMとADaMの定義書標準
– 臨床試験の情報はすべてこの標準に集約される
• XML言語で作成しなければならない
– 富士通が作成ツールを無償提供している
– それでも作成は結構大変…
– 富士通ツールは最新仕様には準拠していない
• 具体的なイメージは下記リンク先からver2.0のzip
ファイルをダウンロードし、sdtmフォルダ内のhtmlファ
イルを確認
http://www.cdisc.org/define-xml
よく聞く意見とそれに対する個人的見解
• CDISC対応って簡単にできるんじゃないの?
– 関連文書を読んでから言ってください。分かっていない人
ほどそう言うので困ります。だから日本にはしっかりした
データベースがないのです。
– CRFをCDASH準拠にしても、SDTMを含むCDISC対応は大
変です。
• CROに外注すれば作ってくれるんじゃないの?
– 委託側も十分な知識を有していない限り的確な指示は出
せません。きちんと作った経験がほとんどない国内CROに
丸投げしてどうしてきちんとした成果物が得られるのでしょ
うか?ちなみに1000万のオーダーで費用が発生します。
よく聞く意見とそれに対する個人的見解
• CDISC対応をして企業やアカデミアにメリットある
の?
– 標準化されたデータを用いればデータレビューや解析、中央
モニタリングも標準化が可能です。規制当局がこの形式で
データレビューや解析をするということは、規制当局的視点
を持って企業やアカデミアもデータを見ることができるとい
うことです。
– 毎回異なるデータベース構造・同一定義なのに異なる変数
名等・定義書があったりなかったり、解析作業の9割はデー
タベース構造の理解と解析のためのデータ加工です。デー
タを使う側からすると、毎回構造が変わるのは大変です。
– ただ、対応するためのリソースがアカデミアにはないですが
…。
よく聞く意見とそれに対する個人的見解
• 個人的に切実に思うこと
– 「データの受け手」のことを考える
– CDISCが良い標準か?ということは置いておいて、
vendor-neutralにする
– ルールさえ知っていれば、分かりやすいデータ
– A fundamental principle is that the structure and
content must support clear, unambiguous
communication
– すべての人が持つべき意識(特にDM!)
– ただ、CDISCの説明でこの点を説明していることってあまり
ないような…(悲しい)
アカデミアの課題
• リソース不足
– 人と資金
• 英語力
– CDISC関連文書を熟読できる人がほとんどいない
• プログラミング
– データの加工にはある程度のプログラミングが必要だが、プロ
グラミングできる人がほとんどいない
• 経験がない
– TRIがCDASH→SDTMの変換検討をしている程度で、
OpenCDISCによるバリデーション、Define.XMLやADaMの作成
まで行った経験のある国内アカデミアはない
• そもそもデータベース作成経験がほとんどない?
– 製薬企業(内資)ですら困っているのに…
– そしてそれをなかなか理解されない
今後進めるべき(?)こと
1. 企業にお任せする
– 医師主導治験開始時に、アカデミアではCDISC対応できな
いことを握っておく
– 又はPMDAと提出しないことを握っておく
– それができなければ次スライドへ…
– 少なくとも2はやってほしい(切実)
今後進めるべき(?)こと
2. CRFの標準化
– ドメインごとのCRFのモジュール化、すなわち、ドメインごとの
標準をCDASHに基づいて作成してしまう
– 各試験で必要な項目・不要な項目は適宜追加・削除し、モ
ジュールを組み合わせてCRFを完成させる
– 存在しないドメインについては新たにCRFを作成する
• SDTMのClassごとでも標準作成は可能
– ※CDASHについては日本語資料もあるので、早急に着手
– Data Processing Flowの上流が改善されない限り効率的
な業務は有り得ない
– ※プログラミングはひとまず不要
今後進めるべき(?)こと
3. SDTM対応
– データベース再考
• 単位等、そもそも必要な情報が含まれていない等
– SDTMを作成するための仕様書作成
• Implementation GuideだけではSDTMを作れないため
– CRFデータ→SDTMへの変換方法検討&変換方法手順書
作成
• GUIでSDTMへマッピングできるソフトがあればいいのだが…
4. Annotated CRF作成
– CRFの各項目に「SDTM変数との対応」を示したもの
• 「CDASH変数との対応」ではない
– 地道にCRF見本を元に作成
今後進めるべき(?)こと
5. ADaM対応
– 私がすべて作れるので、ひとまずそれで。
6. Define.XML、Data Guide作成
– Define.XMLは富士通が無償で提供している「Define.xml
Generator」を使えば良い(バリデーションは有償)
– Data Guideには下記を記載する
• Define.XMLに書かないデータの説明。例えば収集したがSDTMに含
めなかった項目があった場合、その説明等
• OpenCDISCでバリデーションを行った結果、エラー等が出ていた場
合、対応不要でよしとした理由等
• ※OpenCDISCはデータセットとDefine.XMLのバリデーションを行う
オープンソースのソフトで、無償版と有償版がある(FDAとPMDAは有
償版を使用)
規制当局へ提出が必要なもの
•
•
•
•
•
•
•
SDTMデータセット
ADaMデータセット
SDTMとADaMのDefine.XML
SDTMとADaMのData Guide
ADaMとメインの解析結果作成プログラム
Annotated CRF
下記のバリデーション(例えばOpenCDISCで)
– SDTMデータセット
– ADaMデータセット
– SDTMとADaMのDefine.XML