テストデータをどう作るか

データチーム活動報告
2012/3/27
目次
• SDTMチーム概要
• データチーム
– 概要
– データの流れ
– タスク
– スケジュール
– ルール紹介
– まとめ
SDTMチーム概要 [全体フロー]
日付
ツール
プロトコル
被験者
一覧
CRF項目
一覧
項目洗い出し
シート
入力フォーム
模擬
データ
CRF
Annotated
CRF
PGM
:データチーム
凡例
:完了
Terminology
基準値
変換仕様書
SDTM
データ
SDTMチーム概要 [チーム相関図]
2010/11~2011/6
新試験チーム
2011/6~2011/10
2011/11~現在
Tx
Txドメイン
Txドメイン
データチーム
模擬データ
Review
CRFレビュー
CRF作成
プロトコル
症例単位で
データの作成
SDTMデータ
Annotated
CRF
問題を共有して
ゴールを目指す
CRF作成者
が実施
被験者一覧
仕様書チーム
Story
Items
(2011.7月会合 清水様資料より)
症例
シナリオ
CRF項目
一覧
Terminology
基準値
PGM
変換仕様書
SAS経験者、
Challengerが
担当
SDTMチーム概要 [実装のポイント]
• SDTM IG 3.1.2全ドメインをカバー
• CDASHチームとの連携
– CRFをCDASHベースで作成
– 模擬データをCRFベースで作成
• ADaMチームとの連携
– 解析に耐えうるSDTMデータの作成
– 目標症例数などプロトコルデザインからの連携
• 模擬データを全て英語で作成
データチーム [概要]
• チームメンバー:25名
• CRFベースで模擬データを作成
– 前期で作成したプロトコル・CRF・症例一覧などを
元に模擬データを作成
– データクリーニングを実施。ただし意図的にエラ
ーデータを作成することも
• 実作業ベースでルールを策定
データチーム [タスク]
• 入力フォーム作成
– 事後に模擬データを統合するため
• ラボ基準値データ作成
– 外部データとして模擬データと共に提供
• 模擬データ作成(目標31症例)
– 担当者毎に1~2症例分の全ドメインを作成
– 別担当者によるレビュー
• 会合での情報共有
データチーム [スケジュール]
タスク
入力フォーム作成
ラボ基準値作成
模擬データ作成
一次データ統合
一次データ提供
⇒仕様書チーム
二次データ統合
二次データ提供
⇒仕様書チーム
模擬データ修正
2011年
11月
12月
2012年
1月
2月
3月
4月
5月
データチーム [データの流れ]
データチーム
模擬データ (Excel)
CRF
来院日:2011/05/13
来院日:2011/05/13
来院日:2011/05/13
来院日:2011/05/13
体重:50.5
kg
体重:50.5
kg
体重:50.5
kg
体重:50.5
kg
血圧:150/80
mmHg
血圧:150/80
mmHg
血圧:150/80
mmHg
血圧:150/80
mmHg
体温:91.0
F
体温:91.0
F
体温:91.0
体温:97.7FF
VSDAT
VSTEST
1
2011-05-13
2
2011-05-13
3
2011-05-13
4
2011-05-13
Weight
Systolic Blood
Pressure
Diastolic Blood
Pressure
Temperature
VSORRES VSORRESU
50.5
kg
150
mmHg
80
mmHg
97.7
F
仕様書チーム
SDTMデータ
変換
仕様書
SV
データチーム [ルール紹介 – 入力フォーム]
• SDTM形式に合わせ、Eventクラス(AE, CE, CM,
DV, FA)ではVisit情報は不要とした。
• CRF記載項目よりコードリストを作成。プルダ
ウンで選択できるようにした。
• 臨床検査、薬物動態データはセントラルラボ
から外部データとして受領することを想定し、
別途データ入力フォームを作成した。
データチーム [ルール紹介 – 模擬データ]
• 日付フォーマットはISO-8601
• 共通データの入力を減らし、統合時にまとめ
て作成することで工数を減らした。
• EX-EXTRTは模擬データ上は空欄とし、別途作
成した割付情報から仕様書チームがDeriveす
る。
• SU-非喫煙者でも消費量と期間を入力するな
ど入力ルールを統一した。
データチーム [ルール紹介 – 模擬データ]
• LB-臨床検査会社に検体を送付すると、NOT
DONEでも、必ずデータを作成する。
– 採血なし:LB、PC、LabData、PCLabレコードなし
– 採血あり:LB、PCレコードあり、LabData、PCLabレ
コード発生
データチーム [まとめ]
• 前年度からの改良点
– 模擬データ作成者の増員 ( 2名 ⇒ 24名 )
→ 十分な模擬データ作成
– CDISC Terminologyをベースとしたコードリストの作
成、ドロップダウンリストによる統一化
→ 高品質な模擬データ作成
→ 後に仕様書チームでのマッピングが容易に
– 1人で1症例分の模擬データを担当
→ 症例ストーリーに沿ったSDTMデータの理解
データチーム [参考]
• 困ったときの解決方法
– CRFを眺める
– プロトコルを読む
– SDTM/SDTM IGを読む
– Google
– メーリングリストで質問
– 会合でメンバーと協議
データチームメンバー
会社名
氏名
会社名
氏名
シミック株式会社
有村 旨央
武田薬品工業株式会社
清水 源
大日本住友製薬株式会社
上町 浩子
城本 幸治
田辺三菱製薬株式会社
後川 芳輝
クインタイルズ・トランスナショナ
ル・ジャパン株式会社
株式会社ACRONET
妹尾 有紀
ACメディカル株式会社
大里 浩司
株式会社シーエーシー
曽根 義之
株式会社ベルシステム24
高橋 宏行
大塚製薬株式会社
高橋 朝彦
第一三共株式会社
永井 康晴
株式会社中外臨床研究センター 大野 道夫
武田薬品工業株式会社
大平 知世
シミック株式会社
桑江 良
東京大学大学院医学系研究科
小出 大介
キッセイ薬品工業株式会社
櫻庭 啓一郎
田辺三菱製薬株式会社
佐野 啓之
大鵬薬品工業株式会社
佐原 功憲
ACメディカル株式会社
清水 卓
氏名五十音順、敬称略
グラクソ・スミスクライン株式会社 橋尾 美穂
(株)日本科学技術研修所
長谷 和彦
シミック株式会社
浜野 英哲
株式会社ACRONET
松本 萌
シミック株式会社
和田 千穂