スライド 1 - @niftyホームページサービス

平成17年および18年度厚生労働科学研究費
補助 医療技術評価総合研究事業
「国民の視点に基づく適切な診断過程の確立に
関する研究」
峯 徹哉
森實 敏夫
中島 淳
大川 伸一
松橋 信行
玉井 拙夫
桐越 博之
斉藤 聡
島田 英雄
米田 正人
加川 建弘
柴田 実
松嶋 成志
東海大学消化器内科
神奈川歯科大学内科
横浜市立大学分子消化器内科
神奈川県立がんセンター消化器内科
NTT東日本関東病院消化器内科
神奈川県津久井保健福祉事務所
横浜市立大学分子消化器内科
横浜市立大学分子消化器内科
東海大学消化器外科
横浜市立大学分子消化器内科
東海大学消化器内科
NTT東日本関東病院消化器内科
東海大学消化器内科
診断に関する研究のエビデンスレ
ベル分類法
神奈川歯科大学内科
森實敏夫
2007年2月19日
診断に関する研究
2種類の知見
1. 診断法の診断能
2. 適切なアウトカムに対して証明された臨床
的有効性
診断法の適用レベル
• Screening スクリーニング
事前確率低
– 疾患の平均的危険群≒健常者
• Surveillance サーベイランス
事前確率低~中
– 疾患の高危険群
• Diagnosis 診断
事前確率中~高
– 疾患が想定される=通常の診療の状況
一般的なエビデンスレベルの分類
レベルⅠ:システマティクレビュー/メタアナリシス
レベルⅡ:1つ以上のランダム化比較試験による
レベルⅢ:非ランダム化比較試験による
レベルIVa:分析疫学的研究: コーホート研究
レベルIVb:分析疫学的研究: 症例対照研究、横断研究
レベルⅤ:記述研究(症例報告やケースシリーズ)
レベルⅥ:患者データに基づかない、専門委員会や専門
家個人の意見
診断に関する研究の分類
• Type I
– 臨床的意義のあるアウトカムに対する効果を解析したRCTまたは
RCTのメタアナリシス
• Type II
– 臨床的意義のあるアウトカムに対する効果を解析した非ランダム化
比較試験
• Type III
– 臨床的意義のあるアウトカムに対する効果を解析した症例対照研究、
コホート研究またはそのメタアナリシス
• Type IV
– 診断能の解析を目的とした臨床試験、横断研究など
• Type V
– RCT、コホート研究、症例対照研究などの研究に付随して診断法の
診断能のデータが提供されているもの
Type Iの研究
• 研究デザイン: 臨床的意義のあるアウトカムに対する効果を解析した
RCTまたはRCTのメタアナリシス
• 対象者: ある疾患が想定される者
– I-1 :
– I-2 :
– I-3 :
疾患が想定される=通常の臨床のレベル
疾患の高危険群
疾患の平均的危険群≒健常者
• 介入群: 検査法を実施する
– I-1 :
– I-2 :
– I-3 :
診断法の実施
定期的なSurveillanceの実施
定期的なScreeningの実施
• 対照群: 検査法を実施しない、あるいは対照となる検査法を実施する
• アウトカム:生存、治癒、QOL、再発、cost-effectivenessなど
• 効果指標: Number needed to screen (NNS)、平均余命の延長
(ADLG, average duration of life gained)、リスク比、オッズ比、絶対リス
ク減少など
Type IIの研究
• 研究デザイン: 臨床的意義のあるアウトカムに対する効果を解析した非
ランダム化比較試験
• 対象者: ある疾患が想定される者
– II- 1 :
– II- 2 :
– II- 3 :
疾患が想定される=通常の臨床のレベル
疾患の高危険群
疾患の平均的危険群≒健常者
• 介入群: 検査法を実施する
– II- 1 :
– II- 2 :
– II- 3 :
診断法の実施
定期的なSurveillanceの実施
定期的なScreeningの実施
• 対照群: 検査法を実施しない、あるいは対照となる検査法を実施する
• アウトカム:生存、治癒、QOL、再発、cost-effectivenessなど
• 効果指標: Number needed to screen (NNS)、平均余命の延長
(ADLG, average duration of life gained)、リスク比、オッズ比、絶対リス
ク減少など
Type IIIの研究
• 研究デザイン: コホート研究、症例対照研究あるいはそのメタアナリシス
により診断的介入とアウトカム改善の関連が示されているもの
• 対象者:その疾患(+)で診断的介入を受けた例と受けていない例の2群
でアウトカムを比較。その疾患(+)でアウトカム(+)例と疾患(+)でアウ
トカム(-)例で診断的介入の有無を比較。
• 予知因子=その診断法を受けたかどうか
– Type III-1:診断法の実施
– Type III-2:定期的なSurveillanceの実施
– Type III-3:定期的なスクリーニングの実施
• アウトカム=生存、治癒、QOL、など
• 効果指標:リスク比、NNS、オッズ比など
標準的なゴールド
スタンダードで診断
Type IVの研究
• 研究デザイン: 診断能の解析を目的とした臨床試験、横断
研究など
• 対象者:診断のゴールドスタンダード(至適基準)で疾患の有
無を判定した少なくとも2群
• 予知因子=診断法
• アウトカム=ゴールドスタンダードの結果
• 必要条件:対象者の疾患スペクトラム(年齢、性別構成、重症
度や病期など)が明記されている
• 効果指標:感度、特異度、(陽性尤度比、陰性尤度比)、ROC
解析のAUC、オッズ比など
Type Vの研究
• 研究デザイン: RCT、コホート研究、症例対照研究などの研
究に付随して診断法の診断能のデータが提供されているも
の
• 対象者:診断のゴールドスタンダード(至適基準)で疾患の有
無を判定した少なくとも2群
• 予知因子=診断法
• アウトカム=ゴールドスタンダードの結果
• 必要条件:対象者の疾患スペクトラム(年齢、性別構成、重症
度や病期など)が明記されている
• 効果指標:感度、特異度、(陽性尤度比、陰性尤度比)、ROC
解析のAUC、オッズ比など
Type IV, Vの研究→診断能
• 感度、特異度、オッズ比、ROCのAUCなどは診断
能の指標でありその診断法に固有のものである
• ただし、その値を得た研究対象の疾患スペクトラム
によって、変動しうる
• 同じ診断法を健常者、疾患の高危険の者、疾患の
想定される者に適用する場合、事後確率は事前確
率の影響は受けるが、診断能が変化するわけでは
ない
推奨レベル
• A
– 行うよう強く勧められる
• B
– 行うよう勧められる
• C1
– 十分な科学的根拠がないが、行うことを考慮しても良い
• C2
– 十分な科学的根拠がないので、明確な推奨ができない
• D
– 行わないよう勧められる
• E
– 行わないよう強く勧められる
研究の分類と推奨レベルの関係
• Type I
–
A
• Type II
–
C1以下
• Type III
–
効果指標の値に応じてC1以下
• Type IV
–
診断能に応じてB以下
• Type V
–
診断能に応じてC1以下
研究の分類と推奨レベルの関係
Type 推奨レベル
備考
I
A
-1.Screening,
-2.Surveillance,
-3.Diagnosis
II
≦ C1
同上
III
≦ C1(効果指標の値に応じて)
同上
IV
≦ B(診断能に応じて)
Harmも考慮
V
≦ C1(診断能に応じて)
Harmも考慮
Type I-1 → 推奨レベルA
• ある疾患が想定される
• その検査を実施する(Diagnosis) VS 実施
しない
• アウトカム(生存など)が改善する
• 推奨の条件
– アウトカムの改善が統計学的に有意であり臨床
的意義がある
– それ以外はB以下
Type I-2
→ 推奨レベルA
• 疾患の高危険群である
• その検査を行う(定期的Surveillance) VS
行わない
• アウトカム(生存など)が改善する
• 推奨の条件
– アウトカムの改善が統計学的に有意であり臨床
的意義がある
– それ以外はB以下
Type I-3.→ 推奨レベルA
• 疾患の平均的危険群である≒健常者
• その検査を行う(定期的Screening) VS 行
わない
• アウトカム(生存など)が改善する
• 推奨の条件
– アウトカムの改善が統計学的に有意であり臨床
的意義がある
– それ以外はB以下
Type II→ 推奨レベルC1
• 疾患の平均的危険群である≒健常者
• ある疾患が想定される
• 疾患の高危険群
• その検査法によるDiagnosis、Surveillance、Screeningの
実施 VS 行わない
• アウトカム(生存など)が改善する
• 推奨の条件
– アウトカムの改善が統計学的に有意であり臨床的意義がある
– それ以外はD以下
Type III-1,2,3.→ 推奨レベルC1
• 疾患の平均的危険群である≒健常者
• ある疾患が想定される
• 疾患の高危険群
• その検査法によるDiagnosis、Surveillance、Screeningの
実施 VS 行わない
• アウトカム(生存など)が改善する
• 推奨の条件
– アウトカムの改善が統計学的に有意であり臨床的意義がある
– それ以外はC2以下
Type IV → 推奨レベルB
•
•
•
•
ある疾患が想定される
疾患の高危険群
その検査を実施する(Diagnosis)
疾患確率が変化する
• 推奨の条件:以下のいずれかに該当する
– 感度、特異度が0.9以上
– 平均的な検査前確率で陽性の場合、検査後確率が0.9以上=陽性的中率が
0.9以上、および、平均的な検査前確率で陰性の場合、検査後確率が0.1を
下回る=陰性的中率が0.9以上
– 陽性尤度比が9以上
– ROC曲線のAUCが0.9以上
• 上記の条件に満たない研究しかない場合、5種類以上の診断法があれ
ば、診断能の効果指標の分布の上位5分位のものをレベルBとする。
• 上記の条件に満たないものはレベルC1以下とする
Type IV → 推奨レベルC1
• 疾患の平均的危険群である≒健常者
• その検査を実施する(Diagnosis)
• 疾患確率が変化する
• 推奨の条件:以下のいずれかに該当する
– 感度、特異度が0.95以上
– 平均的な検査前確率で陽性の場合、検査後確率が0.5以上=陽性的中率が
0.5以上、および、平均的な検査前確率で陰性の場合、検査後確率が0.01
を下回る=陰性的中率が0.99以上
– または、陽性尤度比が50以上
• 上記の条件に満たない研究しかない場合、5種類以上の診断法があれ
ば、診断能の効果指標の分布の上位5分位のものをレベルC1とする。
• 上記の条件に満たないものはレベルC2以下とする
Type V → 推奨レベルC1
•
•
•
•
ある疾患が想定される
疾患の高危険群
その検査を実施する(Diagnosis)
疾患確率が変化する
• 推奨の条件:以下のいずれかに該当する
– 感度、特異度が0.9以上
– 平均的な検査前確率で陽性の場合、検査後確率が0.9以上=陽性的中率が
0.9以上、および、平均的な検査前確率で陰性の場合、検査後確率が0.1を
下回る=陰性的中率が0.9以上
– 陽性尤度比が9以上
– ROC曲線のAUCが0.9以上
• 上記の条件に満たない研究しかない場合、5種類以上の診断法があれ
ば、診断能の効果指標の分布の上位5分位のものをレベルC1とする。
• 上記の条件に満たないものはレベルC2以下とする
Type V → 推奨レベルC2
• 疾患の平均的危険群である≒健常者
• その検査を実施する(Diagnosis)
• 疾患確率が変化する
• 推奨の条件:以下のいずれかに該当する
– 感度、特異度が0.95以上
– 平均的な検査前確率で陽性の場合、検査後確率が0.5以上=陽性的中率が
0.5以上、および、平均的な検査前確率で陰性の場合、検査後確率が0.01
を下回る=陰性的中率が0.99以上
– または、陽性尤度比が50以上
• 上記の条件に満たない研究しかない場合、5種類以上の診断法があれ
ば、診断能の効果指標の分布の上位5分位のものをレベルC2とする。
• 上記の条件に満たないものはレベルD以下とする
疾患スペクトラムの問題
• それぞれの研究対象はさまざまな診断法の結果に
影響を与えうる共変量がその他の研究の対象、そ
の診断法を適用しようとする患者と異なる可能性が
ある。
–
–
–
–
偶然
医療施設の違い
民族差
医療システムの違い
1. 腫瘍マーカーは進行癌
の方が高値
2. PIVKA-IIは腫瘍が大き
いほうが高値
• それぞれの研究対象は共変量の一致する亜群に分
類しうる
• それぞれの亜群で感度・特異度などが異なる可能
性がある
消化器疾患診断に関するガイドライン
• Type I、II、III、IVの研究
–
–
–
–
–
クリニカルクエスチョン
推奨
理論的根拠
根拠と解説
文献
• Type Vの研究
– 診断法対象者の疾患/病態
至適診断基準
疾患スペクトラム 疾患群の人数
対照群の
人数 感度 特異度
陽性尤度比 陰性尤度
ROC AUC 論文における事前確率 陽性
比
的中率陰性的中率を表形式で提示する
診断法の実施という介入
なし
診
断
法
に
関
す
る
研
究
分
類
ア
ル
ゴ
リ
ズ
ム
あり
診断能の解析が主題
No
Type V
アウトカムの臨床的意義
なし
Yes
Type IV
あり
その他
RCTまたはRCTのMA
No
非RCT
No
コホート研究または
症例対照研究
No
その他
Yes
Type III
Yes
Type II
Yes
Type I
Type
Study Design
Outcome
I
RCTのMeta-analysis, RCT
II
Controlled clinical trial
(CCT)
Cohort study, Case-control
study
Analysis of diagnostic
performance (d.p.)
Studies associated with
data about d.p.
Clinical
relevance
Clinical
relevance
Clinical
relevance
III
IV
V
結論
• 診断法の実施という介入によりアウトカムの
改善が証明されている研究はエビデンスレベ
ルがもっとも高く、実施が強く推奨される。
• 診断能に関する研究は、診断能の高さによっ
てエビデンスレベルを分類する。
• 以上により、診断法実施の決断の根拠として、
レベルの高さを分類することが可能となる。