1 評価方法(Ⅲ) 九州歯科大学 地域健康開発歯学分野 邵 仁浩 1

1
2015 年12月1日
九州歯科大学歯学部2年次生保健医療統計学講義
評価方法(Ⅲ)
九州歯科大学 地域健康開発歯学分野
邵
仁浩
1.はじめに
① スクリー二ングの導入や有効性の判断は疫学研究の集大成である。
② スクリー二ングの対象とする疾患は特定の要件を備えていなければ
ならない。
③ スクリー二ング検査の有効性は感度(敏感度)と特異度で判定する。
④ スクリー二ングの導入にあたっては対象集団の有病率を勘案しなけ
ればならない。
⑤ スクリー二ングの特性を示す指標として陽性反応的中度、陽性尤度比、
陰性尤度比などもある。
⑥ スクリー二ング・プログラムの有効性を確認するには無作為割付介入
研究が最も適切である。
中村好一
著『基礎から学ぶ
楽しい疫学
第3版』医学書院より
スクリーニングは「特定の無症状の疾患に罹患している可能性が高いかどうかを判断
するために、検査を集団に適用すること」と定義することができる。あくまでも「可能
性」であり、最終診断や確定診断を下すものではない。スクリーニングについて論じる
場合には、対象疾患の頻度、疫学研究方法、バイアスなど、種々の疫学に関する事項を
網羅する必要がある。したがって、疫学の集大成といえる。
2.スクリーニングに適している疾患とは
スクリーニングは疾病の二次予防を目的として実施される。二次予防の主眼である早
期発見・早期治療のうちの「早期発見」のさらに前半部分である。早期発見によりその
後の経過を変化させることができ、その結果、なんらかの利益が得られる疾患であれば、
スクリーニングの対象疾患と考えることができる。そのためにはその疾患が、①重篤で
あること、②症状の出現以前に治療を開始することによって経過(予後、重症度、致命
率)が変化すること、③症状出現以前の状態の有病率がスクリーニング対象集団で高い
2
こと、の3点が必要である。
①の重篤性は費用効果(cost-effectiveness)と倫理の 2 つの側面から課せられる。
スクリーニングといえども経費がかかるし、被検者に一定の(スクリーニング自体の)
リスクがかかる。そのため、これらの経費やリスクを上回るだけのメリット、すなわち
重篤な疾患の2次予防である必要が出てくる。②の経過の変化については今さら論じる
までもない(多くのがん検診が、このため実施されている。例:大腸がんスクリーニン
グのための便潜血反応検査)
。③の有病率はスクリーニングの経費に関する課題である。
有病率が低い集団を対象にスクリーニングを実施すると偽陽性が多くなり(後述;p5 陽
性反応的中度)、精密検査についての負担が増加する。
以上のような点を考えた場合、たとえば高血圧のスクリーニングは、①高血圧が危険
因子である脳血管疾患や虚血性心疾患などは生命や ADL/QOL についてきわめて重大な
結果をもたらす、②血圧の適切なコントロールによってこれらの重大な結果のリスクを
低下させることができる、③有病率が高い、という 3 点の要件を満たしており、スクリ
ーニングの対象として適切である。
3.スクリーニング検査の評価
効果的にスクリーニングが行われるためには、有効なスクリーニング検査が存在する
ことが前提となる。表1は、疾病の有無とスクリーニング検査結果との2×2表である。
この表でaとdは「あたり」
、 bとcは「はずれ」である。しかし全体(a+b+c+d)に占め
る「あたり」(a+d)の割合で検査の評価を行うわけにはいかない。有病率のあまり高く
ない疾患に対する検査で、実際に検査を行わずにすべての検体を「陰性」 と報告しても、
(a+d)/(a+ b+ c+d)は高くなる 1。したがって、全体としての「あたり」の確率ではな
く、真に疾患に罹患しているかどうかで二分し、検証する。
表1に示したように、真に疾患に罹患している者で検査の結果が陽性と出る確率を感
度(敏感度、sensitivity)とよび、真に疾患に罹患していない者で検査の結果が陰性と出
る確率を特異度(specificity)とよんでいる。それぞれの値が高い検査がよい検査方法と
いうことはできるが、両者はトレードオフの関係にあり、一方を高くすると、他方は低
くなる。
表1 スクリーニング検査結果(中村好一
著『基礎から学ぶ
楽しい疫学
第3版』医学書院より)
疾病の有無(真の姿)
スクリーニング検査結果
1
あり
なし
合計
陽性
a
b
a+b
陰性
c
d
c+d
合計
a+c
b+d
たとえば有病率が 1%の疾患に対する検査ですべてを「陰性」と報告すれば、罹患していない者が 99%
いるため、結果があたっている確率は 99%である。
3
a:有病者かつ検査結果陽性→真陽性(あたり)
b:非有病者かつ検査結果陽性→偽陽性(はずれ)
c:有病者かつ検査結果陰性→偽陰性(はずれ)
d:非有病者かつ検査結果陰性→真陰性(あたり)
感度(敏感度、sensitivity)=a/(a+c)
特異度(specificity)
=d/(b+d)
陽性反応的中度(predictive value positive) =a/(a+b)
陰性反応的中度(predictive value negative)=d/(c+d)
陽性尤度比(positive likelihood ratio)=感度/(1-特異度)=[a/(a+c)]/[1-d/(b+d)]
陰性尤度比(negative likelihood ratio)= (1-感度)/特異度=[1-a/(a+c)]/[d/(b+d)]
有病率(prevalence) = (a+c)/(a+b+c+d)
図1は集団を疾病の有無別に二分し、それぞれの群での検査結果の分布を示している。
ポイント A をカットオフ値とした場合、感度は、患者集団に占める a の割合、特異度は
非患者集団に占める d の割合となる。カットオフ値をポイント B まで引き上げると、感
度は a′,特異度は d′の部分が関与することになり、結果として感度は低下、特異度は
上昇する。したがって、検査方法を変えずに感度、特異度ともに同時に上昇させようと
するのは不可能である。
カットオフ値を上げると感度は下がるが特異度は上がる(見逃しは多くなるが、読み過ぎは少なくなる)。
図1 カットオフ値と感度・特異度(中村好一
著『基礎から学ぶ
楽しい疫学
第3版』医学書院より)
4
これに対して検査方法を変えれば、感度・特異度ともに改善することができる。複数
の検査方法で感度・特異度を視覚的に評価する技法として ROC(receiver operating
characteristic)曲線がある。図2は ROC 曲線の例である。この図では縦軸に感度、横
軸に特異度(ただし、右に行くほど小さな数値)をとっている。左上の頂点が感度・特
異度ともに 100%で、理想的な検査法である。
検査(1)と検査(2)でいくつかの感度・特異度の組み合わせがあるが、これは同
一の検査でカットオフ値を変化させた場合を示している 2。左上の頂点が理想値なので、
複数の曲線を観察する場合には左上に近いほうが、すなわち、検査(1)のほうがスク
リーニング検査としては好ましいものということがわかる。
図2 2つの検査の ROC 曲線(中村好一
著『基礎から学ぶ 楽しい疫学
第3版』医学書院より)
4.対象集団への適用
スクリーニングにふさわしい健康問題が存在し、これを検出する検査方法があるとし
ても、「ある集団に対してこの検査方法をスクリーニングとして導入する」という決定ま
でにはさらに検討を要する事項がある。1つはスクリーニングで陽性であった対象者に
対してその後の措置が可能かどうか、ということである。これには資源(精密検査を行
う技術や機関があるか)や経費が関係してくるが、その際に「何人陽性者(=精密検査が
必要な者)が出て、そのうち何人が真に疾病を有しているのか」ということが鍵となる。
スクリーニングでは表1に示したように偽陽性(表1では b)があるため、罹患してい
ないが結果が陽性と出る者が出現する。スクリーニングの定義から考えて、陽性者には
さらに検査を行い、対象とする疾患を有しているかどうかを最終的に診断することにな
る。そこで、実体としてはスクリーニングで陽性であった者の多くが疾患有しているこ
2
カットオフ値を上げるほど、図1の線は左下に行く。感度は低下するが、これと引き替えに特異度は上
昇してくる。
5
とが望まれる。そうでなければ精密検査に負担(マンパワーや経費)を要する割には真
の患者の発見は少ない、という効率の悪いものとなってしまう。
偽陽性を数量的に評価するものとして、陽性反応的中度(predictive value positive)
がある。表1に示したように、陽性反応的中度はスクリーニングで陽性であった者のな
かで、真に疾患を有する者の割合である。この値には感度と特異度が影響を与えるが、 こ
れだけではなく、スクリーニングを適用する集団での対象疾患の有病率も関係してくる。
表2に例を示す。この表は2つの集団に同一のスクリーニングを行ったことを想定し
ている。したがって、感度・特異度は当然のことながら 2 つの集団で等しい。しかし対
象とする疾患の有病率は集団1では 1%であるのに対し、集団2では 10%となっている。
その結果、陽性反応的中度は集団1の 7% (1,000 人強の精密検査を行って、患者はた
ったの 70 人)に対し集団 2 では 44%(精密検査実施者の約半分は患者)となる。スク
リーニングを適用する場合には、対象集団における目的とする疾患の有病率を十分に考
慮する必要がある。
陽性反応的中度を事後確率ということがある。すなわち、スクリーニングで陽性だっ
た者が真に当該疾患に罹患している確率は陽性反応的中度に等しい。これに対して事前
確率とは集団全体の有病率にあたるものとなる。表2の集団2では、このスクリーニン
グを受ける前では、受診者が当該疾患に罹患している確率はこの集団の有病率である 0.1
だが、スクリーニングの結果が陽性だとその確率が 0.44 にまで上昇する 3。
表2 有病率と陽性反応的中度(中村好一
著『基礎から学ぶ
楽しい疫学
第3版』医学書院より)
〈集団1〉
疾病の有無(真の姿)
スクリーニング検査結果
あり
なし
合計
陽性
70
990
1,060
陰性
30
8,910
8,940
合計
100
9,900
10,000
有病率
=100/10,000=0.01(1%)
感度
=70/100=0.7(70%)
特異度
=8,910/9,900=0.9(90%)
陽性反応的中度 =70/1,060=0.07(7%)
3
陽性尤度比
=0.7/(1-0.9)=7
陰性尤度比
=(1-0.7)/0.9=0.33
表2は感度=0.7、特異度=0.9 で提示されているが、これが感度=特異度=0.5 であればどうなるだろうか。
集団2では疾病ありスクリーニング陽性は 500 人、疾病なしスクリーニング陽性は 4,500 人で、陽性反
応的中度は 500/5,000 =0.1 となり、事前確率と事後確率が同じ数値となる。すなわち、このようなス
クリーニングは実施しても何も意味がない、ということを表している。
6
〈集団2〉
疾病の有無(真の姿)
スクリーニング検査結果
あり
なし
合計
陽性
700
900
1,600
陰性
300
8,100
8,400
合計
1,000
9,000
10,000
有病率
=1,000/10,000=0.1(10%)
感度
=700/1,000=0.7(70%)
特異度
=8,100/9,000=0.9(90%)
陽性反応的中度 =700/1,600=0.44(44%)
陽性尤度比
=0.7/(1-0.9)=7
陰性尤度比
=(1-0.7)/0.9=0.33
陽性尤度比・陰性尤度比とは、疾患がある者はない者の何倍陽性・陰性の結果が出やす
いかを示すものであり、陽性尤度比は高いほうが、陰性尤度比は低いほうが優秀なスクリ
ーニングということになる。表1に示すように、陽性尤度比は感度/(1-特異度)で、陰性
尤度比は(1-感度)/特異度で求めることができる。
5.スクリーニングの有効性
スクリーニングは目的とする疾患による死亡やQOLの低下を予防するためのものである。
そこで、スクリーニング・プログラムへの参加を「曝露」、対象疾患による死亡やQOLの低
下などを「疾病発生」と考えると、スクリーニングの効果の有無はこれまで述べてきた疫
学研究方法のいずれでも判定することが可能ということに(理論的には)なる。スクリー
ニングの効果判定を目的とした疫学研究では3つのバイアスが常に問題となる。リード・
タイム・バイアス(lead-time-bias)は図3の上段に示すように、疾患の自然治癒のなか
でスクリーニングでは疾患が早期発見される分だけ 4、その後の経過が長くなる、というも
のである。図3には極端な例を示したが、疾患の自然史がまったく同じでも、スクリーニ
ング発見群ではその後の死亡までの経過が長い 5。
レングス・バイアス(length bias)は図 3 の下段に示すように、定期的なスクリーニン
グを行っていると、発病から死亡までの経過が長い者がスクリーニングで発見される確率
が高くなることをいう。逆に考えると、同一の疾患であっても進行が速い病態のものはス
4
図3の「スクリーニングで発見」と「自覚症状で発見」の間の時間が、 lead-time とよばれている。
臨床の場でよく用いられている5年生存率は、発見から死亡までの時間の評価を集団に対して行ったもの
である。したがって、スクリーニング発見群では自覚症状発見群と比較して5年生存率が高いのはあたり
まえであり、これをもってスクリーニングの有効性を議論するのはナンセンスである。
5
7
クリーニングで発見される確率が低いということである 6。
図3 リード・タイム・バイアスとレングス・バイアスの考え方
(中村好一
著『基礎から学ぶ
楽しい疫学
第3版』医学書院より)
セルフ・セレクション・バイアス(自己選択バイアス:self-selection bias)は、スク
リーニング・プログラムへの自発的な参加者は偏った集団である、ということである。ど
のように偏った集団なのかは評価が難しいが、通常考えられているのは、
「参加者は日頃か
ら自分の健康にも留意し、その一環としてスクリーニングを受けている。したがって、ス
クリーニング非参加者よりも健康的な日常生活を送っている」とされている。このような
集団から発見される疾患は、非参加者(=自覚症状発見群)から発見されるものとは性状が
異なる可能性がある。
このような偏りを克服する最もよい研究方法は、無作為割付による介入研究である。す
なわち、対象者を無作為に2群に分け、介入群にはスクリーニングを積極的に受けさせ、
対照群とのその後の死亡率や重症化の頻度を比較するという方法で真のスクリーニングの
有効性が確認できる。
【参考文献】
1)「基礎から学ぶ楽しい疫学
6
第3版」
P128-137 中村好一
著
医学書院
たとえばがん検診で発見されるがんは、進行が比較的遅いものが多い、ということになる。したがって、
逆に自覚症状で発見されたがんは進行が速いとすれば、その後の経過について直接的な比較はできない。
8
練習問題
1.102B-42
疾病のスクリーニング検査で正しいのはどれか。2 つ選べ。
a
b
c
d
e
特異度が高い場合には偽陽性率も高い。
特異度が高い場合には敏感度(感度)も高い。
有病率が低い場合には偽陽性率が低くなる。
特異度と敏感度(感度)から ROC 曲線が得られる。
有病率が高い場合には陽性反応的中率が高くなる。
2.104C-96
9
3.106C-72
死亡率の高い疾患のスクリーニング検査法の評価において、最も重視するのは
どれか。1 つ選べ。
a 敏感度〈感度〉
b 特異度
c 偽陽性率
d 陽性反応的中度
e 陰性反応的中度
4.107A-44