添付文書の統計表現を読み解く⑥ 比率の検定(カイ二乗検定)

添付文書の統計表現を読み解く⑥
比率の検定( カイ二乗検定 )
山村 重雄
新・
医薬
品
情報
学
(10
)
城西国際大学薬学部
統 計 学 的 検 定で平均 値の 検 定( t 検 定 )の次に多く
とプラセボの反応率が等しいと仮定するならば、実際に得
用いられるのが比率の検 定で、その検 定 方法としては
られた「29 例 /64 例」と「18 例 /61 例」という結果は、仮
カイ二乗検定が用いられます。臨床試験の結果をもと
定した等しい反応率からの偶然のばらつきだと考えられ
に有効率を比較する場合などに使われます。
ます。このような結果が得られる確率(p 値 )を求めて、反
応 率が等しいと見なすことができるかどうかを検定しま
比率の検定は、統計学的検定の中で平均値の検定と
す。上記の添付文書では p 値が 0.0682 ですから、有意水
並んで最も基本的なものです。検定方法としてはカイ二乗
準を 0.05(これよりも小さな p 値の場合に反応率が等し
2
検定(χ二乗検定、χ 検定)が用いられます。t 検定に比
くないと考える値 )とすると、統計学的には違いは認めら
べれば添付文書で見かけることは少なめですが、パンフレ
れませんでしたが、p 値はかなり小さく、本剤の反応性が
ットなどでは、臨床試験の結果をもとに有効率を比較す
高い可能性が捨てきれません。
る場合などでよく見かけます。まずは、添付文書から例を
具体的にどんな計算をしているかを理解するために、
みます。
分割表にまとめてみます。
本剤 20mg またはプラセボを1日1 回 18 カ月間経口投
与したとき、反 応 率は本剤 群で 45.3 %
(29/64 例 )、
プラセボ群で 29.5%
(18/61 例 )であり、統計学的な
有意 差は認められないものの本剤群で反応率が高
かった(p = 0.0682、カイ二乗検定)。
表 本剤とプラセボの反応の有無の結果
本剤
反応あり
反応なし
計
64
29
35
プラセボ
18
43
61
合計
47
78
125
この例では、本剤とプラセボの反応率を比較していま
す。本剤では、64 例中 29 例で反応がみられ(45.3%)。プ
この表から、もし、本剤とプラセボの効果が等しけれ
ラセボでは 61 例中 18 例(29.5%)で反応がみられたとい
ば、“反応あり” と “反応なし” の結果が得られる比は、2 つ
う結果です。この 2 つの反応率に違いがあれば本剤には
の群の結果を合わせて47:78と考えられます。そして実
何らかの効果があると考えられます。このような反応率に
際に 2 つの群で得られた結果はこの比率からの偶然のば
違いがあるかを統計学的に検定する方法がカイ二乗検定
らつきと考えられます。そこで、偶然に実験結果のような比
です(検定するのは正確には比です)。
(29 例:35 例と18 例:43 例 )が得られる確率を求めます。
カイ二乗検定では、
「 64 例中 29 例」と「 61 例中 18 例」
それがカイ二乗検定の p 値となります。
という2 つの反応割合が等しいかどうかを検定します。注
反応率は同じでもデータの数が変わるとカイ二乗検定
意したいのは、45.3%と29.5% を比較しているのではない
の結果は異なります。平均値の検定で、差が同じでもデー
ということです。比較する反応率は同じでも、合計の症例
タ数が多ければ統計学的な差が検出されやすいことと対
数(サンプル数 )が異なるとカイ二乗検定の結果は異なり
応しています。この添付文書の例では、p 値は 0.05 よりも
ます。例えば症例数が 10 倍増えて「 640 例中 290 例」と
少しだけ大きな値となりました。しかし、もう少し症例数
「 610 例中 180 例」という実験結果が得られた場合、
「 64
例中 29 例」と「 61 例中 18 例」の場合とそれぞれの反応
を多くすれば 有意な差がみられたであろうと考察して、
「反応性が高い」傾向がみられていると判断したものと考
率は 45.3%と 29.5%と同じですが、その反応割合につい
えられます。
て違いの有無を検定すると、結果は異なるのです。
検定結果を見るときは、p 値だけでなく、サンプル数( 症
カイ二乗検定の考え方を簡単に説明します。もし、本剤
例数 )にも注意する必要があります。
ファーマシストぷらす 2015 No.2 5