1/11ページ - univadis

1/11ページ
Copyright C 2009 Banyu Pharmaceutical Co., Ltd. All rights reserved.
R
:Registered
Trademark of Merck & Co., Inc., Whitehouse Station, N.J., U.S.A.
医師には専門の知識や技術が求められますが、それを正しく使う
「臨床決断」が常に求められます。つまり、知
識や技術以外の最も重要な要素は、診断や治療に際していかに「判断」するか、
ということではないでしょう
か。
そのような「判断」するための材料の一つに、医学論文があります。
しかしそもそも、その医学論文の結論は、
いつも本当に正しいのでしょうか。
臨床試験や医学論文では、
データから結論を導き出すために、統計学が使われています。すなわち、論文中
で使用している統計学的な根拠が適切であるのか否かを判断することができれば、
その論文の結果を、
自信
をもって診断や治療の際の判断材料として用いることができます。
本講座では、医学論文を読み解くために必要な、統計学的判断の中心となる仮説検定について、基本的な原
理を説明しつつ、EBMに繋がる実践的な解説を行っていきます。
第1回目の今回は、検定の基本的な考え方と、基本となる2群間の平均値を比較している検定について理解を
深めましょう。
2/11ページ
Copyright C 2009 Banyu Pharmaceutical Co., Ltd. All rights reserved.
R
:Registered
Trademark of Merck & Co., Inc., Whitehouse Station, N.J., U.S.A.
統計学的検定の説明に入る前に、統計学的検定の意味について触れてみたいと思います。
ひとことで言えば、検定とは、効果や違いがあるかどうかを数学的に検証する手段のことです。例えば、新薬A
が従来薬Bよりも優れていると期待されている場合、A投与群とB投与群それぞれの被験者を比較して、症状
の良くなった患者の割合がA群のほうに多い場合、
「Aのほうが良さそうだ」
と考えることができます。
しかしどんな薬でも効果の現れ方にはバラツキがあり、薬の優劣と関係なく
「たまたまそうなった」可能性を
否定できません。
では、
どうすれば「偶然の差ではなく、確かにAのほうが優れている」
といえるのでしょうか。
この問題を解決す
る、最も合理的かつ明快な手法が検定です。
3/11ページ
Copyright C 2009 Banyu Pharmaceutical Co., Ltd. All rights reserved.
R
:Registered
Trademark of Merck & Co., Inc., Whitehouse Station, N.J., U.S.A.
それではまず、検定の基本的な手順を確認しておきましょう。
はじめに、帰無仮説と、対立仮説を立てます。帰無仮説は、棄却されるべき主張、例えば「A薬群とB薬群の有効
率に差がない」
となり、対立仮説は、本来の主張、
「A薬群とB薬群の有効率に差がある」
となります。
次に、データから検定統計量Tを算出し、
この値を用いて、仮説のもとで偶然その差が生じる確率pを求めます。
p値が一定の基準値を下回れば、
「偶然にしては確率が低すぎる」ため、
「差がない」
とした仮説は棄却され、
「差がある」
とした本来の主張が成り立ちます。
この基準値は有意水準と呼ばれ、0.05とするのが慣習となっています。つまり確率5%以下、20回に1回程度起
こり得るかどうかをもって、統計的判断をすることになります。
このとき、A薬群とB薬群の有効率には、有意差
があるといいます。
4/11ページ
Copyright C 2009 Banyu Pharmaceutical Co., Ltd. All rights reserved.
R
:Registered
Trademark of Merck & Co., Inc., Whitehouse Station, N.J., U.S.A.
それでは、医学論文でよくみられる、2群間の平均値の差の検定を理解するために、
その使われ方を整理して
みましょう。
検定手法を大きく分類すると、連続変数の場合は2つの検定に分けられます。1つは、パラメトリック検定とい
い、サンプルの母集団分布が正規分布であると仮定できる場合に用いられ、そうでない場合にはもう1つの
ノンパラメトリック検定が用いられます。2群を比較する場合にも、パラメトリックとノンパラメトリックの2つ
の検定法がありますが、今回は、パラメトリック検定について取り上げます。
2群間の比較に用いられる検定のうち、パラメトリックな検定としてt検定が用いられています。t検定には、い
くつか種類があり、比較する2群の関係により使い分けられています。2群の関係は、
・対応のある2群間を比べる場合 と、
・独立な2群間を比べる場合
の2つに分類できます。
5/11ページ
Copyright C 2009 Banyu Pharmaceutical Co., Ltd. All rights reserved.
R
:Registered
Trademark of Merck & Co., Inc., Whitehouse Station, N.J., U.S.A.
医学論文では、
このt検定がよく用いられますが、
これには統計的に大きな理由があります。
一つには、サンプルデータが、臨床検査値、すなわち血圧値や、血球数などの連続変数として得られることが
多いためです。
これらの値は、多くの場合、正規分布を仮定することができるからです。
もう一つには、サンプルの大きさの問題があります。検定では、サンプルの大きさというのは重要な要素です
が、医療にかかわる検定では、被験者の数があらかじめ決まっていて、サンプルの大きさが限られるケースが
多いと思います。そういったサンプルが限られている場合でも使えるのが、t検定なのです。
6/11ページ
Copyright C 2009 Banyu Pharmaceutical Co., Ltd. All rights reserved.
R
:Registered
Trademark of Merck & Co., Inc., Whitehouse Station, N.J., U.S.A.
それでは、t検定について理解を深めていきましょう。
まず、対応のある2群間でのt検定です。
対応のある2群間のデータは、図のようにペアになっています。
この各ペアの差を、ひと塊のサンプルデータと
みなして検定を行うのです。例えば、被験者群の治療前の検査値と、治療後の検査値を比較する場合が、
この
ケースに当てはまります。つまり、治療前と、治療後の検査値は、いずれも同一の被験者のものですから、対応
しているといえます。
7/11ページ
Copyright C 2009 Banyu Pharmaceutical Co., Ltd. All rights reserved.
R
:Registered
Trademark of Merck & Co., Inc., Whitehouse Station, N.J., U.S.A.
では、t検定を用いて、
「対応のある2群の平均値に統計的な有意差があるかどうか」を検定する手順に移りま
す。
まず「2群の平均値に差がない」
という帰無仮説を立てます。
そして、計算から得られた検定統計量Tの値から帰無仮説のもとで偶然その差が生じる確率pを求めます。
こ
のとき、例えば被験者の治療前と後の比較で、あらかじめ治療後に検査値が下がると推測される場合などに
は、片側検定を用いることがあります。
一般的に、
片側検定は、2つの治療薬や、治療法の効果の大小が事前に想定できる場合などに使用されま
す。
それに対して、両側検定は、男女間に差があるかどうかを検討する場合や、異なる治療を行った2群間の効
果の大小が事前に推測できない場合などに使用されます。
pが0.05より小さければ、
「帰無仮説が正しいと考えるには低すぎる確率」
となり、帰無仮説は棄却されます
ので、
「平均値に差がある」
という結論が導かれます。
8/11ページ
Copyright C 2009 Banyu Pharmaceutical Co., Ltd. All rights reserved.
R
:Registered
Trademark of Merck & Co., Inc., Whitehouse Station, N.J., U.S.A.
次に、対応のない、すなわち独立な2群の平均値の差を検定している場合のt検定をみてみましょう。
独立な2群の場合とは、たとえば、被験者を2群に分けて、
片方をプラセボ群、
もう片方を実薬群とし、両群の
被験者の検査値を比較する場合や、Cという治療を行った群とDという治療を行った群で、両群の被験者の検
査値を比較する場合などが当てはまります。
さらにこの場合、2つのケースがあります。2群の分散が等しいと
仮定できるケースと、
そうでないケースです。
2群の分散が等しいか等しくないかを見分けるため、t検定の前に、
「2群の分散が等しいと仮定できるか否か
」を調べる別の検定が行われています。
その後は、検定統計量の求め方など細かいところは違いますが、いずれの場合も検定の手順としては、先ほ
どの対応のあるt検定の場合と同じです。すなわち、検定統計量Tを求め、
そのうえでp値を求めることによって
、仮説を棄却するか否かを決定します。
9/11ページ
Copyright C 2009 Banyu Pharmaceutical Co., Ltd. All rights reserved.
R
:Registered
Trademark of Merck & Co., Inc., Whitehouse Station, N.J., U.S.A.
また、一見、独立な2群のようにみえるサンプルデータに、対応のあるt検定が用いられている場合があります。
データにペアマッチと呼ばれる作業を行うことで、あたかも対応のあるデータを用いているような検定が行
えます。例えば、抗癌剤の臨床試験で、
プラセボ群と新薬群の生存期間を比較したい場合、癌のステージや、
性別、年齢が近い被験者同士をペアマッチさせることによって、対応のあるt検定を用いて新薬の真の効果
を評価することができます。
10/11ページ
Copyright C 2009 Banyu Pharmaceutical Co., Ltd. All rights reserved.
R
:Registered
Trademark of Merck & Co., Inc., Whitehouse Station, N.J., U.S.A.
さて、
ここまでで、医学論文などによく登場する、2群を比較する際のt検定の基本的な使われ方が理解できた
と思います。つまり、ひとくちにt検定といっても、比較している2群の関係により、検定手法が異なっている場
合があるのです。
今回は、医療統計で多用されるt検定、すなわち2群間比較におけるパラメトリック検定のバリエーションを紹
介しましたが、
これらは母集団すなわちサンプルデータが含まれる集団全体が正規分布に従うことを前提と
して、用いられています。現実の検定では、データが順位である場合などのように、母集団が正規分布してい
ないこともありますので、そのような場合にはノンパラメトリック検定が行われています。
また3群以上の多群間における比較の場合、2群間比較を繰り返し行うのではなく、新たな手法を導入して検
定を行っている場合があります。
本講座の第2回目以降は、
これらの手法について解説していきます。
11/11ページ
Copyright C 2009 Banyu Pharmaceutical Co., Ltd. All rights reserved.
R
:Registered
Trademark of Merck & Co., Inc., Whitehouse Station, N.J., U.S.A.