保健統計学第5回 「3群以上のデータ解析」 と、その他色々 2007.06.01 本日のテーマ ~3群以上の比較~ まずはデータの種類を確認(2群と同様)! 量的データ ・連続量 or 離散量? ・平均、最大・最小・中央値、分散(標準偏差)は? ・データの分布(グラフの形)は? ・比較しようと思う群の関係は?(独立 or 出所は同じ?) 質的データ? ・順位データ or 単なるカテゴリデータ? ・比較しようと思う群の関係は?(独立 or 出所は同じ?) ここまでは全く2群の比較と同様でございます。 1-(1) 分散分析(1) T XA XB 2 / n S S B / nB A 2 A XA:A群の平均値 XB:B群の平均値 SA:A群の標準偏差 SB:B群の標準偏差 nA:A群の例数 nB:B群の例数 これは「2群の平均値の比較を行う」t検定でしたが・・・3群以上 の場合はどうしましょうか? とりあえず・・・? T1 XA XB S A / n A S B / nB 2 2 T2 X B XC S B / nB S C / nC 2 2 T3 XC X A S C / nC S A / n A 2 2 の、全ての組み合わせでt検定してみましょうか・・・? 有意水準をα=5%とした場合、上記の組み合わせからは最大で15%、もし も7群だったら21通りの組み合わせ・・・ほぼ100%(以上?)有意差が出てく ることになりますけど・・・? 1-(2) 分散分析(2) 検定とは「偶然の発生する度合い」を考えるという行為であり、有意 水準5%とは、20回に1回は偶然が発生するということです。そして、 それは非常に稀なことであるから、そうなるという仮説自体が間違っ ていたとすることでした。ですが・・・ 3群以上の全ての組み合わせについて、有意水準5%で検定すると いうことは、「5%×組み合わせ数」の偶然を発生させてしまうことに なります。稀な事象でも回数が増加すれば発生しやすくなります 下手な鉄砲も数打ちゃ当たる・・・ってか? このような行為を防ぐために、3群以上の平均値の比較 には分散分析(Analysis of Variance : ANOVA)を用い るのです。 1-(3) 分散分析(3) ①問題意識:「A群とB群とC群には差があるのではないか?」 ②検定統計量を求める(分散分析表の作成。分散比(F)を算出する) ③帰無仮説(H0):各群間に差がないのだから、分散比(F)≒1になるはず? ④帰無仮説から分散比(F)≒1となるのであれば、その(F)の値は十分に起こり 得るものなのか?(=単なる偶然ではないのか?) ⑤F分布表から、あらかじめ定めた有意水準(通常α=0.05)よりも大きければ、 帰無仮説(H0)を否定できない。逆に小さければ帰無仮説(H0)を否定し、対立 仮説(H1)を採択する。 では、実際に例題を解くことで原理を学びましょう。ここでの統計量は「分散比 (F)」であります! 1-(4) 分散分析(4) 分散分析表の見方(これを知らなければダメです!) 変動要因 偏差平方和 自由度 群間変動 dfA=群数-1 k S A ni ( x i x) 2 (例えば、3群なら 3-1=2) i 1 群内変動 k SE i 1 総変動 ni (x j 1 ST=SA+SE ii x j )2 dfE=全データ数群数(例えば、 n=15、3群なら 15-3=12) 分散 分散比 sA2=SA/dfA F=sA2/sE2 sE2=SE/dfE dfT=N-1 (もしくはdfA+dfE) これだけでは辛い人・・・?ならば、次の例題を解いてみましょう! 1-(5) 分散分析(5) 例題:出産までの週数によって新生児を3群に分け、新生児期黄疸の強さを調べ たところ、以下のようなデータになった。出産までの週数によって、黄疸の強さに差 があると言えるか? 週数 -36週まで 13 11 6 36-38週 11 10 7 7 5 38-40週 8 7 5 5 4 3 3 データ数 各群の平均値(xi) 分散(si2) 3 10 13 5 8 6 7 5 11/3 群間変動=SA=3×(10-7)2+5×(8-7)2+7×(5-7)2=60 *データ数×(群の平均-全体平均)2の和 群内平均=SE={(13-10)2+(11-10)2+(6-10)2}+{(11-8)2+(10-8)2+(7-8)2×2+(5-8)2}+{(8-5)2+ (7-5)2+(5-5)2×2+(4-5)2+(3-5)2×2}=72 *(各値-各群の平均値)2の和 変動要因 偏差平方和 自由度 分散 分散比 群間変動 60 3-1=2 60/2=30 30/6=5 群内変動 72 3+5+7-3=12 72/12=6 総変動 132 14 自由度12、α=0.05のときのF値は 3.89。分散比F=5>3.89となり、出 産までの週数と黄疸の強さは差 があると言える! 2-(1) Kruskal-Wallis検定(1) 分散分析はt検定同様、「厳密には」等分散の群同士に用いられるも のですが、t検定同様標本が少数の場合は、等分散の検定が通りや すくなります。ですが・・・ 明らかに等分散とは思えない標本や、単なる順位データ」等の検定 には、どのように対応しましょうか?T検定に対応する、Wilcoxonの ような存在はあるのでしょうか? 勿論あります。実際には分散分析以上に出番の多い検 定で、Kruskal-Wallis検定と呼ばれるものです。分散分 析が正規分布を前提としたパラメトリック検定であるなら ば、当然ですがこちらはノンパラメトリック検定です。統計 量も予想通り、順位を基準としたものとなります。 2-(2) Kruskal-Wallis検定(2) ①問題意識:「A群とB群とC群には差があるのではないか?」 帰無仮説(H0): A群とB群とC群には差がない 対立仮説(H1): A群とB群とC群には差がある ②検定統計量を求める k Ri2 12 H 3(n 1) n(n 1) i 1 ni (詳細は省略しますが、上記の12/n(n+1)及び-3(n+1)に関しては、Hが近似的に自由 度k-1のχ2分布に従うので、χ2分布に近似させるための補正を行っている部分です。実 際に群間の偏りを示している部分は、ここだけです) ③Kluskal-Wallis検定表から、あらかじめ定めた有意水準(通常α=0.05)の値 Hαと検定統計量Hの値を比較する。H>Hαとなれば、 A群とB群とC群間には差 があるとする。 2-(3) Kruskal-Wallis検定(3) 例題:集団検診で肥満者14名を抜き出し、体重によって3群に分けて血中の中性 脂肪の濃度を調べた。各群間で中性脂肪濃度に差があると言えるか? 体重 データ数 80-90kg 192 256 166 122 202 5 90-100kg 164 248 264 270 230 5 100kg- 224 298 332 294 各群の平均値(xi) 分散(si2) 4 これも前回同様、順位と順位和で考えてみましょう 体重 順位 順位和 期待順位和 80-90kg 4 9 3 1 5 22 37.5 90-100kg 2 8 10 11 7 38 37.5 100kg- 6 13 14 12 45 30 実際の順位和と、期待 順位和の差に注目! 解答: Kluskal-Wallis統計量 H=12/14(14+1)×{(22)2/5+(38)2/5+(45)2/4}3(14+1)=5.96。α=0.05のときHα=5.666<Hとなるので、各群間で差があるとい える。 生存時間解析(1) 生存時間解析→そもそも生存時間とは何か? 基準となる時点からある事象(イベント)が発生するまでの 時間の長さです。例えば・・・ 手術から死亡までの日数 薬剤の投与から治療効果が認められるまでの時間 入門から入幕までの場所数 生存時間という呼び方はしておりますが、基本的に生死の みを扱うわけではありません。ある時点から、観察すると決 めた事象・出来事(=イベント)が発生するまでの時間のこと を、便宜上「生存時間」と呼んでいるのです。 生存時間解析(2) 5人の肺がん患者を観察した結果、下記のようになりました 4 5 6 7 8 9 10 11 Aさん Bさん (生存) (死亡) Cさん (生存) Dさん Eさん 12月 (生存) (生存) Aさん:観察開始から観察終了まで生存(9ヶ月) Bさん:5月に入院、7月に亡くなられました(2ヶ月) Cさん:10月から観察終了まで生存(3ヶ月) Dさん:観察開始から10月で転院されました(7ヶ月打ち切り) Eさん:観察開始から9月で引越しされました(4ヶ月打ち切り) 実際に様々な理由で観察できなくなります。さらに観察スタート日もまち まちですし・・・?実際に例題で理解することにしましょう! 生存時間解析(3) 8人の肺がん患者を観察した結果、下記のようになりました 患者1 打ち切り 患者2 このように、生存のまま観察を終了し てしまう患者さんもいる。この人たち3 名をどのように考えるのか? 患者3 患者4 打ち切り 患者5 打ち切り 患者6 患者7 患者8 0 10 20 30 40 50 60 70 患者1 患者2 患者3 患者4 患者5 患者6 患者7 患者8 11 21* 33 37 40* 57* 59 63 * 生存のまま観測打ち切り 基本的には、大切なのは「長さ」です。いつから観測しているかではなく、生 存時間(例:何日生きていたか、何日後に発生したか、何場所で昇進したか) が重要なのです! 生存時間解析(4) 患者1 患者2 患者3 患者4 患者5 患者6 患者7 患者8 11 21* 33 37 40* 57* 59 63 * 生存のまま観測打ち切り 日目 T(n)における死亡数 T(n)直前の生存数 T(n)からT(n+1)における打ち切り数 T(0) T(1) T(2) 0 11 33 0 1 1 8 8 6 0 1 0 T(3) 37 1 5 T(4) 59 1 2 2 T(5) 63 1 1 0 ・0≦t<11(=患者1の死亡直前まで)区間の生存確率は、(8-0)/8=1となる ・11≦t<33(=患者3の死亡直前まで)区間の生存確率は、(8-1)/8=0.875。よって、この時点ま での生存確率は1×0.875=0.875となる ・33≦t<37(=患者4の死亡直前まで)区間の生存確率は、(6-1)/6=0.833。よって、この時点ま での生存確率は1×0.875×0.833=0.729となる ・37≦t<59(=患者7の死亡直前まで)区間の生存確率は、(5-1)/5=0.8。よって、この時点まで の生存確率は1×0.875×0.833×0.8=0.583となる ・59≦t<63(=患者8の死亡直前まで)区間の生存確率は、(2-1)/2=0.5。よって、この時点まで の生存確率は1×0.875×0.833×0.8×0.5=0.292となる ・63≦t(=患者8の死亡直後以降)の生存確率は、(1-1)/1=0。よって、この時点までの生存確率 は1×0.875×0.833×0.8×0.5×0=0となる イベント発生以外の打ち切りを考慮しないと結果が矛盾します! 生存時間解析(5) グラフの形だけは覚えておきましょう! (生存確率) 1 0.825 死亡ではなく打ち切りで分母減少 0.729 0.583 こちらは2名減 少しております 0.292 0 11 21 33 37 40 有名なKaplan-Meier 推定量曲線と呼びます! 57 59 63 (日数) 御礼 ご清聴ありがとうございました。卒業研究 に向けましての統計的相談、ソフトウエ ア関連のご相談等ございましたら、下記 までお願い致します。 [email protected] それからもう一点・・・ 試験に関しましては・・・過去問は一切通用 しないと思われます。
© Copyright 2024 ExpyDoc