仮説検定とは - 岡山商科大学

2008/9/24 岡山県看護協会一般研修 資料
データ分析の基礎知識
統計的検定編
岡山商科大学商学部
商学科長・教授 田中 潔
• 統計手法の中で「検定(Test)」は医療統計で
よく使われます。
• 薬効評価、効果判定のために用いられます
• 以前は、平均値を比較するパラメトリック手法
が用いられましたが、最近ではノンパラメト
リック検定が多く用いられています。
仮説検定の考え方を知る
統計的検定はどんなもの
• ある仮説(○=△)を判定する
– 例: この実験結果=160.0
– 例: 群1の平均=群2の平均
• 判定結果は採択、または棄却の2分法
• 採択とは「この仮説を積極的に否定しない」
– (厳密には仮説を認めたくないがやむを得ない)
• 棄却とは「この仮説を積極的に否定する」
看護に代表的な検定
• t検定
• ある測定データの平均値がある値かどうか
– 仮説: 測定データの平均値=46.7
• 2群の平均は等しいとみなせるか
– 仮説: 群1の平均=群2の平均
• カイ2乗検定
• クロス表に傾向や関連性があるか
– 仮説: このクロス表の度数は同じか
(統計的)仮説検定の流れ
• ある検定手法を選択する(パラでもノンパラでも)
• 帰無仮説H0:とは
– 否定する(だろう)ための仮説
– 帰無=無に帰する=否定を期待する
• 対立仮説H1:とは
– 帰無仮説以外の結果
– H0を否定するだけなので積極的な採択はしない
•
•
•
•
H0:とH1:を対にして用意する
分析データを統計ソフトにかける→有意水準を求める
有意水準の値に応じてH0かH1かを判定する
目的に応じて手法はたくさん存在する
仮説の立て方
• 1.自分の持っている仮説(作業仮説ともいう)を対
立仮説H1とする
• 2.H1の否定(逆)をH0とする
• 3.H0は○=△のように等号で作成するのがよい
• 4.H0:○=△とした時、3種類のH1が考えられる
•
H1その1: ○>△ 片側検定
•
H1その2: ○<△ 片側検定
•
H1その3: ○≠△ 両側検定
仮説の事例
• 新薬Bは薬Aより効果あることを証明したい
• H0は等号関係で作成すると良い
– H0: 新薬B=薬A(同じ、効果なし) で決まり!
•
•
•
•
•
H1には3つの作り方あり
① H1: 新薬B>薬A 効果ある 片側
② H1: 新薬B<薬A 効果劣る 片側
③ H1: 新薬B≠薬A 同じでない 両側
「効果ある」なので通常③を採用
仮説H1に方向性があるならば両側検定
•
•
•
•
•
•
•
•
関係があるかないか
ない= ある≠
両側検定
正(負)や大小の関係があるかないか
ない= ある>
片側検定
優れている(劣っている)
同じ= <や>
片側検定
同じか否か
同じ= 同じでない≠ 両側検定
H0とH1の例
– H0: 日本人の平均160センチ 平均=160
– H1: 160センチではない(何センチかは不明)
• H0はハッキリと1点で指定するのが普通(点
指定)
• H1は指定された1点以外のすべて(だから
はっきりと値が判定できない)
•
○
残り全てがH0
H0
棄却と採択
• H0が明らかに成立しないならば棄却
– つまりH1を採用
• H0は帰無したいがどうしても棄却できない状
態のことを採択(=積極的には帰無・棄却し
ない)という
– つまりH0を採用する
検定に見る計算と判定
• 計算: 統計ソフトなどを使用する
• 判定: 出てくる結果の有意確率か有意水準
の値により判定
• 有意水準>0.05 有意水準5%以上で採択
• 0.5%以下ならば棄却された
• 0.05~0.01 5%有意 *
星1つ
• 0.01~0.005 1%有意 **
星2つ
• 0.005より小 0.5%有意 *** 星3つ
まとめましょう
• 正規分布を仮定できそうな時
– 平均値に関するt検定
• 正規分布を仮定できそうでない時
– ノンパラメトリックな検定法
• 仮説は次に固定すると理解し易い
– H0: A=B H1:A≠B(両側検定)
• 計算は統計ソフトやWebサイトで行う
• 有意かどうかの判定は有意水準で行う
検定の実際に慣れる
統計ソフトについて
• 記述統計、グラフなどはエクセルで十分
• 検定、多変量分析となると専用ソフトが望ましい
• http://aoki2.si.gunma-u.ac.jp/ 群馬大青木先生の
サイトで間に合うことも多い。いつまで続くかは不明
• 市販ソフトとしては
• SPSS 高い、施設向き、論文投稿には望ましい。
世界的権威ソフト 新規18万円
• エクセル統計 4万円、エクセルのアドイン、おおむ
ね使えるが細かな使い勝手はあまり良くない
• フリーソフト(無料) R 良くできているが上級者で
まければ使いにくい!
医療統計向けソフト比較
http://www.kenkyuu.net/comp-soft-01.htmlより引用
2グループの平均値差検定
(通称t検定)
•
•
•
•
仮説は以下のとおりに立てる
H0: 平均1=平均2(2つの平均は同じ)
H1: 平均1≠平均2(同じでない)→両側
注意
– H0: 平均1≠平均2(同じでない)
– H1: 平均1=平均2(2つの平均は同じ)
のように逆には立てない
H0は等号関係で作ります!
パラメトリック検定
• 集めたデータが正規分布しそうな場合に適
• 検定力は強い
• 平均値と標準偏差に関する検定がおも
• 2群(実験群と対照群)の平均値差検定
• =通称:t検定が有名
サイトで行う2群平均値差の検定(t検定)
•
•
•
•
•
次の2群の平均値は同じといえる
か
平均 ケース数 標準
偏差
A群 10.0
10
5
B群 10.5
20
15
•
•
•
•
等分散性 0.002 棄却
2群は同じ分散ではない
平均値差 0.894 採択
平均値は等しい(差ない)
使用サイト
http://aoki2.si.gunmau.ac.jp/Java/StatCalc/dist/StatC
alc.html
赤字部分は配布資料に誤りがありまし
た。ここに訂正します。
ノンパラメトリック検定群
•
•
•
•
正規分布を仮定しない
検定力はパラメトリック検定にやや劣る
頑健な検定法
多いのは、平均値など代表値差の検定が多
い
• クロス表のカイ2乗検定もノンパラ検定法の1
つ
パラメトリックvsノンパラ比較表
• http://aoki2.si.gunmau.ac.jp/lecture/Kentei/nonpara.htmlより引用
主な統計的検定法の体系図
(青木サイトより)
クロス表の独立性の検定
通称カイ2乗検定
• 実はノンパラメトリックな検定手法の1つです
• 2×2クロス表の精密なカイ2乗検定
– http://aoki2.si.gunmau.ac.jp/JavaScript/FisherExactTest.html
• R×C表 クロス表入力 通常版
– http://aoki2.si.gunma-u.ac.jp/JavaScript/cross.html
• R×C表 クロス表入力 正確計算版
– http://aoki2.si.gunma-u.ac.jp/JavaScript/cross2.html
– (計算量が多いため通常版で十分)
• R×C表 素データで入力する版
– http://aoki2.si.gunma-u.ac.jp/JavaScript/cross3.html
代表的なノンパラメトリック検定法
• 対応のない2標本(群)の代表値差
– マンーホイットニのU検定
– 2標本コルモゴロフースミロノフ検定
– ファンデル・ワーデン検定
– 中央値検定
• 対応のある2標本(群)の代表値差
– ウイルコクソン符号検定
– ウイルコクソン符号付順位和検定
対応のあるデータ、ないデータ
• 対応ありと考えられる場合
• 同じ人やグループを追跡して測定
•
•
•
1回 2回 3回・・・
Aさん 1.0 1.5 2.0・・・
Bさん 1.2 1.7 2.2・・・
• 対応ないと考えられる場合
• 毎回グループの構成者を取り替えて測定
•
岡山 東京 大阪 福岡・・・
• 人口
• 生産額
• 学生数
• 対応のないk標本(群)の代表値差
– クラスカル・ウォリス検定
– 中央値検定
• 対応のあるk標本(群)の代表値差
– フリードマン検定
マンーホイットニ検定
2群、対応なし
• 9個の部品について4個は
処置群、残り処置なし群とし
た。この2つの群の母代表
値に差があるかどうか検定
しなさい。
– 処置群の観察値
1.2,1.5,1.8,2.6
– 処置なし群の観察値
1.3,1.9,2.9,3.1,3.9
• 有意確率=0.142または0.190
• 有意確率>0.05なので有意差なし・採択
•
参考:http://aoki2.si.gunma-u.ac.jp/Java/TwoSamples/dist/TwoSamples.html
• つまり両群に差は認められない
ウイルコクソン符号検定
2群、対応あり
• 10 人の被検者について,五段階評価をした。
同じ被検者に対して,1 年後にもう一度評価
した。その結果を表 に示す。1 年間で母代表
値に差があったかどうか検定しなさい
•
1 2 3 4 5 6 7 8 9 10
• 最 初 A A C B D A C B D B
• 1年後 C A E D B B D A E D
Wilcoxson符号検定の
結果
検定統計 量b
正確有意確率 (両側)
a. 使用された2項分布
b. 符号検定
VAR00004 VAR00003
.180a
• 正確有意確率=0.180>0.05 → 採択
• 最初と1年後では有意差ない
• もしも計量値としてWilcoxsonの符号付順位検定
を行ったならば、
• 漸近有意確率=0.114>0.05 採択
• やはり
• 最初と1年後では差はない
• 分布計算 http://aoki2.si.gunma-u.ac.jp/CGI-BIN/mpsrtest.html
クラスカルーウォリス検定
3群以上、対応なし
• 12 匹のラットに 3 種類の餌を与えたときの肝臓
の重量は表 1 のようであった。餌の種類により
肝臓の重量の平均値に差があるといえるか
表 1.餌の種類による肝臓の重量
•
A餌
3.42
3.84
3.96
3.76
B餌
3.17
3.63
3.47
3.44
C餌
3.64
3.72
3.91
SPSS入力
3.39
• H0: 平均1=平均2=平均3
• H1: 3群の平均は同じでない
• 漸近有意水準0.062>0.005 棄却
• 結論: 3群の平均は同じではない
• ただ、有意水準6.2%と5%に近いことにも留意する
• 参考http://aoki2.si.gunma-u.ac.jp/JavaScript/kw-test.html
フリードマン検定
3群以上、対応あり
• 表 1 のようなデータがある。4 種の肥料間で
収量に差があるか
• 参考: 行列を入れ替えれば3品種間に差が
あるかを検定できる
表 1.フリードマン検定が対象とするデータ
肥料
品種
B1
B2
B3
B4
A1
9
17
12
16
A2
1
21
16
11
A3
7
19
6
9
エクセル版
http://aoki2.si.gunma-u.ac.jp/lecture/stats-by-excel/vba/html/friedman2.html
– H0: 4群の平均は等しい
– H1: 4群の平均は等しくない
• 漸近有意確率0.001<0.005 ***
• 0.5%有意 肥料4種の平均は等しくない
• 行列を入れ替えると
– H0: 3品種の平均は等しい
– H1: 等しくない
• 漸近有意確率0.004<0.005
• ***0.5%有意→3品種の平均は異なる
• 総合的には、肥料、品種いずれも差あり
肥料
品種
B1
B2
B3
B4
A1
9
17
12
16
A2
1
21
16
11
A3
7
19
6
9
表の形式は似
ていても…
• 表はクロス表に似ている。しかしクロス表は
対応なし、フリードマンは対応ありが大きく異
なる。
• クロス表では行か列はそれぞれ要因。フリー
ドマンでは行か列は標本(ケース)である。
まとめ・チェックリスト
•
•
•
•
•
•
•
□
□
□
□
□
□
□
統計的検定法の概念
採択と棄却がわかる
帰無仮説と対立仮説 H0とH1
計算は統計ソフトで、統計ソフトは色々
時代はパラメトリックからノンパラへ
ノンパラ検定にはたくさんの手法
代表的ノンパラ検定の用法・読み方
研修講師のメモ
• 田中 潔(たなかきよし)
– 略歴: 岡山大、九州大修了の後商大へ勤務。助手、講
師、助教授を経て現在教授。2008年より商学科長。
– 主な科目:情報システム論、情報ネットワーク論他
– 専門分野:計算機統計学、マーケティング
– 連絡先 岡山商科大学 〒700-8601(番号で届く)
– [email protected]
– http://www.osu.ac.jp/~tanaka
– 検索エンジン 「岡山商科大学 田中潔」
– 大学電話 086-252-0642
– 大学FAX 086-255-6947
研修後に相談があれば
• アポイントはメール[email protected]が
最適。その他電話FAXは086-284-7726(自
宅)だが捕まらないならごめんなさい
• データ分析相談は随時応ずるが、エクセルに
素データを入力しておくのが望ましい
• また希望する仮説も事前に固まっている方が
スムーズに進む。
• 遠方の場合メールだけで指導する場合もある
より大規模な分析体制
• 施設からの応需制度として大学では産学官
連携センター受付による受託研究や共同研
究などの制度もあり。
• おおむね1件1年50万円程度から受託し、担
当者も指定可。
• 例:「アミューズメントにおけるマーケティング
研究」パチンコ業受託2007、08年