1章 データの整理 - Econom01 Web Site, Sophia

6章 仮説検定の基礎
統計的仮説検定
1. 有意性検定(矛盾の検出、背理法論理)
帰無仮説 H0
データ
(観測値)
分析
無意味な
偶然の一致を表す
仮説
帰無仮説の下で
このようなデータが出現する可能性を
求める。
例: トランプ5枚を裏返しで当てた。偶然?
偶然当たる確率
 1  1  1  1  1 
      
 52  51  50  49  48 
1

 約 3 億回に1回
311,875,200
主張:「偶然である」
⇒ この結果が起きる可能性は約 3億分の1
⇒ 主張を真に受けない方がよい
⇒ この偶然性仮説は棄却(Reject)
有意性検定(矛盾の検出、背理法論理)
帰無仮説(Null Hypothesis) H0
無意味な偶然性を表す仮説
起きる可能性
有意水準(Level of Significance)
(P値とも言う)
可能性が低い ⇒ 仮説は疑わしい
⇒ 仮説は棄却(Reject)
⇒ 結果は有意(Significant)
偶然ではない何らかの意味ある背景を持つ。
判別型検定
(選択・意思決定の論理)
データ
(観測値)
仮説 H1
決定
対立仮説 H2
検定用の指標(検定統計量)を使って
あらかじめ準備された
H1, H2 の各 採択域 から結論を決める
6.1平均値の検定
μ (分散は既知、または大標本法)
左2.5%線
95%
信頼帯
μH
μ の95%
信頼区間
右2.5%線
μL
95%
信頼帯
o
_
x
_
X
95%信頼区間内
μ < μL ← μ → μH < μ
n( μH , σ2/ n)
n( μL , σ2/ n)
2.5% 2.5%
_
x
_
X
(横軸 1 目盛 = σ / √n )
2.5% 2.5%
1) 95%信頼区間:
_
x
母平均 μ ≦ μL
赤部のような大きな乖離
可能性 2.5% 以下
母平均 μH ≦ μ
青部のような大きな乖離
可能性 2.5% 以下
2) 任意の母平均 μ
『乖離が起きる「確率」』を計算可能。
_
X
μ < μL ←
n( μL , σ2/ n)
μ
→
μH < μ
n( μH , σ2/ n)
2.5% 2.5%
3) 母数 μ の検定:
_
x
_
X
「仮説値 μ0 の下での」この「乖離確率」
=「有意水準」または「P値」
この確率値が小さいほど
(観測結果から判断して)仮説は疑わしい
と考える。
[例1] ある企業 使用電球銘柄 A の寿命
過去の記録
銘柄 A: μo = 1180 時間、
σ = 90 時間
セールスマン 安い電球銘柄 B
B 銘柄 100 個の電球の寿命を検査
銘柄 B の検査結果:
n = 100、 x= 1140 時間
検定問題: 安い銘柄 B の寿命 μ
銘柄 A と同じ (Ho : μ = μo)?
それとも より短い (H1:μ < μo)?
B銘柄の検査結果から、その寿命の
母平均 μ の 95% 信頼区間

90
  x  1.96
 1140 1.96
n
100
 1140 17.64≒ [1122, 1157]
仮説 Ho: μ = 1180 を中心にして見ると
信頼区間は 左 に外れている。
(その確率 2.5% 以下)
μo= 1180
n( 1180 , 902/100)
← 0.0004%
_
x =1140
← 0.1%
← 1% ← 5%
_
X
1152
1159
1165
(横軸 1 目盛 = σ / √n = 9)
仮説 Ho: μ = 1180 の下で、
検定統計量 X が観測された 1140
あるいはそれ以下( H1 側の方向)
の値を取る確率(有意水準):
P X  1140 | H0 
P  X  1140 | H o 

X  o 1140 o 
 P Z 


/ n
/ n 

標準正規分布表
1140 1180 

 P Z 

z
P{ Z < z }
90 / 100 

– 1.65 0.05
 40

 – 1.96 0.025
 P Z 
 4.444  – 2.33 0.01
9

 – 3.09 0.001
結果
1. P{ Z < – 4.444…} ≒ 0.0000044
「約 23 万回に 1 回しか起きない」
2. 小さな出現確率(有意水準またはP値)
⇒ 「推論における矛盾」
数学の背理法(帰謬法):
「仮定下で矛盾発生」 ⇒ 「仮定が誤り」
仮説 Ho は棄却される。
3. 対立仮説 H1
「B銘柄の電球はA銘柄よりも寿命が短い」
が極めて有力。