Document

統計基礎(第11回)
いろいろな検定
早稲田大学大学院商学研究科
2015年6月24日
大塚忠義
1
Agenda
第11回 いろいろな検定
• 母平均の検定
Z検定、t 検定
• 平均差の検定
Z検定、t 検定(分散が等しい場合と
等しくない場合)
• 等分散の検定
2
母平均の検定(1)
Z検定:正規分布を活用する検定
母分散が既知または標本数が100以上
母平均を検定するに際し母分散が既知
である可能性は低い。実質的には標本数
が大きい場合の検定手法
t 検定:t 分布を活用する検定
母分散が未知かつ標本数が100未満
3
母平均の検定(2)
Z値
t値
Z
t
X 
2
n
X 
s2
n
n
1
2
s 
(Xi  X )

n  1 i 1
2
4
正規分布を活用する母平均の検定(1)
:標本の数が100以上
例:東京のラーメンの価格は500円より高
い?
帰無仮説 H 0 : μ=500
対立仮説 H1 : μ>500
有意水準 5%で片側検定を行う
電話帳でランダムに200件のラーメン屋に
電話をかけ価格を調査した
5
正規分布を活用する母平均の検定(2)
その結果:標本平均520円、
標本標準偏差160円
500
母平均
unknown
母分散
200
標本数
520
標本平均
160
標本標準偏差
Z値
p値
1-p値
1.77
0.961
0.039
標本数が100を超えているので
標本標準偏差を代用する
NORMS.DIST(1.77)
帰無仮説は棄却される。従って、 東京の
ラーメンは500円より高い
6
t 分布を活用する母平均の検定(1)
標本の数が100未満
例:東京のラーメンの価格は500円より高
い?
帰無仮説 H 0 : μ=500
対立仮説 H1 : μ>500
有意水準 5%で片側検定を行う
電話帳でランダムに30件のラーメン屋に電
話をかけ価格を調査した
7
t 分布を活用する母平均の検定(2)
その結果:標本平均520/560円、
標本標準偏差160円
母平均
母分散
標本数
500
unknown
500
unknown
30
30
標本平均
520
560
標本標準偏差
160
160
t値
p値
1-p値
0.68
0.751
0.249
2.05
T.DIST(0.68,29,1)(2.05)
0.975
0.025
8
母平均の検定
課題1.2
中学校1年生の平均身長は長らく160㎝で
あるといわれている
別紙の統計データをもとにこの仮説が正し
いか検定せよ
課題1:大規模データ、第2:小規模データ
9
平均差の検定(1)
2つの独立な集団が存在する
:母集団が同じと異なるどちらもありうる
:それぞれの集団から標本を抽出する
平均差: X  Y  X  Y  0
帰無仮説:平均差は0である
という検定は非常に多用する
それぞれの標本の分布を正規分布と仮定
できれば、平均差も正規分布に従う
10
平均差の検定(2)
分散が既知であれば、平均差0の検定は
母平均の検定を使用できる 分散が未知
でも標本数が100以上あれば、使用でき
る
Z検定:正規分布を活用する検定
( X  Y )  ( 1  2 )
Z
12
n1

 22
n2
標本数が100以上あれば
正規分布≒ t 分布
11
平均差の検定(3)
標本数が100未満で分散が未知
それぞれの集団の分散が等しい場合は
t 検定:t 分布を活用する検定 を活用で
n
n
1
きる s 2 
2
2
( (X  X )  (X  X )
n1  n2  2

i 1
i

i 1
i
(n1  1) s12  (n2  1) s22

n1  n2  2
t
( X  Y )  ( 1  2 )
s 2 ( 1n1 
1
n2
)
12
等分散の検定
まず、分散が等しいことを示すため
等分散の検定を行う
フィッシャーの分散比をもとにF 分布のp
値を求める
U
F
V
k1
k2
13
F 分布(1)
次の条件を満たすとき、フィッシャーの分
散比Fは自由度 (k1 , k2 ) の F 分布に従う
U
F
V
k1
k2
①Uは自由度 k1 の
②Vは自由度 k2の
③UとVは独立
分布に従う
分布に従う
14
F 分布(2)
n
1
2
s 
(Xi  X )

n  1 i 1
2
1
U
(n  1) s

2
1
2
1
1
n 1
n
1
2
s 
(Yi  Y )

m  1 i 1
2
2
V
(m  1) s

2
2
2
2
1
m 1
15
F 分布(3)
F
U
(n  1)
V
(m  1)
 s

 s
2
2
2
1
2
1
2
2
Fは自由度((n  1), (m  1))のF 分布に従う
if   
2
1
2
2
2
1
2
2
s
F
s
16
ウェルチ検定
標本数が100未満で分散が未知
それぞれの集団の分散が等しくない場合
⇒等分散の検定が棄却された場合
単純なt 統計量を用いることができない
複雑な統計量をウェルチの近似法により、
t 分布に従う統計量を活用する
17
平均差の検定
課題3
中学校1年生と2年生の平均身長は異なる
といえるか
別紙の統計データ(小規模データ)をもとに
仮説を立てたうえで、その仮説を検定せよ
18
Question?
お疲れ様でした
19