スライド

平成 26 年度 経済統計分析入門
第 12 回 「母平均の仮説検定 (1).」
原 尚幸
.
新潟大・経済
http://www.econ.niigata-u.ac.jp/˜hara/G-stat/
[email protected]
H. Hara (Niigata U.)
母平均の仮説検定 (1)
Dec 17, 2014
1 / 24
例:株価収益率の分析
X1 , . . . , Xn : A 社の日次株価収益率 (n 日分)
母集団は未来の収益率も含む
{X1 , . . . , Xn , Xn+1 , . . . , XP }
iid
Xi ∼ N (µ, σ 2 ) と仮定
µ : 期待収益率 (リターン )
σ : ボラティリティ
H. Hara (Niigata U.)
母平均の仮説検定 (1)
Dec 17, 2014
2 / 24
例:株価収益率の分析
投資家にとって最も基本的な興味は
µ > 0,
µ < 0,
µ=0
のいずれが成立するか
µ > 0 : 収益が期待できる
µ = 0 : 収益が期待できない
µ < 0 : 減益が予想できる
いずれが正しいかを判定する方法はないか?
H. Hara (Niigata U.)
母平均の仮説検定 (1)
Dec 17, 2014
3 / 24
例:株価収益率の分析
¯ : µ の最小分散不偏推定量
X
¯ を用いて
X
¯ >0⇒µ>0
X
¯ =0⇒µ=0
X
¯ <0⇒µ<0
X
で判定してはどうか?
実はこの方法だと問題が多い
¯ = 0.00001 のときにも µ > 0 と判定していいのか?
X
iid
¯ = 0) = 0 となることが
Xi ∼ N (µ, σ 2 ) のとき P (X
知られている ⇒ µ = 0 と判定できない etc...
このようなとき「統計的仮説検定」を用いる
H. Hara (Niigata U.)
母平均の仮説検定 (1)
Dec 17, 2014
4 / 24
統計的仮説検定の考え方
次のような 2 つの 仮説 を設定
H0 : µ = 0 (収益率が 0)
H1 : µ 6= 0 (収益率が 0 でない )
H0 , H1 の H は “hypothesis(仮説)” の頭文字
H0 , H1 (収益率が 0 か否か ) のいずれが正しいかを
判定することを考えてみよう
統計学ではその際にまず H0 : µ = 0 が正しいと
仮定して, 矛盾があるかどうかを調べる
H. Hara (Niigata U.)
母平均の仮説検定 (1)
Dec 17, 2014
5 / 24
帰無仮説・対立仮説
帰無仮説・対立仮説
H0 : µ = 0 のように, 考察の基準となる仮説を
「帰無仮説」と言う
H1 : µ 6= 0 は H0 に対する仮説で「対立仮説」
という
.
仮説検定とは帰無仮説 H0 と対立仮説 H1 の
どちらが正しいかを判定する手続き
どのように判定すればよいか?
.
H. Hara (Niigata U.)
母平均の仮説検定 (1)
Dec 17, 2014
6 / 24
仮説検定の考え方
帰無仮説 H0 : µ = 0 が正しいと仮定する
iid
X1 , . . . , Xn ∼ N (µ, σ 2 ) なので H0 の下では
iid
X1 , . . . , Xn ∼ N (0, σ 2 )
(
)
n
2
∑
1
σ
¯=
Xi ∼ N 0,
⇒X
n i=1
n
¯
X
⇒ √ ∼ N (0, 1)
σ/ n
H. Hara (Niigata U.)
母平均の仮説検定 (1)
Dec 17, 2014
7 / 24
統計的仮説検定の考え方
µ の値に関わらず ,
Se2
=
n
∑
¯ 2
(Xi − X)
i=1
とすると
Se2
∼ χ2 (n − 1)
2
σ
H. Hara (Niigata U.)
母平均の仮説検定 (1)
Dec 17, 2014
8 / 24
統計的仮説検定の考え方
H0 の下では
√ ¯
¯
X
nX
√ =
∼ N (0, 1),
σ
σ/ n
Se2
∼ χ2 (n − 1)
2
σ
¯ と独立
Se2 は X
√
Se2
2
S0 :=
: 不偏分散, S0 := S02
n−1
t 分布の定義より H0 の下では
√ ¯
√ ¯
nX/σ
nX
√
=
∼ t(n − 1)
S0
(Se2 /σ 2 )/(n − 1)
H. Hara (Niigata U.)
母平均の仮説検定 (1)
Dec 17, 2014
9 / 24
t 統計量
t 統計量
√ ¯
nX
t=
を t 統計量という
S0
.
fX (x)
t は標本 (データ) の関数
.
標本が与えられれば計算できる量
t は H0 の下で t ∼ t(n − 1)
0
x
H. Hara (Niigata U.)
母平均の仮説検定 (1)
Dec 17, 2014
10 / 24
t 統計量の性質
t はデータから計算が可能
帰無仮説 H0 : µ = 0 が正しいとき
→ t は 0 に近い値を取る
→ |t| が小さい
対立仮説 H1 : µ 6= 0 が正しいとき
→ t は 0 から離れた値を取る
→ |t| が大きい
H0 , H1 のいずれが正しいかを判別するために,
|t| の大きさを評価することを考える
H. Hara (Niigata U.)
母平均の仮説検定 (1)
Dec 17, 2014
11 / 24
母平均の t 検定
母平均の t 検定
H0 : µ = 0, H1 : µ 6= 0
t0.025 (n − 1) : t(n − 1) の上側 2.5 % 点
1
2
3
4
H0 : µ = 0 と仮定
t 統計量 t をデータから計算
|t| > t0.025 (n − 1) なら H0 を棄却して H1 を採択
.
|t| ≤ t0.025 (n − 1) なら H0 を採択
このような方式によって H0 , H1 のいずれが
正しいかを判別する方法を統計的仮説検定という
H. Hara (Niigata U.)
母平均の仮説検定 (1)
Dec 17, 2014
12 / 24
母平均の t 検定
t0.025 (n − 1) : t(n − 1) の上側 2.5 % 点
次のようなルールで H0 , H1 のいずれが
正しいかを判別する
1
2
3
4
H0 : µ = 0 と仮定
√ ¯
nX
t 統計量 t =
をデータから計算
S0
|t| > t0.025 (n − 1) なら H0 を棄却して H1 を採択
|t| ≤ t0.025 (n − 1) なら H0 を採択
H. Hara (Niigata U.)
母平均の仮説検定 (1)
Dec 17, 2014
13 / 24
t 統計量の大きさと仮説の関係
H0 が正しいとき t ∼ t(n − 1) で |t| は 0 と
近い値をとる確率が高い
H1 が正しいとき |t| は 0 から離れた値を取る
確率が高いことが知られている
H. Hara (Niigata U.)
0
0
H0 : µ = 0
H1 : µ 6= 0
母平均の仮説検定 (1)
Dec 17, 2014
14 / 24
t 統計量の大きさと仮説の関係
t0.025 (n − 1) : t(n − 1) の上側 2.5%点とすると
P (|t| > t0.025 (n − 1)) = 0.05
P (|t| ≤ t0.025 (n − 1)) = 0.95
−t0.025(n − 1) 0
t0.025(n − 1)
−t0.025(n − 1) 0
P (|t| > t0.025 (n − 1))
H. Hara (Niigata U.)
t0.025(n − 1)
P (|t| ≤ t0.025 (n − 1))
母平均の仮説検定 (1)
Dec 17, 2014
15 / 24
t 統計量の大きさと仮説の関係
tX : 標本から計算した t 統計量の値 (実現値)
|tX | > t0.025 (n − 1) となったとしよう
P (|t| > |tX |) < 0.05
−t0.025(n − 1) 0
H. Hara (Niigata U.)
t0.025(n − 1)
母平均の仮説検定 (1)
Dec 17, 2014
16 / 24
t 統計量の大きさと仮説の関係
tX : 標本から計算した t 統計量の値 (実現値)
|tX | > t0.025 (n − 1) となったとしよう
P (|t| > |tX |) < 0.05
0
H. Hara (Niigata U.)
tX
母平均の仮説検定 (1)
Dec 17, 2014
16 / 24
t 統計量の大きさと仮説の関係
H0 : µ = 0 が正しいとすると t 統計量が tX より
も 0 から離れる確率は 5 % 未満
しかしもし H1 : µ 6= 0 が正しいとするともっと
尤もらしいことが起こっていると言える
尤もらしい:
「もっともらしい」と読む
0
H. Hara (Niigata U.)
tX
母平均の仮説検定 (1)
Dec 17, 2014
17 / 24
t 統計量の大きさと仮説の関係
H0 : µ = 0 が正しいとすると t 統計量が tX より
も 0 から離れる確率は 5 % 未満
しかしもし H1 : µ 6= 0 が正しいとするともっと
尤もらしいことが起こっていると言える
尤もらしい:
「もっともらしい」と読む
0
H. Hara (Niigata U.)
tX
母平均の仮説検定 (1)
Dec 17, 2014
17 / 24
t 統計量の大きさと仮説の関係
|tX | > t0.025 (n − 1) だったとする
H0 : µ = 0 が正しいとすると・
・
・
|tX | の 0 からの離れ方は 5 %も起こらないこと
H1 : µ 6= 0 が正しいとすると・
・
・
|tX | の値は尤もらしい
この場合は H1 の方が尤もらしいと判断して
H0 を棄却して H1 を採択する
0
H. Hara (Niigata U.)
tX
母平均の仮説検定 (1)
Dec 17, 2014
18 / 24
t 統計量の大きさと仮説の関係
|tX | > t0.025 (n − 1) だったとする
H0 : µ = 0 が正しいとすると・
・
・
|tX | の 0 からの離れ方は 5 %も起こらないこと
H1 : µ 6= 0 が正しいとすると・
・
・
|tX | の値は尤もらしい
この場合は H1 の方が尤もらしいと判断して
H0 を棄却して H1 を採択する
0
H. Hara (Niigata U.)
tX
母平均の仮説検定 (1)
Dec 17, 2014
18 / 24
t 統計量の大きさと仮説の関係
|tX | ≤ t0.025 (n − 1) となったとしよう
P (|t| > |tX |) > 0.05
−t0.025(n − 1) 0
H. Hara (Niigata U.)
t0.025(n − 1)
母平均の仮説検定 (1)
Dec 17, 2014
19 / 24
t 統計量の大きさと仮説の関係
|tX | ≤ t0.025 (n − 1) となったとしよう
P (|t| > |tX |) > 0.05
tX
H. Hara (Niigata U.)
0
母平均の仮説検定 (1)
Dec 17, 2014
19 / 24
t 統計量の大きさと仮説の関係
H0 : µ = 0 が正しいとしても t 統計量が tX よりも
0 から離れる確率は 5 % 以上では起こりえること
この場合は 0 からの離れ方が許容範囲と考えて
H0 : µ = 0 を採択
tX
H. Hara (Niigata U.)
0
母平均の仮説検定 (1)
Dec 17, 2014
20 / 24
演習
演習
X1 , . . . , X100 : A 社の 100 日分の株価収益率
iid
X1 , . . . , X100 ∼ N (µ, σ 2 )
1
2
H0 : µ = 0, H1 : µ 6= 0
¯ = 1.2%, S0 = 2.5%
X
√ ¯
nX
を計算せよ
t 統計量 t =
S0
.
t0.025 (n − 1) = 1.98 である. そのときこのルールに
よれば , H0 , H1 のどちらの仮説が正しいか?
H. Hara (Niigata U.)
母平均の仮説検定 (1)
Dec 17, 2014
21 / 24
統計数値表
仮説検定をするには t0.025 (n − 1) などの
パーセント 点が必要
統計数値表とはさまざまな分布のさまざまな
パーセント 点をまとめた表である
教科書によっては巻末についている
例えば統計検定のウェブサイト
http://www.toukei-kentei.jp/exam/rss.html
などからもダウンロード が可能
H. Hara (Niigata U.)
母平均の仮説検定 (1)
Dec 17, 2014
22 / 24
統計数値表の読み方
t 分布表
自由度
1
2
3
4
5
6
7
8
9
10
0.100
3.078
1.886
1.638
1.533
1.476
1.440
1.415
1.397
1.383
1.372
0.050
6.314
2.920
2.353
2.132
2.015
1.943
1.895
1.860
1.833
1.812
0.025
12.706
4.303
3.182
2.776
2.571
2.447
2.365
2.306
2.262
2.228
0.010
31.821
6.965
4.541
3.747
3.365
3.143
2.998
2.896
2.821
2.764
0.005
63.657
9.925
5.841
4.604
4.032
3.707
3.499
3.355
3.250
3.169
0.001
318.309
22.327
10.215
7.173
5.893
5.208
4.785
4.501
4.297
4.144
0.0005
636.619
31.599
12.924
8.610
6.869
5.959
5.408
5.041
4.781
4.587
上側 2.5% 点は赤
上側 5% 点は青
H. Hara (Niigata U.)
母平均の仮説検定 (1)
Dec 17, 2014
23 / 24
Excel によるパーセント 点の計算
エクセルでも上側 100 · α パーセント 点の計算が
可能
t 分布の場合は “ = tinv(2α, 自由度)”
χ2 分布の場合は “ = chiinv(α, 自由度)”
自由度 15 の t 分布の上側 2.5 % 点なら
= tinv(0.05, 15)
t 分布の場合, パーセント の引数が 2α と
なっていることに注意
H. Hara (Niigata U.)
母平均の仮説検定 (1)
Dec 17, 2014
24 / 24