統計的検定

統計的検定
関係の有無の確認
1
正規分布とカイ二乗分布とティ分布
分布の紹介
2
正規分布の確率密度関数
f x  
 1x
exp   


2

2 



1
2




は分布の平均
2
 は分布の分散


N  ,  と表記される
2
3
問題
f x  
 1x
exp   


2

2 



1
2




平均、分散2の正規分布の確率密度
関数は上の式で与えられる。この式を
参考にして、平均 0、分散 1の正規分
布の確率密度関数を書きなさい。
4
標準正規分布
N 0,1
の確率密度関数は
 z
1
f z  
exp  
2
 2
2



で与えられる。
5
N(0,1)の確率密度関数
0.5
0.4
0.3
0.2
0.1
0.0
-4.0
-3.0
-2.0
-1.0
0.0
1.0
2.0
3.0
4.0
6
標準化

N ,
2

z
に従う確率変数 x を
x

によって線形変換すると z は、標準正規分布
N 0,1
に従う
7
カイ二乗分布
標準正規分布に従うn個の独立な確率変数z(正規偏
差)の平方和はカイ二乗分布と呼ばれる確率分布に従
う
n
   z
2
i 1
2
i

分布の形は正規偏差ziの個数により決まり、この数を
カイ二乗分布の自由度と呼んでいる
vn
8
カイ二乗分布の確率密度関数
n
2
1
  n 1  x
2 2

f  x; n  
x e 2
n
 
2

a    x e dx
a 1  x
0
9
v=1のカイ二乗分布の確率密度関数
0.3
0.2
0.1
0.0
0.0
1.0
2.0
3.0
4.0
5.0
6.0
7.0
8.0
9.0
10.0
v=1
10
v=2のカイ二乗分布の確率密度関数
0.3
0.2
0.1
0.0
0.0
1.0
2.0
3.0
4.0
5.0
6.0
7.0
8.0
9.0
10.0
v=2
11
v=3のカイ二乗分布の確率密度関数
0.3
0.2
0.1
0.0
0.0
1.0
2.0
3.0
4.0
5.0
6.0
7.0
8.0
9.0
10.0
v=3
12
v=4のカイ二乗分布の確率密度関数
0.3
0.2
0.1
0.0
0.0
1.0
2.0
3.0
4.0
5.0
6.0
7.0
8.0
9.0
10.0
v=4
13
v=5のカイ二乗分布の確率密度関数
0.3
0.2
0.1
0.0
0.0
1.0
2.0
3.0
4.0
5.0
6.0
7.0
8.0
9.0
10.0
v=5
14
v=6のカイ二乗分布の確率密度関数
0.3
0.2
0.1
0.0
0.0
1.0
2.0
3.0
4.0
5.0
6.0
7.0
8.0
9.0
10.0
v=6
15
v=7のカイ二乗分布の確率密度関数
0.3
0.2
0.1
0.0
0.0
1.0
2.0
3.0
4.0
5.0
6.0
7.0
8.0
9.0
10.0
v=7
16
v=8のカイ二乗分布の確率密度関数
0.3
0.2
0.1
0.0
0.0
1.0
2.0
3.0
4.0
5.0
6.0
7.0
8.0
9.0
10.0
v=8
17
v=9のカイ二乗分布の確率密度関数
0.3
0.2
0.1
0.0
0.0
1.0
2.0
3.0
4.0
5.0
6.0
7.0
8.0
9.0
10.0
v=9
18
v=10のカイ二乗分布の確率密度関数
0.3
0.2
0.1
0.0
0.0
1.0
2.0
3.0
4.0
5.0
6.0
7.0
8.0
9.0
10.0
v = 10
19
分布関数と分布の形
ティ分布
20
ティ分布
標準正規分布に確率変数zとこれとは独立に自由度v
のカイ二乗分布にしたがう確率変数χ2を用いてあらわ
される統計量
t
z

2
v
の標本分布はティ分布と呼ばれる。分布の形はvに
よって異なり、このvをティ分布の自由度と呼ぶ。
21
自由度 n の t 分布の確率密度関数
 n 1
n 1



2
2


t
2


1  
f t ; n  
n
n
n  
2

a    x e dx
a 1  x
0
22
n = 1の t 分布の確率密度関数
0.5
0.4
0.3
0.2
0.1
0.0
-4.0
-3.0
-2.0
-1.0
N=1
0.0
1.0
2.0
3.0
4.0
正規分布
23
n = 2 の t 分布の確率密度関数
0.5
0.4
0.3
0.2
0.1
0.0
-4.0
-3.0
-2.0
-1.0
N=2
0.0
1.0
2.0
3.0
4.0
正規分布
24
n = 3 の t 分布の確率密度関数
0.5
0.4
0.3
0.2
0.1
0.0
-4.0
-3.0
-2.0
-1.0
N=3
0.0
1.0
2.0
3.0
4.0
正規分布
25
n = 4 の t 分布の確率密度関数
0.5
0.4
0.3
0.2
0.1
0.0
-4.0
-3.0
-2.0
-1.0
N=4
0.0
1.0
2.0
3.0
4.0
正規分布
26
n = 25 の t 分布の確率密度関数
0.5
0.4
0.3
0.2
0.1
0.0
-4.0
-3.0
-2.0
-1.0
N=25
0.0
1.0
2.0
3.0
4.0
正規分布
27
n = 50 の t 分布の確率密度関数
0.5
0.4
0.3
0.2
0.1
0.0
-4.0
-3.0
-2.0
-1.0
N=50
0.0
1.0
2.0
3.0
4.0
正規分布
28
パラメータの統計的検定
推定値の統計性質
29
b の分布

E bˆ  b

ver bˆ 

n
2
 x  x 
2
i
i 1
 は誤差eの分散
2
30
推定された b を標準化
bˆ  b
z

n
2
 x  x 
i 1
これによりzは
2
i
z~N 0,1
31
 2 の推定値
 は未知なので
2
1
2
 yi  yˆ i 
s 

n2
2
で推定される。
32
b は自由度 n-2 の t 分布
bˆ  b
t
s
n
2
 x  x 
i 1
2
i
33
詳しくは参考文献へ!
「行動科学における統計解析法」
南風原 朝和 芝 祐順著
東京大学出版会
「完全独習 統計学入門」
小島寛之
ダイヤモンド社
「回帰分析」
佐和 隆光著
朝倉書店
34
仮説検定
帰無仮説
H0 : b  0
対立仮説
H1 : b  0
35
帰無仮説が真であると仮定
bˆ
t
s
n
2
 x  x 
i 1
2
i
これにより、帰無仮説が真であるときに観測結果
がおこる確率を求めることができる。
36
有意水準と臨界値
•
•
•
•
珍しさの基準は5%が多く取られる
珍しさの基準を有意水準と呼ぶ
「有意水準a = 5%」と書かれることが多い
自由度nの t 分布の両側 5%に対応する値を
臨界値と呼ぶ
• b = 0の仮説のもとの t と臨界値を比較し、珍
しいかどうかを判断する
37
a=5%の臨界値
自由度
臨界値
自由度
臨界値
自由度
臨界値
1
2
3
4
5
6
7
8
9
12.706
4.303
3.182
2.776
2.571
2.447
2.365
2.306
2.262
11
12
13
14
15
16
17
18
19
2.201
2.179
2.160
2.145
2.131
2.120
2.110
2.101
2.093
30
40
50
60
70
80
90
100
500
2.042
2.021
2.009
2.000
1.994
1.990
1.987
1.984
1.965
10
2.228
20
2.086
1000
1.962
38
臨界値を超えた場合の判断
b = 0は正しい
たまたま珍しいことが起った
b = 0は誤りで、b ≠ 0が正しい。
今回の観測は珍しいわけではない
39
t が臨界値を超えた場合
• 帰無仮説を棄却する。
• パラメータは0と有意に異なることに
なり、独立変数は従属変数に影響を
与えないとは言えない
• 転じて、独立変数は従属変数に影
響を与えるとみなされる。
40