モジュール1のまとめ

数理統計学
西 山
前回までの要点
ランダムにとったサンプルの平
均値は正規分布に従います。
その正規分布の特徴は定理8に
つきます。
他方、サンプルの分散は下方バ
イアスをもっています。
第4章では不偏分散が大事です。
平均と分散の標本分布
母集団は、μ=170、σ2=102、データ数は5個で反復
標本分散の分布
標本平均の分布
700
600
500
400
300
200
100
0
最大値
最小値
平均値
分散
歪み度
尖り度
25
-5
0
75
-1
00
12
515
0
17
520
0
22
525
0
27
530
0
32
535
0
37
540
0
42
545
0
47
550
0
<=
33
7.
89
カイ二乗分布の形
3.8
9-
18
3.
46
データの分散の値
18
18
0.4
6-
18
0.
02
17
7.0
2-
18
7.
59
17
3.5
9-
17
3.
15
17
0.1
5-
17
0.
72
16
6.7
2-
17
6.
28
16
3.2
8-
16
3.
85
16
9.
15
9.8
5-
15
1-
6.4
15
15
2.9
8-
15
6.
41
0
頻度
900
800
700
600
500
400
300
200
100
0
187.33
152.9773
169.9806
20.43845
0.007936
0.042042
最大値
最小値
平均値
分散
歪み度
尖り度
477.6252
0.448268
79.85362
3114.514
1.367639
2.805332
S2は母集団分散に対してバイアスあり!
式で書くと
 
ES
2
n 1 2


n
いまの例で言うと
 
ES
2
4
2
  10  80
5
データから分散を計
算すると、実際には
100でも80前後の値
になる・・・
バイアスが生じる理由
母集団です
簡単な計算で確認できます
5
 X
i 1
 170

2
i
真の偏差二乗和

 X
i 1
5
 X
i 1

 X
5
 X  X  170
i
 X   5  X  170
2
2
2
 X     X i  170  5  X  170
2
i
i
5
i 1
偽の偏差二乗和
5
2
2
i 1
2
10
2
E偏差二乗和  5 10  5 
 4 10
5
2
不偏分散の利用目的
教科書127ページ
言葉の定義どおりだと
1
2
S 
N
 X
N
i 1
 X
2
i
母集団の分散を知りたいなら
N
1
2
2
ˆ
X i  X 
 

N  1 i 1
 
E ˆ 2   2
不偏分散、と呼んで
います
【例題1】 二つの分散の違い
ランダムに5個のデータをとると
1,2,3,4,5
★ このデータの分散は
二乗偏差の合計 10
S 

2
データ 数
5
2
★ このデータはどんな分散をもつ母集団からとられたか
二乗偏差の合計 10
ˆ 

 2.5
データ 数-1
4
2
「カイ二乗」の意味とイメージ
2個のサイコロを振って出た目を
二乗する
2
6
二乗の合計に着目します
22+62 = 40
自由度は2
カイ二乗値の定義
2枚の札をとりだします。それから
二乗して加えます。
Z Z
2
1
0.2
2
2
ー0.7
0.22+(-0.7)2 = 0.53
自由度が2のカイ二乗値
カイ二乗値の確率分布 → カイ二乗分布
ここまで
6/9
 
V    2 自由度
E  自由度
2
何個の二乗を足す
かによります
2
Karl Pearson
カイ二乗値
Kは自由度。教科書123頁
その他の正規分布ではどうするか
2個のサンプルをとりだします。そ
れから標準化して二乗和をとりま
す。
平均: μ=170
標準偏差: σ=10
1
 X  170   X  170 
  X  170

 
 
 10   10  100
2
2
2
1
2
2
i 1
2個のZの二乗和
自由度が2のカイ二乗値
i
カイ二乗分布応用の鍵:定理14
平均値にとっての定理8に該当
母集団
(正規)
サンプル:
μ=170
σ2=100
X1, X 2, ..., X n
Z2が1個少ない
1 n
2
X i  X 

100 i 1
  n21
教科書124~125頁
μ=170
前にやった計算です・・・①
n
 X
i 1
 
2
i
σ2=100
データをn個とって、真の偏差二乗和
2
  X i  X  X   
n
i 1
2
   X i  X   2 X i  X X     n X   
n
n
i 1
2
i 1
2
ゼロになります
   X i  X   n X   
n
2
i 1

 X
2
n
i 1
i
2
 X     X i     n X   
n
i 1
2
これが大事
μ=170
前のつづき
1

2
 X
2
n
i 1
σ2=100
i
X 
Xi  

1

2
 X
i 1
i
  
n

2
X   
2
は標準値 Zになっている
 X  




X



 2 n 
2


n
2
n
2
2
 これも1個の標準値
Z2の個数はn個でなく、n-1個になる → 自由度n-1のカイ二乗
サンプル分散S2の期待値と分散は?
S
μ=170
2
1
2
  X i  X 
n i 1
n
σ2=100
標準値でみる
2 1 n
2 平均の分布
X i  X 

2 
n  i 1
カイ二乗値でみる
2 n
分散の分布
2

X X




n
i
i 1

2
n
 n21

教科書126~127頁
【実力問題】前のスライドを参考に次の
問に答えなさい
サンプル分散S2の期待値を求めてください。
 
ES
2
サンプル分散S2の分散を求めてください。
 
VS
2
教科書126~127ページ