モジュール1のまとめ

数理統計学
西 山
第3章前半のポイント
サンプル平均値の確率分布《定理8》
平均がμ、分散がσ2 である集団から無作為に取り出した n 個のデータを X 1 , X 2 , X n と
し、データから求められる標本平均を X とおく。このとき、 X の標本分布の平均と分散は
それぞれ
EX   
2
V X  
n
教科書106頁
となる。
常に、正規分布する
定理10<中心極限定理> 112頁
復習問題【1】
統計学の定期試験の得点分布は、正規分布
N(55,152)が当てはまっている。(但し、担当教員
本人はまだそのことを知らない)ランダムに何人
かの答案を抜き出して平均点を求めてみる。設問
に答えなさい。
1. 10人の平均点が50点未満になる確率はどの
程度ありますか?
2. 25人の平均点が50点未満になる確率はどの
程度ありますか?
復習問題の解答
  55
分布図を描いて
  15
2
2
50未満の面積を求める
サンプル10人
E X   55
2
225
V X  

 22.5
N
10
SDX   22.5  4.74
50  55
Z
 1.05
4.74
今日のポイント
標本分散S2の分布の特徴
散布度の測り方: もう一つ
教科書:
3.3節(119~127ページ)
特に、不偏分散は重要!
平均と分散の標本分布
ここまで
6/7
母集団は、μ=170、σ2=102、データ数は5個で反復
標本分散の分布
標本平均の分布
700
600
500
400
300
200
100
0
最大値
最小値
平均値
分散
歪み度
尖り度
25
-5
0
75
-1
00
12
515
0
17
520
0
22
525
0
27
530
0
32
535
0
37
540
0
42
545
0
47
550
0
<=
33
7.
89
正規分布でない
3.8
9-
18
3.
46
データの分散の値
18
18
0.4
6-
18
0.
02
17
7.0
2-
18
7.
59
17
3.5
9-
17
3.
15
17
0.1
5-
17
0.
72
16
6.7
2-
17
6.
28
16
3.2
8-
16
3.
85
16
9.
15
9.8
5-
15
1-
6.4
15
15
2.9
8-
15
6.
41
0
頻度
900
800
700
600
500
400
300
200
100
0
187.33
152.9773
169.9806
20.43845
0.007936
0.042042
最大値
最小値
平均値
分散
歪み度
尖り度
477.6252
0.448268
79.85362
3114.514
1.367639
2.805332
S2は母集団とバイアスあり!
式で書くと
 
ES
2
n 1 2


n
いまの例で言うと
 
ES
2
4
2
  10  80
5
データから分散を計
算すると、実際には
100でも80前後の値
になる・・・
バイアスが生じる理由
母集団です
簡単な計算で確認できます
5
 X
i 1
 170

2
i
真の偏差二乗和

 X
i 1
5
 X
i 1

 X
5
 X  X  170
i
 X   5  X  170
2
2
2
 X     X i  170  5  X  170
2
i
i
5
i 1
偽の偏差二乗和
5
2
2
i 1
2
10
2
E偏差二乗和  5 10  5 
 4 10
5
2
不偏分散の利用目的
言葉の定義どおりだと
1
2
S 
N
 X
N
i 1
 X
2
i
母集団の分散を知りたいなら
N
1
2
2
ˆ
X i  X 
 

N  1 i 1
 
E ˆ 2   2
不偏分散、と呼んで
います
【例題1】 二つの分散の違い
ランダムに5個のデータをとると
1,2,3,4,5
★ このデータの分散は
二乗偏差の合計 10
S 

2
データ 数
5
2
★ このデータはどんな分散をもつ母集団からとられたか
二乗偏差の合計 10
ˆ 

 2.5
データ 数-1
4
2
【例題2】 目の数のばらつき
さいころを5回振って、目の数の分散
を求める。この値は2.92位になるか?
1から6まで同じ割合で出るとき、分散は2.92
母集団の分散
平均二乗偏差は
4
E S    2.92  2.34
5
2
【例題3】
ある高校の1年からランダムに5名を選んで100
メートル走の記録をとると、
12.32、15.28、14.19、13.72、13.26
だった。学年全体の分散はいくら位か見当がつく
だろうか?
ヒント
X  13.754
S 2  0.964
例題【2】の解答
合計
平均
分散推定
記録(X)
12.32
15.28
14.19
13.72
13.26
68.770
13.754
偏差
-1.434
1.526
0.436
-0.034
-0.494
0.000
0.000
二乗偏差
2.056356
2.328676
0.190096
0.001156
0.244036
4.820
0.964
1.205
0.964×5÷4
です
4.820÷(5-1)