モジュール1のまとめ

数理統計学
第13回
西山
第3章前半のまとめ
平均値の標本分布《定理8》(くりかえし)
平均がμ、分散がσ2 である集団から無作為に取り出した n 個のデータを X 1 , X 2 , X n と
し、データから求められる標本平均を X とおく。このとき、 X の標本分布の平均と分散は
それぞれ
EX   
2
V X  
n
となる。
特にこちら
この科目最大の
ポイントです
教科書106ページ
前回の復習問題
何人かの人を無作為に選び、現在の内閣を支
持するか、支持しないかを聞き、日本全体の
内閣支持率を調べる。通常含まれる誤差は、
1%以内としたい。最低、何人の人をアンケー
ト対象に含めるべきか?
復習問題の解答・・・①
とりあえず
社会全体の支持率を50%
と仮定すると
  0.5
  0.25
2
アンケート対象を
N人として
EX   0.5
2
0.25
V X  

N
N
0.25
SDX  
N
復習問題の解答・・・②
0.25
SDX  
 0.01
N
N  2500 人
復習問題の解答・・・③
とりあえず社会全体の比率を50%でやった。
それ以外の比率を仮定しても、
2500人をとれば十分なことは明白
答えは2500人以上
練習問題【1】
ある乗用車のブレーキは時速40Kmから急ブレーキをかけ
てから40メートルで停止するように決められている.ただ踏
み込む時の強さなどから停止距離にはバラツキがあり、そ
の標準偏差は1メートルとおいてよい.いま10回反復してブ
レーキのテストを行うと、10回の停止距離の平均値はどの
程度の値になるか.1シグマ区間で解答しなさい.
練習問題【2】
正しいサイコロを20回振るときに出る目の数の平
均値は、確率的に考えて、どの位まで大きくなると
考えておけばよいか?
ヒント
μ=3.5
σ2=2.92
統計量とはデータの結果
• いくつかのデータの結果を統計量と言いま
す.代表例は平均値と分散、標準偏差.
• 色々なサンプルがありますから、統計量は
分布で考えないといけません。この分布の
ことを標本分布と言います.
• 標本分布は、データ数およびサンプルを
とった元の集団(=母集団)の特徴により
ます。
今日のポイント
標本分散S2の分布の特徴
分散の求め方に二通りあり
(時間あれば)推定入門(第4章に入ります)
教科書: 3.3節(119~127ページ)
特に、不偏分散は重要!
平均と分散の標本分布
指定した値はμ=170、σ2=102、データ数は5個で反復
標本分散の分布
標本平均の分布
187.33
152.9773
169.9806
20.43845
0.007936
0.042042
<=
33
7.
89
18
9-
3.8
18
3.
46
データの分散の値
18
18
0.4
6-
0.
02
18
2-
7.0
17
9-
17
7.
59
17
3.5
17
3.
15
17
0.1
5-
0.
72
17
2-
6.7
16
8-
16
6.
28
16
3.2
16
3.
85
15
9.8
5-
9.
41
15
6.
1-
15
6.4
815
2.9
15
最大値
最小値
平均値
分散
歪み度
尖り度
25
-5
0
75
-1
00
12
515
0
17
520
0
22
525
0
27
530
0
32
535
0
37
540
0
42
545
0
47
550
0
700
600
500
400
300
200
100
0
0
頻度
900
800
700
600
500
400
300
200
100
0
最大値
最小値
平均値
分散
歪み度
尖り度
477.6252
0.448268
79.85362
3114.514
1.367639
2.805332
S2は傾向として小さめ!
式で書くと
 
ES
2
n 1 2


n
いまの例で言うと
 
ES
2
4
  10 2  80
5
126-127頁に示
されてますが、カ
イ二乗分布の話
は割愛します
データから分散を
計算すると、実際
には100でも80前
後の値になる・・・
分散の計算に二通りあり
言葉の定義どおりだと
1
2
S 
N
 X
N
i 1
 X
2
i
元の分散を知りたいなら
N
1
2
2
ˆ
X i  X 
 

N  1 i 1
 
E ˆ 2   2
不偏分散、と呼んで
います
【例題1】 二つの分散の違い
ランダムに5個のデータをとると
1,2,3,4,5
★ このデータの分散は
二乗偏差の合計 10
S 

2
データ 数
5
2
★ このデータはどんな分散をもつ集団からとられたか
ˆ 2 
二乗偏差の合計 10

 2.5
データ 数-1
4
【例題2】不偏分散の使いみち?
ある高校の1年からランダムに5名を選んで
100メートル走の記録をとると、
12.32、15.28、14.19、13.72、13.26
だった。学年全体の分散はいくら位か見当
がつくだろうか?
ヒント
X  13.754
S 2  0.964
例題【1】の解答
合計
平均
分散推定
記録(X)
12.32
15.28
14.19
13.72
13.26
68.770
13.754
偏差
-1.434
1.526
0.436
-0.034
-0.494
0.000
0.000
二乗偏差
2.056356
2.328676
0.190096
0.001156
0.244036
4.820
0.964
これはS2だか
ら小さめのは
ず!
1.205
0.964×5÷
4じゃ
4.820÷(5-1)