モジュール1のまとめ

統計学
西 山
【まとめ】サンプル平均について
平均がμ、分散がσ2 である集団から無作為に取り出した n 個のデータを X 1 , X 2 , X n と
し、データから求められる標本平均を X とおく。このとき、 X の標本分布の平均と分散は
それぞれ
E X   
V X  
2
n
第3章の定理8が
基本じゃが、
ここまで
定理10までは落
5/28
とせんな
となる。
合計値は平均値×個数
分布の形は常に
正規分布
<中心極限定理>
<ルートNの法則>とは?
1個ずつにわけて値を確認すると、平均がμ、標準偏差がσ
N個のサンプルをとると
合計値
ゲタの公式
期待値  N  
標準偏差  N  
平均値=合計÷N
期待値  
標準偏差 

N
例題【1】40回の平均値
サイコロを40回振って出る目の数の平
均値は、最大でいくらまでを考えておけ
ばよいか?
確率的に意味のないことを答えても駄目
(無意味な例)最大は6じゃないだろうか
平均値=合計値÷40
1000回の実験結果をみる
正規分布が
あてはまる!
標本平均の分布
350
300
250
200
150
100
50
0
<サンプル誤差>ともいいます
定理8から
サンプルの数は?
母集団の特徴
データはどんな値か?
E X   3.5
V  X   2.92
SD X   1.71
E  X   3.5
2.92
V X  
 0.073
40
1.71
SD X   0.073 
 0.27
40
加えて、分布は正規分布を当てはめてよい
練習問題【1】
日本人の体重分布には正規分布N(55,225)が
当てはまっているとする。11人のサンプルをとる
として・・・
1.サンプル平均の値が60Kg以上になるのは、
どの位の確率ですか?
2. サンプル平均の値が50Kg台になるのは、
どの位の確率ですか?
解答(1)のみ;
母集団の特徴: 平均=55Kg、標準偏差=15Kg
11個のサンプル平均
EX     55Kg
SD X  

15

 4.52 Kg
N
11
 X  55 60  55 
P X  60  P

  PZ  1.11
4.52 
 4.52
練習問題【2】<合計の問題>
旅客機利用客の体重は、全体として平均55Kg、標準
偏差10Kgで正規分布していると言われる。では、定
員400人が満席の時の旅客総ウェイトの最大値をいく
らと見込むとよいか?
次回この問題から
6/11
合計値と平均値
は本質的に同じ問
題
総ウェイト= 400 
(400人の平均体重 )
今回の標本分布
母集団
どんな400人が
多いか
定理8―母集団の確認から
  55
  10
2
2
正規分布の
3シグマの法則
400人がサンプル
E  X   55
100
V X  
 0.25
400
10
SD X  
 0.5
400
平均56.5Kgを
超えないはず!
合計は
22600Kg
-5
3.
53
.83 83
-5
4.
54
.14 14
-5
4.
54
.44 44
-5
4.
54
.75 75
-5
5.0
55
5
.05
-5
5.
55
.35 35
-5
5.
55
.66 66
-5
5.
55
.96 96
-5
6.
56
.26 26
-5
6.5
7
53
.53
解答 400人の平均体重では
コンピューター実験で解答しましょう・・・400人のデータ抽出を1000回反
復
標本平均の分布
250
200
150
100
50
0
最大値
最小値
平均値
分散
56.56709
53.53117
55.00031
0.256368
合計を直接予測する<ルートN法則>
1人ずつを見ると、平均55Kg、標準偏差10Kg
400人の合計は?
平均値=400  55  22000
標準偏差  400 10  200
正規分布を当てはめて、最大22000+3×200、22600Kgまで