数理統計学第11回 - 国立大学法人 小樽商科大学

数理統計学
西 山
前回のポイント<ルートNの法則>
1.
データ(サンプル)の合計値


2.
正規分布をあてはめる
ルートNをかけて標準偏差を求める
データ(サンプル)の平均値



正規分布を当てはめる
定理8がポイント
ルートNで割って標準偏差を求める
【まとめ】<ルートNの法則>とは?
1個ずつにわけてデータの特徴を確認すると、平均がμ、標準偏差がσ
N個のサンプルをとると
合計値
期待値  N  
標準偏差  N  
平均値
期待値  
標準偏差 

N
正規分布を当てはめる! << 中心極限定理(データは30~100個以上が目安)
クイズ
1.
2.
正しいサイコロを100回振るときに出る目の数の
平均値はどのくらいになりますか?1シグマで予
想してください。
日本人の身長分布はN(170,100)とする。無作
為に10人をとって平均身長を求める。10人の平
均は何センチ位になりますか。1シグマで予想し
てください。
解答 ― (1)のみ
母集団はサイコロ
E X   3.5
V X   2.92
E  X   3.5サンプル数は15個
2.92
V X  
 0.0292
100
1.71
SD X  
 0.017
100
練習問題【1】
日本人の体重分布には正規分布N(55,225)が
当てはまっているとする。11人のサンプルをとる
として・・・
1. サンプル平均の値が60Kg以上になるのは、
どの位の確率ですか?
2. サンプル平均の値が50Kg台になるのは、
どの位の確率ですか?
解答(1)のみ; (2)はどこかで出題
母集団の特徴: 平均=55Kg、標準偏差=15Kg
11個のサンプル平均
EX     55Kg
SD X  

15

 4.52 Kg
N
11
 X  55 60  55 
P X  60  P

  PZ  1.11
4.52 
 4.52
練習問題【2】<合計の問題>
旅客機利用客の体重は、全体として平均55Kg、標準
偏差10Kgで正規分布していると言われる。では、定
員400人が満席の時の旅客総ウェイトの最大値をいく
らと見込むとよいか?
合計値と平均値
は本質的に同じ問
題
総ウェイト= 400 
(400人の平均体重 )
今回の標本分布
母集団
どんな400人が
多いか
定理8―母集団の確認から
  55
  10
2
2
正規分布の
3シグマの法則
400人がサンプル
E  X   55
100
V X  
 0.25
400
10
SD X  
 0.5
400
平均56.5Kgを超
えないはず!
合計は
22600Kg
-5
3.
53
.83 83
-5
4.
54
.14 14
-5
4.
54
.44 44
-5
4.
54
.75 75
-5
5.0
55
5
.05
-5
5.
55
.35 35
-5
5.
55
.66 66
-5
5.
55
.96 96
-5
6.
56
.26 26
-5
6.5
7
53
.53
解答 400人の平均体重では
コンピューター実験で解答しましょう・・・400人のデータ抽出を1000回反復
標本平均の分布
250
200
150
100
50
0
最大値
最小値
平均値
分散
56.56709
53.53117
55.00031
0.256368
合計を直接予測する<ルートN法則>
1人ずつを見ると、平均55Kg、標準偏差10Kg
ここまで
5月26日
400人の合計は?
平均値=400  55  22000
標準偏差  400 10  200
正規分布を当てはめて、最大22000+3×200、22600Kgまで
練習問題【3】
2号館に設置されているエレベーターの定員は11名であ
り、最大積載量は750Kgと明示されている。定員一杯の
とき、平均68.2Kgだと「乗れない!」ということになる。そ
んなことがあるのか?統計上の観点にたって、考えると
ころを自由に述べなさい。 但し、上のエレベータに乗る
かもしれない人たち(=母集団)の体重分布は、
N(55,225)としておく。
簡単のため11人満員の時の状況だけを考える
【解答】
合計値の分析=平均値の分析
11人の総体重=11人 11人の平均体重
EX   55
11人の平均体重は最大の
ときで
225
V X  
 20.45
55  3  411
.52  68.56
SDX   20.45  4.52
3シグマで最大値を予測しておけばよい。ないし、4シグマ。