パワーポイント12

数理統計学
西 山
前回のポイント<定理8>
1.
データ(サンプル)の合計値
正規分布をあてはめる
 ルートNをかけて標準偏差を求める

2.
データ(サンプル)の平均値(合計も)
正規分布を当てはめる(定理10)
 定理8がポイント

定理8「ばらつきルートNの法則」
データの特徴は、平均がμ、標準偏差がσ
N個のサンプルをとると
教科書では省略
合計値
期待値  N  
標準偏差  N  
平均値
期待値  
標準偏差 

N
正規分布を当てはめる! << 中心極限定理(データは30~100個以上が目安)
クイズ
1.
2.
正しいサイコロを100回振るときに出る目の数
の平均値はどのくらいになりますか?1シグマで
予想してください。
日本人の身長分布はN(170,100)とする。無作
為に10人をとって平均身長を求める。10人の平
均は何センチ位になりますか。1シグマで予想し
てください。
実験結果(1万回)
10回の平均値、ほか40回、100回
不偏性
> sd(jikken10)
[1] 0.5417527
> sd(jikken40)
[1] 0.2716625
> sd(jikken100)
[1] 0.1702467
解答 ― (1)のみ
目の出方
平
均
の
出
方
母集団はサイコロ
EX   3.5
V X   2.92
E X   3.5
2.92
V X  
 0.0292
100
1.71
SDX  
 0.17
100
練習問題【1】
日本人の体重分布には正規分布N(55,225)が
当てはまっているとする。11人のサンプルをとる
として・・・
1. サンプル平均の値が60Kg以上になるのは、
どの位の確率ですか?
2. サンプル平均の値が50Kg台になるのは、
どの位の確率ですか?
解答(1)のみ; (2)はどこかで出題
母集団の特徴: 平均=55Kg、標準偏差=15Kg
11個のサンプル平均
(µ)
(σ)
EX     55Kg

15
SD X  
N

11
 4.52 Kg
 X  55 60  55 
P X  60  P

  PZ  1.11
4.52 
 4.52
練習問題【2】<合計の問題>
旅客機利用客の体重は、全体として平均55Kg、標準
偏差10Kgで正規分布していると言われる。では、定
員400人が満席の時の旅客総ウェイトの最大値をいく
らと見込むとよいか?
合計値と平均値
は本質的に同じ問
題
総ウェイト= 400 
(400人の平均体重 )
定理8―母集団の確認から
  55
  10
2
2
正規分布の
3シグマの法則
400人がサンプル
E  X   55
100
V X  
 0.25
400
10
SD X  
 0.5
400
平均56.5Kgを超
えないはず!
合計は
22600Kg
合計にも<ルートN法則>
1人ずつを見ると、平均55Kg、標準偏差10Kg
400人の合計は?
平均値=400  55  22000
標準偏差  400 10  200
正規分布を当てはめて、最大22000+3×200、22600Kgまで
10年間、毎日飛んでみた
>
JIKKEN
<-
REPLICATE(3650,SUM(RNORM(400,MEAN=55,SD=10)))
小文字で
> mean(jikken); sd(jikken)
[1] 22003.49
[1] 200.3838
> max(jikken)
[1] 22613.95
400人合計(Kg)
練習問題【3】二値変数の合計
値
-10
+10
確率
0.5
0.5
1000
100回後の標準偏差?
100日目
-1000
実験結果(1万回)
100回後の合計
ほぼ正規分布
> mean(jikken4)
[1] -0.04
> sd(jikken4)
[1] 100.0514
【解答】
どんなデータか?
値
-10
+10
 0
  10
確率
0.5
0.5
結果の出方?
正規分布
E 合計  0
SD合計  100 10  100
【クイズ】
2号館に設置されているエレベーターの定員は11名であ
り、最大積載量は750Kgと明示されている。定員一杯の
とき、平均68.2Kgだと「乗れない!」ということになる。そ
んなことがあるのか?統計上の観点にたって、考えると
ころを自由に述べなさい。 但し、上のエレベータに乗る
かもしれない人たち(=母集団)の体重分布は、
N(55,225)としておく。
簡単のため11人満員の時の状況だけを考える
【解答】
合計値の分析=平均値の分析
11人の総体重=11人 11人の平均体重
E X   55
11人の平均体重は最大の
ときで
225
V X  
 20.45
55  3  411
.52  68.56
SDX   20.45  4.52
3シグマで最大値を予測しておけばよい。ないし、4シグマ。