モジュール1のまとめ

統計学
第9回
西 山
第8回目のポイント
標本分散S2は元の母分散σ2に比べて小
さくなる傾向がある(下方バイアス).
不偏分散≒母集団の分散
1
2
X i  X 
ˆ 

N  1 i 1
N
2
シグマハット
教科書: 127頁、3‐15式
今日のポイント
 サンプル平均の確率法則を復習します。
 第4章へ進みます。推定入門。
 第3章のT分布については、後で戻ります。
例題【1】合計値に関する問題
旅客機利用客の体重は、全体として平均55Kg、標準
偏差10Kgで正規分布していると言われる。では、定
員400人が満席の時の旅客総ウェイトの最大値をいく
らと見込むとよいか?
これは平均値の
確率法則を利用
する問題
総ウェイト= 400 
(400人の平均体重 )
無作為データ
=
サイコロの目
全体を母集団
集めたデータをサンプル
と呼びます
今回の標本分布
母集団
どんな400人が
多いか
【1】の解答―実験結果
コンピューター実験で解答しましょう・・・母平均=55、母
分散=102、サンプル数=400人に設定してから、1000
回反復してサンプル平均を確認
標本平均の分布
250
200
150
100
50
53
.53
-5
3.
53
.83 83
-5
4.
54
.14 14
-5
4.
54
.44 44
-5
4.
54
.75 75
-5
5.0
55
5
.05
-5
5.
55
.35 35
-5
5.
55
.66 66
-5
5.
55
.96 96
-5
6.
56
.26 26
-5
6.5
7
0
最大値
最小値
平均値
分散
56.56709
53.53117
55.00031
0.256368
理論的な解答―母集団の確認から
  55
  10
2
2
正規分布の
3シグマの法則
400人がサンプル
E X   55
100
V X  
 0.25
400
SDX   0.5
平均56.5Kgを
超えないはず!
練習問題【1】
あるビルに設置されているエレベーターの定員は11名
であり、最大積載量は750Kgと明示されている。定員一
杯のとき、平均68.2Kgだと「乗れない!」ということにな
る。このエレベーターの安全性について、統計上の観点
にたって、考えるところを自由に述べなさい。 但し、上の
エレベータに乗るかもしれない人たち(=母集団)の体重
分布は、N(55,225)としておく。
簡単のため11人満員の時の状況だけを考える
例題【2】:0‐1データの平均値
社会全体で視聴率が30%である人気ドラマ
がある。100世帯(=100台)のTVを無作為
に選んで、視聴率調査をする場合、結果とし
て得られる数字は、どんな範囲におさまるだ
ろうか。
例題2は
スキップするかも
しれません
例題【2】の解答・・・①
30人はみて、70人は見ていないと回答するサ
みた=1、みない=0
0、1データの合計=
 (標本)視聴率
1の数
データの合計

X
100
サンプル平均の確率法則を使え
0‐1母集団と0‐1サンプル
0、1サンプルの母集団は?
視聴率は母平均μのこと
母集団の特徴
EX   0.3  
V X   0.3  0.7  0.21  
2
例題【1】の理論的な解答
母集団の分布
  0.3
  0.21
2
E X     0.30
100人

0.21
V X  

 0.0021
n 100
SDX   0.0021 0.046
2
反復実験してみると
100個の0‐1データの平均値は?
3000回データ抽出を反復しました.
最大値: 0.45
最小値: 0.15
平均: 0.3002
分散: 2.037346e-03
標準偏差: 0.0451
サンプル誤差
この反復結果が理論通りか、前のスライドを
確認しておいてください
【例題】推定への入門
ある高校の1年生からランダムに5名を選ん
で100メートル走の記録をとると、
12.32、15.28、14.19、13.72、13.26
だった。学年全体の平均はいくら位か範囲を
示して答えなさい。
X  13.75
ˆ 2  1.205
当分は元の母分散と一致
していると仮定する
【例題】の解答?
学年の平均値は13.75です。
いま調べました。
学年全体は、調べてないので、わかりません。
推定には定石があります①
統計的推測とは割り切り術
0.95  P 2  Z  2
推定の定石②
サンプルの平均値を標準値に
直すというのは
Z
X 
 /n
2
【例題】の
解答
0.95
 P 2  Z  2
本当はちょっと不正確!
最初正しければ
みな正し!


X


 P  2 
 2 
2 /n


わかっている値
を代入
2
2 




 P   2 
 X    2


n
n


2 未知数
2 




 P X  2 
   X  2


n
n

 サンプル誤差

1.205
1.205 

 P13.75  2 
   13.75  2 

5
5


 P12.77    14.73
本当はちょっと不正確
信頼係数を90%に落とすと
信頼係数
0.90  P 1.645  Z  1.645




X 


 P  1.645 
 1.645
2



n



1.205
1.205 

 P13.75  1.645
   13.75  1.645

5
5


サンプル平均
標準誤差