モジュール1のまとめ

数理統計学
第12回
西山
今日のポイント
• 第3章定理8の活用
• いろいろな分布、いろいろなデータで定理
8を使う
• 平均値の標本分布は、いつでも、正規分
布で決まり → 1シグマ、2シグマ、3シグ
マを活用
練習問題【1】
2号館に設置されているエレベーターの定員は11名であ
り、最大積載量は750Kgと明示されている。定員一杯の
とき、平均68.2Kgだと「乗れない!」ということになる。こ
のエレベーターの安全性について、統計上の観点にた
って、考えるところを自由に述べなさい。 但し、上のエレ
ベータに乗るかもしれない人たち(=母集団)の体重分
布は、N(55,225)としておく。
簡単のため11人満員の時の状況だけを考える
合計の分析=平均値の分析
11人の総体重=11人 11人の平均体重
E X   55
11人の平均体重は最大の
ときで
225
V X  
 20.45
55  3  411
.52  68.56
SDX   20.45  4.52
3シグマで最大値を予測しておけばよい。ないし、4シグマ。
例題【1】:0‐1データの平均値
社会全体で視聴率が30%である人気ドラ
マがある。100世帯(=100台)のTVを無作
為に選んで、視聴率調査をする場合、結果
として得られる数字は、どんな範囲におさま
るだろうか。
例題【1】の解答・・・①
30人はみて、70人は見ていないと回答するサ
0、1データの合計=
 (標本)視聴率
1の数
データの合計

X
100
例題【1】の解答・・・②
0、1データの元の分布は?
EX   0.3  
V X   0.3  0.7  0.21   2
例題【1】の解答・・・③
100個の0‐1データの平均値は?
3000回データ抽出を反復しました.
最大値: 0.45
最小値: 0.15
平均: 0.3002
分散: 2.037346e-03
標準偏差: 0.0451
この反復結果は理論どおり?
例題【1】の解答・・・④
定理8を使うと
E X     0.30

0.21
V X  

 0.0021
n
100
SDX   0.0021  0.046
2
練習問題【2】
視聴率、新聞社の行う○○支持率調査などは
、概ね1000人前後のランダム・サンプル(=無
作為標本)を対象にしています。0‐1データの
分析として、結果の正確性はどの程度保証さ
れていますか?データ数(=標本サイズ)は十
分多いと言えますか?
とりあえず1000人、
社会全体の支持率等は50%として、
平均値のばらつきを調べてください
練習問題【2】の解答・・・①
  0.5
  0.5  0.5  0.25
2
練習問題【2】の解答・・・②
E X   0.5
授業は
ここま
で
0.25
V X  
 0.00025
1000
SDX   0.016
ほぼ確実に、結果は47%から53%の範囲にはおさまる。
標本誤差は、確率95%で3%だ。
練習問題【3】
何人かの人を無作為に選び、現在の内閣を支
持するか、支持しないかを聞き、日本全体の
内閣支持率を調べる。通常含まれる誤差は、
1%以内としたい。最低、何人の人をアンケー
ト対象に含めるべきか?
練習問題【3】の解答・・・①
とりあえず
社会全体の支持率を50%
と仮定すると
  0.5
  0.25
2
アンケート対象を
N人として
E X   0 . 5
2
0.25
V X  

N
N
0.25
SDX  
N
練習問題【3】の解答・・・②
0.25
SDX  
 0.01
N
N  2500人
練習問題【3】の解答・・・③
とりあえず社会全体の比率を50%でやった。
それ以外の比率を仮定しても、
2500人をとれば十分なことは明白
答えは2500人以上