モジュール1のまとめ

数理統計学
西 山
第4章は<統計分析の実践>です
推定入門
 区間推定の手順は決まっている
 信頼係数とは?
 区間推定と点推定
教科書: 第4章、150~156ページ2行目ま
で
【例題】推定とは?
推定:イントロだ
け(6/14)
ある高校の1年生からランダムに5名を選ん
で100メートル走の記録をとると、
12.32、15.28、14.19、13.72、13.26
だった。学年全体の平均はいくら位か範囲を
示して答えなさい。
X  13.75
ˆ  1.205
2
点推定
誤差を無視
当分、 は元の分散と一致
していると仮定する
【例題】の解答?
学年の平均値?5人の平均値が13.75だか
ら、これに一致しているさ
推定には定石があります①
出だしが肝心です
0.95  P 2  Z  2
推定の定石②
サンプルの平均値を標準値に
直すというのは
Z
X 
 /n
2
【例題】の
解答
0.95
 P 2  Z  2
本当はちょっと不正確!
最初正しければ
みな正し!


X


 P  2 
 2 
2 /n


わかっている値
を代入
2
2 




 P   2 
 X    2


n
n


2
2 




 P X  2 
   X  2


n
n



1.205
1.205 

 P13.75  2 
   13.75  2 

5
5


 P12.77    14.73
本当はちょっと不正確
練習問題【1】
ある高校の1年生からランダムに5名を選ん
で50メートル走の記録をとると、
12.32、15.28、14.19、13.72、13.26
だった。学年全体の平均を推定しなさい.信
頼係数は90%とする。
X  13.75
ˆ  1.205
2
当分、 は元の分散と一致
していると仮定する
ヒント: まず下の形で答えて下さい
0.90
 P ①  Z  ①


X


 P  ① 
 ① 
2
 /n


 Pについてどんな計算式になりますか
0.90を信頼係数といいます
練習問題【1】の解答
0.90
 P 1.645  Z  1.645


X


 P  1.645 
 1.645
2

/n


2
2 




 P X  1.645 
   X  1.645 

n
n 


1.205
1.205 

 P13.75  1.645 
   13.75  1.645 

5
5


 P12.9    14.6
練習問題【1’】
ある高校の1年生からランダムに5名を選ん
で50メートル走の記録をとると、
12.32、15.28、14.19、13.72、13.26
だった。次の解答を完成させなさい。
X  13.75
ˆ  1.205
2
当分、 は元の分散と一致
していると仮定する
練習問題【1’】の解答
 P 1  Z  1
・
・
・
X  13.75
ˆ  1.205
2
 P    
練習問題【1’】の解答
0.68
 P 1  Z  1
・
・
・
13.26    14.24 
 P X  13.75
ˆ 2  1.205
点推定の理屈
ここまで
6/16
区間推定は、
ここをどれだけ広くとるか
2
 標準誤差
1.645

 1.205
  13.75  

1
5


0

誤差を評価しない推定を点推定といいます
練習問題【2】
ある高校の1年生からランダムに20名を選
んで100メートル走の記録をとると、
X  13.75
2
ˆ
  1.205
だった。学年全体の平均について推定し
なさい。但し、信頼係数は95%とする。
練習問題【2】の解答
0.95
 P 1.96  Z  1.96


X 
 P  1.96 
 1.96
2

/n


2
2 




 P X  1.96
   X  1.96


n
n



1.205
1.205 

 P13.75  1.96
   13.75  1.96

20
20


 P13.27    14.23
推定には手順がある
信頼係数を決める
標準誤差を求める=標準偏差
まず標準値で区間をつくる
 95%信頼区間なら、±2以内
 90%信頼区間なら、±1.65以内
標準値の定義式で置き換える
未知数μの区間に変形する
教科書:151~156ページ
区間推定のまとめ: 95%信頼区間
標準誤差
母平均 =サンプル平均  X   1.96 

n
1.96を四捨五入して2としても、推定結果はほぼ同じです
母集団の分散が分らない場合は、不偏分散を求めて、代わりに使う
サンプル数が10個未満なら、必ずT分布の数値表を見て、
1.96を修正しないといけない(次回予定)
【例題】○○率の推定
ある人気ドラマをみたかどうかを、100人の
サンプルに対して質問したところ、40人の人
が「みた」と答えた。社会全体では、何%程
度の人がこのドラマを見ただろうか。
信頼係数は95%で答えてください。
知りたいのは社会全体の視聴率です
視聴率は40%だと、
いまわかったじゃない
社会全体のことは調べてませんから、
分かりません
ゼロイチ母集団の特徴
みた → 1
みない → 0
社会全体では
30%(=0.30)がみた
本当の視聴率は
母平均(μ)のこと
ゼロイチ分布では、1の確率をPとして
平均
分散
  1 p  0  1  p   p
  p  1  p
2
100人サンプ
ルの視聴率
はこうなる
0  0 1 0
X
 サンプルの視聴率
100
サンプル平均と標準誤差を求めよ!
サンプル平均
40
 0.40
100
標準誤差

2
n

p1  p 
0.40 0.60

 0.049
n
100
母平均(μ)=0.40±2×0.049
95%信頼区間
区間推定のまとめ: 95%信頼区間
標準誤差
母平均 =サンプル平均  X   1.96 

n
1.96を四捨五入して2としても、推定結果はほぼ同じです
母集団の分散が分らない場合は
推定値を作って、代わりに使う
サンプル数が10個未満なら、必ずT分布の数値表を見て、
1.96を修正しないといけない(次回予定)
練習問題【3】
札幌地区在住者を対象に、ある人気ドラマ
をみたかどうかを、300人のサンプルに対し
て質問したところ、60人の人が「みた」と答
えた。札幌圏では、何%程度の人がこのドラ
マを見ただろうか。区間推定をしなさい。
信頼係数は95%で答えてください。
解答のポイント
サンプル平均
60
 0.20
300
サンプル誤差
2
n

p1  p 
0.20 0.80

 0.023
n
300
母平均(μ)=0.20±2×0.023
95%信頼区間