モジュール1のまとめ

数理統計学
第19回
西 山
推定のまとめ
標準値でいくか、T値でいくか
Z
X 
2 /n
X 
T
ˆ 2 / n
T値の確率分布=T分布
自由度=データ数-1
T分布の数値表の使い方
教科書:156~158ページ
復習【1】
ある高校の1年に在学する生徒から9名を選んで100
メートル走の記録をとった.
12.32, 15.28, 14.19, 13.72, 13.26
14.08, 14.06, 11.82, 12.80 (秒)
学年平均はいくら位ですか.信頼係数は95%です.
ヒント:
データ数=9
標本平均=13.50
不偏分散=1.138
教科書158頁練習問題(2)
まずこの形で解答してください
0.950.95
 P 2.306  T  2.306
ヒント:
データ数=9
標本平均=13.50
分散推定=1.138
データ数が9だ
 P ①  T  ①
からT分布の自


X 
由度は8


 P  2.306
 X2  
2.306 


 P ①  ˆ n

①




2
ˆ 2 / n


2 

ˆ
ˆ


 2
 P X 2.306
 2  X  2.306



ˆ
ˆ


n
n

 P X  ① 
   X  ①


n
n


1
.
138
1
.
138



 P13.50  2.306
   13.50  2.306

9
9


になりますか
μについてのどんな式
P



 P12.7    14.3
全体平均=12.0秒は無理か
学年平均タイム(μ)=12.0とすると
13.50 12.0
T
 4.22
1.138 9
こんなサンプルが得られる確率は5%もない
復習【2】
ある高校の1年に在学する生徒から9名を選んで
100メートル走の記録をとった.
12.32, 15.28, 14.19, 13.72, 13.26
14.08, 14.06, 11.82, 12.80 (秒)
学年平均はいくら位ですか.信頼係数は95%です.
なお、学年全体の標準偏差は1.8秒とします.
ヒント:
データ数=9
標本平均=13.50
分散推定=1.138
教科書158頁練習問題(1)
復習【2】の解答
0.95
 P1.96  Z  1.96


X



 P 1.96 

1
.
96
2



n


2
2 




 P X 1.96
   X  1.96


n
n


2
2

1
.
8
1
.
8
 P13.5 1.96
   13.5  1.96

9
9

 P12.3    14.7




補
足
• 元の母集団の分散σ2が分かっている場合は、
標準値Z値を使っても、T値を使っても、全体
の平均μが推定できます。 ← 復習【2】
• いずれの方法でも構いません。
• T値を使う推定法は、いつでも可能です。覚え
るならこちら!
• 通常は、T値を使った推定結果のほうが、区
間が広くなってしまいます。狭い区間を選べ
ばよい。
例題【1】○○率の推定
ある人気ドラマをみたかどうかを、100人の
サンプルに対して質問したところ、40人の
人が「みた」と答えた。社会全体では、何%
程度の人がこのドラマを見ただろうか。
信頼係数は95%で答えてください。
社会全体の視聴率です
視聴率は40%なんじゃ
ないの?
社会全体の視聴率なんて、調べてない!
これが正解
ならば、推定しよう
元の母集団が先に分かっていると
みた → 1
みない → 0
社会全体では
30%がみた
100人サン
プルの視聴
率はこうなる
この母集団から視聴
率40%というサンプ
ルが出るだろうか?
サンプルの視聴率=サンプルの平均値
2シグマで割り切ればよい
0.95
 P 2  Z  2
何を標準化した?
Z
X 
 n
2
ゼロイチ分布では
平均
分散
  1 p  0 1 p  p
  p  1 p
2
例題【1】の解答①
0.95
 P 2  Z  2


X



 P  2 

2
2



n


2
2 




 P X  2 
   X  2


n
n




1
1
 P X  2   p1  p    X  2   p1  p 
n
n


例題【1】の解答②


1
1
P X  2   p1  p    X  2   p1  p 
n
n


サンプルの平均はわかる → 0.4
データ数はわかる → 100
Pは全体の視聴率だからわからない!
(1)サンプルの結果を代わりに使う → 0.4
(2)0.5を代入する → 区間をできるだけ広くとっておく
例題【1】の解答③


1
1
P X  2   p1  p    X  2   p1  p 
n
n




1
1

 P 0.40  2 
 0.4  1  0.4    0.40  2 
 0.4  1  0.4 
100
100


 P0.30    0.50
(補足1)サンプル視聴率を代入し
てよい理由
データは0か1
二乗も同じ値
1
1
2
2
2
S   X i  X   X i  X  X 1  X 
n i 1
n i 1
n
n
2
  p1  p
2
つまり、σ2の代わりに、S2を使ったこ
とになる
(補足2)もっと良い方法
要するに
p1  p
X  p  2
n
二乗して
p1 p
X  p  4 n
2
未知数pについての二次不等式になる