確率・統計Ⅰ

確率・統計Ⅱ
第3回
区間推定(1)
1. 区間推定とは
2. 母平均の推定(母分散既知)
3. 母平均の推定(母分散未知)
区間推定とは
推定したい母数が確率γで含まれる
(確率的な)区間を求め、その確率的
区間に統計量の実現値を代入して、
母数が確率γで含まれる区間 (a, b)を
ひとつ定めること
γを信頼水準(信頼度)、
(a, b) を信頼区間という。
区間推定の手順
1. 信頼水準γを定める。( 0.90, 0.95, 0.99 等)
2. 計算でき(てい)る確率分布を用いて、
P(c1≦推定したい母数θを含む統計量≦c2)=γ と
なる c1, c2 を求める。
3.
c1≦θを含む統計量の実現値≦c2
変形して、a≦θ≦b とする。
を
4. (a, b) が信頼水準γの信頼区間(の
ひとつの例)。
「パーセント点」の定義
0.4
0.3
0.2
0.1
α%
β%
-3
-2
-1
左側β%点
(右側100-β%点)
1
2
3
右側α%点
(左側100-α%点)
x
標準正規分布のパーセント点
左側2.5%点
右側2.5%点
左側0.5%点
 2.58  1.96
右側0.5%点
1
0
0.95
0.99
1
 1.96
 2.58
標準正規分布のパーセント点
標準正規分布の右側α%点を zα/100 と書くことにする。
信頼水準90%
右側5%点
z0.05 = 1.65
信頼水準95%
右側2.5%点
z0.025 = 1.96
信頼水準99%
右側0.5%点
z0.005 = 2.58
区間推定(1)
1. 区間推定とは
2. 母平均の推定(母分散既知)
3. 母平均の推定(母分散未知)
母平均の推定(母分散既知)
母平均μ, 母分散σ2 とする。
標本の大きさ n が大きい場合、
または(nが小さくても)
母集団が正規分布に従う場合
標本平均 X は正規分布に従う
N(μ, σ2 / n )
(復習)標本平均の性質
(1) E( X )   , V ( X )   n
2
(2) 母集団分布が正規分布ならば、
X も正規分布に従う 。(正規分布の性質)
(3) n が大きければ (n≧50くらい)、X は
つねに正規分布と考えてよい。(中心極限定
理)
X 
(4) (2),(3) のとき、 Z  X 
 n
標準正規分布に従う。
*
は
母平均の推定(母分散既知)
母平均μ, 母分散σ2 とする。
標本の大きさ n が大きい場合、
または(nが小さくても)
母集団が正規分布に従う場合
X 
Z
標本平均
X は正規分布に従う
は 標準正規分布
 n N(μ, σ2 / n )
に従う
母平均の推定(母分散既知)
標準正規分布の 2.5パーセント点
P( z0.025 Z  z0.025 )  0.95
(信頼水準95%の場合)


X 
 z0.025   0.95
つまり P  z0.025 
/ n






よって P X  z0.025
   X  z0.025
  0.95
n
n

X  z0.025

n
   X  z0.025

n
これに X の実現値
x を代入
母平均の推定(母分散既知)
(信頼水準95%の場合)
x  z0.025

n
   x  z0.025

n
つまり
x  1.96

n
   x  1.96

n
(再確認)
標準正規分布のパーセント点
信頼水準90%
左側5%点
z0.05 = 1.65
信頼水準95%
左側2.5%点
z0.025 = 1.96
信頼水準99%
左側0.5%点
z0.005 = 2.58
[例題]母平均の推定(母分散既知)
[1] 約8000世帯の収入の平均を調べた
ところ、703万円であった。
母分散σ2は判っていて、σ=410万円
とする。
このデータから、母平均μ(全世帯の
平均収入)の95%信頼区間を求めよ。
[例題]母平均の推定(母分散既知)
8000世帯の標本平均が703(万円)、
母集団の標準偏差が410(万円)だか
ら、
n  8000, x  703,   410
したがって母平均μの95%信頼区間の
上限・下限は、
[例題]母平均の推定(母分散既知)
下限 = x  z0.025

410
 703 1.96
n
8000
 703  8.98  694 .0
上限 = x  z0.025

410
 703 1.96
n
8000
 703  8.98  712 .0
[演習]正規分布を用いた推定
[1] あるマンモス大学の受験生の得点分布
は、昨年のデータから標準偏差4点と考え
られる。この受験生の母集団から大きさ36
の標本をとったところ、標本平均は60点で
あった。
全体の平均点を95%の信頼率で推定せよ。
区間推定(1)
1. 区間推定とは
2. 母平均の推定(母分散既知)
3. 母平均の推定(母分散未知)
母平均の推定(母分散未知)
母平均μ, 母分散σ2 とする。
① 標本の大きさ n が大きい場合
② (nが小さくても)母集団が正規分布に従う場合
標本平均 X は正規分布に従う
N(μ, σ2 / n )
母平均の推定(母分散未知)
① 標本の大きさ n が大きい場合
母分散σ2 を標本分散 S2 (の実現値
s2 )で代用する。 (点推定)
★大数の法則により S2 → E(S2)=σ2 (n→∞) だ
から、n が大きければ悪くない
[例題]母平均の推定(母分散未知、大標本)
[2] 約8000世帯の収入の平均と標準偏
差を調べたところ、それぞれ703万円、
410万円であった。
このデータから、母平均μ(全世帯の
平均収入)の95%信頼区間を求めよ。
[例題]母平均の推定(母分散未知、大標本)
8000世帯の平均収入が703(万円)、
標準偏差が410(万円)だから、
n  8000, x  703, s  410
したがって母平均μの95%信頼区間の
上限・下限は、
[例題]母平均の推定(母分散未知、大標本)
下限 = x  z0.025
s
410
 703 1.96
n
8000
 703  8.98  694 .0
上限 = x  z0.025
s
410
 703 1.96
n
8000
 703  8.98  712 .0
母平均の推定(母分散未知)
母平均μ, 母分散σ2 とする。
① 標本の大きさ n が大きい場合
② (nが小さくても)母集団が正規分布に従う場合
標本平均 X は正規分布に従う
N(μ, σ2 / n )
母平均の推定(母分散未知)
② 母集団が正規分布に従う場合
σ2 の代わりに s2 を用い、
次の定理によって、
正規分布の代わりに t 分布を用いる。
【定理】
X 
t
S n
は 自由度 n-1の t 分布に従う
t 分布の式とグラフ
t 分布 (自由度 n=1 )
0.45
0.4
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
-4.0
 n 1
n 1


2  2
x 
2  

1 

f ( x) 
n
n 
n  
 2
標準正規分布
-3.0
-2.0
-1.0
0.0
1.0
2.0
3.0
4.0
t 分布のグラフ
t 分布 (自由度 n=5 )
n が大きくなると、t 分布は標準正規分布に近づく。
0.45
0.4
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
-4.0
標準正規分布
-3.0
-2.0
-1.0
0.0
1.0
2.0
3.0
4.0
t 分布のパーセント点
t 分布の右側α%点を tα/100 と書くことにする。
信頼水準90%
右側5%点
t0.05 = ?
信頼水準95%
右側2.5%点
t0.025 = ?
信頼水準99%
右側0.5%点
t0.005 = ?
【注】 n に依存する
t 分布のパーセント点
0.025
t
0.005
1
2
3
4
5
6
7
8
9
6.314
2.920
2.353
2.132
2.015
1.943
1.895
1.860
1.833
12.706
4.303
3.182
2.776
2.571
2.447
2.365
2.306
2.262
63.657
9.925
5.841
4.604
4.032
3.707
3.499
3.355
3.250
…
t
…
0.05
…
t
…
自由度 n
母平均の推定(母分散未知)
② 母集団が正規分布に従う場合
σ2 の代わりに s2 を用い、
次の定理によって、
正規分布の代わりに t 分布を用いる。
【定理】
X 
t
S n
は 自由度 n-1の t 分布に従う
母平均の推定(母分散未知)
② 母集団が正規分布に従う場合
つまり
(標本の大きさ n 、信頼水準95%の場合)
x  t0.025
s
s
   x  t0.025
n
n
標本分散 の実現値
自由度 n-1 の t 分布の 2.5パーセント点
[例題]母平均の推定(母分散未知、小標本)
[3] 10世帯の収入の平均と標準偏差を
調べたところ、それぞれ703万円、15
万円であった。
このデータを正規母集団 N(μ,σ2) から
の無作為標本と考えて、母平均μの
95%信頼区間を求めよ。
[例題]母平均の推定(母分散未知、小標本)
10世帯の平均収入が703(万円)、標
準偏差が15(万円)だから、
n  10, x  703, s  15
したがって母平均μの95%信頼区間の上
限・下限は、
(自由度 9 の t 分布の2.5%点を用いて)
t 分布のパーセント点
0.025
t
0.005
1
2
3
4
5
6
7
8
9
6.314
2.920
2.353
2.132
2.015
1.943
1.895
1.860
1.833
12.706
4.303
3.182
2.776
2.571
2.447
2.365
2.306
2.262
63.657
9.925
5.841
4.604
4.032
3.707
3.499
3.355
3.250
…
t
…
0.05
…
t
…
自由度 n
[例題]母平均の推定(母分散未知、小標本)
下限 = x  t0.025
s
n
自由度 9
上限 = x  t0.025
15
 703 2.26
10
 703  10.72  692 .3
s
n
15
 703 2.26
10
 703  10.72  713 .7
[演習] t 分布を用いた推定
[1] 正規分布に従う母集団から、次のデータ
が得られた。
12, 14, 14, 9, 10, 12, 11, 13, 10, 15
母平均μの95%信頼区間を求めよ。
メニューに戻る
メニューへ