労働経済学 B 標本平均の分布と母平均の区間推定 【定理 0】X 1,X2,X3

労働経済学 B 標本平均の分布と母平均の区間推定
【定理 0】X1 , X 2 , X 3 ⋯ , X n を,平均μ,分散σ2 の母集団から無作為に取り出された n 個の標本とする。このとき,
σ2
標本平均の期待値はμ,分散は n となる。
【定理 1】正規母集団の標本平均の分布
X1 , X 2 , X 3 ⋯ , X nを,N(μ, σ2 )の母集団から無作為に取り出されたサイズ n の標本とする。
2
̅の分布は,平均μ,分散σ の正規分布となる。
このとき,標本平均X
n
2
1
σ
標本平均 ̅
X = ∑ni=1 X i ~N(μ, )
n
n
̅の標準化変量は,
したがって,標本平均X
標準化変量 z =
̅ −μ
X
σ/√n
~N(0,1)
(例)日本の男子大学生の身長は,平均 170cm,標準偏差 10cm の正規分布であるとする。いま,男子大学生を
無作為に 100 人選んで身長を計測する。このとき,100 人の平均身長の分布は,
̅~N(170,102 /100) → X
̅~N(170,1)
X
100 人の平均身長が 172cm よりも高くなる確率は,
̅ > 172) = P (z >
P(X
172 − 170
) = P(z > 2) = 0.023
1
標本のサイズが 16 人であれば,16 人の平均身長の分布は,
̅
X~N(170,102 /16) → ̅
X~N(170,2.52 )
16 人の平均身長が 172cm よりも高くなる確率は,
̅ > 172) = P (z >
P(X
172 − 170
) = P(z > 0.8) = 0.212
2.5
【標本平均の区間推定】いま,母集団は正規分布で,分散σ2 はわかっているものとする。
標本平均の分布は,
̅~N (μ,
X
σ2
)
n
その標準化変量
z=
̅
X−μ
σ/√n
労働経済学 B 標本平均の分布と母平均の区間推定
の分布は,N(0,1)なので,標準正規分布表から,
Pr (− 1.96 <
̅
X−μ
σ/√n
< 1.96) = 0.95
この式を書き直すと,
̅ − 1.96
Pr (X
̅ − 1.96
したがって,母平均μが,X
σ
√n
σ
̅ + 1.96
<μ<X
√n
̅ + 1.96
~ X
σ
√n
σ
) = 0.95
√n
の区間にある確率は 95%となる。
このような区間を母平均μの 95%信頼区間といい,信頼区間を求めることを区間推定という。
(例)日本の男子大学生の身長は,標準偏差 10cm の正規分布であることがわかっているが,平均身長はわから
ないとする。いま,男子大学生を無作為に 16 人選んで身長を計測したところ, 16 人の平均身長は 170cm であ
った。このとき,日本の男子大学生全体の平均身長の 95%信頼区間は,
10
Pr (170 − 1.96 ×
√16
< μ < 170 + 1.96 ×
10
√16
) = 0.95
→ Pr(165.1 < μ < 174.9) = 0.95
→
95%信頼区間は 165.1~174.9
90%,99%信頼区間は,それぞれ,
10
Pr (170 − 1.645 ×
< μ < 170 + 1.645 ×
√16
Pr (170 − 2.576 ×
10
√16
< μ < 170 + 2.576 ×
10
) = 0.90 → 90%信頼区間は,165.8875~174.1125
√16
10
√16
) = 0.99 → 99%信頼区間は,163.56~176.44
標本サイズを 100 人に増加させたとき,90%,95%,99%信頼区間は,それぞれ,
10
Pr (170 − 1.645 ×
Pr (170 − 1.96 ×
√100
10
√100
Pr (170 − 2.576 ×
< μ < 170 + 1.645 ×
< μ < 170 + 1.96 ×
10
√100
10
√100
10
√100
< μ < 170 + 2.576 ×
) = 0.90 → 90%信頼区間は,168.355~171.645
) = 0.95
10
√100
→
95%信頼区間は,168.04~171.96
) = 0.99 → 99%信頼区間は,167.424~172.576
労働経済学 B 標本平均の分布と母平均の区間推定
【定理 2】母集団は正規分布で,分散σ2 はわからないとする。このとき,標本から以下の式で標本分散を計算す
る(通常の分散と違って,n―1 で割っていることに注意)。
S2 =
1
∑(X i − ̅
X)2
n−1
i
このとき,
T=
̅−μ
X
S
は自由度 n―1 の t 分布にしたがう。
【定理 3】中心極限定理
S2
母集団がどのような分布であっても(正規分布でなくても),n が十分に大きければ,標本平均の分布はN(μ, n )
で近似することができる。
→母集団のどのような分布でも(分布が正規分布でなくても),標本が十分に大きければ母平均の区間推定を行
うことができる。
(例)
ある市において家計の平均収入を知るために,
無作為に抽出した 2,500 世帯に対して調査を行ったところ,
標本平均は 400 万円,標準偏差は 500 万円であった。このとき,この市における家計の平均収入の 95%信頼区
間は,
標本平均の分布は近似的に N(400,
Pr (400 − 1.96 ×
500
√2500
5002
2500
) であるから,
< μ < 400 + 1.96 ×
500
√2500
) = 0.95
→
95%信頼区間は,380.4 万円~419.6 万円