第1章 記述統計の復習

母平均の区間推定
(第3章 統計的推定 補足)
統計学 2008年度
母集団(個体数N)
×
×
×
標本(個体数n)
×
×
×
•
•
×
×
母平均μ
•
×
×
標本平均x
区間推定
母集団の一部として選ばれた標本の情報に基づき、母集団の特徴を推
論することが統計的推論である。
その1つに、「母平均を標本平均から推定する」ということがあるが、標本
平均が母平均にピタリと一致することはあまりなく、標本平均のまわりの
ある区間を考え、その中に母平均が含まれる(可能性が高い)という推定
をおこなう。これが区間推定である。
たとえば、日本全国全世帯の家計の平均年収を知りたいとき、1万世帯
を標本として調査し、500万円という標本平均を得たとする。この500万
円±10万円という区間をとればよいのか、±30万円という区間を取れば
よいのかを考えていく。(区間が広がれば母平均が含まれる可能性は高
くなるが、実用性に劣る)
母集団(大きさ N)
標本(大きさ n)
×
×
×
•
標本平均 x
×
×
×
×
×
×
×
×
標本平均 x
×
×
標本平均 x
×
× ×
標本調査をおこなう場合、
通常は1つの標本について
の標本平均がわかるだけで
あるが、とりうるすべての標
本について標本平均を知る
ことができたなら、その分布
を考えることができる。これ
を標本分布という。
母平均 μ
•
標本平均 x の分布の特性値は、
E( x )  
V (x) 
2
n
N n 2
N n
(正確には
であるが、 Nが十分大きい場合
 1となる。 )
N 1 n
N 1
である。
• また、正規分布の再生性および中心極限定理から x の分布は、
母集団が正規分布にしたがうとき、または正規分布にしたがうかど
うか分からなくても、nが十分に大きいときには
となる。
2
N(μ, n
) (平均μ、分散
2
の正規分布)
n
x の分布
zの分布
標準化
z
  1.96

n
x  1.96
×
μ
  1.96

n
×
x
x
 n

-1.96
0
1.96
n
x  1.96
×

n
標準正規分布にしたがう確率変
数のうち、95%は、-1.96と1.96の
間の値をとるので、 x の95%は
(   1.96

n
,   1.96

n
)
という区間内に含まれる。
このことから、
( x  1.96

n
, x  1.96

n
)
という区間(信頼区間)の95%は、
母平均μを区間内に含むといえ
母集団(個体数N)
×
×
×
標本(個体数n)
×
×
×
•
•
×
×
母平均μ
母分散σ2
•
×
×
標本平均x
区間推定
標本分散s2
標本平均 x の信頼区間の構成には、標本平均 、標本の個体数n、母
分散σ2が用いられる。
しかし、母平均がわからない状況で、母分散が分かっていることはあまり
多くない。(過去の調査において母分散のおおよその値が分かり、それを
用いるなどの例外はあるが)
そのため、母分散σ2の代わりに標本分散s2が用いた区間推定をおこなう
ことが多い。
x の分布
zの分布
標準化
z
  1.96

n
μ
  1.96
x
 n

-1.96
0
1.96
n
tの分布
母分散が分からない場合、
t
x
が自由度n-1の
s n 1
t分布にしたがう。
t統計量の95%が含まれる区
間の境界値であるt0.95の値を、
t分布表から探し出す。
変換
t
(自由度n-1のt分布)
x
s n 1
-t0.95
t0.95
母分散σ2と標本分散s2の相違点
母分散σ2は定数であるのに対し、標本分散s2は確率変数である。
ns2
2
は自由度n-1のχ2 (カイ2乗)分布にしたがう。
カイ2乗分布の密度関数
0.6
自由度1
自由度2
自由度3
自由度4
自由度5
自由度6
0.5
0.4
0.3
0.2
0.1
0
0
2
4
6
8
10
12
x の分布
tの分布
変換
t
x
s n 1
μ
-t0.95
t0.95
0
×
×
そのため、zとは異なり、tと x は1対1
対応をするわけではない。(同じ大き
さの x であっても、sの大きさによって
対応するtの大きさが異なる。)
sの変動も考慮に入れた上で、信頼区
間を構成することになる。
×
x
の分布
母分散が分からない場合の
信頼区間は、±1.96より広め
の±t0.95を用いて構成される。
μ
x  t0.95
s
n 1
s(正確には不偏分散 sˆ )とσ
が等しいとき、母分散が分か
らない場合のほうが信頼区間
が若干広くなる。
×
x
x  t0.95
×
×
s
n 1