第 5 章 母集団と標本

第 5 章母集団と標本
宮﨑憲治
2014 年後期
宮﨑憲治
第 5 章母集団と標本
2014 年後期
1 / 20
Outline
1
標本抽出
2
標本平均と標本分散
3
正規分布から導かれる標本分布
4
大数の法則と中心極限定理
宮﨑憲治
第 5 章母集団と標本
2014 年後期
2 / 20
標本抽出
母集団 (population) 調査対象の全体
有限母集団 構成する要素が有限個の母集団
無限母集団 構成する要素が無限個の母集団
標本 (sample) 母集団から取り出した要素
標本抽出 (sampling) 標本を母集団から取り出すこと
復元抽出 (sampling with replacement)
非復元抽出 (sampling without replacement)
有意抽出 (purposive selection)
無作為抽出 (random sampling)
くじびきは, 有限母集団での非復元で無作為抽出
さいころ投げは, 無限母集団からの無作為抽出
無限母集団のとき, 復元か非復元は問題にならない.
宮﨑憲治
第 5 章母集団と標本
2014 年後期
3 / 20
標本抽出
統計的推測 (statistical inference) 標本から確率論にもとづいて母集団
の特性値についての結論をもとめること
標本 (sample) X1 , X2 , . . . , Xn
統計量 (statistic) 標本の関数 T = T(X1 , X2 , . . . , Xn )
無作為標本 (random sample) n 個の独立で同一分布に従う確率変数
標本の大きさ (sample size) 標本数 n
標本分布 (sample distribution) 統計量の分布
母数をギリシャ文字で, 統計量を英数字で表す.
統計量推測のために統計量を用いる.
確率変数に関数である統計量は確率変数である.
母集団は無限母集団か, 有限母集団ならば復元抽出を考える.
宮﨑憲治
第 5 章母集団と標本
2014 年後期
4 / 20
1
標本抽出
2
標本平均と標本分散
3
正規分布から導かれる標本分布
4
大数の法則と中心極限定理
宮﨑憲治
第 5 章母集団と標本
2014 年後期
5 / 20
標本平均と標本分散
無限母集団, もしくは構成要素が多数の有限母集団をひとつの確
率変数と考える.
確率変数 X の分布の母平均を µ = E(X), 母分散を σ = V(X) とす
る.
無作為標本 X1 , X2 , . . . , Xn は独立で, X と同じ分布にしたがう n 個
の確率変数である.
¯ と標本分散 S2 を考える.
統計量として, 標本平均 X
1∑
Xi
n
n
¯ =
X
i=1
S2 =
n
1∑
¯ 2
(Xi − X)
n
i=1
母平均と母分散と標本平均と標本分散との間の関係は?
宮﨑憲治
第 5 章母集団と標本
2014 年後期
6 / 20
標本平均と標本分散
定理 5.1
標本平均は母平均の周りに分布し, 標本平均の平均と分散は
¯ = µ,
E(X)
¯ =
V(X)
σ2
n
である. n は標本数.
宮﨑憲治
第 5 章母集団と標本
2014 年後期
7 / 20
標本平均と標本分散
定理 5.2
次の関係式が成り立つ.
1∑
¯ − µ)2
(Xi − µ)2 = S2 + (X
n
n
i=1
宮﨑憲治
第 5 章母集団と標本
2014 年後期
8 / 20
標本平均と標本分散
定理 5.3
標本分散を確率変数と考えるとき, その平均は
n−1 2
σ (< σ 2 )
n
E(S2 ) =
である. したがって, 統計量
1 ∑
¯ 2 = n S2
(Xi − X)
n−1
n−1
n
U2 =
i=1
を考えるとき, 上の式から
E(U2 ) =
n
E(S2 ) = σ 2
n−1
が得られる.
宮﨑憲治
第 5 章母集団と標本
2014 年後期
9 / 20
1
標本抽出
2
標本平均と標本分散
3
正規分布から導かれる標本分布
4
大数の法則と中心極限定理
宮﨑憲治
第 5 章母集団と標本
2014 年後期
10 / 20
正規分布から導かれる標本分布
この節では母集団が正規分布 N(µ, σ 2 ) に従い, これから得られた無作
為標本 X1 , X2 , . . . , Xn についての標本平均や標本分散について考察
する.
定理 5.4
正規分布 N(µ, σ 2 ) に従う n 個の無作為標本 X1 , X2 , . . . , Xn の標本平均
は正規分布 N(µ, σ 2 /n) に従う. したがって, その z-変換は標準正規分
布 N(0, 1) に従う.
(
)
√ ¯
σ2
n(X − µ)
¯
X ∼ N µ,
⇐⇒ Z =
∼ N(0, 1)
n
σ
宮﨑憲治
第 5 章母集団と標本
2014 年後期
11 / 20
カイ 2 乗分布
標準正規分布にしたがう ν 個の無作為標本 Z1 , Z2 , . . . , Zν の 2 乗
和
ν
∑
X=
Z2i
i=1
は 自由度 ν の カイ 2 乗分布 と呼ばれる分布に従うことが知られ
ており, その分布を記号 χ2ν で表す.
自由度 ν のカイ 2 乗分布に従う確率変数 X の平均と分散:
E(X) = ν,
V(X) = 2ν
付表 2 (p158)
宮﨑憲治
第 5 章母集団と標本
2014 年後期
12 / 20
カイ 2 乗分布
定理 5.5
母集団が正規分布 N(µ, σ 2 ) に従うとき, これから得られた無作為標本
¯ とすると
X1 , X2 , . . . , Xn の標本平均を X
Y=
n
1 ∑
nS2
2
¯
(X
−
X)
=
i
σ2
σ2
i=1
は自由度 ν = n − 1 のカイ 2 乗分布に従う.
宮﨑憲治
第 5 章母集団と標本
2014 年後期
13 / 20
ティー分布
確率変数 X が標準正規分布 N(0, 1) に従い, Y が自由度 ν のカイ 2
乗分布に従うとする. このとき, X, Y が独立ならば,
T= √
X
Y/ν
は自由度 ν の ティー分布 と呼ばれる分布に従うことが知られて
おり, その分布を記号 tν で表す.
自由度 ν のティー分布に従う確率変数 T の平均と分散:
E(T) = 0 (ν ≥ 2),
V(T) =
ν
(ν ≥ 3)
ν−2
付表 3 (p159)
ν → ∞ のとき, t は標準正規分布に従う.
宮﨑憲治
第 5 章母集団と標本
2014 年後期
14 / 20
ティー分布
定理 5.6
母集団が正規分布 N(µ, σ 2 ) に従うとき, これから得られた無作為標本
¯ 不偏分散 U2 ) によって与えられる統計
X1 , X2 , . . . , Xn (標本平均を X,
量:
√ ¯
n(X − µ)
T=
U
は自由度 ν = n − 1 のティー分布に従う.
宮﨑憲治
第 5 章母集団と標本
2014 年後期
15 / 20
エフ分布
確率変数 X, Y が独立で, それぞれ自由度 νl , ν2 の カイ 2 乗分布
に従う とき
X/ν1
F=
Y/ν2
は自由度 (ν1 , ν2 ) の エフ分布 と呼ばれる分布に従うことが知られ
ており, その分布を記号 Fνν12 で表す.
自由度 (ν1 , ν2 ) のエフ分布に従う確率変数 F の平均と分散:
E(F) =
ν2
(ν2 ≥ 3),
ν2 − 2
V(F) =
2ν22 (ν1 + ν2 − 2)
(ν2 ≥ 5)
ν1 (ν2 − 2)2 (ν2 − 4)
付表 5 (p160, 161)
ν2 → ∞ のとき, ν1 F は自由度 ν1 のカイ二乗分布に従う.
エフ分布は分散比について考えるときに使われる.
宮﨑憲治
第 5 章母集団と標本
2014 年後期
16 / 20
1
標本抽出
2
標本平均と標本分散
3
正規分布から導かれる標本分布
4
大数の法則と中心極限定理
宮﨑憲治
第 5 章母集団と標本
2014 年後期
17 / 20
大数の法則と中心極限定理
前節では母集団が正規分布 N(µ, σ 2 ) に従い, これから得られた無作為
標本 X1 , X2 , . . . , Xn について考察した. この節では母集団が正規分布に
したがっていないときの, 標本平均について考察する.
そのためにつぎの チェビシェフの不等式 をしめす.
定理 5.7 (チェビシェフの不等式)
確率変数 X が平均 µ, 分散 σ 2 をもつとき, 任意の ϵ > 0 に対して, 次
の不等式が成り立つ:
σ2
P(|X − µ| > ϵ) ≤ 2
ϵ
宮﨑憲治
第 5 章母集団と標本
2014 年後期
18 / 20
大数の法則
¯ n が 母平均に近い とい
標本の大きさ n が十分大きければ, 標本平均 X
うことがいえる. これを 大数の法則 (law of large numbers) という.
定理 5.8 (大数の法則)
¯n
母平均 µ をもつ分布からの無作為標本 X1 , X2 , . . . , Xn の標本平均 X
と任意の ϵ > 0 に対して, 次の式が成り立つ:
¯ n − µ| > ϵ) = 0
lim P(|X
n→∞
宮﨑憲治
第 5 章母集団と標本
2014 年後期
19 / 20
中心極限定理
母集団が正規分布に従わなくても, 標本数 n が十分大きいとき, 標本平
¯ n の z-変換は標準正規分布に近づくことが示される. これを 中心
均X
極限値定理 (central limit theorem) という. (証明は略す.)
定理 5.9 (中心極限値定理)
¯ n の z-変換 Zn の分布は標準正規分布に収束する: n → ∞
標本平均 X
のとき
√ ¯
n(Xn − µ)
Zn =
→ Z ∼ N(0, 1)
σ
すなわち,
∫
lim P(Zn ≤ z) = Φ(z) =
n→∞
宮﨑憲治
第 5 章母集団と標本
z
ϕ(x)dx
−∞
2014 年後期
20 / 20