補足プリント 17:標本平均と標本分散の分布 松井宗也 南山大学経営学部 平成 27 年 9 月 22 日 今回の内容は「数理統計学」(稲垣宣生、裳華房)のセクション 6 を参考にした。 1 標本平均と標本分散の分布 正規母集団 X ∼ N (µ, σ 2 ) から、無作為抽出により n 個の標本 (X1 , . . . , Xn ) を得るものとする。こ ∑ のとき標本平均 X = n1 ni=1 Xi と標本分散 1 ∑ (Xi − X)2 n−1 n S2 = i=1 の分布を考える。Xi , i = 1, . . . , n は独立で Xi ∼ N (µ, σ 2 ) なので、標準化したものを Yi = すれば、Yi ∼ N (0, 1) となり、Y = (Y1 , Y2 , . . . , Yn ) の同時確率密度関数は fY (y) = fY (y1 , . . . , yn ) = n ∏ (2π)− 2 e− 1 yi2 2 Xi −µ σ と ′ = (2π)− 2 e− 2 y y n 1 i=1 となる。いま直交行列 C: √1 n √1 2 √1 2·3 ··· √ 1 (n−1)·n √1 n − √12 √1 2·3 ··· ··· ··· ··· ··· 0 ··· ··· − √22·3 0 ··· ··· ··· ··· ··· 0 0 ··· n−1 −√ (n−1)·n √1 n ··· √ 1 (n−1)·n を考えると、C は直交行列となり CC ′ = C ′ C = I が成り立つ。(ここで I は n × n 単位行列で C ′ は C の転置行列を表す。)この行列による変換 Y1 Z1 .. .. Y = . → Z = . = CY Yn Zn を行うとき、ヤコビアンが J = |C ′ | = ±1 であるから、Z の同時確率密度関数は ′ ′ ′ ′ ′ ′ fZ (z) = fY (C ′ z)|J | = (2π)− 2 e− 2 (C z) (C z) = (2π)− 2 e− 2 z CC z = (2π)− 2 e− 2 z z = π 1 π 1 1 π 1 n ∏ zi2 1 √ e− 2 2π i=1 となる。従って確率変数 Z1 , Z2 , . . . , Zn は互いに独立で各変数は Zi ∼ N (0, 1) である。 ∑ ∑ 直交変換を考えたから Z ′ Z = (CY )′ (CY ) = Y ′ Y となり ni=1 Zi2 = ni=1 Yi2 を満たすことに注 意する。さらに直交行列の第 1 行から Y1 √ ( 1 ) 1 ∑ n(X − µ) 1 . Z1 = √ , . . . √ .. = √ Yi = ∼ N (0, 1) σ n n n i=1 Yn も分かる。これらに注意すると Z12 + Z22 + · · · + Zn2 = Y12 + Y22 + · · · + Yn2 = n ∑ (Xi − µ)2 i=1 σ2 n(X − µ)2 ∑ (Xi − X)2 (n − 1)S 2 2 + = Z + 1 σ2 σ2 σ2 n = i=1 (n−1)S 2 が成り立ち、 σ2 の分布は Z22 + Z32 + · · · + Zn2 の分布と等しく、それは Zi ∼ N (0, 1), i = 2, . . . , n に注意して、自由度 n − 1 のカイ2乗分布に従うことが分かる。さらに Z1 と (Z2 , Z3 , . . . , Zn ) は独立 √ n(X−µ) (n−1)S 2 であることから、 と σ2 も独立となることが分かる。このことは X と S 2 が独立である σ ことを意味する。 定理 正規母集団 N (µ, σ 2 ) に従う無作為標本 X1 , . . . , Xn に関して以下が成り立つ。 √ (1) 標本平均 X を標準化したものは、標準正規分布に従う。つまり Z = n(X−µ) ∼ N (0, 1). σ n−1 2 (2) 標本分散 S を σ2 倍したものは、自由度 n − 1 のカイ2乗分布に従う。 n (n − 1)S 2 1 ∑ (Xi − X)2 ∼ χ2 (n − 1). = σ2 σ2 i=1 (3) 標本平均 X と標本分散 S 2 は独立である。 N (µ, σ 2 ) この定理をもとに、正規母集団 から得られる代表的な2つの統計量を考えてみる。統計科 学では標本の分布に正規分布を仮定することがほとんどである。 □ T 統計量。平均の検定や区間推定に用いられる。正規母集団 N (µ, σ 2 ) から独立に得られた n 個の 標本 (X1 , . . . , Xn ) を考える。上の定理から Z ∼ N (0, 1) で (n − 1)S 2 = σ2 ∑n i=1 (Xi − σ2 X)2 ∼ χ2 (n − 1) となり、またこれらが独立となることから、 X −µ X − µ/ √ = √ T = S/ n σ/ n √∑ n i=1 (Xi − X)2 Z =√ (n − 1)σ 2 S 2 /σ 2 は自由度 n − 1 の t 分布に従うことがわかる。(t 分布の定義と T の形を見比べよ。)ここでは σ をそ の推定量 S で置き換えたものとなっている。 2 □ F 統計量。当分散性の検定や分散分析で用いられる。それぞれ正規母集団 N (µ1 , σ12 ) と N (µ2 , σ22 ) に独立に従う (X11 , . . . , X1n ), (X21 , . . . , X2n )、(n = n1 + n2 ) を考える。このとき F = S1 S 2 /σ 2 = 12 2 S1 S1 /σ2 は自由度 n1 − 1, n2 − 1 の F 分布に従うことが分かる。S1 と S2 は独立である。(分子と分母それぞ れが χ2 分布に従う確率変数をその自由度で割ったものになっている。) 3
© Copyright 2024 ExpyDoc