第 20 回 区間推定 村澤 康友 2015 年 7 月 5 日 目次 1 信頼域 1 2 正規母集団 1 2.1 母平均の信頼区間 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 2.2 母分散の信頼区間 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 2.3 母平均の差の信頼区間 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 2.4 母分散の比の信頼区間 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 2 項母集団 7 3 1 信頼域 定義 1. 母数を含む領域を定める推定を区間推定という. 定義 2. ある確率で母数を含む確率的な領域を,その母数の信頼域という. 定義 3. 1 次元の信頼域を信頼区間という. 定義 4. 信頼域が母数を含む確率を,その信頼域の信頼係数という. 注 1. 「信頼係数 α の信頼域」を「100α %信頼域」と略すことが多い. 2 正規母集団 2.1 母平均の信頼区間 2.1.1 母分散が既知 ( ) 母集団分布を N µ, σ 2 とする.µ の 95 %信頼区間を求める.ただし σ 2 は既知とする.大きさ n の無作為 標本の標本平均を X̄ とすると ) ( σ2 X̄ ∼ N µ, n 1 標準化すると X̄ − µ √ ∼ N(0, 1) σ 2 /n 標準正規分布表より ] X̄ − µ Pr −1.96 ≤ √ ≤ 1.96 = .95 σ 2 /n [ すなわち [ √ Pr −1.96 または [ √ ] σ2 σ2 ≤ X̄ − µ ≤ 1.96 = .95 n n √ Pr X̄ − 1.96 √ ] σ2 σ2 ≤ µ ≤ X̄ + 1.96 = .95 n n したがって µ の 95 %信頼区間は [ √ X̄ − 1.96 σ2 , X̄ + 1.96 n √ σ2 n ] 2.1.2 母分散が未知 標本分散を s2 とする.σ 2 を s2 に置き換えると X̄ − µ √ ∼ t(n − 1) s2 /n t 分布表より,例えば n = 10 なら [ ] X̄ − µ Pr −2.262 ≤ √ ≤ 2.262 = .95 s2 /10 すなわち [ √ Pr −2.262 または [ √ ] s2 s2 ≤ X̄ − µ ≤ 2.262 = .95 10 10 √ Pr X̄ − 2.262 √ ] s2 s2 ≤ µ ≤ X̄ + 2.262 = .95 10 10 したがって n = 10 なら µ の 95 %信頼区間は [ X̄ − 2.262 √ s2 , X̄ + 2.262 10 2 √ s2 10 ] 2.2 母分散の信頼区間 2.2.1 母平均が既知 σ 2 の 95 %信頼区間を求める.ただし µ は既知とする.標本分散は 1∑ (Xi − µ)2 n i=1 n σ̂ 2 := このとき nσ̂ 2 ∼ χ2 (n) σ2 χ2 分布表より,例えば n = 10 なら ] [ 10σ̂ 2 ≤ 20.4832 = .95 Pr 3.24697 ≤ σ2 すなわち または [ ] 1 σ2 1 Pr ≤ ≤ = .95 20.4832 10σ̂ 2 3.24697 [ ] 10σ̂ 2 10σ̂ 2 2 Pr ≤σ ≤ = .95 20.4832 3.24697 したがって n = 10 なら σ 2 の 95 %信頼区間は [ 10σ̂ 2 10σ̂ 2 , 20.4832 3.24697 ] 2.2.2 母平均が未知 µ が未知なら標本分散は )2 1 ∑( Xi − X̄ n − 1 i=1 n s2 := このとき (n − 1)s2 ∼ χ2 (n − 1) σ2 χ2 分布表より,例えば n = 10 なら [ ] 9s2 Pr 2.70039 ≤ 2 ≤ 19.0228 = .95 σ すなわち [ ] 1 σ2 1 Pr ≤ 2 ≤ = .95 19.0228 9s 2.70039 または [ Pr ] 9s2 9s2 ≤ σ2 ≤ = .95 19.0228 2.70039 したがって n = 10 なら σ 2 の 95 %信頼区間は [ 9s2 9s2 , 19.0228 2.70039 3 ] 2.3 母平均の差の信頼区間 2.3.1 母分散が既知 ( ) ( ) 2 2 母集団分布を N µX , σX ,N µY , σY2 とする.µX − µY の 95 %信頼区間を求める.ただし σX , σY2 は既 知とする.各母集団から独立に抽出した大きさ m, n の無作為標本の標本平均を X̄, Ȳ とすると ( ) σ2 X̄ ∼ N µX , X m ) ( σY2 Ȳ ∼ N µY , n 両者は独立だから ( ) σ2 σ2 X̄ − Ȳ ∼ N µX − µY , X + Y m n 標準化すると X̄ − Ȳ − (µX − µY ) √ ∼ N(0, 1) 2 /m + σ 2 /n σX Y 標準正規分布表より すなわち [ ] X̄ − Ȳ − (µX − µY ) Pr −1.96 ≤ √ 2 ≤ 1.96 = .95 σX /m + σY2 /n [ √ Pr −1.96 または [ 2 σX σ2 + Y ≤ X̄ − Ȳ − (µX − µY ) ≤ 1.96 m n √ Pr X̄ − Ȳ − 1.96 √ 2 σX σ2 + Y m n = .95 ] √ 2 2 σX σY2 σX σY2 + ≤ µX − µY ≤ X̄ − Ȳ + 1.96 + = .95 m n m n したがって µX − µY の 95 %信頼区間は [ √ X̄ − Ȳ − 1.96 ] √ 2 2 σX σY2 σX σY2 + , X̄ − Ȳ + 1.96 + m n m n 2.3.2 母分散が未知 2 σX = σY2 = σ 2 なら ] X̄ − Ȳ − (µX − µY ) √ ∼ N(0, 1) σ 2 (1/m + 1/n) プールした標本分散を s2 とする.σ 2 を s2 に置き換えると X̄ − Ȳ − (µX − µY ) √ ∼ t(m + n − 2) s2 (1/m + 1/n) t 分布表より,例えば m = 4,n = 6 なら [ ] X̄ − Ȳ − (µX − µY ) Pr −2.306 ≤ √ ≤ 2.306 = .95 s2 (1/4 + 1/6) 4 すなわち √ [ Pr −2.306 s2 ( 1 1 + 4 6 √ ) ≤ X̄ − Ȳ − (µX − µY ) ≤ 2.306 ( s2 1 1 + 4 6 )] = .95 または √ [ Pr X̄ − Ȳ − 2.306 s2 ( 1 1 + 4 6 √ ) ≤ µX − µY ≤ X̄ − Ȳ + 2.306 s2 ( 1 1 + 4 6 )] = .95 したがって m = 4,n = 6 なら µX − µY の 95 %信頼区間は [ √ X̄ − Ȳ − 2.306 ( s2 √ ( ) )] 1 1 1 1 + , X̄ − Ȳ + 2.306 s2 + 4 6 4 6 2 注 2. σX ̸= σY2 なら近似的な信頼区間を用いる. 2.4 母分散の比の信頼区間 2.4.1 母平均が既知 補題 1. X ∼ F(m, n) =⇒ 1 ∼ F(n, m) X 証明. F 分布の定義より U/m V /n 1 U/n = X V /m X= ただし U ∼ χ2 (m) と V ∼ χ2 (n) は独立. 注 3. したがって [ 1 1 Pr[X ≤ x] = Pr ≥ X x ] より F(n, m) の上側確率から F(m, n) の下側確率が求まる(図 1). 2 2 σX /σY2 の 95 %信頼区間を求める.ただし µX , µY は既知とする.標本分散を σ̂X , σ̂Y2 とすると 2 mσ̂X ∼ χ2 (m) 2 σX nσ̂Y2 ∼ χ2 (n) σY2 両者は独立だから 2 2 σ̂X /σX ∼ F(m, n) 2 σ̂Y /σY2 F 分布表より,例えば m = 4,n = 6 なら ] [ 2 2 σ̂X /σX 1 ≤ 2 2 ≤ 6.227 = .95 Pr 9.197 σ̂Y /σY 5 0.8 0.0 0.2 0.4 df(x, 25, 5) 0.6 0.8 0.6 0.4 0.0 0.2 df(x, 5, 25) 0 2 4 6 8 10 0 2 x 図1 すなわち または 6 x F(5, 25) の 10 %下側確率と F(25, 5) の 10 %上側確率 ] σ̂Y2 /σY2 1 ≤ 2 2 ≤ 9.197 = .95 Pr 6.227 σ̂X /σX [ [ 2 2 2 1 σ̂X σX σ̂X Pr ≤ ≤ 9.197 6.227 σ̂Y2 σY2 σ̂Y2 ] = .95 2 したがって m = 4,n = 6 なら σX /σY2 の 95 %信頼区間は [ 2 1 σ̂X σ̂ 2 , 9.197 X 2 6.227 σ̂Y σ̂Y2 ] 2.4.2 母平均が未知 標本分散を s2X , s2Y とすると (m − 1)s2X ∼ χ2 (m − 1) 2 σX (n − 1)s2Y ∼ χ2 (n − 1) σY2 両者は独立だから 2 s2X /σX ∼ F(m − 1, n − 1) 2 sY /σY2 F 分布表より,例えば m = 4,n = 6 なら ] [ 2 s2X /σX 1 ≤ 2 2 ≤ 7.764 = .95 Pr 14.885 sY /σY すなわち 4 ] s2Y /σY2 1 ≤ 2 2 ≤ 14.885 = .95 Pr 7.764 sX /σX [ 6 8 10 または [ Pr 2 1 s2X σX s2X ≤ ≤ 14.885 7.764 s2Y σY2 s2Y ] = .95 2 したがって m = 4,n = 6 なら σX /σY2 の 95 %信頼区間は [ 1 s2X s2 , 14.885 X 2 7.764 sY s2Y ] 3 2 項母集団 母集団分布を Bin(1, p) とする.p の 95 %信頼区間を近似的に求める.Bin(1, p) の平均は p,分散は p(1 − p).したがって母平均の信頼区間を近似的に求めればよい.大きさ n の無作為標本の標本平均を p̂ とす ると,中心極限定理より ( ) p(1 − p) p̂ ∼ N p, n a 標準化すると √ 分母の p を p̂ に置き換えると √ 標準正規分布表より [ p̂ − p a p(1 − p)/n p̂ − p ∼ N(0, 1) a p̂(1 − p̂)/n ∼ N(0, 1) p̂ − p ] Pr −1.96 ≤ √ ≤ 1.96 ≈ .95 p̂(1 − p̂)/n すなわち [ √ Pr −1.96 または [ ] √ p̂(1 − p̂) p̂(1 − p̂) ≤ p̂ − p ≤ 1.96 ≈ .95 n n √ Pr p̂ − 1.96 ] √ p̂(1 − p̂) p̂(1 − p̂) ≤ p ≤ p̂ + 1.96 ≈ .95 n n したがって p の 95 %信頼区間は近似的に [ √ p̂ − 1.96 ] √ p̂(1 − p̂) p̂(1 − p̂) , p̂ + 1.96 n n 例 1. 100 世帯を対象にある番組の視聴率を調査したら 10 %の視聴率であった.真の視聴率 p の 95 %信頼区 間は n = 100,p̂ = .1 を代入すると [ ] √ √ .1(1 − .1) .1(1 − .1) .1 − 1.96 , .1 + 1.96 10 10 計算すると [.0412, .1588],すなわち 4.12∼15.88 %となる. 7
© Copyright 2024 ExpyDoc