労働経済学 B 標本平均の分布と母平均の区間推定 【定理 0】X1 , X 2 , X 3 ⋯ , X n を,平均μ,分散σ2 の母集団から無作為に取り出された n 個の標本とする。このとき, σ2 標本平均の期待値はμ,分散は n となる。 【定理 1】正規母集団の標本平均の分布 X1 , X 2 , X 3 ⋯ , X nを,N(μ, σ2 )の母集団から無作為に取り出されたサイズ n の標本とする。 2 ̅の分布は,平均μ,分散σ の正規分布となる。 このとき,標本平均X n 2 1 σ 標本平均 ̅ X = ∑ni=1 X i ~N(μ, ) n n ̅の標準化変量は, したがって,標本平均X 標準化変量 z = ̅ −μ X σ/√n ~N(0,1) (例)日本の男子大学生の身長は,平均 170cm,標準偏差 10cm の正規分布であるとする。いま,男子大学生を 無作為に 100 人選んで身長を計測する。このとき,100 人の平均身長の分布は, ̅~N(170,102 /100) → X ̅~N(170,1) X 100 人の平均身長が 172cm よりも高くなる確率は, ̅ > 172) = P (z > P(X 172 − 170 ) = P(z > 2) = 0.023 1 標本のサイズが 16 人であれば,16 人の平均身長の分布は, ̅ X~N(170,102 /16) → ̅ X~N(170,2.52 ) 16 人の平均身長が 172cm よりも高くなる確率は, ̅ > 172) = P (z > P(X 172 − 170 ) = P(z > 0.8) = 0.212 2.5 【標本平均の区間推定】いま,母集団は正規分布で,分散σ2 はわかっているものとする。 標本平均の分布は, ̅~N (μ, X σ2 ) n その標準化変量 z= ̅ X−μ σ/√n 労働経済学 B 標本平均の分布と母平均の区間推定 の分布は,N(0,1)なので,標準正規分布表から, Pr (− 1.96 < ̅ X−μ σ/√n < 1.96) = 0.95 この式を書き直すと, ̅ − 1.96 Pr (X ̅ − 1.96 したがって,母平均μが,X σ √n σ ̅ + 1.96 <μ<X √n ̅ + 1.96 ~ X σ √n σ ) = 0.95 √n の区間にある確率は 95%となる。 このような区間を母平均μの 95%信頼区間といい,信頼区間を求めることを区間推定という。 (例)日本の男子大学生の身長は,標準偏差 10cm の正規分布であることがわかっているが,平均身長はわから ないとする。いま,男子大学生を無作為に 16 人選んで身長を計測したところ, 16 人の平均身長は 170cm であ った。このとき,日本の男子大学生全体の平均身長の 95%信頼区間は, 10 Pr (170 − 1.96 × √16 < μ < 170 + 1.96 × 10 √16 ) = 0.95 → Pr(165.1 < μ < 174.9) = 0.95 → 95%信頼区間は 165.1~174.9 90%,99%信頼区間は,それぞれ, 10 Pr (170 − 1.645 × < μ < 170 + 1.645 × √16 Pr (170 − 2.576 × 10 √16 < μ < 170 + 2.576 × 10 ) = 0.90 → 90%信頼区間は,165.8875~174.1125 √16 10 √16 ) = 0.99 → 99%信頼区間は,163.56~176.44 標本サイズを 100 人に増加させたとき,90%,95%,99%信頼区間は,それぞれ, 10 Pr (170 − 1.645 × Pr (170 − 1.96 × √100 10 √100 Pr (170 − 2.576 × < μ < 170 + 1.645 × < μ < 170 + 1.96 × 10 √100 10 √100 10 √100 < μ < 170 + 2.576 × ) = 0.90 → 90%信頼区間は,168.355~171.645 ) = 0.95 10 √100 → 95%信頼区間は,168.04~171.96 ) = 0.99 → 99%信頼区間は,167.424~172.576 労働経済学 B 標本平均の分布と母平均の区間推定 【定理 2】母集団は正規分布で,分散σ2 はわからないとする。このとき,標本から以下の式で標本分散を計算す る(通常の分散と違って,n―1 で割っていることに注意)。 S2 = 1 ∑(X i − ̅ X)2 n−1 i このとき, T= ̅−μ X S は自由度 n―1 の t 分布にしたがう。 【定理 3】中心極限定理 S2 母集団がどのような分布であっても(正規分布でなくても),n が十分に大きければ,標本平均の分布はN(μ, n ) で近似することができる。 →母集団のどのような分布でも(分布が正規分布でなくても),標本が十分に大きければ母平均の区間推定を行 うことができる。 (例) ある市において家計の平均収入を知るために, 無作為に抽出した 2,500 世帯に対して調査を行ったところ, 標本平均は 400 万円,標準偏差は 500 万円であった。このとき,この市における家計の平均収入の 95%信頼区 間は, 標本平均の分布は近似的に N(400, Pr (400 − 1.96 × 500 √2500 5002 2500 ) であるから, < μ < 400 + 1.96 × 500 √2500 ) = 0.95 → 95%信頼区間は,380.4 万円~419.6 万円
© Copyright 2025 ExpyDoc