統計推定: 母集団比率の区間推定 1.基本概念 2.母集団比率の区間推定 3.小標本の区間推定 4.標本の大きさの決定 1.基本概念 点推定(point estimation):母集団の未知 パラメータ を一つの値で推計する。 区間推定(interval estimation):母集団の パラメータ が入る確率がある値 1 以上と保証される区間[L1, L2]を求める。 ( は が区間に入らない確率) P( L1 L2 ) 1 母集団比率の区間推定 標本比率の期待値と分散 pq E ( p ) p, V ( p ) n 基準化確率変数 Z p p pq / n 2.信頼区間の作成 中心極限定理により、Nが大きいとき N(0,1) P(| Z | c) 1 P( pˆ c pq n P pˆ c pq n ) q=1-p x 不等式の両端の辺でpの変わりに pˆ を n 用いると、 信頼区間、信頼係数、区間推定 P * ( pˆ c 近似的に区間 pˆ (1 pˆ n J z ( pˆ ) ( pˆ c P pˆ c pˆ (1 pˆ n , pˆ c pˆ (1 qˆ n ) pˆ (1 qˆ n ) の中に母集団比率Pが含まれる確率が 1 である ことを示す。ただし、ここで信頼度の大きさ 1 を信頼係数という。P*は確率ではないこと。 練習問題 ある都市の労働力人口から1000人を無作 為に抽出した結果、31人が失業であった。 1)失業率の点推定値 pˆ を求め、標本の データから標本分布の標本分散を推定し、 推定の誤差を説明せよ。 2)母集団比率P(この都市の失業率)につい て信頼係数0.95の信頼区間を求めよ。 解答(1) N=1000、x=31 x 31 pˆ 0.031 n 1000 n=1000で大標本であるので、 pˆ の分散の 推定値は pˆ (1 pˆ ) 0.031(1 0.031) v( pˆ ) 0.00003 n 1000 pˆ 0.0055 解答(2) P(| Z | c) 2(c) 1 1 0.95 (c) 0.975 C=1.96 L1 0.0311.96 0.0055 0.02 L2 0.031 1.96 0.0055 0.042 即ち、 0.02 P 0.042 3. N<30、1 0.95 ときの区間推定 P(| Z | c) 0.95 p(| Z | 1.96) P 1.96 x P n 1.96 0.95 p(1 p) / n x 2 2 p (1 p ) 上の式を書き直すと、 ( n p ) (1.96 ) n これを整理すると、Pについての2次不等式 2 x (n 3.84) p (2 x 3.84) p 0 n 2 P( p1 p p2 ) 0.95 p1 p2 2次方程式 ap bp c 0 の解 2 2 x (n 3.84) p (2 x 3.84) p 0 n 2 b b 2 4ac p1 2a b b 4ac p2 2a 2 練習問題 学生400人をランダムに選んで、たばこを 好む人の数を調べたところ、95人であった。 学生全員の中で喫煙者の割合Pを、信頼係 数95%で区間推定してみよう。 4.標本の大きさの決定 nが大であれば、標本比率x/nは近似的に正規 分布N(p,pq/n)に従うから、信頼係数95%で x P n 1.96 p(1 p) / n 推定の誤差|x/n - p|をE以内にとすると、 |x/n - p|=Eとし、不等号を等号にして求められ ると、nの値は 1.96 2 n( ) p(1 p) となる。(P=1/2とする) E 練習問題 ある電気器具メーカが自社のある製品を利 用している家庭の割合を標本調査によっ て推定しようと考えている。信頼係数95% で誤差を3%以内におさえたいとすれば必 要な標本数はどれくらいか? 解:E=0.03,P=1/2として、 1.96 2 1 1 n( ) ( )( ) 1067 .1 0.03 2 2
© Copyright 2024 ExpyDoc