第1回小テストの基礎知識(標本調査) • 表が出る確率 p の(ゆがんだ)コインを n 回投げて x 回表が出るとき, x は二項分布にしたがう確率変数で,x ∼ B(n, p) と表される. • 確率変数 x ∼ B(n, p) の平均(期待値)は E(x) = np,標準偏差(分散の平方根) √ は n p (1 − p) • 母集団(個人)のサイズ N が大きいとき,n 人を抽出して x 人がある属性(政策に 賛成など)をもっている比率(割合)は(近似的に)「正規分布」にしたがう確率変 数である. p は推定したい未知の比率で,母集団比率と呼ばれる. • n が大きいとき,標本比率 p̂ = x/n (母集団比率 p の推定量)は正規分布で近似 √ され,その平均は np,標準偏差は p(1 − p)/n である. • 標準偏差の表現を少し変えて,母集団比率 p が 95%程度含まれる区間は次のように 求められる. √ p̂(1 − p̂) p̂ ± 2 n • 母集団平均 µ の推定量(標本平均)を x̄,標本の標準偏差を s と表すとき,母集団 平均 µ が 95%程度含まれる区間は次のように求められる. s x̄ ± 2 √ n 第1回小テストの練習問題(標本調査) (1) 意識調査で 20 歳から 39 歳の男女を住民基本台帳から抽出し,質問票を郵送したとこ ろ,n = 900 人が回答して,ある政策の支持者が 60% (p̂ = 0.6) となった.無作為 抽出と考えると,母集団における支持率はどの程度と考えるべきか. (2) 前問で,調査票を郵送したのは m = 3000 人,回答率は 30%であった.どのような 点に注意すべきか. (3) 同じ時期に実施した電話調査では,年齢が 20–39 歳であることを確認できた個人 3000 人のうち,男性 600 人,女性 900 人,計 n = 1500 人が回答し,政策の支持率は 45%で あった.この結果をどう解釈すべきか. (4) ある世帯調査に関して,世帯の消費支出が 316,166 円で,その標準誤差率は 1%以内 であると表示されている.その調査が適切な無作為抽出で実施された場合,標本平均 x̄ の標準偏差(標準誤差) se(x̄) はどの程度の大きさか. 解答例 講義の復習 √ 1. 可能性が高い(95%程度)値は p̂ ± 2 × p̂(1 − p̂) n 表示すると,次のように 57%∼63%程度となる. √ 60 ± 2 × 60 · 40 900 で求める.パーセントで = 60 ± 2 × 1.63 = (56.7, 63, 3) 2. 回答率が比較的低いため,無回答者が回答者と異なる属性を持っていないか,過去 の類似の調査と比較するなど,注意が必要である.たとえば,賛成意見を持つ人の 回答率が高い,性別の支持率に違いがあり,女性の方が回答率が高いなど. 3. 郵送調査と電話調査では,回収率は一般に異なるため,直接,二つの調査結果を比 較するだけでなく,同種の過去の調査と比較することも考える.調査結果を無条件 に信用せずに,信頼性を考える習慣を身に着けること. 4. 標準誤差率は 推定量の標準偏差 推定量 = se(x̄) x̄ と定義される.se(x̄)/316166 = 0.01 を解くと, se(x̄) = 316166 × 0.01 ≈ 3200(円) この計算では標本の大きさは不要だが,統計を読むときには,常識として確認する こと.家計調査なら約 8000 世帯. 標本平均の標準誤差 = 母集団の標準偏差 √ n 母集団の 1 世帯あたり消費支出は,ほぼ次の範囲と考えてよい. 母集団平均の範囲 = 標本平均 ± 2 × 推定量の標準偏差 316200 ± 2 × 3200 = (319800, 322600)
© Copyright 2024 ExpyDoc