第1回小テストの基礎知識(標本調査)

第1回小テストの基礎知識(標本調査)
• 表が出る確率 p の(ゆがんだ)コインを n 回投げて x 回表が出るとき,
x は二項分布にしたがう確率変数で,x ∼ B(n, p) と表される.
• 確率変数
x ∼ B(n, p) の平均(期待値)は E(x) = np,標準偏差(分散の平方根)
√
は n p (1 − p)
• 母集団(個人)のサイズ N が大きいとき,n 人を抽出して x 人がある属性(政策に
賛成など)をもっている比率(割合)は(近似的に)「正規分布」にしたがう確率変
数である.
p は推定したい未知の比率で,母集団比率と呼ばれる.
• n が大きいとき,標本比率 p̂ = x/n
(母集団比率 p の推定量)は正規分布で近似
√
され,その平均は np,標準偏差は p(1 − p)/n である.
• 標準偏差の表現を少し変えて,母集団比率 p が 95%程度含まれる区間は次のように
求められる.
√
p̂(1 − p̂)
p̂ ± 2
n
• 母集団平均 µ の推定量(標本平均)を x̄,標本の標準偏差を s と表すとき,母集団
平均 µ が 95%程度含まれる区間は次のように求められる.
s
x̄ ± 2 √
n
第1回小テストの練習問題(標本調査)
(1) 意識調査で 20 歳から 39 歳の男女を住民基本台帳から抽出し,質問票を郵送したとこ
ろ,n = 900 人が回答して,ある政策の支持者が 60% (p̂ = 0.6) となった.無作為
抽出と考えると,母集団における支持率はどの程度と考えるべきか.
(2) 前問で,調査票を郵送したのは m = 3000 人,回答率は 30%であった.どのような
点に注意すべきか.
(3) 同じ時期に実施した電話調査では,年齢が 20–39 歳であることを確認できた個人 3000
人のうち,男性 600 人,女性 900 人,計 n = 1500 人が回答し,政策の支持率は 45%で
あった.この結果をどう解釈すべきか.
(4) ある世帯調査に関して,世帯の消費支出が 316,166 円で,その標準誤差率は 1%以内
であると表示されている.その調査が適切な無作為抽出で実施された場合,標本平均
x̄ の標準偏差(標準誤差) se(x̄) はどの程度の大きさか.
解答例
講義の復習
√
1. 可能性が高い(95%程度)値は p̂ ± 2 ×
p̂(1 − p̂)
n
表示すると,次のように 57%∼63%程度となる.
√
60 ± 2 ×
60 · 40
900
で求める.パーセントで
= 60 ± 2 × 1.63 = (56.7, 63, 3)
2. 回答率が比較的低いため,無回答者が回答者と異なる属性を持っていないか,過去
の類似の調査と比較するなど,注意が必要である.たとえば,賛成意見を持つ人の
回答率が高い,性別の支持率に違いがあり,女性の方が回答率が高いなど.
3. 郵送調査と電話調査では,回収率は一般に異なるため,直接,二つの調査結果を比
較するだけでなく,同種の過去の調査と比較することも考える.調査結果を無条件
に信用せずに,信頼性を考える習慣を身に着けること.
4. 標準誤差率は
推定量の標準偏差
推定量
=
se(x̄)
x̄
と定義される.se(x̄)/316166 = 0.01 を解くと,
se(x̄) = 316166 × 0.01 ≈ 3200(円)
この計算では標本の大きさは不要だが,統計を読むときには,常識として確認する
こと.家計調査なら約 8000 世帯.
標本平均の標準誤差 =
母集団の標準偏差
√
n
母集団の 1 世帯あたり消費支出は,ほぼ次の範囲と考えてよい.
母集団平均の範囲 = 標本平均 ± 2 × 推定量の標準偏差
316200 ± 2 × 3200 = (319800, 322600)