統計学

統計学入門2
標本分布、標本誤差
統計学入門2 - 後期 第2回 -
1
今日の内容

標本誤差とは

調査の事例から

標本調査

標本分布とは(全員が参加した実験を)
統計学入門2 - 後期 第2回 -
2
調査結果の記事から

日本経済新聞


朝日新聞


(9/26)福田内閣支持率59%・日経世論調査
福田内閣支持53% 「古い自民」56% 本社
世論調査
読売新聞

福田内閣支持率57・5%、発足直後で4位…
読売世論調査
統計学入門2 - 後期 第2回 -
3
福田内閣の支持率

日本経済新聞


朝日新聞


59%
53%
数字が違う理由
は?
読売新聞
正しい数字は?
57・5%
矛盾した結果?

統計学入門2 - 後期 第2回 -
4
CNNの事例
統計学入門2 - 後期 第2回 -
5
記事の引用




Fifty-seven percent of those polled said they did not believe it
was worth going to war, versus 41 percent who said it was,
according to a CNN/USA Today/Gallup poll of 1,006 adults.
That was a drop in support from February, when 48 percent said
it was worth going to war and half said it was not.
It's also the highest percentage of respondents who have
expressed those feelings and triple the percentage of Americans
who said that it was not worth the cost shortly after the war
began about two years ago.
The new poll question, asked by telephone on April 29-May 1,
had a margin of error of plus or minus 5 percentage points.
統計学入門2 - 後期 第2回 -
6
重要部分

The new poll question, asked by
telephone on April 29-May 1, had a
margin of error of plus or minus 5
percentage points.
「この最後の部分が、日本の新聞社の記事
についていれば」と考えてみよう
統計学入門2 - 後期 第2回 -
7
(調査結果)プラスマイナス(誤差)

日本経済新聞


朝日新聞


59%
53%
読売新聞

5%ポイントの
誤差があると
すれば、矛盾
はしていない
57・5%
統計学入門2 - 後期 第2回 -
8
全数調査と標本調査

研究対象となる集団全体(母集団)を
対象とした調査
全数調査(Census Survey)

母集団の一部(標本)に対してのみ
行う調査
標本調査(Sample Survey)
統計学入門2 - 後期 第2回 -
9
なぜ、誤差が生じるのか
統計学入門2 - 後期 第2回 -
10
標本抽出
(Sampling)
標本
母集団
統計学入門2 - 後期 第2回 -
11
データの収集
標本
x1
x2

xn
母集団
統計学入門2 - 後期 第2回 -
12
標本
x1
x2

xn
標
本
の
集
団
の
母集団 母
特
性
値
特
性
値
統計的推測
統計学入門2 - 後期 第2回 -
13
標本
母集団
母集団平均の推定
x1
x2

xn
1 n
x   xi
n i 1
統計学入門2 - 後期 第2回 -
14
実習

誤差がどうのように生じるのか観察してみ
よう

実験結果
大きさ
男
女
男性の比率
母集団
65
46
19
70.77%
標本1
8
6
2
75.00%
標本2
3
1
2
33.33%
標本3
5
3
2
60.00%
標本4
20
14
6
70.00%
統計学入門2 - 後期 第2回 -
15
標本分布


標本を繰り返し作成したと想定した場合に
得られる統計量の分布
仮想的な分布
統計学入門2 - 後期 第2回 -
16
標本分布とは…
x
標本
母集団
統計学入門2 - 後期 第2回 -
17
標本分布とは…
x
x
標本
x
母集団
統計学入門2 - 後期 第2回 -
18
標本分布とは…



標本ごとに1つの標本平均
数多くの標本があると想定して、標本平均
の分布を考えることができる
実際の調査では、その中の1つの標本が
作成され、1つの標本平均の実現値が得
られる
統計学入門2 - 後期 第2回 -
19
平均の標本分布
(1)
(2)
x の平均は、母集団の平均m
2
x の分散は、  / n
(3a) n が大きいとき、 x の分布は正規分布
(3b) 母集団分布が正規分布であれば、x の
分布は正規分布
統計学入門2 - 後期 第2回 -
20
比率の標本分布
(1) p の平均は、母集団での比率P
(2) p の分散は、 P(1-P)/n
(3) n が大きいとき、p の分布は正規分布
1
x
0
if Q = YES
とおいて考えてみよう…
if Q = NO
統計学入門2 - 後期 第2回 -
21
練習問題

MLBの2007年レギュラーシーズンが9月30日で
終了した。イチロー選手は、


678打数で、238本のヒットを打ち、打率(ヒットを打っ
た割合)が0.351であった。
この結果を、イチロー選手の打撃能力を知るた
めの標本調査との観点で見た場合、何を母集団
の特性値と考え、何を標本の特性値と考えれば
よいか。
解答:打撃能力、観察された打率
統計学入門2 - 後期 第2回 -
22