経営統計とデータ分析 応用

標本分布と推定・検定
標本平均を用いた母平均の推定
担当:岩村 英之
1
推測統計のイメージ
母集団
(名商大生全体)
母平均

標本平均 X
2

母分散
母標準偏差
標本
(選ばれた25人)
標本分散

標本標準偏差
ˆ 2
ˆ
推測(予想)
標本平均(25人の平均点)をヒントに
母平均(名商大生全体の平均)を推定する方法を学ぶ.
2
母平均の推定:2つのケース
母平均
母分散
(母標準偏差)
ケースA
わからない
わかっている
正規分布
ケースB
わからない
わからない
t 分布
3
標本平均は確率変数
この25人が選ばれた
ときの平均
=55点
この25人が選ばれた
ときの平均
=48点
この25人が選ばれた
ときの平均
=61点
母集団
(名商大生全体)
どの25人が選ばれるかによって,
出てくる平均点の値も様々な可能性を持つ
標本平均は確率変数
4
標本平均が確率変数ということは,
どの数値が出やすく,どの数値が出にくいか,
つまり確率分布を持つ.
確率
このあたりの値は
出やすい
このあたりの値は
出にくい
標本平均
出やすい値は?(=標本平均の母平均は?)
どのあたりの値まで可能か?(=標本平均の母標準偏差は?)
5
標本平均の確率分布
名商大生の母平均が52点であるとすると…
確率
確率
52
名商大生の得点
(=選ばれた1人の得点)
の確率分布
X
52
選ばれた25人の得点の平均
(=標本平均)の確率分布
X
どちらも最も出やすいのは52点(母平均)だが,
標本平均のほうが52点に近い値が出やすくなっている.
6
定理1(資料p20)
母集団
平均
分散

2
標準偏差 
正規分布
n人(個)選んだときの
標本平均
平均

2

分散
標準偏差

n
n
正規分布
もっとも出やすい値は同じ(=母平均)
母平均により近い値が出やすくなる
このことが意味するのは. . . .
標本平均は母平均  から

 1.96 
n
の範囲内の値が95%の確率で出てくる
確率

95%
標本平均

σ
1.96 
n
σ
1.96 
n
8
例題A
今,名商大生の得点の母分散が252である
(=母標準偏差は25点)とわかっているとする.
95%

1.96
25
25
標本平均
1.96
25
25
母平均を推測する目的で,25人の名商大生を無作為に
選んで試験を受けてもらったところ,平均は58点であった.
標本平均58点をヒントに,
母平均の値を推測することができる.
9
母平均の区間推定の考え方
確率密度
95%
48
53
95%
58
95%
63
予想 A 母平均は63点
否定できない
予想 B 母平均は68点
否定できる
予想 C 母平均は53点
否定できない
予想 D 母平均は48点
否定できる
68
95%
標本平均
母平均の予想として
否定できない「区間」が残る
母平均の推定区間
母平均の区間推定:ケースA
“ぎりぎり”の予想を見つける
確率密度
B
58
A
標本平均
この区間の予想ならば,58点によって
否定されることはない.
母平均の推定区間
11
 L  9.8  58
L
標本平均
58
58  9.8  U
1.96  5  9.8 1.96  5  9.8
58
U
1.96  5  9.8 1.96  5  9.8
標本平均
12
 L  9.8  58
 L  58  9.8  45.1
58  9.8  U
U  58  9.8  67.8
母平均の95パーセント信頼区間は45.1点から67.8点である.
13
例題B
母平均を推測する目的で,25人の名商大生を無作為に
選んで試験を受けてもらったところ,平均は58点であった.
今,名商大生の得点の母分散もわかっていない
(=母標準偏差もわかっていない)とする.

 1.96 
n
がわからない
95%


?
標本平均
?
14
母平均の区間推定:ケースB
母標準偏差の予想値として,25人の得点から不偏標準偏差
(s)を計算し,これを代わりに使う.
s
Aさんの得点 582    Nさんの得点 582
25  1
 1.96


n
 22
代わりに s を入れる
もはや正規分布が使えない
=1.96が使えない

15
標本平均の
標準正規分布
の95%点
ケースA
ケースB
1.96
2.064
標準偏差


自由度24のt分布の
95%点
25
25
?
代わりに不偏標準偏差(s)を
入れると
22
25
標本平均の
標準偏差の推定値
自由度=標本数-1
16
 L  2.064
L
2.064
22
25
標本平均
58
2.064
22
25
58  2.064
22
25
2.064
22
 U
25
標本平均
U
58
2.064
22
 58
25
22
25
17
22
 L  2.064
 58
25
22
 L  58  2.064
 48.9184
25
22
58  2.064
 U
25
22
U  58  2.064
 67.0816
25
母平均の95パーセント信頼区間は48.9184点から67.0816点である.
18
母平均の区間推定:要点
標本平均は母平均から
 1.96 

n
の範囲内の値が95%の確率で出てくる
標本平均は母平均から

 t 0.95 n 1 
s
n
の範囲内の値が95%の確率で出てくる
自由度n-1のt分布の95%点
19
定期試験に向けて
1
標本平均・標本分散・標本標準偏差の計算を確認しよう.
2
母平均の区間推定の方法(2通り)を確認しよう.
3
中間試験の問題を解けるようにしておこう.
*問題はウェブから入手可
4
計算ミスをした場合でも部分点がもらえるように,
途中のプロセスを書こう.
*自分が後で見て分かるように,
しかし解答欄に収まるように.
5
再試験になってしまったら,定期試験の問題を
解けるようにしておこう.
*問題は定期試験終了後にアップします.
20