経営統計とデータ分析 応用

経営統計とデータ分析 応用
中心極限定理・母平均の推定
担当:岩村 英之
2008年1月7日
1
推測統計のイメージ
母集団
母平均
標本

標本平均 X
2

母分散
母標準偏差
標本分散

標本標準偏差
ˆ 2
ˆ
推測
今回は,標本平均をヒントに母平均の値を推定する方法を学ぶ.
2
標本平均は確率変数(1)
この100人が選ばれた
ときの平均
=171cm
この100人を選ばれた
ときの平均
=173cm
この100人を選ばれた
ときの平均
=167cm
母集団
(高3男子全体)
どの100人が選ばれるかによって,
出てくる平均身長の値も様々な可能性を持つ
標本平均は確率変数
3
標本平均は確率変数(2)
標本平均が確率変数ならば,どの数値が出やすく,
どの数値が出にくいか,つまり確率分布を持つ.
確率密度
このあたりの値は
出やすい
このあたりの値は
出にくい
標本平均
4
標本平均の確率分布
高3生の身長の母平均が168cmであるとすると…
確率密度
確率密度
168
高3生の身長
(=選ばれた1人の身長)
の確率分布
X
168
選ばれた100人の身長の平均
(=標本平均)の確率分布
X
どちらも最も出やすいのは168(母平均)だが,
標本平均のほうが168に近い値が出やすくなっている.
5
中心極限定理
母集団
平均
分散

2
サイズnの標本平均
平均
分散

2
n
近似的に正規分布
6
中心極限定理つづき
サイズnの標本平均
平均
分散

2
n
近似的に正規分布

標本平均

n
平均
0
分散
1
近似的に正規分布
要するに標準正規分布
7
今,高校3年生男子の身長の母分散が152である
(=母標準偏差は15cm)とわかっているとする.
母平均を推測する目的で,100人の高3生男子を無作為に
選んで身長を測定すると,平均は165cmであった.
確率密度
標本平均
母平均(未知)
標本平均165cmをヒントに,中心極限定理を利用して
母平均の値を推測することができる.
8
母平均の区間推定の考え方(1)
確率密度
95%
160
163
95%
165
166
予想 A
  166
否定できない
予想 B
  171
否定できる
予想 C
  163
否定できない
予想 D
  160
否定できる
95%
171
95%
X
母平均の予想として
否定できない「区間」が残る
母平均の推定区間
母平均の区間推定の考え方(2)
“ぎりぎり”の予想を見つける
確率密度
B
165
A
X
この区間の予想ならば,165cmによって
否定されることはない.
母平均の推定区間
10
母平均の区間推定(1)
標本平均の確率分布
95%
N ( B ,152 100)
N ( A ,152 100)
B
A
165
95%
X
X 
の確率分布
15 / 100
N (0, 1)
95%
165  A
15 / 100
 1.96
0
165  B
15 / 100
 1.96
X 
15 / 100
母平均の区間推定(2)
165  A
 1.96
15 / 100
165  B
 1.96
15 / 100
15
 A  165 1.96
 167.94
100
15
 B  165 1.96
 162.06
100
母平均の95パーセント信頼区間は162.06cmから167.94cmである.
12
母平均の区間推定(一般ケース)
標本平均の確率分布
95%
N ( B , 2 n)
N ( A , 2 n)
B
A
X0
95%
X
X 
の確率分布
/ n
N (0, 1)
95%
X0  A
/ n
 1.96
0
X 0  B
/ n
 1.96
X 
/ n
母平均の区間推定(2)
X0  A
 1.96
/ n
X 0  B
 1.96
/ n

 A  X 0  1.96
n

 B  X 0  1.96
n
母平均の95パーセント信頼区間は


X 0  1.96
である.
から X 0  1.96
n
n
14
定期試験に向けて
1
計算ミスをした場合でも部分点がもらえるように,
途中のプロセスを書こう.
注:自分が後で見て分かるように,
しかし解答欄に収まるように.
2
中間試験の問題を解けるようにしておこう.
3
再試験になってしまったら,定期試験の問題を
解けるようにしておこう.
15