Document

統計基礎(第10回)
正規分布からの標本
早稲田大学大学院商学研究科
2014年12月10日
大塚忠義
1
母平均の検定(1)
正規分布を活用する検定
:標本の数が100以上
例:東京のラーメンの価格は500円より高
い?
帰無仮説 H 0 : μ=500
対立仮説 H1 : μ>500
有意水準 5%で片側検定を行う
電話帳でランダムに500件のラーメン屋に
電話をかけ価格を調査した
2
母平均の検定(2)
その結果:標本平均520円、
標本標準偏差160円
500
母平均
unknown
母分散
200
標本数
520
標本平均
160
標本標準偏差
標本数が100を超えているので
標本標準偏差を代用する
Z値
p値
1-p値
1.77
0.961
0.039
NORMS.DIST(1.77)
帰無仮説は棄却される。従って、 東京の
ラーメンは500円より高い
3
Agenda
第9回 正規分布からの標本母集団
• 正規標本論
•
分布
• t 分布
• F 分布
4
正規母集団
正規母集団:分布が正規分布であると仮
定できる母集団
正規母集団を仮定すると理論も応用もス
ムーズ
多くの理論、実務、ソフトウェアは正規母集
団から抽出した標本の統計量を対象に発
達した
統計的推測の理論は正規標本論を中心に
発達・構成されている
5
正規標本論(1)
正規標本論:正規母集団からの標本
X1 , X 2 ,,,, X n に基づく統計量の分布を活用
する
正規分布:ガウス分布:誤差分布
ガウスの惑星観測の際の誤差を測定す
るために作った確率分布
推定誤差は確率分布である
観測の精度が高ければ誤差は小さい
観測の回数を増やせば制度は高まる
6
正規標本論(2)
正しい値は未知だが存在する=平均
観測の回数を増やすと観測値の平均は母
集団の平均に近づく
観測の回数を増やすと誤差のばらつき=
標準偏差は減少する
平均から一定の距離の外にある観測値
は誤差の範囲外⇒誤差以外の理由が存
在⇒有意である
7
正規分布の性格(1)
確率密度関数
1
(x  )
f ( x) 
exp(
)
2
2
2
2
N ( , 2 )
平均E ( X )   , 分散V ( X )  
2
1.平均、分散の2つの母数で形状が決定
する
2.平均を中心に左右対称のベル型の形状
8
正規分布の性格(2)
3.メディアン、モードは平均と一致する
4.我々が対象とする多くの母集団は正規
分布を仮定できる(中心極限定理)
5.母集団が正規分布であれば、標本平均
も正規分布に従う(再生性)
6.独立な標本からの統計量(例えば平均
の差)は正規分布に従う
9
正規分布の性格(3)
7.Xが正規分布に従えば、aX+bも正規分
布に従い、次のように標準化される
Z
X 

N (0,1)
2
1
z
f ( z) 
exp( 2 )
2
2
10
正規標本の分布 (1)
正規母集団からの統計量が従う確率分布
を4種類示す
1. 正規分布
標本平均 の分布(分散が既知)
2.
分布
標本分散 s2 の分布
n
1
2
s2 
(
X

X
)

i
n  1 i 1
11
正規標本の分布 (2)
3. t 分布
標本平均 の分布(分散が未知)
4. F分布
2
2
標本分散 s1 , s2 の比の分布
12
正規分布
分散が既知の場合の標本平均 X は正
規分布 N (,  2 n ) に従う
X 
とするとZは N (0,1) に従う
Z
2

n
既知でなくても標本数nが100以上あれば
正規分布とみなすことができる
13
 分布(1)
2
, Z k : 独立、N (0,1)
Z1 , Z 2 ,
 Z Z 
2
2
1
Z
2
2
2
k
 :自由度kの 分布に従う
2
2
14
 分布(1)
2
n
1
2
s2 
(
X

X
)

i
n  1 i 1
Z2 
(n  1) s 2

1
n
2
(
X

X
)
i
2 

 i 1
X1   2 X 2   2
(
) (
) 


2
(
Xn  

)2
:各項はN (0,1)に近似できる
自由度k -1の 2分布に従う
15
t 分布(1)
次の条件を満たすとき、t 統計量は自由度
t の t 分布に従う
Z
t
Y
k
①Zは標準正規分布N(0.1)に従う
②Yは自由度kの 分布に従う
③ZとYは独立
16
t 分布(2)
スチューデントのt 統計量は自由度n の
t 分布に従う
t
X 
s2
n
n
1
2
2
s 
(Xi  X )

n  1 i 1
Sは標本分散、未知の母分散の代用品
17
F 分布(1)
次の条件を満たすとき、フィッシャーの分
散比Fは自由度 (k1 , k2 ) の F 分布に従う
U
F
V
k1
k2
①Uは自由度 k1 の
②Vは自由度 k2の
③UとVは独立
分布に従う
分布に従う
18
F 分布(2)
n
1
2
s 
(Xi  X )

n  1 i 1
2
1
U
(n  1) s

2
1
2
1
1
n 1
n
1
2
s 
(Yi  Y )

m  1 i 1
2
2
V
(m  1) s

2
2
2
2
1
m 1
19
F 分布(3)
F
U
(n  1)
V
(m  1)
 s

 s
2
2
2
1
2
1
2
2
Fは自由度((n  1), (m  1))のF 分布に従う
if   
2
1
2
2
2
1
2
2
s
F
s
20
母平均の検定(1)
t 分布を活用する検定
:標本の数が100未満
例:東京のラーメンの価格は500円より高
い?
帰無仮説 H 0 : μ=500
対立仮説 H1 : μ>500
有意水準 5%で片側検定を行う
電話帳でランダムに30件のラーメン屋に電
話をかけ価格を調査した
21
母平均の検定(2)
その結果:標本平均520/560円、
標本標準偏差160円
母平均
母分散
標本数
500
unknown
500
unknown
30
30
標本平均
520
560
標本標準偏差
160
160
t値
p値
1-p値
0.68
0.751
0.249
2.05
T.DIST(0.68,29,1)(2.05)
0.975
0.025
22
Question?
お疲れ様でした
次回できたらPCを
お持ちください
23