S3_0増補版 - Info Shako

S3-0 計量経済学
統計学の復習 続き
正規母集団からの無作為標本
正規分布、カイ二乗分布、t分布、
F分布と仮説検定
1
A2-2 標準正規分布
平均ゼロ分散1の正規分布を標準正規分布と呼び、Z で表す。
Zが標準正規分布に従うことを Z~N(0,1)で表す。
例1: Zi = (Xi)/
例2:
X μ
2
σ /n
i = 1,2,..,n)、Zi~N(0,1)
~ N(0,1)
基準化、標準化、Z 化
期待値から標準偏差の単位で測る
2
統計学の最重要定理
LLN,CLT
大数の法則
• LLN(Law of Large Numbers)
• 母集団からのn個の無作為標本
において、nが十分大きければ標
本平均 は母集団平均に一致
する。
の平均, 分散/n
•
• nが大きければ の分散はゼロに
近づく。
•
の分布はの上でつぶれる。
中心極限定理
• CLT(Central Limit Theorem)
• 標本平均 の分布は(母集団分
布の形にかかわらず)正規分布
に近づく。
• 元の分布がどのようなものであっ
てもn大なら基準化した分布は
N(0,1)に近づく。
• 和iXiの分布も正規分布に近づ
く。(和は のn倍、正規分布に従
う確率変数をスカラー倍した結果
は正規分布に従う。)
3
Zテスト 平均の検定
X~N()
X

P(Z>Z)=
Z
-1
Z:Zの限界値
0
1 Z

Z
値
0.10
Z0.10
1.282
0.05
Z0.05
1.645
0.025
Z0.025
1.960
0.005
Z0.005
2.576
4
t分布 t =
• 分布の特徴
1. ゼロを中心とした釣鐘型(対称)。
2.自由度dfとともに形が変わり、増
加とともに標準正規分布に近づく。
分散df/(df-2)
3.N(0,1)より平ら(fat-tail)
4.自由度が大きい(50以上)なら
N(0,1)にかなり近くなる。
5.自由度が無限なら分布はN(0,1)
に一致。 (分母が1に収束)
注意:t分布の限界値
t: Pr(t>t) = 
5
tテスト 平均の検定
仮説検定 は未知
• H0: , H1:≠ 
• 直感: は に十分近いか?
• 距離|  |
•
基準化した距離 t0=
|
|
=
|
|
Pr(t>t)=
/
• 検定ルール
|t|<t 有意度で棄却しない。
|t0|>t 棄却
例:n=9, s=3, =10, H0: =8, =0.05
検定量(t値)t0=2、t0.025=2.306
棄却しない。
t
-1
t: tの限界値
自由度により変わる。
自由度8なら=>
0
t
1 Z

t
値
Z
0.10
t0.10
1.397
1.256
0.05
t0.05
1.860
1.645
0.025
t0.025
2.306
1.960
0.005
t0.005
3.355
2.576
6
A2-3 カイ二乗分布(再掲)
n個の独立なN(0,1) 変数Z1,Z2,..,Znの二乗和の従う分布を、
自由度nのカイ二乗分布と呼び2(n)で表す。
W~2(n)
ならW = Z12 + Z22 +..+ Zn2と表せる。
Wの期待値はn(自由度)、分散は2n。
(和の期待値、独立な変数の和の分散)
例1:
(Xi)2/~2(1)
例2:
i(Xi)2/~2(n)
例3:
i(Xi- X )2/(n1)S2/~2(n1)
S2=i(Xi- X )2/ (n1) 不偏分散、標本分散
2
例4:
n (X   ) /2~2(1)
例5:
W1~2(n1), W2~2(n2)かつW1,W2は独立なら
W1 W2~2(n1+n2)
再生性
7
カイ二乗分布
分布の特徴
1.非負
2.非対称(左に偏り)
3.期待値=自由度(df)(E(zi2)=1)
4.分散=2df (Var(zi2)=2)
5.自由度df増とともに分布は右に移動
、拡がりながら対称に近づく。自由度が
大きくなるとN(df,2df)に近づく。(CLT)
注意:カイ二乗分布の右確率を与える
限界値をで表す。
Pr(W>
必要に応じて自由度を明記する。
例: (n1)
自由度と分布形
確率

8
カイ二乗分布の応用
• 適合度の検定
• 独立性の検定
• 平均の検定
H0:既知
Zテスト |Z0|に注目
Z0 =
/
カイ二乗テスト Z02 に注目
W= Z02 ~2(1)
W>2(1) なら棄却
例:
n=9,=3, =10, H0:=8
W0 = Z02 = 22 = 4
5% 限界値
2(1)0.05 = 3.84 =1.962 = Z0.0252
9
分散の検定(カイ二乗検定)
棄却は
大きすぎ)
受容
棄却は
小さすぎ)
W0


n-1
: 分布の限界値
自由度により変化。
自由度8なら(付表3)


0.975
0.975
2.180
0.500
0.500
7.344
0.025
0.025
17.535
値
例:H0:  = 。 で検定。
n=9, S2 = 16, 自由度 n-1=8
比率: S2  
下限: 2.180/8 = 上限 17.535/8 =
10
A2-5 F分布
W1~2(n1), W2~2(n2), かつ独立とする。
F=
W1 / n1
W2 / n 2
注意:分母、分子の期待値はそれぞれ1
(大雑把にいえば)Fはほぼ1を中心に分布
Fの従う分布を自由度(n1,n2)のF分布と呼びF~F(n1,n2)で表す。平均n2/(n22)
例1:t~t(n)なら、t2 ~F(1,n)
t=
例2:
Z
Z2 Z2 / 1
2
=> t =
=
W/n W/n
W/n
S12をN(1,2)、S22をN(2,2)から得られた
標本分散、データ数n1, n2 かつ独立。
(S12/2)/(S22/2)~F(n1-1, n2-1)
なぜなら、例3より
W1 = (n11)S12/~2(n11)
W1/(n11) = S12/
W2 = (n21)S22/~2(n21)
W2/(n21) = S22/
11
12
分散比の検定(F検定)
H0が真なら12=22
• F0= S12/S22 ~F(n1-1, n2-1)
• 検定ルール
F<F<Fなら棄却しない。
下限
上限
例:日本 n1 = 41 S12 = 102 =100
米国 n2 = 61 S22 = 152 = 225
有意度 =0.10
自由度(40,60) F0=100/225=0.444
上限 F0.05 = 1.693
下限 F0.95 = 表にない!?
13
F 分布 おまけ
• F0.95 自由度(40,60)
Pr(F0>F0.95) = 0.95
Pr(F0<F0.95) = 0.05
Pr(1/F0>1/F0.95) = 0.05
左辺(1/F0)~F(60,40)
1/F0.95 = F0.05(60,40)
F0.95(40,60)=1/F0.05(60,40)
= 1/1.594 = 0.627
受容域 下限: 0.627
上限: 1.694
分散比は0.444
仮説を有意度10%で棄却。
予告:回帰分析ではF分布は複数(
m個)の係数についての同時検定な
どに使われる。
m=1の時はt検定もしくは
t02に注目したF検定を使う。
F検定は初等統計では「分散分析」
に使われた(はず)。
14