S3-0 計量経済学 統計学の復習 続き 正規母集団からの無作為標本 正規分布、カイ二乗分布、t分布、 F分布と仮説検定 1 A2-2 標準正規分布 平均ゼロ分散1の正規分布を標準正規分布と呼び、Z で表す。 Zが標準正規分布に従うことを Z~N(0,1)で表す。 例1: Zi = (Xi)/ 例2: X μ 2 σ /n i = 1,2,..,n)、Zi~N(0,1) ~ N(0,1) 基準化、標準化、Z 化 期待値から標準偏差の単位で測る 2 統計学の最重要定理 LLN,CLT 大数の法則 • LLN(Law of Large Numbers) • 母集団からのn個の無作為標本 において、nが十分大きければ標 本平均 は母集団平均に一致 する。 の平均, 分散/n • • nが大きければ の分散はゼロに 近づく。 • の分布はの上でつぶれる。 中心極限定理 • CLT(Central Limit Theorem) • 標本平均 の分布は(母集団分 布の形にかかわらず)正規分布 に近づく。 • 元の分布がどのようなものであっ てもn大なら基準化した分布は N(0,1)に近づく。 • 和iXiの分布も正規分布に近づ く。(和は のn倍、正規分布に従 う確率変数をスカラー倍した結果 は正規分布に従う。) 3 Zテスト 平均の検定 X~N() X P(Z>Z)= Z -1 Z:Zの限界値 0 1 Z Z 値 0.10 Z0.10 1.282 0.05 Z0.05 1.645 0.025 Z0.025 1.960 0.005 Z0.005 2.576 4 t分布 t = • 分布の特徴 1. ゼロを中心とした釣鐘型(対称)。 2.自由度dfとともに形が変わり、増 加とともに標準正規分布に近づく。 分散df/(df-2) 3.N(0,1)より平ら(fat-tail) 4.自由度が大きい(50以上)なら N(0,1)にかなり近くなる。 5.自由度が無限なら分布はN(0,1) に一致。 (分母が1に収束) 注意:t分布の限界値 t: Pr(t>t) = 5 tテスト 平均の検定 仮説検定 は未知 • H0: , H1:≠ • 直感: は に十分近いか? • 距離| | • 基準化した距離 t0= | | = | | Pr(t>t)= / • 検定ルール |t|<t 有意度で棄却しない。 |t0|>t 棄却 例:n=9, s=3, =10, H0: =8, =0.05 検定量(t値)t0=2、t0.025=2.306 棄却しない。 t -1 t: tの限界値 自由度により変わる。 自由度8なら=> 0 t 1 Z t 値 Z 0.10 t0.10 1.397 1.256 0.05 t0.05 1.860 1.645 0.025 t0.025 2.306 1.960 0.005 t0.005 3.355 2.576 6 A2-3 カイ二乗分布(再掲) n個の独立なN(0,1) 変数Z1,Z2,..,Znの二乗和の従う分布を、 自由度nのカイ二乗分布と呼び2(n)で表す。 W~2(n) ならW = Z12 + Z22 +..+ Zn2と表せる。 Wの期待値はn(自由度)、分散は2n。 (和の期待値、独立な変数の和の分散) 例1: (Xi)2/~2(1) 例2: i(Xi)2/~2(n) 例3: i(Xi- X )2/(n1)S2/~2(n1) S2=i(Xi- X )2/ (n1) 不偏分散、標本分散 2 例4: n (X ) /2~2(1) 例5: W1~2(n1), W2~2(n2)かつW1,W2は独立なら W1 W2~2(n1+n2) 再生性 7 カイ二乗分布 分布の特徴 1.非負 2.非対称(左に偏り) 3.期待値=自由度(df)(E(zi2)=1) 4.分散=2df (Var(zi2)=2) 5.自由度df増とともに分布は右に移動 、拡がりながら対称に近づく。自由度が 大きくなるとN(df,2df)に近づく。(CLT) 注意:カイ二乗分布の右確率を与える 限界値をで表す。 Pr(W> 必要に応じて自由度を明記する。 例: (n1) 自由度と分布形 確率 8 カイ二乗分布の応用 • 適合度の検定 • 独立性の検定 • 平均の検定 H0:既知 Zテスト |Z0|に注目 Z0 = / カイ二乗テスト Z02 に注目 W= Z02 ~2(1) W>2(1) なら棄却 例: n=9,=3, =10, H0:=8 W0 = Z02 = 22 = 4 5% 限界値 2(1)0.05 = 3.84 =1.962 = Z0.0252 9 分散の検定(カイ二乗検定) 棄却は 大きすぎ) 受容 棄却は 小さすぎ) W0 n-1 : 分布の限界値 自由度により変化。 自由度8なら(付表3) 0.975 0.975 2.180 0.500 0.500 7.344 0.025 0.025 17.535 値 例:H0: = 。 で検定。 n=9, S2 = 16, 自由度 n-1=8 比率: S2 下限: 2.180/8 = 上限 17.535/8 = 10 A2-5 F分布 W1~2(n1), W2~2(n2), かつ独立とする。 F= W1 / n1 W2 / n 2 注意:分母、分子の期待値はそれぞれ1 (大雑把にいえば)Fはほぼ1を中心に分布 Fの従う分布を自由度(n1,n2)のF分布と呼びF~F(n1,n2)で表す。平均n2/(n22) 例1:t~t(n)なら、t2 ~F(1,n) t= 例2: Z Z2 Z2 / 1 2 => t = = W/n W/n W/n S12をN(1,2)、S22をN(2,2)から得られた 標本分散、データ数n1, n2 かつ独立。 (S12/2)/(S22/2)~F(n1-1, n2-1) なぜなら、例3より W1 = (n11)S12/~2(n11) W1/(n11) = S12/ W2 = (n21)S22/~2(n21) W2/(n21) = S22/ 11 12 分散比の検定(F検定) H0が真なら12=22 • F0= S12/S22 ~F(n1-1, n2-1) • 検定ルール F<F<Fなら棄却しない。 下限 上限 例:日本 n1 = 41 S12 = 102 =100 米国 n2 = 61 S22 = 152 = 225 有意度 =0.10 自由度(40,60) F0=100/225=0.444 上限 F0.05 = 1.693 下限 F0.95 = 表にない!? 13 F 分布 おまけ • F0.95 自由度(40,60) Pr(F0>F0.95) = 0.95 Pr(F0<F0.95) = 0.05 Pr(1/F0>1/F0.95) = 0.05 左辺(1/F0)~F(60,40) 1/F0.95 = F0.05(60,40) F0.95(40,60)=1/F0.05(60,40) = 1/1.594 = 0.627 受容域 下限: 0.627 上限: 1.694 分散比は0.444 仮説を有意度10%で棄却。 予告:回帰分析ではF分布は複数( m個)の係数についての同時検定な どに使われる。 m=1の時はt検定もしくは t02に注目したF検定を使う。 F検定は初等統計では「分散分析」 に使われた(はず)。 14
© Copyright 2025 ExpyDoc