統計基礎(第11回) いろいろな検定 早稲田大学大学院商学研究科 2016年1月13日 大塚忠義 1 Agenda 第11回 いろいろな検定 • 母平均の検定 Z検定、t 検定 • 平均差の検定 Z検定、t 検定(分散が等しい場合と 等しくない場合) • 等分散の検定 2 母平均の検定(1) Z検定:正規分布を活用する検定 母分散が既知または標本数が100以上 母平均を検定するに際し母分散が既知 である可能性は低い。実質的には標本数 が大きい場合の検定手法 t 検定:t 分布を活用する検定 母分散が未知かつ標本数が100未満 3 母平均の検定(2) Z値 t値 Z t X 2 n X s2 n n 1 2 s (Xi X ) n 1 i 1 2 4 正規分布を活用する母平均の検定(1) :標本の数が100以上 例:東京のラーメンの価格は500円より高 い? 帰無仮説 H 0 : μ=500 対立仮説 H1 : μ>500 有意水準 5%で片側検定を行う 電話帳でランダムに200件のラーメン屋に 電話をかけ価格を調査した 5 正規分布を活用する母平均の検定(2) その結果:標本平均520円、 標本標準偏差160円 母平均の検定 母平均 母分散 標本数 標本平均 標本標準偏差 Z値 1-p値 p値 500 unknown 200 520 標本数が100を超えているので 160 標本標準偏差を代用する 1.77 0.961 0.039 NORMS.DIST(1.77) 帰無仮説は棄却される。従って、 東京の ラーメンは500円より高い 6 t 分布を活用する母平均の検定(1) 標本の数が100未満 例:東京のラーメンの価格は500円より高 い? 帰無仮説 H 0 : μ=500 対立仮説 H1 : μ>500 有意水準 5%で片側検定を行う 電話帳でランダムに30件のラーメン屋に電 話をかけ価格を調査した 7 t 分布を活用する母平均の検定(2) その結果:標本平均520/560円、 標本標準偏差160円 母平均の検定 母平均 母分散 標本数 500 unknown 500 unknown 30 30 標本平均 標本標準偏差 520 560 160 160 t値 0.68 2.05 1-p値 0.751 0.975 p値 0.249 0.025 T.DIST(0.68,29,1)(2.05) 8 母平均の検定 課題1 中学校1年生の平均身長は長らく161㎝で あるといわれている 別紙の大規模データをもとにこの仮説が正 しいか検定せよ ただし有意水準1%とする 9 母平均の検定 課題2 中学校1年生の平均身長は長らく160㎝で あるといわれている 別紙の小規模データをもとにこの仮説が正 しいか検定せよ ただし有意水準10%とする 10 平均差の検定(1) 2つの独立な集団が存在する :母集団が同じと異なるどちらもありうる :それぞれの集団から標本を抽出する 平均差: X Y X Y 0 帰無仮説:平均差は0である という検定は非常に多用する それぞれの標本の分布を正規分布と仮定 できれば、平均差も正規分布に従う 11 平均差の検定(2) 分散が既知であれば、平均差0の検定は 母平均の検定を使用できる 分散が未知 でも標本数が100以上あれば、使用でき る Z検定:正規分布を活用する検定 ( X Y ) ( 1 2 ) Z 12 n1 22 n2 標本数が100以上あれば 正規分布≒ t 分布 12 平均差の検定(3) 標本数が100未満で分散が未知 それぞれの集団の分散が等しい場合は t 検定:t 分布を活用する検定 を活用で n n 1 きる s 2 2 2 ( (X X ) (X X ) n1 n2 2 i 1 i i 1 i (n1 1) s12 (n2 1) s22 n1 n2 2 t ( X Y ) ( 1 2 ) s 2 ( 1n1 1 n2 ) 13 等分散の検定 まず、分散が等しいことを示すため 等分散の検定を行う フィッシャーの分散比をもとにF 分布のp 値を求める U F V k1 k2 14 F 分布(1) 次の条件を満たすとき、フィッシャーの分 散比Fは自由度 (k1 , k2 ) の F 分布に従う U F V k1 k2 ①Uは自由度 k1 の ②Vは自由度 k2の ③UとVは独立 分布に従う 分布に従う 15 F 分布(2) n 1 2 s (Xi X ) n 1 i 1 2 1 U (n 1) s 2 1 2 1 1 n 1 n 1 2 s (Yi Y ) m 1 i 1 2 2 V (m 1) s 2 2 2 2 1 m 1 16 F 分布(3) F U (n 1) V (m 1) s s 2 2 2 1 2 1 2 2 Fは自由度((n 1), (m 1))のF 分布に従う if 2 1 2 2 2 1 2 2 s F s 17 ウェルチ検定 標本数が100未満で分散が未知 それぞれの集団の分散が等しくない場合 ⇒等分散の検定が棄却された場合 単純なt 統計量を用いることができない 複雑な統計量をウェルチの近似法により、 t 分布に従う統計量を活用する 18 平均差の検定 課題3 中学校1年生と2年生の平均身長は異なる といえるか 別紙の統計データ(小規模データ)をもとに 仮説を立てたうえで、その仮説を検定せよ 19 Question? お疲れ様でした 20
© Copyright 2024 ExpyDoc