統計基礎(第11回) いろいろな検定 早稲田大学大学院商学研究科 2015年6月24日 大塚忠義 1 Agenda 第11回 いろいろな検定 • 母平均の検定 Z検定、t 検定 • 平均差の検定 Z検定、t 検定(分散が等しい場合と 等しくない場合) • 等分散の検定 2 母平均の検定(1) Z検定:正規分布を活用する検定 母分散が既知または標本数が100以上 母平均を検定するに際し母分散が既知 である可能性は低い。実質的には標本数 が大きい場合の検定手法 t 検定:t 分布を活用する検定 母分散が未知かつ標本数が100未満 3 母平均の検定(2) Z値 t値 Z t X 2 n X s2 n n 1 2 s (Xi X ) n 1 i 1 2 4 正規分布を活用する母平均の検定(1) :標本の数が100以上 例:東京のラーメンの価格は500円より高 い? 帰無仮説 H 0 : μ=500 対立仮説 H1 : μ>500 有意水準 5%で片側検定を行う 電話帳でランダムに200件のラーメン屋に 電話をかけ価格を調査した 5 正規分布を活用する母平均の検定(2) その結果:標本平均520円、 標本標準偏差160円 500 母平均 unknown 母分散 200 標本数 520 標本平均 160 標本標準偏差 Z値 p値 1-p値 1.77 0.961 0.039 標本数が100を超えているので 標本標準偏差を代用する NORMS.DIST(1.77) 帰無仮説は棄却される。従って、 東京の ラーメンは500円より高い 6 t 分布を活用する母平均の検定(1) 標本の数が100未満 例:東京のラーメンの価格は500円より高 い? 帰無仮説 H 0 : μ=500 対立仮説 H1 : μ>500 有意水準 5%で片側検定を行う 電話帳でランダムに30件のラーメン屋に電 話をかけ価格を調査した 7 t 分布を活用する母平均の検定(2) その結果:標本平均520/560円、 標本標準偏差160円 母平均 母分散 標本数 500 unknown 500 unknown 30 30 標本平均 520 560 標本標準偏差 160 160 t値 p値 1-p値 0.68 0.751 0.249 2.05 T.DIST(0.68,29,1)(2.05) 0.975 0.025 8 母平均の検定 課題1.2 中学校1年生の平均身長は長らく160㎝で あるといわれている 別紙の統計データをもとにこの仮説が正し いか検定せよ 課題1:大規模データ、第2:小規模データ 9 平均差の検定(1) 2つの独立な集団が存在する :母集団が同じと異なるどちらもありうる :それぞれの集団から標本を抽出する 平均差: X Y X Y 0 帰無仮説:平均差は0である という検定は非常に多用する それぞれの標本の分布を正規分布と仮定 できれば、平均差も正規分布に従う 10 平均差の検定(2) 分散が既知であれば、平均差0の検定は 母平均の検定を使用できる 分散が未知 でも標本数が100以上あれば、使用でき る Z検定:正規分布を活用する検定 ( X Y ) ( 1 2 ) Z 12 n1 22 n2 標本数が100以上あれば 正規分布≒ t 分布 11 平均差の検定(3) 標本数が100未満で分散が未知 それぞれの集団の分散が等しい場合は t 検定:t 分布を活用する検定 を活用で n n 1 きる s 2 2 2 ( (X X ) (X X ) n1 n2 2 i 1 i i 1 i (n1 1) s12 (n2 1) s22 n1 n2 2 t ( X Y ) ( 1 2 ) s 2 ( 1n1 1 n2 ) 12 等分散の検定 まず、分散が等しいことを示すため 等分散の検定を行う フィッシャーの分散比をもとにF 分布のp 値を求める U F V k1 k2 13 F 分布(1) 次の条件を満たすとき、フィッシャーの分 散比Fは自由度 (k1 , k2 ) の F 分布に従う U F V k1 k2 ①Uは自由度 k1 の ②Vは自由度 k2の ③UとVは独立 分布に従う 分布に従う 14 F 分布(2) n 1 2 s (Xi X ) n 1 i 1 2 1 U (n 1) s 2 1 2 1 1 n 1 n 1 2 s (Yi Y ) m 1 i 1 2 2 V (m 1) s 2 2 2 2 1 m 1 15 F 分布(3) F U (n 1) V (m 1) s s 2 2 2 1 2 1 2 2 Fは自由度((n 1), (m 1))のF 分布に従う if 2 1 2 2 2 1 2 2 s F s 16 ウェルチ検定 標本数が100未満で分散が未知 それぞれの集団の分散が等しくない場合 ⇒等分散の検定が棄却された場合 単純なt 統計量を用いることができない 複雑な統計量をウェルチの近似法により、 t 分布に従う統計量を活用する 17 平均差の検定 課題3 中学校1年生と2年生の平均身長は異なる といえるか 別紙の統計データ(小規模データ)をもとに 仮説を立てたうえで、その仮説を検定せよ 18 Question? お疲れ様でした 19
© Copyright 2025 ExpyDoc