統計基礎(第10回) 正規分布からの標本 早稲田大学大学院商学研究科 2014年12月10日 大塚忠義 1 母平均の検定(1) 正規分布を活用する検定 :標本の数が100以上 例:東京のラーメンの価格は500円より高 い? 帰無仮説 H 0 : μ=500 対立仮説 H1 : μ>500 有意水準 5%で片側検定を行う 電話帳でランダムに500件のラーメン屋に 電話をかけ価格を調査した 2 母平均の検定(2) その結果:標本平均520円、 標本標準偏差160円 500 母平均 unknown 母分散 200 標本数 520 標本平均 160 標本標準偏差 標本数が100を超えているので 標本標準偏差を代用する Z値 p値 1-p値 1.77 0.961 0.039 NORMS.DIST(1.77) 帰無仮説は棄却される。従って、 東京の ラーメンは500円より高い 3 Agenda 第9回 正規分布からの標本母集団 • 正規標本論 • 分布 • t 分布 • F 分布 4 正規母集団 正規母集団:分布が正規分布であると仮 定できる母集団 正規母集団を仮定すると理論も応用もス ムーズ 多くの理論、実務、ソフトウェアは正規母集 団から抽出した標本の統計量を対象に発 達した 統計的推測の理論は正規標本論を中心に 発達・構成されている 5 正規標本論(1) 正規標本論:正規母集団からの標本 X1 , X 2 ,,,, X n に基づく統計量の分布を活用 する 正規分布:ガウス分布:誤差分布 ガウスの惑星観測の際の誤差を測定す るために作った確率分布 推定誤差は確率分布である 観測の精度が高ければ誤差は小さい 観測の回数を増やせば制度は高まる 6 正規標本論(2) 正しい値は未知だが存在する=平均 観測の回数を増やすと観測値の平均は母 集団の平均に近づく 観測の回数を増やすと誤差のばらつき= 標準偏差は減少する 平均から一定の距離の外にある観測値 は誤差の範囲外⇒誤差以外の理由が存 在⇒有意である 7 正規分布の性格(1) 確率密度関数 1 (x ) f ( x) exp( ) 2 2 2 2 N ( , 2 ) 平均E ( X ) , 分散V ( X ) 2 1.平均、分散の2つの母数で形状が決定 する 2.平均を中心に左右対称のベル型の形状 8 正規分布の性格(2) 3.メディアン、モードは平均と一致する 4.我々が対象とする多くの母集団は正規 分布を仮定できる(中心極限定理) 5.母集団が正規分布であれば、標本平均 も正規分布に従う(再生性) 6.独立な標本からの統計量(例えば平均 の差)は正規分布に従う 9 正規分布の性格(3) 7.Xが正規分布に従えば、aX+bも正規分 布に従い、次のように標準化される Z X N (0,1) 2 1 z f ( z) exp( 2 ) 2 2 10 正規標本の分布 (1) 正規母集団からの統計量が従う確率分布 を4種類示す 1. 正規分布 標本平均 の分布(分散が既知) 2. 分布 標本分散 s2 の分布 n 1 2 s2 ( X X ) i n 1 i 1 11 正規標本の分布 (2) 3. t 分布 標本平均 の分布(分散が未知) 4. F分布 2 2 標本分散 s1 , s2 の比の分布 12 正規分布 分散が既知の場合の標本平均 X は正 規分布 N (, 2 n ) に従う X とするとZは N (0,1) に従う Z 2 n 既知でなくても標本数nが100以上あれば 正規分布とみなすことができる 13 分布(1) 2 , Z k : 独立、N (0,1) Z1 , Z 2 , Z Z 2 2 1 Z 2 2 2 k :自由度kの 分布に従う 2 2 14 分布(1) 2 n 1 2 s2 ( X X ) i n 1 i 1 Z2 (n 1) s 2 1 n 2 ( X X ) i 2 i 1 X1 2 X 2 2 ( ) ( ) 2 ( Xn )2 :各項はN (0,1)に近似できる 自由度k -1の 2分布に従う 15 t 分布(1) 次の条件を満たすとき、t 統計量は自由度 t の t 分布に従う Z t Y k ①Zは標準正規分布N(0.1)に従う ②Yは自由度kの 分布に従う ③ZとYは独立 16 t 分布(2) スチューデントのt 統計量は自由度n の t 分布に従う t X s2 n n 1 2 2 s (Xi X ) n 1 i 1 Sは標本分散、未知の母分散の代用品 17 F 分布(1) 次の条件を満たすとき、フィッシャーの分 散比Fは自由度 (k1 , k2 ) の F 分布に従う U F V k1 k2 ①Uは自由度 k1 の ②Vは自由度 k2の ③UとVは独立 分布に従う 分布に従う 18 F 分布(2) n 1 2 s (Xi X ) n 1 i 1 2 1 U (n 1) s 2 1 2 1 1 n 1 n 1 2 s (Yi Y ) m 1 i 1 2 2 V (m 1) s 2 2 2 2 1 m 1 19 F 分布(3) F U (n 1) V (m 1) s s 2 2 2 1 2 1 2 2 Fは自由度((n 1), (m 1))のF 分布に従う if 2 1 2 2 2 1 2 2 s F s 20 母平均の検定(1) t 分布を活用する検定 :標本の数が100未満 例:東京のラーメンの価格は500円より高 い? 帰無仮説 H 0 : μ=500 対立仮説 H1 : μ>500 有意水準 5%で片側検定を行う 電話帳でランダムに30件のラーメン屋に電 話をかけ価格を調査した 21 母平均の検定(2) その結果:標本平均520/560円、 標本標準偏差160円 母平均 母分散 標本数 500 unknown 500 unknown 30 30 標本平均 520 560 標本標準偏差 160 160 t値 p値 1-p値 0.68 0.751 0.249 2.05 T.DIST(0.68,29,1)(2.05) 0.975 0.025 22 Question? お疲れ様でした 次回できたらPCを お持ちください 23
© Copyright 2024 ExpyDoc