第4章 統計的検定 統計学 2006年度 Ⅰ 仮説検定の考え方 a) 仮説の設定 1) 検定仮説、対立仮説 2) 片側検定、両側検定 (その1) b) 2種類の誤り c) 仮説検定の手順 Ⅱ 1つの標本にもとづく検定 a) 母平均の検定 1) 母分散が既知の場合 2) 母分散が未知の場合 Ⅲ 2つの標本にもとづく検定 a) 母平均の差の検定 b) 母比率の差の検定 (その2) Ⅰ 仮説検定の考え方 次のような問題を考える。 • 2005年のセンター試験、数学Ⅱ・Bの平均点は53点であっ た。 • K予備校はセンター入試の直前に、「センター入試直前講 習」をおこなった。この講習の受講生の中から100人を選ん で調査したところ、その平均点は70点であった。 • K予備校の直前講習の成果はあったといえるだろうか。 ⇒ この疑問に対し、統計的に答える方法が統計的検定 a) 仮説の設定 1) 検定仮説、対立仮説 • この問題において、「直前講習の受講生の点数は全国平均と 変わらない」のか、 「直前講習の受講生の点数は全国平均よ り高い」のかが知りたいことである。 • 直前講習の受講生全体の平均点をμとあらわすと、 H0: μ=53 H1: μ>53 という二者択一の仮説を考え、標本の情報によっていずれか一 方の仮説を採択する。 • 検定仮説(H0) 検定したい状況を表したもの。否定されること を目的とした仮説の設定をおこなうことがあるので、帰無仮説 といわれることもある。(この場合、K予備校としては直前講習 の効果があったという結論を出したいので、この仮説は否定し てほしい) • 対立仮説(H1) 検定仮説と反対の状況をあらわしたもの。 検定仮説と対立仮説は、同時に成り立つことはなく、その2つ ですべての状況をあらわしている。 2) 片側検定、両側検定 • この例では、直前講習の受講生の平均点は「変わらない」か 「高い」の場合のみを考えた。(K予備校の直前講習を受けて 「低くなる」場合は考えなかった) ⇒ このように、対立仮説のとりうる範囲が検定仮説の片側 にくる検定を片側検定という。 • 一方、ネジを作る工場において作られたネジが規格どおりか どうかを判断する場合には、「規格どおり」か「大きいか、小さ いか」という判断が必要となる。 ⇒ この場合、対立仮説は検定仮説の両側の範囲をとる。こ のような検定を両側検定という。 b) 2種類の誤り • 仮説検定には2種類の誤りがある。 • 理想的な仮説検定は第1種の誤りと第2種の誤りがともに小さ くなるような検定であるが、これらを同時に成り立たせることは 難しい。 • 通常は第1種の誤りを0.05などの一定の小さな値(有意水準 という)以下におさえた検定をおこなう。これはH0を否定(棄却) する強い証拠がない限り、H0を採択するということである。 c) 仮説検定の手順 仮説検定は次のような手順をとる。 • K予備校の直前講習会の例では、100人の標本平均 x の分 布は中心極限定理により、平均μ、分散σ2 /nの正規分布にし たがう。 • これを標準化した x z n は標準正規分布にしたがうので、これが仮説検定に適当な統 計量である。 x (母分散が未知の場合は t s n 1 が自由度n-1のt分布にし たがうことを使う) • 仮説検定では、まず検定仮説が正しいと思ってみる。もし、 σ=10だったら、 z=(70-53)/10=1.7 となる。これは標本分布の95%の範囲内で ある。⇒ 検定仮説を採択 反対に標本分布の95%の範囲を超えたら対立仮説を採択す る。→ 他の母集団から得られた標本と考える。 5 4.5 4 3.5 3 2.5 2 1.5 1 0.5 0 -0.5 -1 -1.5 -2 100 95 90 85 80 75 70 65 60 55 50 45 40 35 30 25 20 → -2.5 標準化 0.45 0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0 -3 0.45 0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0 • 採択域と棄却域は次のように設定される。 両側検定 棄却域 採択域 棄却域 片側検定 採択域 棄却域 • 判定の境界値はそれぞれの統計量の分布による。(統計量 の分布が標準正規分布で両側検定の場合は、-1.96と1.96 の間に入れば採択域、それ以外が棄却域となる)
© Copyright 2024 ExpyDoc