第4章 統計的検定 統計学 2007年度 Ⅰ 仮説検定の考え方 a) 仮説の設定 1) 検定仮説、対立仮説 2) 片側検定、両側検定 b) 2種類の誤り c) 仮説検定の手順 Ⅱ 1つの標本にもとづく検定 a) 母平均の検定 1) 母分散が既知の場合 2) 母分散が未知の場合 b) 母比率の検定 Ⅲ 2つの標本にもとづく検定 a) 母平均の差の検定 b) 母比率の差の検定 Ⅰ 仮説検定の考え方 次のような問題を考える。 • 2007年のセンター試験、英語の平均点は131点であった。 • T高校では3年生全員がセンター試験を受験したが、受験生 の中から25人を選んで調査したところ、その平均点は145点 であった。 • T高校の生徒の英語の試験の成績は、全受験者平均より良 いといえるだろうか。 ⇒ この疑問に対し、統計的に答える方法が統計的検定 a) 仮説の設定 1) 検定仮説、対立仮説 • この問題において、「T高校の生徒の英語の成績は全受験者 平均と変わらない」のか、 「T高校の生徒の英語の成績は全受 験者平均より高い」のかが知りたいことである。 • T高校の受験生全体の英語の平均点をμとあらわすと、 H0: μ=131 H1: μ>131 という二者択一の仮説を考え、標本の情報によっていずれか 一方の仮説を採択する。 • 検定仮説(H0) 検定したい状況を表したもの。否定される ことを目的とした仮説の設定をおこなうことがあるので、帰無仮 説といわれることもある。(この場合、T高校としては「全受験者 平均より良い」という結論を出したいので、この仮説は否定して ほしい) • 対立仮説(H1) 検定仮説と反対の状況をあらわしたもの。 検定仮説と対立仮説は、同時に成り立つことはなく、 その2つですべての状況をあらわしている。 2) 片側検定、両側検定 • この例では、T高校の受験生の平均点は「変わらない」か「高 い」の場合のみを考えた。(T高校の受験生の平均点が全受 験者平均より「低い」場合は考えなかった) ⇒ このように、対立仮説のとりうる範囲が検定仮説の片側 にくる検定を片側検定という。 H0: μ=131 H1: μ>131 ※ この例の場合、検定仮説をH0: μ≦131として、 「 T高校の生徒の英 語の成績は全受験者平均より高くない」のか 「 T高校の生徒の英語の 成績は全受験者平均より高い」のかを検定することも可能である。しか しこの場合も検定仮説は対立仮説に近い値であるH0: μ=131を用いる。 理由は後述する。 • 一方、ネジを作る工場において作られたネジが規格どおりか どうかを判断する場合には、「規格どおり」か「大きいか、小さ いか」という判断が必要となる。 ⇒ この場合、対立仮説は検定仮説の両側の範囲をとる。こ のような検定を両側検定という。 たとえば、ネジがの直径が5mmかどうかを検定するには、 H0: μ=5 H1: μ≠5 という両側検定をおこなうことになる。 H1: μ<5 H0: μ=5 あわせてH1: μ≠5 H1: μ>5 b) 2種類の誤り • 仮説検定には2種類の誤りがある。 H0を採択 (逮捕) H1を採択 (不逮捕) H0が真 (真犯人) 正 取り逃がし (第1種の誤り) H1が真 (無実) 誤逮捕 (第2種の誤り) 正 • 理想的な仮説検定は第1種の誤りと第2種の誤りがともに小さ くなるような検定であるが、これらを同時に成り立たせることは 難しい。 • 通常は第1種の誤りを0.05などの一定の小さな値(有意水準 という)以下におさえた検定をおこなう。これはH0を否定(棄却) する強い証拠がない限り、H0を採択するということである。 c) 仮説検定の手順 仮説検定は次のような手順をとる。 <ステップ1> <ステップ2> <ステップ3> 仮説の設定 仮説検定に適当な統計量を選ぶ 検定仮説の採択域と棄却域を設定する 統計量が 採択域 <ステップ4> H0を採択 統計量が 棄却域 H1を採択 <ステップ2>仮説検定に適当な統計量 • T高校の例では、25人の標本平均 x の分布は中心極限定 理により、平均μ、分散 の正規分布にしたがう。 n • これを標準化した 2 z x n は標準正規分布にしたがうので、これが仮説検定に適当な統 計量である。 x t (母分散が未知の場合は s n 1 が自由度n-1のt分布にし たがうことを使う) <ステップ3>採択域と棄却域の設定 • 仮説検定では、まず検定仮説が正しいと思ってみる。T高校 の例で、σ=40であったなら、 x は平均131、分散82の正規分 布にしたがう。 zの分布 x の分布 z 150 160 145 131 14 1.75 となる。これは標本分布の95%の範囲内 40 5 8 (両側検定の場合)である。⇒ 検定仮説を採択 5 4 3 2 1 4.5 140 3.5 130 2.5 120 1.5 110 0.5 100 0 0 -0.5 0.01 -1 → 0.02 -1.5 0.03 -2 標準化 0.04 -2.5 0.05 0.45 0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0 -3 0.06 5 4.5 4 3.5 3 2.5 2 1.5 1 0.5 0 -0.5 -1 -1.5 -2 -2.5 -3 zがここだったら検定仮 説を棄却し、対立仮説 を採択する。 5 4.5 4 3.5 3 2.5 2 1.5 1 0.5 0 -0.5 -1 -1.5 -2 0.45 0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0 -2.5 • 片側検定の場合は、 zが0より だいぶ大きい場合、検定仮説 を棄却して対立仮説を採択す ることになるが、このようなzの 値は、μ<131を仮定した分布 (たとえばμ=120)のすべてに おいて、検定仮説が棄却され る。 0.45 0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0 -3 • もし、z=2.4という結果が出た なら、どのように考えれば良い のであろうか。 • この例の場合対立仮説を採択 し、他の母集団(たとえばμ= 160)から得られた標本と考え る。 zがここだったら検定仮 説を棄却し、対立仮説 を採択する。 • 採択域と棄却域は次のように設定される。 両側検定 棄却域 採択域 棄却域 片側検定 採択域 棄却域 • 判定の境界値はそれぞれの統計量の分布による。(統計量 の分布が標準正規分布で両側検定の場合は、-1.96と1.96 の間に入れば採択域、それ以外が棄却域となる) • 片側検定において有意水準5%の検定をおこなう場合、標準 正規分布にしたがう変数であれば、 z 1.64 のとき検定仮説を採択し、 z 1.64 のとき対立仮説を採択する。 • t分布にしたがう変数であれば、α=.05の列から求める自由 度のものを探す。(ここでは、t0.90と表記する。) Ⅱ 1つの標本にもとづく検定 a) 母平均の検定 1) 母分散が既知の場合 次のような問題を考える。 (例) ある工場では直径5mmのねじを標準偏差0.04mmにお さまるような管理体制で製造している。製造機械の劣化に よって、品質に変化が生じたかどうかを検討するために、9本 を標本として選んだところ、その平均が4.97mmであった。こ れは品質管理上異常なしと考えて良いだろうか。 1.仮説の設定 この例の場合、 「品質管理上異常がない」か、「品質管理上異常がある」 かを検定する。 検定仮説としては「品質管理上異常がない」という仮説を用いる。このと き対立仮説は「品質管理上異常がある」という仮説となり、 H0: μ=5 vs. H1: μ≠5 と表すことができる。この場合、対立仮説は検定仮説の両側をとる(「異 常がある」には、大きすぎると小さすぎるの両方が含まれ、「異常がない」 という検定仮説の両側の範囲をとる)。 ※1 検定仮説と対立仮説を逆にし、 H0: μ≠5 vs. H1: μ =5 とすることも考えられ る。しかし、採択域と棄却域を構成する場合、検定仮説が正しいとみなして構成 するため、検定仮説はある範囲(複合仮説)より、1つの数値(単純仮説)であること の方が望ましい。 ※2 「ねじがねじ穴に入るかどうか」を検定するなら、「ねじ穴に入る」という検定 仮説と、「ねじ穴に入らない」という対立仮説が考えられる。すなわち、 H0: μ≦5 vs. H1: μ > 5 とすることである。 2.検定統計量 この例では母分散が分かっているので、標本平均 x を用いて、 z x n を考えると、これは標準正規分布にしたがう。 3.採択域と棄却域 検定仮説が正しいと仮定する。このとき、標本平均をもとに計算したzが0 から大きく離れていたならばこの仮定は誤りだったと考える。 zがここだったら検 定仮説が正しいが 5 4.5 4 3.5 3 2.5 2 1.5 1 0.5 0 -0.5 -1 -1.5 -2 -2.5 -3 0.45 0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0 zがここだったら検定仮 説は誤りで、 このような分布が正し いと考える。 この場合、zは標準正規分布にしたがうので、有意水準5%†の仮説検定 をおこなうなら、 1.96 z 1.96 のとき検定仮説を採択し、 z 1.96 または z 1.96 のとき対立仮説を採択する。 棄却域 -1.96 採択域 1.96 棄却域 † 検定仮説が正しいなら、z>1.96またはz<-1.96となるような x が選ばれる確率は 5%である。これは第1種の誤りの確率すなわち有意水準が5%であることを意味 している。 4.統計量の計算 検定仮説が正しいとみなして(μに5を入れて)統計量を計算すると x 4.97 5 z 2.25 n 0.04 9 となる。よって z 1.96 なので棄却域に入り、検定仮説を棄却し、対立 仮説を採択する。 2) 母分散が未知の場合 母分散が未知の場合は、zの代わりに t x s n 1 を考え、こ れが自由度n-1のt分布にしたがうことを用いて仮説検定をお こなう。 次のような問題を考える。 (例) ある科目の試験を、平均点70点となるように作成したい。 そこで、26人をサンプルとして選び、問題をといてもらったと ころ、26人の平均点は60点、分散が625であった。試験の問 題作りは成功したといえるだろうか。 (解) 1.仮説の設定 「平均点が70点である」という仮説を、「平均点が70点でな い」という仮説に対して検定するので、 H0: μ=70 vs. H1: μ≠70 という仮 説を設定する。 2.検定統計量 標本平均 x を用いて、 x t s n 1 を考えると、これは自由度n-1のt分布にしたがう。 3.採択域と棄却域 検定仮説が正しいと仮定する。このとき、標本平均をも とに計算したtが0から大きく離れていたならばこの仮定は誤りだったと考 える。tは自由度26-1=25のt分布にしたがうので、t0.95=2.060でる。有意 水準5%の仮説検定をおこなうなら、 2.060 t 2.060 のとき検定仮説 を採択し、t 2.060 または t 2.060 のとき対立仮説を採択する。 4.統計量の計算 x 60 70 t 2 s n 1 25 26 1 となる。 2.060 t 2.060 なので検定仮説を採択する。よって問題作 りは成功したといえる。 b) 母比率の検定 • 母比率の検定では、 z ことを利用する。 pˆ p が標準正規分布にしたがう pq n (例) 2007年5月30日(水)に放送された「藤原紀香・陣内智則 結婚披露宴」では、視聴率が24.7%(関東地区 600世帯を対 象)†であった。この結果から、20%を超えたといえるであろう か。 † ちなみに関西地区では40.0%であった。 (解) 1.仮説の設定 H0: p=0.2 vs. H1: p>0.2 という仮説を設定する。「20%を 超えない」という検定仮説に対し、「20%を超えた」という対立仮説を検定 するので、 H0: p≦0.2 vs. H1: p>0.2 であるが、検定仮説は対立仮説に 最も近い1点を考えれば良い。(0.2で成り立てば、それより小さな値では 必ず成り立つ) 2.検定統計量 標本比率 pˆ を用いて、 z pˆ p pq n を考えると、これは標準正規分布にしたがう。 3.採択域と棄却域 zは標準正規分布にしたがうので、有意水準5%の仮説 検定を片側検定でおこなうなら、 z 1.64 のとき検定仮説を採択し、z 1.64 のとき対立仮説を採択する。 4.統計量の計算 z pˆ p 0.247 0.2 2.878 pq n (0.2 0.8) 600 となる。 z 1.64 なので対立仮説を採択する。よってこの番組の視聴率 は20%を超えたといえる。 Ⅱ 2つの標本にもとづく検定 a) 母平均の差の検定 • 2つの母平均の差の検定は、2社のメーカーが作った電球の 寿命の差があるかどうかとか、試験の成績について男女間 で差があるかどうかなどを検定するときに用いられる。 • 母平均の差の検定は、母分散についての情報がどの程度あ るかによって、次のように分類できる。 – 母分散がともに分かっている場合 – 母分散は分からないが、等しいとみなしてよい場合 – 母分散について全く分からない場合 • この3通りについて、それぞれ用いる検定統計量は異なる。ここでは、母 分散は分からないが、等しいとみなしてよい場合を考えてみる。 • 2つの標本から求められた分散を s12 , s22 とあらわすと、母分散の不偏 推定量は n1s12 n2 s22 ˆ n1 n2 2 2 となり、これを用いて t ( x1 x2 ) ( 1 2 ) 1 1 n1 n2 を考えると、これは自由度 n1+ n2-2 のt分布にしたがう。 (例) A, B 2銘柄のタバコのニコチン含有量を調べたところ、銘 柄Aのタバコ10本は平均 27.0mg、標準偏差 1.7mg、 銘柄 Bのタバコ7本は平均 29.3mg、標準偏差 1.9mgであった。こ の2つの銘柄の間にニコチン含有量の差はあるであろうか。 (解) 1.仮説の設定 銘柄Aのニコチン含有量をμ1、銘柄Bのニコチン含有量をμ2 とし、M=μ1 ー μ2とすると、 H0: M=0 vs. H1: M≠0 となる。 2.検定統計量 標本平均 x1 , x2 を用いて、 ( x x ) ( 1 2 ) t 1 2 1 1 n1 n2 を考えると、これは自由度n1+n2-2のt分布にしたがう。 3.採択域と棄却域 検定仮説が正しいと仮定する。このとき、標本平均をも とに計算したtが0から大きく離れていたならばこの仮定は誤りだったと考 える。tは自由度10+7-2=15のt分布にしたがうので、t0.95=2.131である。 有意水準5%の仮説検定をおこなうなら、 2.131 t 2.131 のとき検定 仮説を採択し、t 2.131 または t 2.131 のとき対立仮説を採択する。 4.統計量の計算 σ2について不偏推定量 n1s12 n2 s22 10 (1.7) 2 7 (1.9) 2 ˆ 3.611 n1 n2 2 10 7 2 2 を用いると、 ( x x ) ( 1 2 ) (27.0 29.3) 0 2.3 t 1 2 2.457 1 1 1 1 0.936 3.611 n1 n2 10 7 よって t 2.131 なので棄却域に入り、検定仮説を棄却し、対立仮説を 採択する。 2銘柄のニコチン含有量には差があるといえる。 b) 母比率の差の検定 • 2つの母比率p1およびp2に差があるかどうかを検定する場合 は、 z ( pˆ 1 pˆ 2 ) ( p1 p2 ) 1 1 pq n1 n 2 が標準正規分布にしたがうことを利用する。 (例) 6月10日(日)に放送された「サンデーモーニング」の視聴 率は13.9%(関東地区 600世帯を対象)であった。この結果 は、同じ日に放送された「THEサンデー」の視聴率11.7%を 上回ったといえるかどうか。 (解) 1.仮説の設定 「サンデーモーニング」の視聴率をp1、「THEサンデー」の視 聴率をp2とし、M= p1-p2とすると、H0: M=0 vs. H1: M>0$ となる。 2.検定統計量 標本比率 pˆ1 , pˆ 2 を用いて、 z ( pˆ 1 pˆ 2 ) ( p1 p2 ) 1 1 pq n1 n 2 を考えると、これは標準正規分布にしたがう。 3.採択域と棄却域 zは標準正規分布にしたがうので、有意水準5%の仮説 検定をおこなうなら、 z 1.64 のとき検定仮説を採択し、z 1.64 のとき 対立仮説を採択する。 0.139 0.117 0.128 4.統計量の計算 pの値が不明なので、プールした推定値 2 をもちいる。 z ( pˆ 1 pˆ 2 ) ( p1 p2 ) 1 1 pq n1 n 2 (0.139 0.117) 0 1 1 0.128 0.832 600 600 より、z 1.64 なので検定仮説を棄却しない。 0.022 1.14 0.019
© Copyright 2025 ExpyDoc