第2章 確率と確率分布

第4章 統計的検定
統計学 2011年度
Ⅰ 仮説検定の考え方
a) 仮説の設定
1) 検定仮説、対立仮説
2) 片側検定、両側検定
b) 2種類の誤り
c) 仮説検定の手順
Ⅱ 1つの標本にもとづく検定
a) 母平均の検定
1) 母分散が既知の場合
2) 母分散が未知の場合
b) 母比率の検定
Ⅲ 2つの標本にもとづく検定
a) 母平均の差の検定
1) 母分散がともに分かっている場合
2) 母分散は分からないが、等しいとみなしてよい場合
※ 等分散の検定
3) 母分散について全く分からない場合
b) 母比率の差の検定
Ⅰ 仮説検定の考え方
次のような問題を考える。
• 2011年のセンター試験、英語の平均点は123点であった。
• T高校では3年生全員がセンター試験を受験したが、受験生の中から25
人を選んで調査したところ、その平均点は135点であった。
• T高校の生徒の英語の試験の成績は、全受験者平均より良いといえるだ
ろうか。
⇒ この疑問に対し、統計的に答える方法が統計的検定
母集団(T高校3年生全員)
×
×
×
×
×
×
×
母平均μ
×
標本(n=25)
×
×
標本平均x=135
検定(123点より良いかどうか)
a) 仮説の設定
1) 検定仮説、対立仮説
• この問題において、「T高校の生徒の英語の成績は全受験者
平均と変わらない」のか、 「T高校の生徒の英語の成績は全受
験者平均より高い」のかが知りたいことである。
• T高校の受験生全体の英語の平均点をμとあらわすと、
H0: μ=123
H1: μ>123
という二者択一の仮説を考え、標本の情報によっていずれか
一方の仮説を採択する。
• 検定仮説(H0) 検定したい状況を表したもの。否定される
ことを目的とした仮説の設定をおこなうことがあるので、帰無仮
説といわれることもある。(この場合、T高校としては「全受験者
平均より良い」という結論を出したいので、この仮説は否定して
ほしい)
• 対立仮説(H1) 検定仮説と反対の状況をあらわしたもの。
検定仮説と対立仮説は、同時に成り立つことはなく、
その2つですべての状況をあらわしている。
2) 片側検定、両側検定
• この例では、T高校の受験生の平均点は「変わらない」か「高
い」の場合のみを考えた。(T高校の受験生の平均点が全受
験者平均より「低い」場合は考えなかった)
⇒ このように、対立仮説のとりうる範囲が検定仮説の片側
にくる検定を片側検定という。
H0: μ=123
H1: μ>123
※ この例の場合、検定仮説をH0: μ≦123として、 「 T高校の生徒の英
語の成績は全受験者平均より高くない」のか 「 T高校の生徒の英語の
成績は全受験者平均より高い」のかを検定することも可能である。しか
しこの場合も検定仮説は対立仮説に近い値であるH0: μ=123を用いる。
理由は後述する。
• 一方、ネジを作る工場において作られたネジが規格どおりか
どうかを判断する場合には、「規格どおり」か「大きいか、小さ
いか」という判断が必要となる。
⇒ この場合、対立仮説は検定仮説の両側の範囲をとる。こ
のような検定を両側検定という。
たとえば、ネジの直径が5mmかどうかを検定するには、
H0: μ=5
H1: μ≠5
という両側検定をおこなうことになる。
H1: μ<5
H0: μ=5
あわせてH1: μ≠5
H1: μ>5
b) 2種類の誤り
• 仮説検定には2種類の誤りがある。
H0を採択
(逮捕)
H1を採択
(不逮捕)
H0が真
(真犯人)
正
取り逃がし
(第1種の誤り)
H1が真
(無実)
誤逮捕
(第2種の誤り)
正
• 理想的な仮説検定は第1種の誤りと第2種の誤りがともに小さ
くなるような検定であるが、これらを同時に成り立たせることは
難しい。
• 通常は第1種の誤りを0.05などの一定の小さな値(有意水準
という)以下におさえた検定をおこなう。これはH0を否定(棄却)
する強い証拠がない限り、H0を採択するということである。
c) 仮説検定の手順
仮説検定は次のような手順をとる。
<ステップ1>
<ステップ2>
<ステップ3>
仮説の設定
仮説検定に適当な統計量を選ぶ
検定仮説の採択域と棄却域を設定する
統計量が
採択域
<ステップ4>
H0を採択
統計量が
棄却域
H1を採択
<ステップ2>仮説検定に適当な統計量
• T高校の例では、25人の標本平均 x の分布は中心極限定
理により、平均μ、分散  の正規分布にしたがう。
n
• これを標準化した
2
z
x
 n
は標準正規分布にしたがうので、これが仮説検定に適当な統
計量である。
x
t

(母分散が未知の場合は s n  1 が自由度n-1のt分布にし
たがうことを使う)
<ステップ3>採択域と棄却域の設定
• 仮説検定では、まず検定仮説が正しいと思ってみる。T高校
の例で、σ=40であったなら、 x は平均   123 、
標準偏差   40  40  8 の正規分布にしたがう。
n
の分布
zの分布
90
z
100
110
120
130
135 123 12
  1.5
40 5
8
140
150
となる。これは標本分布の95%の範囲内
(両側検定の場合)である。⇒ 検定仮説を採択
5
4.5
4
3.5
3
2.5
2
1.5
1
0
0.5
-3
0.01
0
→
0.02
-0.5
0.03
-1
標準化
0.04
-1.5
0.05
0.45
0.4
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
-2
0.06
-2.5
x
5
25
5
4.5
4
3.5
3
2.5
2
1.5
1
0.5
0
-0.5
-1
-1.5
-2
-2.5
-3
5
4.5
4
3.5
3
2.5
2
1.5
1
0.5
0
-0.5
-1
-1.5
0.45
0.4
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
-2
• 片側検定の場合は、 zが0よりだい
ぶ大きい場合、検定仮説を棄却して
対立仮説を採択することになるが、
このようなzの値は、μ<123を仮定し
た分布(たとえばμ=120)のすべてに
おいて、検定仮説が棄却される。
zがここだったら検定仮
説を棄却し、対立仮説
を採択する。
-2.5
• この例の場合対立仮説を採択し、他
の母集団(たとえばμ=145)から得ら
れた標本と考える。
0.45
0.4
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
-3
• もし、z=2.5という結果が出たなら、
どのように考えれば良いのであろう
か。( x  143 のとき、z=2.5とな
る。)
zがここだったら検定仮
説を棄却し、対立仮説
を採択する。
• 採択域と棄却域は次のように設定される。
両側検定
棄却域
採択域
棄却域
片側検定
採択域
棄却域
• 判定の境界値はそれぞれの統計量の分布による。(統計量
の分布が標準正規分布で両側検定の場合は、-1.96と1.96
の間に入れば採択域、それ以外が棄却域となる)
• 片側検定において有意水準5%の検定をおこなう場合、標準
正規分布にしたがう変数であれば、
z  1.64 のとき検定仮説を採択し、 z  1.64 のとき対立仮説を採択す
る。
• t分布にしたがう変数であれば、α=.05の列から求める自由
度のものを探す。(ここでは、t0.90と表記する。)
Ⅱ 1つの標本にもとづく検定
a) 母平均の検定
1) 母分散が既知の場合
次のような問題を考える。
(例) ある工場では直径5mmのねじを標準偏差0.04mmにお
さまるような管理体制で製造している。製造機械の劣化に
よって、品質に変化が生じたかどうかを検討するために、9本
を標本として選んだところ、その平均が4.97mmであった。こ
れは品質管理上異常なしと考えて良いだろうか。
1.仮説の設定
この例の場合、 「品質管理上異常がない」か、「品質管理上異常がある」
かを検定する。
検定仮説としては「品質管理上異常がない」という仮説を用いる。このと
き対立仮説は「品質管理上異常がある」という仮説となり、
H0: μ=5 vs. H1: μ≠5
と表すことができる。この場合、対立仮説は検定仮説の両側をとる(「異
常がある」には、「大きすぎる」と「小さすぎる」の両方が含まれ、「異常が
ない」という検定仮説の両側の範囲をとる)。
※1 検定仮説と対立仮説を逆にし、 H0: μ≠5 vs. H1: μ =5 とすることも考えられ
る。しかし、採択域と棄却域を構成する場合、検定仮説が正しいとみなして構成
するため、検定仮説はある範囲(複合仮説)より、1つの数値(単純仮説)であること
の方が望ましい。
※2 「ねじがねじ穴に入るかどうか」を検定するなら、「ねじ穴に入る」という検定
仮説と、「ねじ穴に入らない」という対立仮説が考えられる。すなわち、 H0: μ≦5
vs. H1: μ > 5 とすることである。
2.検定統計量
この例では母分散が分かっているので、標本平均 x を用いて、
z
x
 n
を考えると、これは標準正規分布にしたがう。
3.採択域と棄却域
検定仮説が正しいと仮定する。このとき、標本平均をもとに計算したzが0
から大きく離れていたならばこの仮定は誤りだったと考える。
zがここだったら検
定仮説が正しいが
5
4.5
4
3.5
3
2.5
2
1.5
1
0.5
0
-0.5
-1
-1.5
-2
-2.5
-3
0.45
0.4
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
zがここだったら検定仮
説は誤りで、 このような分布が正し
いと考える。
この場合、zは標準正規分布にしたがうので、有意水準5%†の仮説検定
をおこなうなら、
 1.96  z  1.96 のとき検定仮説を採択し、
z  1.96 または z  1.96 のとき対立仮説を採択する。
棄却域
-1.96
採択域
1.96
棄却域
† 検定仮説が正しいなら、z>1.96またはz<-1.96となるような x が選ばれる確率は
5%である。これは第1種の誤りの確率すなわち有意水準が5%であることを意味
している。
4.統計量の計算
検定仮説が正しいとみなして(μに5を入れて)統計量を計算すると
x
4.97  5
z

 2.25
 n 0.04 9
となる。よって z  1.96 なので棄却域に入り、検定仮説を棄却し、対立
仮説を採択する。
2) 母分散が未知の場合
母分散が未知の場合は、zの代わりに
t
x
s n 1
を考え、こ
れが自由度n-1のt分布にしたがうことを用いて仮説検定をお
こなう。
次のような問題を考える。
(例) ある科目の試験を、平均点70点となるように作成したい。
そこで、26人をサンプルとして選び、問題をといてもらったと
ころ、26人の平均点は60点、分散が625であった。試験の問
題作りは成功したといえるだろうか。
(解)
1.仮説の設定 「平均点が70点である」という仮説を、「平均点が70点でな
い」という仮説に対して検定するので、 H0: μ=70 vs. H1: μ≠70 という仮
説を設定する。
2.検定統計量 標本平均 x を用いて、
x
t
s n 1
を考えると、これは自由度n-1のt分布にしたがう。
3.採択域と棄却域 検定仮説が正しいと仮定する。このとき、標本平均をも
とに計算したtが0から大きく離れていたならばこの仮定は誤りだったと考
える。tは自由度26-1=25のt分布にしたがうので、t0.95=2.060でる。有意
水準5%の仮説検定をおこなうなら、 2.060  t  2.060 のとき検定仮説
を採択し、t  2.060 または t  2.060 のとき対立仮説を採択する。
4.統計量の計算
x 
60  70
t

 2
s n  1 25 26  1
となる。  2.060  t  2.060 なので検定仮説を採択する。よって問題作
りは成功したといえる。
b) 母比率の検定
• 母比率の検定では、 z 
ことを利用する。
pˆ  p
が標準正規分布にしたがう
pq n
(例) 2011年6月7日(火)に放送された「キリンカップサッカー
日本 対 チェコ戦」では、視聴率が23.3%(関東地区 600世帯
を対象)であった。この結果から、20%を超えたといえるであ
ろうか。
(解)
1.仮説の設定 H0: p=0.2 vs. H1: p>0.2 という仮説を設定する。「20%を
超えない」という検定仮説に対し、「20%を超えた」という対立仮説を検定
するので、 H0: p≦0.2 vs. H1: p>0.2 であるが、検定仮説は対立仮説に
最も近い1点を考えれば良い。(0.2で成り立てば、それより小さな値では
必ず成り立つ)
2.検定統計量 標本比率 pˆ を用いて、
z
pˆ  p
pq n
を考えると、これは標準正規分布にしたがう。
3.採択域と棄却域 zは標準正規分布にしたがうので、有意水準5%の仮説
検定を片側検定でおこなうなら、 z  1.64 のとき検定仮説を採択し、z  1.64
のとき対立仮説を採択する。
4.統計量の計算
z
pˆ  p
0.233 0.2

 2.02
pq n
(0.2  0.8) 600
となる。 z  1.64 なので検定仮説を棄却し、対立仮説を採択する。よって
この番組の視聴率は20%を超えたといえる。
Ⅲ 2つの標本にもとづく検定
母集団1(個体数N1)
×
×
標本1(個体数n1)
×
×
×
×
×
×
×
×
ここに差がある
かどうかを検定
この差をもとに
母集団2(個体数N2)
×
×
標本2(個体数n2)
×
×
×
×
×
×
×
×
a) 母平均の差の検定
• 2つの母平均の差の検定は、2社のメーカーが作った電球の
寿命の差があるかどうかとか、試験の成績について男女間
で差があるかどうかなどを検定するときに用いられる。
• 母平均の差の検定は、母分散についての情報がどの程度あ
るかによって、次のように分類できる。
1) 母分散がともに分かっている場合
2) 母分散は分からないが、等しいとみなしてよい場合
3) 母分散について全く分からない場合
1) 母分散がともに分かっている場合
平均値の差の検定において、2つの標本平均 x1  x2 の分布は、
2
2


平均μ1-μ2、分散 1  2 の正規分布にしたがうことが理論的に導か
n1 n2
れる。
したがって、
z
( x1  x2 )  (1  2 )
 12
n1

 22
n2
が、標準正規分布にしたがう。
2つの母集団の分散がともに分かっている場合にはこの統計量を用いて、
検定をおこなえばよい。
⇒ ただし、このような仮定はあまり現実的ではない。
2) 母分散は分からないが、等しいとみなしてよい場合
この場合の検定は、現実味と対処しやすさの両方を持っている。
母分散を等しいとみなしてよいかどうかは、後述する等分散の検定をおこ
なうことが可能である。
したがって、
等分散の検定をおこなって等分散であると判定
→ 母分散は分からないが等しいとみなしてよい場合の検定の適用
という手順を用いればよい。
• 母分散は分からないが、等しいとみなしてよい場合には、2つの標本から
求められた分散を s12 , s22 とあらわすと、母分散の不偏推定量は
n1s12  n2 s22
ˆ 
n1  n2  2
2
となり、これを用いて
t
( x1  x2 )  ( 1   2 )
1 1
ˆ

n1 n2
を考えると、これは自由度 n1+ n2-2 のt分布にしたがう。
(例) A, B 2銘柄のタバコのニコチン含有量を調べたところ、銘
柄Aのタバコ10本は平均 27.0mg、標準偏差 1.7mg、 銘柄
Bのタバコ7本は平均 29.3mg、標準偏差 1.9mgであった。こ
の2つの銘柄の間にニコチン含有量の差はあるであろうか。
(解)
1.仮説の設定 銘柄Aのニコチン含有量をμ1、銘柄Bのニコチン含有量をμ2
とし、M=μ1 ー μ2とすると、
H0: M=0 vs. H1: M≠0
となる。
2.検定統計量 標本平均 x1 , x2 を用いて、
( x  x )  ( 1   2 )
t 1 2
1 1


n1 n2
を考えると、これは自由度n1+n2-2のt分布にしたがう。
3.採択域と棄却域 検定仮説が正しいと仮定する。このとき、標本平均をも
とに計算したtが0から大きく離れていたならばこの仮定は誤りだったと考
える。tは自由度10+7-2=15のt分布にしたがうので、t0.95=2.131である。
有意水準5%の仮説検定をおこなうなら、 2.131  t  2.131 のとき検定
仮説を採択し、t  2.131 または t  2.131 のとき対立仮説を採択す
る。
2 2
4.統計量の計算 σ
n sについて不偏推定量
 n s 2 10 (1.7) 2  7  (1.9) 2
ˆ 2 
1 1
2 2
n1  n2  2

10  7  2
 3.611
( x  x )  ( 1  2 )
(27.0  29.3)  0
 2.3
を用いると、
t 1 2


 2.457
1 1
 1 1  0.936


3.611   
n1 n2
 10 7 
t  2.131
よって
なので棄却域に入り、検定仮説を棄却し、対立仮説を
採択する。
2銘柄のニコチン含有量には差があるといえる。
※ 等分散の検定
• 2つの母集団の分散が等しいかどうかについても検定をおこなうことがで
きる。この検定では、「2つの母集団の分散は等しい」という検定仮説に対
し、「 2つの母集団の分散は等しくない」という対立仮説を想定して検定を
おこなう。すなわち、
H0: σ1 = σ2 vs. H1: σ1≠σ2
という仮説検定である。
この場合、
n1 2
s1
n1  1
F
n2 2
s2
n2  1
が自由度(n1-1, n2-1) のF分布に従う
• F分布は次のような形状をしている。
F分布の例
(1,1)
(5,5)
(2,10)
(10,2)
(3,28)
0.14
確率密度
0.12
0.1
0.08
0.06
0.04
0.02
F
6
5.6
5.2
4.8
4.4
4
3.6
3.2
2.8
2.4
2
1.6
1.2
0.8
0.4
0
0
<例> タバコの2銘柄の間で、ニコチン含有量の母分散に差があるかどう
かを検定してみる。
• 銘柄Aは10本で標準偏差 1.7mg、 銘柄Bは7本で標準偏差 1.9mg で
あった。
H0: σ1 = σ2 vs. H1: σ1≠σ2
という仮説検定をおこなうとき、検定統計量は
自由度(9,6)のF分布
0.1
0.09
0.08
0.07
0.06
0.05
0.04
0.03
0.02
0.01
0
となり、これが自由度(n1-1, n2-1) のF分布に従う。
自由度(9,6)のF分布の95%点は(0.231, 5.523)となるので、
0.231≦F≦5.523のとき、検定仮説を採択し、
F<0.231またはF>5.523のとき、検定仮説を棄却し、対立仮説を採
択する。
F
6
5.6
5.2
4.8
4
4.4
3.6
3.2
2.8
2
2.4
1.6
1.2
0.8
0
0.4
確率密度
n1 2
s1
n 1
F 1
n2 2
s2
n2  1
検定統計量を計算すると
n1 2 10
s1
 (1.7) 2
3.211
n 1
F 1
 9

 0.763
n2 2
7
s2
 (1.9) 2 4.211
n2  1
6
となるので、0.231≦F≦5.523より検定仮説を採択する。
よって、2つの母集団の分散は等しいといえる。(より正確には2つの母集
団の分散が異なるとはいえない)
この検定をおこなえば、母分散の等しい場合の検定を用いることができ
ることがわかる。
† 平均値の差の検定の予備的分析としてこの検定を用いる場合、有意
水準を少し大きめにとる(たとえば0.25など)。有意水準が0.05であると、
母集団の分散が等しいという検定仮説が棄却されにくく、母分散が異な
る場合にも、母分散が等しいと仮定して平均値の差の検定をおこなって
しまうからである。
3) 母分散について全く分からない場合
この場合には、
t
( x1  x2 )  ( 1   2 )
1 1
ˆ

n1 n2
が自由度 n1+ n2-2 のt分布には従わないことがわかっている。
しかし、自由度を修正することによって、t検定を利用することができる。
自由度を
s12
s22 2
(

)
n1  1 n2  1
 2
( s1 /(n1  1))2 ( s22 /(n2  1))2

n1  1
n2  1
によって求めると、自由度νのt分布に従う。(Welchの方法)
b) 母比率の差の検定
• 2つの母比率p1およびp2に差があるかどうかを検定する場合
は、
z
( pˆ 1  pˆ 2 )  ( p1  p2 )
1 1 
pq  
 n1 n 2 
が標準正規分布にしたがうことを利用する。
(例) 6月19日(日)に放送されたアニメ「サザエさん」の視聴率
は17.0%(関東地区 600世帯を対象)であった。この結果は、
同じ6月19日(日)に放送された「真相報道バンキシャ!」の視
聴率14.5%を上回ったといえるかどうか。
(解)
1.仮説の設定 「サザエさん」の視聴率をp1、「真相報道バンキシャ!」の視
聴率をp2とし、M= p1-p2とすると、H0: M=0 vs. H1: M>0 となる。
2.検定統計量 標本比率 pˆ1 , pˆ 2 を用いて、
z
( pˆ 1  pˆ 2 )  ( p1  p2 )
1 1 
pq  
 n1 n 2 
を考えると、これは標準正規分布にしたがう。
3.採択域と棄却域 zは標準正規分布にしたがうので、有意水準5%の仮説
検定をおこなうなら、 z  1.64 のとき検定仮説を採択し、z  1.64 のとき
対立仮説を採択する。
0.170  0.145
 0.1575
4.統計量の計算 pの値が不明なので、プールした推定値
2
をもちいる。
z
( pˆ 1  pˆ 2 )  ( p1  p2 )
1 1 
pq  
 n1 n 2 

(0.170 0.145)  0
1 
 1
0.1575 0.8425 


600
600


より、z  1.64 なので検定仮説を棄却しない。

0.025
 1.19
0.021