第2章 確率と確率分布

2つの標本にもとづく検定の補足
(第4章補足)
統計学 2007年度
2つの標本にもとづく検定
母集団1(個体数N1)
×
×
標本1(個体数n1)
×
×
×
×
×
×
×
×
ここに差がある
かどうかを検定
この差をもとに
母集団2(個体数N2)
×
×
標本2(個体数n2)
×
×
×
×
×
×
×
×
※ 母平均の差の検定
• 母平均の差の検定は、母分散についての情報がどの程度あるかによっ
て、次のように分類できる。
– 母分散がともに分かっている場合
– 母分散は分からないが、等しいとみなしてよい場合
– 母分散について全く分からない場合
•
このそれぞれの場合について、検定の方法をまとめてみる。
• 母分散がともに分かっている場合
平均値の差の検定において、2つの標本平均 x1  x2 の分布は、
平均μ1-μ2、分散
 12  22の正規分布にしたがうことが理論的に導か

れる。
n1 n2
したがって、
z
( x1  x2 )  (1  2 )
 12
n1

 22
n2
が、標準正規分布にしたがう。
2つの母集団の分散がともに分かっている場合にはこの統計量を用いて、
検定をおこなえばよい。
⇒ ただし、このような仮定はあまり現実的ではない。
• 母分散は分からないが、等しいとみなしてよい場合
この場合の検定は、現実味と対処しやすさの両方を持っている。
母分散を等しいとみなしてよいかどうかは、後述する等分散の検定をおこ
なうことが可能である。
したがって、
等分散の検定をおこなって等分散であると判定
→ 母分散は分からないが等しいとみなしてよい場合の検定の適用
という手順を用いればよい。
• 母分散は分からないが、等しいとみなしてよい場合には、2つの標本から
求められた分散を s12 , s22 とあらわすと、母分散の不偏推定量は
n1s12  n2 s22
ˆ 
n1  n2  2
2
となり、これを用いて
t
( x1  x2 )  ( 1   2 )
1 1
ˆ

n1 n2
を考えると、これは自由度 n1+ n2-2 のt分布にしたがう。
• 母分散について全く分からない場合
この場合には、
( x1  x2 )  ( 1   2 )
t
ˆ
1 1

n1 n2
が自由度 n1+ n2-2 のt分布には従わないことがわかっている。
しかし、自由度を修正することによって、t検定を利用することができる。
自由度を
s1 s2 2
 )
n1 n2

( s1 / n1 ) 2 ( s2 / n2 ) 2

n1
n2
(
によって求めると、自由度νのt分布に従う。(Welchの方法)
※ 等分散の検定
• 2つの母集団の分散が等しいかどうかについても検定をおこなうことがで
きる。この検定では、「2つの母集団の分散は等しい」という検定仮説に対
し、「 2つの母集団の分散は等しくない」という対立仮説を想定して検定を
おこなう。すなわち、
H0: σ1 = σ2 vs. H1: σ1≠σ2
という仮説検定である。
この場合、
n1 2
s1
n1  1
F
n2 2
s2
n2  1
が自由度(n1-1, n2-1) のF分布に従う
• F分布は次のような形状をしている。
F分布の例
1.2
(1,1)
(5,5)
(2,10)
(10,2)
0.8
0.6
0.4
0.2
F
6
5.6
5.2
4.8
4.4
4
3.6
3.2
2.8
2.4
2
1.6
1.2
0.8
0.4
0
0
確率密度
1
<例> タバコの2銘柄の間で、ニコチン含有量の母分散に差があるかどう
かを検定してみる。
• 銘柄Aは10本で標準偏差 1.7mg、 銘柄Bは7本で標準偏差 1.9mg で
あった。
H0: σ1 = σ2 vs. H1: σ1≠σ2
という仮説検定をおこなうとき、検定統計量は
n1 2
s1
n1  1
F
n2 2
s2
n2  1
となり、これが自由度(n1-1, n2-1) のF分布に従う。
自由度(9,6)のF分布の95%点は(0.231, 5.523)となるので、
0.231≦F≦5.523のとき、検定仮説を採択し、
F<0.231またはF>5.523のとき、検定仮説を棄却し、対立仮説を採
択する。
検定統計量を計算すると
n1 2 10
s1
 (1.7) 2
3.211
n 1
F 1
 9

 0.763
n2 2
7
s2
 (1.9) 2 4.211
n2  1
6
となるので、0.231≦F≦5.523より検定仮説を採択する。
よって、2つの母集団の分散は等しいといえる。(より正確には2つの母集
団の分散が異なるとはいえない)
この検定をおこなえば、母分散の等しい場合の検定を用いることができ
ることがわかる。
† 平均値の差の検定の予備的分析としてこの検定を用いる場合、有意
水準を少し大きめにとる(たとえば0.25など)。有意水準が0.05であると、
母集団の分散が等しいという検定仮説が棄却されにくく、母分散が異な
る場合にも、母分散が等しいと仮定して平均値の差の検定をおこなって
しまうからである。