応用統計学第5回

第5回 独立2群の差の検定
教科書p72~89
問題例1
健常人5名(N群)、バセドウ病患者7名(B群)に糖負荷検査を
行い、負荷後30分血糖上昇値を求めた。両群間に差があると
言ってよいか。(但し、両群は等分散とみなせるとする。)
N群 54 49 42 40 35
B群 68 65 60 56 52 47 44
帰無仮説:両群に差はない=> 同一母集団からのデータ
正規分布(母平均、母分散は未知)
N群の平均値:μ1
B群の平均値:μ2
H0:μ1=μ2
対立仮説:両群の血糖上昇値に差はある
H1:μ1≠μ2
有意水準5%で検定
n1
求められる統計量
N群の平均値m1、標準偏差s1
B群の平均値m2、標準偏差s2
s1 
2


x

m
 Ni 1
i 1
n1 1
m1の標準誤差: m1 
m2の標準誤差:
s1
n1
期待値<m1 –m2>=0:正規分布(標準偏差s)
m1 –m2の標準誤差Δm=(Δm1 2 +Δm2 2)1/2
2
s1 s2
1 1
m 

s

n1 n 2
n1 n 2
m1 –m2を標準誤差Δmで標準化する
m1 –m2
Δm
m1 –m2 :正規分布
Δm:統計量
n1
2
s2 
n2
2




x

m

y

m
 i 1  i 2
2
i 1
i 1
n1  n2  2
自由度n1+n2-2のt分布
n1
s1 
2


x

m
 Ni 1
i 1
n1 1
s1 n1  1  s2 n2  1
2
s 
n1  n2  2
2
2
s1=s2=s
2
2
s1 s2
1 1
m 

s

n1 n 2
n1 n 2
|tα=0.05|=2.228
m1 m2
t
m
=
44-56
4.93
自由度df=n1+n2-2=5+7-2=10
m1 –m2
Δm
=t
m1 –m2 :正規分布
Δm:統計量
m1 m2 44  56
t

 2.44
m
4.93
tα=0.05=2.228
π|t|≧2.44<α
帰無仮説を棄却
t=2.44
期待値の合成
正規分布N(μ1,σ12)とN(μ2,σ22)の母集団から、それぞれn個の
標本を取り出した。i個目の標本同志の和zi=xi1+xi2も正規分布
に従う。
測定値:
平均値 不偏分散
x11, x12,・・・, x1n
m1
s1 2
x21, x22,・・・, x2n
m2
s2 2
z1, z2, ・・・, zn
m
s2
平均値の期待値
<m1>=μ1
<m2>=μ2
<m>=?
n=∞
分散の期待値
<s12>=σ12
<s22>=σ22
<s2>=?
<m>=<m1 + m2>=<m1>+<m2>= μ1 + μ2
n
s2 
 z i m 
i 1
 x
n

i 1
n 1

2


x

x

m

m
 i1 i 2 1 2
i 1
n 1
i1  m1   2 x i1  m1  x i 2  m2    x i 2  m2 
2
2

n 1
n

n
2
 x
i 1
i1
n
2
i 1
i 1
n 1
 s1  s2
2
n
m1    x i 2 m2   2 x i1 m1 x i 2 m2 
2
2
s 2  s1  s2
2
2
 1   2
2
2
問題例2
糖負荷検査を行い、負荷後30分血糖上昇値の標準偏差は
健常人で7.5、バセドウ病患者で9.0と分かっている。ある負荷検査で
健常人5名の平均値44、バセドウ病患者7名の平均値は56であった。
両群間に差があると言ってよいか。
帰無仮説:両群に差はない=> 2つの正規分布の母集団
(平均、分散は既知)
H0:μ1=μ2
対立仮説:両群の血糖上昇値に差はある
有意水準5%で検定
H1:μ1≠μ2
σ
人数 平均
2

2
健常人 σ1=7.5
n1=5 m1=44 sm1  1
n1
患者
σ2=9.0
n2=7 m2=56
平均値m1,m2の合成分散
sm  sm1  sm 2
2
2
2
(m1-m2)をsmで標準化
m1 –m2
sm
=z
m1 –m2 :正規分布
sm :母標準偏差
z:標準正規分布N(0,1)
sm 
 12
n1
m1  m2 44  56
z

 2.5157 
sm
4.777

 22
n2
7.52 9.02


 4.777
5
7
zα=0.05=1.96
π|z|≧2.52<α
帰無仮説を棄却
z=2.52
問題例3
血中中性脂肪の正常値を求めるため、健常成人男性30例、
女子40例を測定した。
平均 標準偏差
例数
男
120
s1=21
n1=30
女
135
s2=30
n2=40
男女別設定値を設定する必要があるか。有意水準5%
分散s12、 s22は等しいか?
s22
s12 =u
F分布;自由度(n2-1,n1-1)
mn
m
m n
自由度(m,n)のF分布;



m
2   m  2 2 1  m  2

f (u : m, n) 
  u 1  u 
n 
m n n

    
 2  2
n1=39,n2=29
uα=0.05(df1=40,df2=30)=1.79
302
u  2  2.04
21
π|u|≧2.04<α
帰無仮説を棄却
分散s12、 s22は等しくない
F分布表
分子
分母
m1 –m2
Δm
=t
m1 –m2 :正規分布
Δm:統計量
2
2
s1 s2
212 302
m 



 37.2  6.099
n1 n 2
30 40
m1 m2 120  135
t

 2.459
m
6.10
2
 s12 s2 2 
 

n

n
37.212
1384
1
2 

df 


 67.7
2
2
2 2
2 2
21
30
20
.
43
 s1   s2 

  

30 2  29 40 2  39
n  n 
 1   2 
n1  1
n2  1
tα=0.05,df=67=1.995
π|t|≧2.46<α
帰無仮説を棄却
t=2.459
演習5.1
A,B2種類の野菜を同じ条件で栽培し、収穫時に地上部分の
重さを測定した。A,Bの収穫量に差があるといえるか。
有意水準5%で検定しなさい。
野菜A 3.6 3.1 3.7 3.3 3.2 kg
野菜B 3.1 2.3 2.9 2.4 3.3 3.0 kg
演習5.2
ある大学のA,B 2つのクラブ員の身長を測定した。
A 178 165 168 152 175 175 165 162 164 170 169 155 153 162 168
B 180 168 173 156 177 175 169 165 167 173 171 158
両クラブ員平均身長に差があるといってよいか。
有意水準5%で検定しなさい。