応用統計学第11回

第11回 回帰係数の検定
i=
独立変数xi
従属変数yi
1
x1
y1
2
x2
y2
回帰係数
S xy
b
S xx
a
教科書p212~223
・・・
・・・
・・・
標準誤差
sb 
n
n
i 1
i 1
 yi  b xi
sa  s
n
y
s
S xx
 xi
n
xn
yn
(xn,yn)
測
定
値
2
nS xx
(xi,yi)
(x2,y2)
(x1,y1)
x1 x2・・・・・・・・・・・・・・xi ・ xn
n
s
  yi  Yi 
2
i 1
n2

S yy  bS xy
n2
y=a+bx
:実験条件(xi)
x
回帰の有意性
y
回帰係数:傾き
S xy
b
S xx
標準誤差
sb 
s
S xx
測
定
値
帰無仮説:b=0
測定値は実験条件に依存しない
対立仮説:b≠0
測定値は実験条件に1次で依存する
x1 x2・・・・・・・・・・・・・・xi ・ xn
:実験条件(xi)
x
標準誤差で標準化
b  0 b S xx
t

sb
s
母回帰係数:   b  t0.05
自由度n-2のt-分布
s
(95%信頼区間)
S xx
95%
-t0.05
t0.05
y切片の検定
回帰係数
n
a
y
i 1
i
標準誤差
n
 b xi
i 1
n
sa  s
 xi
2
nS xx
一定の値a0から有意に偏っているか?
帰無仮説:a=a0(aはa0に対して偏っているとは言えない)
対立仮説:a≠a0(aはa0に対して偏っている)
標準誤差で標準化
t
a  a0 a  a0

sa
s
母回帰係数:
nS xx
2
x
i
  a  t0.05s
自由度n-2のt-分布
x
i
nS xx
2
(95%信頼区間)
n
E  X    xi pi  
推定値Yの標準誤差
i 1
V (Y )  V (a  bx)
n
V  X    xi    pi   2
 V ( y  bx  bx)  V y  b x  x 
2
 V ( y )   x  x  V (b) 
2
n
n
σ2=>
s 
2

i 1
n2
1 xi  x 
Y  t0.05  s

n
S xx
2
df=8,t0.05=2.306
V (aX  bY )  a 2V ( X )  b 2V (Y )
 x  x 
 1  x  x 2 
  

n
S
xx


2


y

Y
 i i
i 1
2
2
S yy  bS xy
n2
2
2
S xx
n
E  X    xi pi  
個々のyiの分散
i 1
V  yi  Yi   V  yi   (1) V Y i     V a  bxi 
2
n
V  X    xi    pi   2
2
i 1
   V  y  bx  bxi     V y  bxi  x 
2
   V  y   xi  x  V b    
2
2
 1 xi  x 2 
  1  

n
S
xx


2
n
s 
2
V (aX  bY )  a 2V ( X )  b 2V (Y )
2
2
2


y

Y
 i i
i 1
n2

S yy  bS xy
n2
1 xi  x 
Y  t0.05  s 1  
n
S xx
2
df=8,t0.05=2.306
2
n
2
 xi  x 
2
2
S xx
回帰係数の差の検定
甲状腺ホルモンT4は血中で大部分がTBGと言う蛋白に結合して
存在する。妊娠中TBGの濃度は増加するので、T4も増加する。
正常妊婦10例、疾患A妊婦9例についてT4とTBGの関係を調べた。
正常
疾患A
TBG
T4
TBG
T4
54
17
43
22
50
15
39
21
39
15
49
19
44
14
42
18
35
13
35
16
41
12
31
15
32
11
36
13
46
10
34
11
38
10
27
8
30
9
y=a1+b1x
y=a2+b2x
参考
傾きの差の検定
S y1 y1  b1S x1 y1
s1 
s2 
n1  2
S y2 y2  b2 S x2 y2
n2  2
n1
s
s1
sb1 
S x1x1
s2
sb2 
S x2 x2
i 1
i 1
n1  n2  4
t
n
s

n1  2s12  n2  2s2 2
2
s1
s2
 V b1  b2  

S x1x1 S x2 x2
b1  b2
sb1 b2
 y  Y 
i 1
2
i
n2
i

S xx
s
S xx
S yy  bS xy
n2
n1  n2  4
2
sb1 b2
標準誤差 sb 
n2
2
  y1i Y1i     y 2i Y2i 
2
b
傾き
S xy
s1=s2=s
自由度n1+n2-4、t分布
母回帰係数の差の95%信頼区間
1   2  b1  b2  t0.05s
1
S x1x1

1
S x2 x2
sb1 b2  s
1
S x1x1

1
S x2 x2
y切片の差の検定
S y1 y1  b1S x1 y1
s1 
sa1  s1
n1  2
S y2 y2  b2 S x2 y2
s2 
sa2  s2
n2  2
n1
s
 y
i 1
n2
1i Y1i     y 2 i Y2 i 
2
n1  n2  4
sa1 a2 
t
2
 x1i
n1S x1x1
a1  a2
sa1  a2
 x1i
 x2 i
2

s2
2
 y  b x
i 1
i
x
i
nS xx
n1  2s12  n2  2s2 2
n1  n2  4
 x2i
2
s1=s2=s
sa1 a2  s
n1S x2 x2
自由度n1+n2-4、t分布
母回帰係数の差の95%信頼区間
 x1i
2
n1S x1x1

 x2i
2
n1S x2 x2
 x1i
2
n1S x1x1

i
i 1
n
標準誤差 sa  s
2
n
nS x2 x2

1   2  a1  a2  t0.05s
a
y切片
2
nS x1x1
2
i 1
s1
n
参考
 x2 i
2
n1S x2 x2
2
2標本t検定
:平均値の差の検定
分散は一様か?
2
s2
4.4442
F 2 
 2.849
2
2
.
63
s1
<F8,9,:0.05 =3.23
等分散
s
n1  1s12  n2  1s12
n1  n2  2
平均値の差を合成誤差で標準化
t
y1  y2
12.6  16

 2.06
1 1
1 1
s

3.60

n1 n2
10 9
自由度n1+n2-2のt分布
<t17:0.05(両側) =2.11
帰無仮説を採択:平均値に差があるとは言えない
 3.60
b1-b2
の標準誤差 sb1 b2  s
b1-b2の標準化
1

1
 2.467
1
1

 0.168
534.9 358
S x1x1 S x2 x2
b b
0.5196  0.233
t 1 2 
 1.706
sb1 b2
0.168
自由度n1+n2-4のt分布
<t15:0.05(両側) =2.131
帰無仮説を採択:傾きに差があるとは言えない
y切片の差の検定
TBG
sa1 a2 
T4
s1
sa1 a2  s
2
 x1i
xx
2

n1S x1x1
 x1i
s2
2
xy
 x2i
2
n1S x2 x2
s
2
n1S x1x1

 x2 i
2
n1S x2 x2
yy
TBG T4
xx
xy
yy
s1=s2=s
n1
 y
i 1
1i
n2
Y1i     y 2i Y2i 
2
i 1
n1  n2  4
2

n1  2s12  n2  2s2 2
n1  n2  4
=2.467
=6.6355
a1  a2
= 3.07-(-3.40) =0.974 <T15,α=0.05=2.131
sa1  a2
6.64
自由度10+9-4、t分布
帰無仮説を棄却できない:y切片に差があるとは言えない
t
演習11.1
ある物質を化合するのに触媒A、Bで温度による流量を比較した。
(1)収量は温度に依存しているといえるか。
(2)触媒のA,Bについて終了に差があるか。
触媒A
触媒B
温度
(℃)
収量
温度
(℃)
収量
63
20
55
35
50
15
39
21
39
12
49
22
44
14
42
18
35
13
35
16
41
12
31
12
32
11
36
15
46
15
30
11
38
10