応用統計学第10回

第10回 直線回帰
教科書p204~211
タートラジンの濃度を変えて吸光度を測定した。
濃度(mol/L) i 1
2
・・・
n
×10-5
x1
x2
・・・
xn :実験条件(独立変数、説明変数)
測定吸光度 y1
y2
・・・
yn :測定値(従属変数、被説明変数)
y
(xn,yn)
測
定
値
y=a+bx
(xi,yi)
(x2,y2)
(x1,y1)
x1 x2・・・・・・・・・・・・・・xi ・ xn
:実験条件(xi)
x
最小2乗法
y
測
定
値
y=a+bx
(xn,yn)
y=a’+b’x
(xi,Yi):条件xiに対する関数上の点
(xi,yi)
(x2,y2)
Yi=a+bxi
(x1,y1)
a,b:回帰係数
x
x1 x2・・・・・・・・・・・・・・xi ・ xn
:実験条件(xi)
n
n
回帰残差の平方和: S    yi  Yi     yi  a  bxi 
i 1
2
2
i 1
最適直線の条件
S
最小
S
0
a
a
S
最小
S
0
b
b
n
S    yi  a  bxi 
2
i 1
n
n
i 1
i 1
  yi  na  b xi  0
S
 2  yi  a  bxi  1  0
a
i 1
n
n
n
n
i 1
i 1
i 1
  xi yi  a  xi  b xi  0
S
 2  yi  a  bxi  xi   0
b
i 1
n
n
n
n
n
i 1
i 1
i 1
i 1
X   xi , Y   yi , Z   xi yi , W   xi
na+Xb=Y
Xa+Wb=Z
YW  XZ
a
nW  X 2
XY  nZ
b 2
X  nW
2
1
 yi  b xi 
n
 xi  x  yi  y 
a  y  bx 
b
S xy
S xx

2


x

x
 i

x

  x  x    x 
n
2
n
S xx
2
i 1
n
2
i
2
i
S xy   xi  x  yi  y    xi yi
i 1
i
x y


i
n
i
回帰係数の標準誤差
1
 yi  b xi 
n
 xi  x  yi  y 
a  y  bx 
b
S xy

S xx
 x  x 

 2  Var( X )  E x   2

Var(kx)  k 2Var( x)
2
i
Var(a)  Var( y  bx )  Var( y )  x 2  Var(b)
   xi  x  yi  y  
 S xy 
2
2
2
2
2


  Var




x
x
Var(b)  Var
 

 


i
i
2

   xi  x 
  n  n 2  S  n  1  nS 
 S xx 
xx
xx 

2


1
2







Var
x

x
y


x


i
i

i
2


S xx 
   xi  x  
2 
n 



2


nS xx


1
2





x

x
Var
(
y
)

 i
i
2




x

x
  i

2
2
2




x
x
2


i
i


x


1
2 2

i
2



x

x

n
n


i
2
 


x

x
  i

nS xx

2
 x  x 
2
i

2
S xx
 2 
 xi
nS
2
y
測
定
値
(xn,yn)
b  sb 
y=a+bx
s
S xx
n
Yi=a+bxi
(xi,yi)
(x2,y2)
a  s a  s
 xi
yi-Yi:回帰残差
2
i 1
nSxx
(x1,y1)
x1 x2・・・・・・・・・・・・・・xi ・ xn
x
回帰直線からの標準偏差
n
 y
n
s
2


y

Y
 i i
i 1
n2
i 1

s2:回帰の残差分散
S yy  bS xy
n2
n
 Yi     yi  a  bxi 
2
i
2
i 1
n
n
   yi   y  bx   bxi     yi  y   b xi  x 
2
i 1
n
2
i 1

   yi  y   2b yi  y xi  x   b 2  xi  x 
i 1
2
 S yy  2bS xy  b 2 S xx
 S yy  bS xy
2
b 
S xy
S xx

回帰係数の誤差
y
y=a’+(b+Δb)x
(xn,yn)
y=a+bx
y=a’’+(b-Δb)x
測
定
値
(x2,y2)
s
b  sb 
S xx
(xi,yi)
(x1,y1)
x1 x2・・・・・・・・・・・・・・xi ・ xn
x
y=( a+Δa)+bx
y
測
定
値
(xn,yn)
y=a+bx
y=( a-Δa)+bx
n
(x2,y2)
(xi,yi)
a  sa  s
(x1,y1)
x1 x2・・・・・・・・・・・・・・xi ・ xn
x
 xi
i 1
nS xx
2
測定値の標準誤差が既知の場合
タートラジンの濃度を変えて吸光度を測定した。
濃度(mol/L) I 1
2
・・・
n
×10-5
x1
x2
・・・ xn
測定吸光度 y1
y2
・・・
yn
標準誤差
e1
e2
・・・
en
n
n
1
1
2
2
S   2  yi  Yi    2  yi  a  bxi 
i 1 ei
i 1 ei
2
n
n
n
n
n
xi
yi
xi yi
xi
1
N   2 , X   2 , Y   2 , Z   2 ,W   2
i 1 e i
i 1 e i
i 1 e i
i 1 e i
i 1 e i
xi 
yi
1  

 2  a   2  b   2
i 1 e i
 i 1 ei   i 1 ei 
n
n
n
xi   xi 
xi yi

 2  a   2  b   2
i 1 e i
 i 1 ei   i 1 ei 
n
n
2
n
YW  XZ
a
NW  X 2
XY  NZ
b 2
X  NW
n 1
a   2 
 i 1 ei 

1
2
 n xi 
b   2 
 i 1 ei 

1
2
2
YW  XZ
a
NW  X 2
XY  NZ
b 2
X  NW
演習10.1
甲状腺ホルモンT4は血中でTBGの濃度という蛋白に結合して
存在する。正常妊婦10人についてTBGとT4を測定した。
TBG濃度に対してT4を予想する一次式の回帰係数を求めなさい。
i
1
2
3
4
5
6
7
8
9
10
TBG
54
50
39
44
35
41
32
46
38
30
T4
17
15
15
14
13
12
11
10
10
9
演習10.2
右表はある物理量の測定値である。
回帰直線を求めなさい。また、
回帰係数の標準誤差をプラスマイナス
した回帰直線を比較しなさい。