PowerPoint プレゼンテーション

土木計画学
第8回(11月30日)
計画における予測1
担当:榊原 弘之
土木計画における循環的なプロセス
問題の明確化
YES!
意思決定
Decision Making
調査
NO!
OK?
予測
解釈と評価
代替案の設計
本日の内容
・回帰分析について説明する.
1.回帰分析
2.重回帰分析
3.最小2乗法
複数の調査項目間の相関の有無の検討
共分散
(covariance)
sxy 
  fij{xi  x}{ y j  y}
相関係数
(correlation coefficient)
i
j
n
r
s xy
sx s y
x,yの標準偏差
回帰分析(regression analysis)
x,yの組のデータから, x,yの線形の(直線の)関係式を
導く.
y
y
x
x
xが1種類の場合:単回帰, xが2種類以上の場合:重回帰
想定:あるxiに対し,yiは平均値ηiを中心に正規分布する.
y
   0  1x
yi
i
i   0  1xi
0
N (0, 2 )
xi
x
切片  0 と傾き(回帰係数) 1 が母数
母数の推定値 ˆ0 , ˆ1 の下でのyの推定値と
yの実現値との差:残差(residual)
ei  yi  yˆi  yi  (ˆ0  ˆ1xi )
最小2乗法(method of least squares)
残差2乗和
S e  e12  e22  ...  en2
が最小となるような ˆ0 , ˆ1 を求める.
ˆ0 , ˆ1 で偏微分して0になるようにする(点推定と同じ).
Se 
n

n

{ yi  ( ˆ0  ˆ1xi )}2
より,
i 1
i 1
n
S e
 2 ( yi  ˆ0  ˆ1xi )(1)  0
ˆ0
i 1
n
S e
 2 ( yi  ˆ0  ˆ1xi )( xi )  0
ˆ1
i 1
n
n
n
ˆ0 1  ˆ1 xi 
yi
①
i 1
i 1
i 1
n
n
n
ˆ0 xi  ˆ1 xi2 
xi yi
②
i 1
i 1
i 1
ei2 








①の両辺をn(標本数)で割ると
ˆ0  ˆ1x  y
回帰直線は必ず ( x , y ) を通る
ˆ0  ˆ1x  y を②に代入すると
( ˆ1x  y )
n

i 1
xi  ˆ1
n

i 1
xi2 
n
 xi yi
i 1
S xy
ˆ
1 
S xx
S xy
ˆ
ˆ
 o  y  1x  y 
x
S xx
ここで



x
i

n
n

i 1 
S xx 
( xi  x ) 2 
xi2  
n
i 1
i 1

 n

2

偏差平方和
 n  n

 x 

y
i 
i

n
n


i 1  i 1 
S xy 
( xi  x )( yi  y ) 
xi yi  
n
i 1
i 1
偏差積和




このとき,最小化された残差2乗和は
Se 
n

i 1
ei2 
n

{ yi  ( ˆ0  ˆ1xi )}2
i 1
 S yy  ˆ12 S xx
回帰分析結果はどんなデータからも得られる.
結果が意味あるものか否かが問題となる.
検定の必要性
I:分散分析
II:回帰係数の検定
I:分散分析
n

n
( yi  y ) 2 
i 1

( yi  yˆ i  yˆ i  y ) 2
i 1
n


{ei  ( yˆ i  y )}2
i 1
n


i 1
n
ei 2 

( yˆ i  y ) 2
i 1
残差2乗和 回帰平方和
残差2乗和の割合が小さいほど良い
n
寄与率
R2 

( yˆi  y ) 2

( yi  y ) 2
i 1
n
i 1
回帰直線が,相関関係をどの程度説明できているか
相関係数の2乗に一致
分散分析
帰無仮説:回帰直線はyの推定の役に立たない
n
分散比
F0 

( yˆ i  y ) 2
i 1
n

はF分布F(1,n-2) に従う
ei 2 ( n  2)
i 1
有意水準αのとき,
F0  F (1, n  2, )
であれば帰無仮説棄却(回帰直線は意味がある)
II:回帰係数の検定
1.帰無仮説 1  0
(yは実はxと関係ないのではないか)
ˆ1  1
母数が 1 のとき,
は標準正規分布
 2 / S xx
N(0,1)に従う.
通常σがわからない
y
yi
0
N (0, 2 )
xi
x
t
ˆ1  1
Se /{(n  2) S xx }
帰無仮説 1  0
ˆ1
Se /{(n  2)S xx }
は自由度(n-2)のt分布に従う.
であるから,
の絶対値が
を上回っているか否か検定する.
(上回っていれば棄却)
 
tn2  
2
回帰係数の検定
2.帰無仮説  0  0
ˆ0
t
(1 / n  x 2 / S xx ){S e /(n  2)}
は自由度(n-2)のt分布に従う.
ˆ0
t
の絶対値が
2
(1 / n  x / S xx ){S e /(n  2)}
を上回っているか否か検定する.
(上回っていれば棄却)
 
tn2  
2