多変量解析
第4章 単回帰分析
新納浩幸
単回帰分析とは?
x,yについて直線的な
関係を前提とした解析
説明変数が1つの物
→単回帰分析
右図は単回帰分析として
扱えるデータの一例
図1 成分Aの含有量xと
収率yのデータと散布図
解析の流れ
1.
2.
3.
4.
5.
単回帰モデルを想定、回帰母数を
最小2乗法より推定
寄与率と自由度調整済寄与率より
回帰式の評価
回帰係数の検定と推定
残差とテコ比の検討
得られた回帰式からの予測
1.回帰式の推定
取得できるデータには
ばらつきがある。
近似直線を求める必要有り
(最小2乗法を用いる)
単回帰モデル式
図2 単回帰モデルの考え方
ˆ 0 1 x i , i ~ N (0, 2 )
y
右上図は単回帰モデルを
示している
・・・式(1)
最小2乗法(1)
最小2乗法とは・・・
実測値と予測値の差(残
差)の平方和が最小になる
パラメータを求めること
予測値
yˆi ˆ0 ˆ1 xi
残差
ei yi yˆi yi (ˆ0 ˆ1 xi )
図3 残差と単回帰モデル
最小2乗法(2)
実際に解くために・・・
残差平方和から正規方程式を導く
正規方程式を解いてパラメータを得る
残差平方和
n
n
i 1
i 1
S e ei2 { yi ( ˆ0 ˆ1 xi )}2
最小2乗法(3)
パラメータの偏微分
n
S e
2 ( yi ˆ0 ˆ1 xi ) 0
ˆ0
i 1
n
S e
2 xi ( yi ˆ0 ˆ1 xi ) 0
ˆ1
i 1
正規方程式
ˆ0 n ˆ1 xi yi
ˆ0 xi ˆ1 xi2 xi yi
(上記方程式より単回帰式の推定式を得る)
最小2乗法(4)
正規方程式より求まるパラメータ導出式
ˆ0 y ˆ1 x
ˆ
1
(ただし、 x
( x x )( y y ) S
S
(x x)
i
i
2
i
xy
xx
単回帰式の推定式
yˆ ˆ0 ˆ1 x y ˆ1 ( x x )
x
i
n
,y
y )
i
n
S xy ( xi x )( yi y )
(ただし、
)
2
S xx ( xi x )
2.寄与率と自由度調整済寄与率(1)
求めた単回帰式の推定式
→有用かどうかを評価しなければならない
評価指標の寄与率R2を求める
寄与率とは・・・・
全変動のうち回帰によって説明できる変動の割合
計算結果が1に近いほど良い
2.寄与率と自由度調整済寄与率(2)
寄与率を求めるのに必要なパラメータ
目的変数yの平方和(yの全変動)
推定した回帰式から求まる回帰による平方和
この2つのパラメータの割合によって求められる。
yの平方和を求める
n
S yy ( yi y ) 2
i 1
S yy { yi ( ˆ0 ˆ1 xi )}2 {( ˆ0 ˆ1 xi ) yi }2
・・・式(2)
S yy ˆ1S xy S e
・・・式(3)
2.寄与率と自由度調整済寄与率(3)
回帰式より求める平方和
2
xy
S
2
ˆ
ˆ
ˆ
S R {( 0 1 xi ) y} 1S xy (
)
S xx
寄与率
Se
SR
R
1
S yy
S yy
2
・・・式(5)
・・・式(4)
2.寄与率と自由度調整済寄与率(4)
各平方和にはそれぞれ自由度が対応している
→自由度を調整した寄与率も必要になる
それぞれの平方和に対する自由度
Syy :φT = n-1
SR :φR = 1
Se :φe = n-2
2.寄与率と自由度調整済寄与率(5)
自由度を調整した寄与率:自由度調整済寄与率
Se e
R 1
S yy T
*2
・・・式(6)
この式は重回帰分析の時も有用
3.回帰係数の検定と推定(1)
求められた回帰式のパラメータ
ˆ1 は統計量
→確率分布から回帰係数の検定と推定を行う
母分散σ2の推定量
Se
ˆ Ve
e n 2
2
Se
・・・式(7)
3.回帰係数の検定と推定(2)
回帰係数 ˆ1の確率分布
2
ˆ
1 ~ N 1 ,
S xx
・・・式(8)
確率分布の標準化
ˆ1 1
u
~ N (0,12 )
2 S xx
・・・式(9)
3.回帰係数の検定と推定(3)
式(9)の標準式に式(7)を代入
ˆ1 1
t
~ t (e ) (e n 2)
Ve S xx
この式を用いて検定を行う
→帰無仮説、対立仮説を立てる
帰無仮説 H0: 0
1
対立仮説 H1: 1 0
・・・式(10)
3.回帰係数の検定と推定(4)
検定統計量
t0
̂1
Ve S xx
・・・式(11)
計算結果が|t0|≧t(φe,α)の時
有意水準αで有意である
帰無仮説H0は棄却される
3.回帰係数の検定と推定(5)
分散比
F0 t
2
0
2
ˆ
1
Ve S xx
SR
F (1, e ; )
Ve
β1の信頼率95%の信頼区間
Ve
ˆ
1 t (e ,0.05)
S xx
4.残差とテコ比の検討(1)
各サンプルにおける残差が推定回帰直線と比べ
異常に大きい(または小さい)
→何らかの問題がある可能性
残差の標準化:標準化残差
ek
e' k
Ve
標準正規分布N(0,12)に近似的に従う
4.残差とテコ比の検討(2)
各データが予測値に対しての影響力を測る
→テコ比を求める
第kサンプルの予測値を求める
yˆ k y ˆ1 ( xi x )
hk1 y1 hk 2 y2 hkk yk hkn yn
このときの係数hkkをテコ比と呼ぶ
4.残差とテコ比の検討(3)
テコ比の性質
n
h
k 1
kk
1 1 2( (説明変数の個数 ) 1)
1
hkk 1
n
5.得られた回帰式の利用
回帰式の推定量の確率分布
2
1
(
x
x
)
2
ˆ0 ˆ1 x ~ N ˆ0 ˆ1 x,
S xx
n
母回帰の区間推定、予測区画を構成できる
© Copyright 2026 ExpyDoc