第7章 2変数線形回帰モデル ・誤差項は無数の微少な誤差要因の和として表さ れるので,中心極限定理が働き,誤差項は正規分 布に従うと仮定されることが多い。この正規性の 変数の表記 仮定は,推定を行うときには特に必要ではないが, 検定を行うときには不可欠。 ・これまでは,確率変数を大文字で,実現値を小文 字で表してきたが,回帰(regression)では変数が ・誤差項が正規分布に従うとき,上の3つの仮定は, 多くなるので,これからはこの区別はしない。回 帰では,平均からの偏差形の変数を小文字で表す u1 ; u2 ; :::; un ò N ID(0; õ2 ) ことが多い。 として表される。 (正規分布のときは,独立と無相 関が同値であることに注意。) 回帰 ・以下では,誤差項は正規分布に従うと仮定する。 ・ある変数で,他の変数の動きを説明(予測)でき るとき,すなわち変数間に理論的な因果関係があ るときに回帰分析が行われる。 E[ut ] = 0 の仮定の意味 ・ut は微少な誤差の和であるので,正の誤差と負 ・これに対して,相関係数は2つの変数間の直線関 係の強さを表す指標であり,2つの変数に因果関 の誤差が相殺されて,その平均はゼロになると考 えられる。 係があることを必ずしも想定するものではない。 ・また, 2変数線形回帰モデル E[Yt ] = E[ã+ åXt + ut ] Yt = ã+ åXt + ut 2 = ã+ åXt + E[ut ] Yt :従属変数 (dependent variable) または被説明 変数 (regressand) 3 = ã+ åXt から,E[ut ] = 0 のとき,Yt の期待値が Yt と Xt Xt:独立変数 (independent variable) または説明 変数 (regressor) の間の理論関係式(ã+ åXt )に等しくなる。 ã:定数項 (constant term) または切片 (intercept) å:勾配係数(slope coeécient) 線形回帰の考え方 ・ã + åXt + ut は,Xt が与えられたとき Yt の データを生成する構造である。 ut :誤差項 (error term) ・ã と å をまとめて回帰係数 (regression coeé- ・E[Yt ] = ã+ åXt ,V (Yt ) = õ2 から cient) という。 ・Xt は非確率変数(確率変数であれば ut と独立) Yt ò N (ã+ åXt ; õ2 ) であると仮定されるが,誤差項 (ut ) が確率変数で あるので Yt は確率変数となる。 となり,母集団の平均が t とともに変動する(ã+ åXt )正規母集団であると考えられる。 ・Yt と Xt の理論的な関係式が Yt = ã+ åXt で あっても,実際のデータには観測誤差などが含ま ・このとき,未知母数は ã; å; õ2 である。 ・線形回帰モデルは,ã と å に関して線形(ã と å の1次式)であればよく,変数に関しては非線 れるため,Yt は ã+ åXt 上には完全には乗らず, Yt は ã + åXt の上下に散らばる。この,Yt と ã+ åXt の差が誤差項として定式化される。 形でもよい。 誤差項に関する仮定 例1. log Yt = ã+ ålog Xt + ut において,Yt0 = (1) E[ut ] = 0 (平均は 0) log Yt ; Xt0 = log Xt とおけば,線形回帰モデル Yt0 = ã+ åXt0 + ut として表され,線形回帰の理 (2) V (ut ) = õ2 (分散は一定で õ2 ) (3) E[ut us ] = 0 (t 6= s) (ut と us は無相関) 論がそのまま適用できる。 ・変数が対数で表されているとき(対数線形回帰 1 b をã b で偏微分すると として,L(b ã; å) bとå モデル),Xt で微分すると n X b @L(b ã; å) b t )(Ä1) = 2(Yt Ä ã b Ä åX @ã b t=1 d log Yt d log Xt =å dXt dXt 1 dYt 1 =å Yt dXt Xt 2 X b @L(b ã; å) b t )(ÄXt ) = 2(Yt Ä ã b Ä åX b @å t=1 b ã b å b = 0 とおくと, @L(b ã; å)=@ b = 0, @L(b ã; å)=@ から, å= 次の正規方程式が得られる。 dYt =Yt dXt =Xt n n X X b= nb ã+ ( Xt )å Yt よって,å は Xt が1単位変化したとき,Yt が何 n X ( Xt )b ã+ ( 単位変化するかを表しているので,Yt の Xt に対 する弾力性となっている。需要関数の推定におい t=1 t=1 b= Xt2 )å 最小自乗法 b を ã と å の何らかの推定値とすると,推 ・b ãと å 定された回帰直線は b t Ybt = ã b + åX 値という。 Pn Pn ・ t=1 Xt = nX; t=1 Yt = nY から Pn 2 t=1 Xt Yt Ä n X Y b= n P å 2 n nt=1 Xt2 Ä n2 X Pn t=1 Xt Yt Ä nX Y 2= P 2 n 2 t=1 Xt Ä nX ・残差と誤差は異なった概念であり(残差は観測 されるが,誤差は観測されない),残差は誤差の 推定値と考えられる。 ・データ全体と推定された回帰直線の距離とし て,残差自乗和 e2t さらに, n X t=1 b を決める を考え,これを最小にするように ã bとå のが最小自乗法 (Least Squares Method) である。 t=1 n X t=1 å の最小自乗推定量 = n X n X t=1 t=1 e2t = (7:2) t=1 (通常)最小自乗推定量( (ordinary)least squares estimator, OLSE あるいは LSE) という。また,Yt b を (通常) 最小自乗推定 を実現値と考えたとき,å et = Yt Ä Ybt b = L(b ã; å) Xt Yt (7:1) b ・Yt を実現値ではなく確率変数と考えたとき,åを となり,Yt と Ybt との差を残差という。 残差自乗和を t=1 n X b について解くと クラーメルの公式で å Pn å å å å t=1 Yt å åPn n P n å å Xt t Yt t=1 XP b= Pn t=1 P å n n jn Xt t=1 Xt X2 j Pn t=1 Pn Pnt=1 t n t=1 Xt Yt Ä t=1 Xt t=1 Yt Pn Pn 2= n t=1 Xt2 Ä ( t=1 Xt )2 ては,弾力性が重要であることが多いので,対数 線形回帰モデルが使われることが多い。 n X t=1 n X Xt Yt Ä nX Y = 2 Xt2 Ä nX = n X t=1 n X t=1 (Xt Ä X)(Yt Ä Y ) (Xt Ä X)2 を使うと, Pn (Xt Ä X)(Yt Ä Y ) b å = t=1 Pn 2 t=1 (Xt Ä X) n X (Yt Ä Ybt )2 t=1 b t )2 (Yt Ä ã b Ä åX となる。 ・xt = Xt Ä X,yt = Yt Ä Y と置くと(回帰分析 2 b では,よく平均からの偏差を小文字で表す。),å 残差に関する制約 残差自乗和を ã b で微分した式から は次のように書ける。 Pn xt yt b Pt=1 å= n 2 t=1 xt X b @L(b ã; å) b t) = 0 = (Ä2) (Yt Ä ã b Ä åX @ã b t=1 ここで, b t et = Yt Ä ã b Ä åX ã の最小自乗推定量 ・正規方程式の第1式から n n X X b= nb ã+ ( Xt )å Yt t=1 なので n X t=1 両辺を n で割ると ã の(通常)最小自乗推定量 が得られる。 が得られる。 b ã b = Y Ä åX また, ・この式から,推定された回帰直線は点 (X; Y ) から 最小自乗推定値を求める。 Xt 1 2 3 4 5 Yt 2 5 4 8 6 X b @L(b ã; å) b t )Xt = 0 = (Ä2) (Yt Ä ã b Ä åX b @å t=1 を通ることが分かる。 例2.次の5つのデータがあるとき,回帰係数の n X Xt et = 0 t=1 が得られる。 Pn Pn ・et には2つの制約 t=1 et = 0 と t=1 Xt et = 0 があるので,e1 ; e2 ; :::; en の自由度は n Ä 2 と ・まず,回帰係数の最小自乗推定値を計算するた めの表を作る。ただし,以下の表で,xt = Xt Ä なる。 X; yt = Yt Ä Y 。 合計 et = 0 t=1 Xt Yt xt yt x2t yt2 xt yt 1 2 -2 -3 4 9 6 2 3 5 4 -1 0 0 -1 1 0 0 1 0 0 4 5 8 6 1 2 3 1 1 4 9 1 3 2 15 25 0 0 10 20 11 線形推定量 ・å の最小自乗推定量 Pn xt yt b å = Pt=1 n 2 t=1 xt P において, の添え字は,t でも i でも何でも良 b の分母の P の添え字を i で表すと, いので,å Pn xt yt b = Pt=1 å n 2 i=1 xi この表から, 15 25 X= = 3; Y = = 5; 5 5 P5 b = Pt=1 xt yt = 11 = 1:1 å 5 2 10 t=1 xt b = 5 Ä 1:1 Ç 3 = 1:7 ã b = Y Ä åX と書ける。 ・wt を次のように定義する。 xt w t = Pn i=1 よって,推定された回帰直線は, x2i このとき, Ybt = 1:7 + 1:1Xt b= å ・ここでは,Ünt=1 yt2 は必要ではないが,後で決定 係数を計算するときに必要であるので,ここで計 算しておく。 2= n ê X t=1 n X t=1 3 x Pn t i=1 wt yt x2i ë yt (1) に関しては,すでに示されているので,ここで P は (2) と (3) を示す。ここでも,wt の分母の の添え字を i で表すと, n n ê ë X X x Pn t 2 Xt wt Xt = i=1 xi t=1 t=1 Pn t=1 xt Xt = P (7:4) n 2 i=1 xi と書ける。 n n X X xt = (Xt Ä X) n X t=1 t=1 2= t=1 Xt Ä nX 3 = nX Ä nX = 0 なので, n n X X x Pn t wt = t=1 = ここで, n n X X x2t = xt (Xt Ä X) 2 i=1 xi t=1 Pn x Pnt=1 2t = 0 x i=1 i t=1 n X t=1 2= t=1 wt Yt Ä Y ( 3= 3= ( wt t=1 4= wt = 0 なので) wt Yt いわれる。 ・同様にして,b ã も線形推定量になっていること (7:3) n X t=1 ・wt に関して,次の3つの等式が成立する。 n X (1) wt = 0 t=1 x2 Pn t b に代入すると, Yt = ã+ åXt + ut を å n X b= å wt Yt であった。ただし, xt wt = Pn 2 i=1 xi (3) t=1 となり,(3) が得られる。 t=1 t=1 n X n X x t Xt ( wt Xt の分子) ( i=1 x2i )2 Pn x2 3 = Pnt=1 2t 2 ( i=1 xi ) 1 4 = Pn 2 t=1 xt t=1 最小自乗推定量の分散 ・å の最小自乗推定量は (2) xt = 0 なので) t=1 n X 2= が分かる。 wt Yt xt t=1 となり,(2) が得られる。次に n n ê ë2 X X x Pn t 2 wt2 = i=1 xi t=1 t=1 いることを意味するので(ウエイトの wt は非確 b は線形推定量(linear estimator)と 率変数),å t=1 n X n X n X であるので, Pn n X x2t wt Xt = Pt=1 n 2 =1 i=1 xi t=1 b が Yt の1次式になって が得られる。この式は,å n X n X xt X t=1 x t Xt Ä X t=1 t=1 t=1 b å= x t Xt Ä t=1 n X t=1 t=1 n X n X n X n X t=1 2= となる。これらのことから, n n X X b= å wt yt = wt (Yt Ä Y ) n X 2= 3=ã wt + å t=1 wt Xt = 1 wt2 = Pn wt (ã+ åXt + ut ) t=1 n X t=1 w t Xt + n X wt ut t=1 (wt に関する性質 (1) と (2) から) n X 4 = å+ wt ut 1 t=1 n X x2t t=1 4 b の平均は よって,å b = å+ E[å] n X となる。まったく同様にして,n が一般の場合でも n n n X n X X X 2 2 2 ( wt ut ) = wi ui + wi wj ui uj wt E[ut ] = å t=1 t=1 となる。よって,最小自乗推定量は不変推定量で となる。 b = E[(åÄ b E[å]) b 2] V (å) ・非対角線の部分は,同じ項が2個ずつある(対 b å)2 ] 2 = E[(åÄ n X 3 = E[( wt ut )2 ] 角線に関して対称な位置にある項)ので, n X n X | {z } i6=j となる。 n n n X X X ( wt ut )2 = ( wt ut )( wt ut ) ではなく XX 2 wi wj ui uj P において, の添え字は何でもよいので,最初の P P の添え字を i,次の の添え字を j とすると, t=1 t=1 i>j と書かれることもある。 n n n X X X ( wt ut )2 = ( wi ui )( wj uj ) i=1 ・よって,分散は次のようになる。, b =E V (å) j=1 ・簡単のため,n = 3 の場合を例示すると, 3 X 1 ( wt ut )2 3 X t=1 2 =( 3 X wi ui )( i=1 2= wj uj ) n X b = V (å) + w3 w1 u3 u1 + w3 w2 u3 u2 + w32 u23 n X wi2 õ2 n X 2 b = Pnõ V (å) と書け,非対角線の部分は t=1 wi2 x2t となる。 wi wj ui uj ・同様にして,b ã の分散を計算すると i=1 j=1 i6=j wt ut )2 = | {z } wi wj E[ui uj ] i=1 j=1 Pn Pn wt の性質 (3) から, t=1 wt2 = 1=( t=1 x2t ) で b の分散は あるので,å i=1 t=1 wi2 E[u2i ] + i6=j n n XX i=1 wi2 u2i ( i=1 j=1 3 X i=1 wi2 u2i + i i=1 2 = õ2 対角線の部分は と書けるので, | {z } wi wj ui uj 0 (i 6= j) であるので, + w2 w1 u2 u1 + w22 u22 + w2 w3 u2 u3 3 X i=1 n X n X 誤差項の仮定により,E[u2t ] = õ2 ,E[ui uj ] = 4 = w12 u21 + w1 w2 u1 u2 + w1 w3 u1 u3 | {z } wi2 u2i + i6=j j=1 Ç (w1 u1 + w2 u2 + w3 u3 ) 3 X 3 X n hX i=1 3 = (w1 u1 + w2 u2 + w3 u3 ) 3 X wi wj ui uj i=1 j=1 t=1 t=1 i=1 j=1 i6=j ある。 b E[å] b = åÄ b å なので,分散は ・åÄ t=1 | {z } i=1 3 X 3 X | {z } V (b ã) = õ2 となる。 wi wj ui uj ê1 n X + Pn 2 t=1 x2t ë i=1 j=1 定理 7.1. ガウス=マルコフの定理 i6=j 5 すべての線形不偏推定量の中で,最小の分散をも ように書ける。 つのは最小自乗推定量である。 b の場合について示す。å の任 証明.ここでは,å b = å+ t=1 とする。さらに,ct = wt + dt (wt = xt = として,上の式に代入すると b= 2= 3= n X t=1 n X よって,b の分散は次のように計算される。 V (b) = E[(b Ä E[b])2 ] Pn i=1 2 = E[(b Ä å)2 ] n hê X ë 2i 3=E (wt + dt )ut x2i ) b の分散の計算と同様にして) (å n X 4 = E[ (wt + dt )2 u2t t=1 (wt + dt )Yt (wt + dt )(ã+ åXt + ut ) + t=1 + (wt + dt )ut i 5= n n êX ë X 4=ã wt + dt n X t=1 6=õ 7 = õ2 t=1 n êX ここで, n X t=1 (wt + dt )ut wt dt = t=1 2= n ê ë X dt + å 1 + dt Xt 3= t=1 4= となる。b が不偏推定量(E[ b ] = å)であるため には t=1 n X (wt + dt )2 wt2 + 2 t=1 t=1 E[ b ] = ã = õ2 ; E[ui uj ] = 0 (i 6= j) なので) t=1 t=1 n X (wi + di )(wj + dj )E[ui uj ] i6=j n ê ë X dt + å 1 + dt Xt n X | {z } (E[u2t ] n X 2 (wt + dt )ut t=1 n X n X n X i=1 j=1 t=1 よって, (wt + dt )2 E[u2t ] + n n X X ( wt = 0; wt Xt = 1 なので) + i6=j t=1 t=1 t=1 n X i=t n n êX ë X +å w t Xt + dt Xt t=1 + | {z } (wi + di )(wj + dj )ui uj ] i=1 j=1 (wt + dt )ã+ (wt + dt )Xt å n X n X n X t=1 t=1 n h X 5=ã (wt + dt )ut t=1 意の線形不偏推定量を b = c1 Y1 + c2 Y2 + ÅÅÅ+ cn Yn n X 2= ct Yt n X n ê X n X t=1 n X dt Xt = 0 t=1 でなければならない。この制約の下で,b は次の t=1 6 Xt dt = 0 dt = 0 wt dt + t=1 x Pn t n X t=1 ë 2 dt i=1 xi t=1 Pn xt dt Pt=1 n 2 i=1 xi Pn (X Ä X)dt t=1 Pn t 2 i=1 xi Pn Pn t dt Ä X t=1 XP t=1 n 2 i=1 xi 不偏性の条件から dt = 0 n X dt d2t ë であるので n X ・W = Pn s2 = wt dt = 0 t=1 分散の第2項が0なので, 2 V (b) = õ n êX wt2 + t=1 n X d2t t=1 ë 乗推定量であるので,最小自乗推定量はすべての 線形不偏推定量の中で最小の分散をもつ。// 最小自乗推定量の標準誤差 ê ë 2 b ò N å; Pnõ å 2 t=1 xt の一次結合であるので,正規分布の再生性によっ b の分布は正規分布である。また, てå から b の分散は から,å õ2 t=1 となる。 x2t ë 誤差分散 õ の不偏推定量 ・s2 を次のように定義すると, = 1 nÄ2 t=1 n X t=1 1 = nÄ2 b = pP s Se(å) n x2t ã b ò N ã; õ + Pn t=1 2 e2t x2t 2 b の分散の推定量という意味で V にハットがつ ・å いている。 b の正の平方根を å b の標準誤差(standard ・Vb (å) b と書く。 error)といい,Se(å) となる。 1 s = nÄ2 b = Pns Vb (å) t=1 2 ê ê1 ëë X ã b ò N ã; õ2 + Pn 2 n t=1 xt 2 x2t ・õ2 は未知であるので,その推定量 s2 で置き換 える。 ・同様にして,b ã の分布は n X 2 b = Pnõ V (å) t=1 2 t=1 xt ê 2 b N å; Pnõ åò õ2 W nÄ2 となり,不偏性が示される。 最小自乗推定量の分布 b は Yt ・Yt は正規分布に従う確率変数であり,å b = Pn V (å) と置くと となり,カイ自乗分布の期待値(平均)は自由度 であるので, h õ2 W i E[s2 ] = E nÄ2 õ2 = E[W ] nÄ2 õ2 = (n Ä 2) = õ2 nÄ2 となる。dt は実数であるので,分散が最小になる Pn のは, t=1 d2t = 0,すなわち d1 = d2 = ÅÅÅ= dn = 0 のときである。dt = 0 のとき,b は最小自 b =å E[å] 2 2 t=1 et =õ ・同様に n X t=1 (Yt Ä Ybt ) 2 b t )2 (Yt Ä ã b Ä åX ê 2 ê1 n X 2 t=1 から,b ã の標準誤差は s 2 1 X Se(b ã) = s + Pn 2 n t=1 xt s2 が õ2 の不偏推定量である。すなわち, E[s2 ] = õ2 t値 ・s2 はカイ自乗分布と関連している。 Pn 2 (n Ä 2)s2 t=1 et = ò ü2(nÄ 2) õ2 õ2 Z= 7 x2t ëë b å åÄ pPn ò N (0; 1) 2 õ= t=1 xt W = から p b の t 値とよばれる。 はå (n Ä 2)s2 ò ü2nÄ 2 õ2 Z W=(n Ä 2) ・同様に,帰無仮説 H0 : ã = ã0 に対する検定統 計量は ã b Ä ã0 tã b = Se(b ã) ò tnÄ 2 p b å)=(õ= Pn x2 ) (åÄ t=1 t p (n Ä 2)s2 =(õ2 (n Ä 2)) b å åÄ = pPn 2 s= t=1 xt b å åÄ = ò tnÄ 2 b Se(å) よって であり,その t 値は ã b tã b = Se(b ã) である。 例3.例2のデータを使って誤差分散の不偏推定 値を求め,回帰係数がゼロであるという仮説を有 意水準 5% で検定する。 が得られる。 ・帰無仮説が H0 : å = å0 のとき,検定統計量は b å0 åÄ tå b = Se(å) b ・まず,残差を計算するための表を作る。 で与えられる。 ・対立仮説(alternative hypothesis)として,次の 3つのうち適当なものを立てる。 H1 : å> å0 (右側検定) 合計 H1 : å< å0 (左側検定) 3.9 5.0 et = Yt Ä Ybt 4 5 8 6 6.1 7.2 15 25 Yt 1 2 2.8 2 3 この表から, H1 : å6= å0 (両側検定) e2t -0.8 0.64 1.1 -1 1.21 1.00 1.9 -1.2 3.61 1.44 0.0 7.9 P5 e2t 7:9 = = 2:633 nÄ2 3 p s = 2:633 = 1:623 s b Se(å) = qP 5 2 t=1 xt s2 = ・定数項を ã で表しているので,ここでは有意水 準を èで表すと,P (tå b > tè(n Ä 2)) = èまたは P (jtå j > t (n Ä 2)) = èを満たす tè(n Ä 2) や è=2 b tè=2 (n Ä 2) の値を t 分布表から求めることができ る。この tè(n Ä 2) や tè=2 (n Ä 2) を使うと,各対 t=1 1:623 = p = 0:513 10 v u 2 u1 X Se(b ã) = st + P5 2 n t=1 xt r 1 32 = 1:623 + = 1:702 5 10 帰無仮説 H0 : å= 0 を,対立仮説 H1 : å6= 0 立仮説に対する棄却域は次のように定められる。 (1) H1 : å > å0 のとき tå b > tè(n Ä 2) (2) H1 : å < å0 のとき tå b < tè(n Ä 2) (3) H1 : å 6= å0 のとき jtå bj > tè(n Ä 2) または,tå b < Ätè=2 (n Ä2); tå b > tè=2 (n Ä 2) ・特に,帰無仮説が H0 : å = 0 のとき,この仮 説は Xt が Yt に何の影響も与えないことを意味 する。回帰分析は,Xt が Yt に影響を与えること を想定して行われるので,もしこの帰無仮説が採 に対して検定すると,検定統計量の値は, b å 1:1 tå = = 2:144 b= b 0:513 Se(å) 択されれば,回帰分析を行うことの意味が失われ る。このことから,帰無仮説 H0 : å = 0 に対し となる。検定が両側検定であるとき,自由度3の t分布の有意水準 0.05 の棄却点は て検定を行うことは特に重要なことであると考え られる。この帰無仮説に対する検定統計量 b å tå = b b Se(å) 5 4 Ybt Xt 8 t0:025 (3) = 3:182 ê ë P (j tå j< 3:182) = 0:05 b であるので,検定統計量の値は採択域にはいる。 よって,帰無仮説は採択され,X は Y に有意な 影響を与える変数ではないといえる。 同様にして,帰無仮説 H0 : ã = 0 を,対立仮 t=1 4 = ã b ã b 1:7 = = 0:999 Se(b ã) 1:702 であるので,検定統計量の値は再び採択域にはい n X 決定係数(coeé cient of determination) 次の3つの変動を考える。 = (Yt Ä Y ) e2t (Ybt Ä Y )2 n X t=1 2 = n X n X n X t=1 4 = n X t=1 5 = =et (et + Ybt Ä Y )2 =0 =0 (Yt Ä Y )2 {z } Y の回りの変動 n X | (Ybt Ä Y )2 {z } | {z } e2t + 2 t=1 n X n X n X t=1 (Ybt Ä Y ) Pn t=1 (Yt 左辺を R2 と書いて,決定係数という。 Pn b (Yt Ä Y )2 R2 = Pt=1 n 2 t=1 (Yt Ä Y ) [e2t + 2et (Ybt Ä Y ) + (Ybt Ä Y )2 ] t=1 t=1 t=1 Pn b (Yt Ä Y )2 Pt=1 n 2 t=1 (Yt Ä Y ) Pn 2 e 2 = 1 Ä Pn t=1 t 2 (Y Ä Y) t Pt=1 n 2 e 3 = 1 Ä Pnt=1 t2 y t=1 t (Yt Ä Ybt +Ybt Ä Y )2 | {z } + ここで, | {z } =0 となり (Yt Ä Y )2 t=1 3 = | {z } Ä Y )2 で割ると Pn b Pn 2 (Yt Ä Y )2 t=1 et 1 = Pt=1 + P n n 2 2 t=1 (Yt Ä Y ) t=1 (Yt Ä Y ) 両辺を ・Y の回りの全変動を次のように分解する。 1 et t=1 n X b et +å et Xt = 0 | {z } t=1 n X 回帰によって説明できない変動 ・回帰によって説明できる Y の回りの全変動 t=1 et Y t=1 b t) Ä Y et (b ã + åX n X t=1 t=1 n X n X 回帰によって説明できる変動 n X + e2t t=1 2 ・回帰によって説明できない変動 n X | t=1 ・Y の回りの全変動 t=1 et Ybt Ä であるので, る。よって,帰無仮説は採択される。 n X t=1 n X 3 = 説 H1 : ã 6= 0 に対して検定すると,検定統計量の 値は, tb = ã n X 2 = et (Ybt Ä Y ) R2 は回帰によって説明できる変動の全変動に占め る割合を表しており,回帰のデータへの当てはま りの良さ(goodness of åt)をはかる尺度である。 Pn e2 2 1 Ä R = Pnt=1 t2 > =0 t=1 yt 2 et (Ybt Ä Y ) 2 なので,0 < =R < = 1 となり,Ä1 < =R< = 1 であ る。 9 ・R = 1 のとき,すべてのデータが正の傾きをも をもつ。Y の回りの全変動は 4 X つ直線上にあり,R = Ä1 のとき,すべてのデー タが負の傾きをもつ直線上にある。 t=1 (Yt Ä Y )2 2 = (0 Ä 1=2)2 + (0 Ä 1=2)2 例4.例2のデータを使って,推定された回帰式 の決定係数の値を求める。 + (1 Ä 1=2)2 + (1 Ä 1=2)2 3 = 1=4 + 1=4 + 1=4 + 1=4 = 1 ・決定係数の値は, P5 e2t R2 = 1 Ä Pt=1 5 2 t=1 yt = 1 Ä 7:9=20 = 0:605 なので,決定係数は Pn e2 R2 = 1 Ä Pn t=1 t 2 t=1 (Yt Ä Y ) 3=2 1 = 1Ä =Ä 1 2 となる。 ・回帰モデルに定数項が無い場合,決定係数には となり,負になってしまう。このことから,定数 項のないモデルでは,決定係数には何の意味もな 何の意味もないことに注意を要する。 いことが分かる。 例5.4つのデータ (0, 0),(0, 1),(1, 0),(1, 1) を考える。これらのデータは完全に散らばってお 問1.次の X と Y に関する5つのデータがある。 り,y と x の間には何の関係もないので,最小自 乗法で回帰直線を当てはめると,(0, 1/2) を通り x 軸に水平な直線 (y = 1=2) となるはずである。 しかし,回帰直線に定数項がないとき,モデルは Xt 2 3 4 5 6 Yt 7 10 8 9 11 このとき, Yt = åXt + ut Yt = ã+ åXt + ut と定式化され,このモデルでは,必然的に原点を 通る。 という回帰モデルを想定して次の問に答えよ。 (1) 回帰係数 ã と å の最小自乗推定値を求めよ。 このとき,データ (0, 0) に対する残差は0であり (e1 = 0),データ (0, 1) 対する残差は1である (2) 分散の不偏推定値と t 値を求めよ。 (3) 決定係数を求めよ。 b = 0:7,b (答:(1) å ã = 6:2 (2) s2 = 1:7, (e2 = 1)。データ (1, 0) と データ (1, 1) に対す る残差を,それぞれ,e3 ,e4 と置くと,残差自乗 tå = 3:545 b = 1:699,tb ã 和は e21 + e22 + e23 + e24 = 02 + 12 + e23 + e24 (3) R2 = 0:490 ) 問2.もとの回帰モデルを となり,e23 + e24 が最小になるときに残差自乗和も Yt = ã+ åXt + ut 最小になる。je3 j + je4 j = 1 で e3 < 0 であるので, Äe3 + e4 = 1 (e4 = 1 + e3 )。よって, とする。いま,独立変数 Xt の値をすべて a 倍し たものを改めて独立変数としたモデル e23 + e24 = e23 + (1 + e3 )2 2 = 2e23 + 2e3 + 1 ê 1ë2 1 3 = 2 e3 + + 2 2 よって,e3 = Ä1=2,e4 = 1=2 のとき残差自乗和 Yt = ã+ å(a Xt ) + ut の最小自乗推定値は,もとの最小自乗推定値の 1=a 倍になることを示せ。 は最小値 e21 + e22 + e23 + e24 2 = 02 + 12 + (Ä1=2)2 + (1=2)2 3 = 1 + 1=4 + 1=4 = 3=2 10 第8章 重回帰 ただし,e の第 t 要素は b1 + x2t å b2 + ÅÅÅ+ xkt å bk ) et = yt Ä (x1t å 重回帰モデル ・残差自乗和は b = L(å) ・独立変数が k 個ある回帰モデル(小文字である が,偏差形ではない。) b はスカラーなので, (y0 X å b (y 0 X å) b0=å b0 X 0 y から) y 0 X å= yt : 従属変数(被説明変数) xit : 第 i 独立変数 (説明変数) b0 X 0 y + å b0 X 0 X å b 4 = y 0 y Ä 2å åi : 第 i 回帰係数 ut : 誤差項 b を求めるために,残 ・残差自乗和を最小にする å b 差自乗和を å で微分するが,その前にベクトルの ・å1 が定数項ならば 微分の公式を示す。 x1t = 1 t = 1; 2; :::; n ・ベクトルの微分の公式(1次式) 2 3 2 3 a1 x1 6 7 6 7 6 a2 7 6 x2 7 7 7 a=6 x=6 6 .. 7 6 .. 7 4 . 5 4 . 5 an xn ・誤差項に関する仮定 u1 ; u2 ; :::; un ò N ID(0; õ2 ) 3 y1 6 7 6 y2 7 7 y=6 6 .. 7 ; 4 . 5 x11 6 6 x12 X =6 6 .. 4 . x1n 6 7 6 å2 7 7 å= 6 6 .. 7 ; 4 . 5 6 7 6 u2 7 7 u=6 6 .. 7 ; 4 . 5 2 å1 3 åk t=1 b å b0 X 0 y + å b0 X 0 X å b 3 = y 0 y Ä y 0 X åÄ (t = 1; 2; :::; n; n > k) yn e2t = e0 e b 0 (y Ä X å) b 2 = (y Ä X å) yt = x1t å1 + x2t å2 + ÅÅÅ+ xkt åk + ut 行列表示 2 n X 2 2 u1 3 x21 x22 .. . x2n 3 ÅÅÅxk1 7 ÅÅÅxk2 7 7 . . .. 7 . . 5 とし,y = a0 x とすると @y =a @x 例として,n = 3 の場合を示す。 ÅÅÅxkn y = a0 x = a1 x1 + a2 x2 + a3 x3 であるので 2 un と置くと,重回帰モデルは 2 a1 3 ・ベクトルの微分の公式(2次式) 2 3 2 3 a11 a12 . . . a1n x1 6 7 6 7 6 a21 a22 . . . a2n 7 6 x2 7 7 A=6 x=6 .. .. .. 7 6 .. 7 6 .. 7 4 . 4 . 5 . . . 5 y = Xå+ u と書ける。 (通常の行列の要素表示と X の添え字 が逆であることに注意。例えば,n 行 k 列の要素 が xkn 。) an1 an2 . . . ann 最小自乗推定量 b (å b1 ; å b2 ; :::; å bk )0 を å の何らかの推定量と ・å= とし,y = x0 Ax とすると すると,残差は b e = y Ä Xå 3 @y 6 7 6 7 = 4 @ y=@ x2 5 = 4 a2 5 = a @x @ y=@ x3 a3 @ y=@ x1 @y = A0 x + Ax @x 11 xn 特に,A が対称行列(A0 = A) のとき @y = 2Ax @x ・残差自乗和は b = y 0 y Ä 2å b0 X 0 y + å b0 X 0 X å b L(å) 例として n = 3 の場合を示す。 2 32 3 a11 a12 a13 x1 6 76 7 2 = (x1 ; x2 ; x3 ) 4 a21 a22 a23 5 4 x2 5 y = x0 Ax 2 a31 a32 a33 x3 b x = å,a = X 0 y,A = X 0 X と置いてベクトルの 微分の公式を使うと,X 0 X は対称であるので, b @ L(å) b = 0 Ä 2X 0 y + 2X 0 X å b @å 3 a11 x1 + a12 x2 + a13 x3 6 7 3 = (x1 ; x2 ; x3 ) 4 a21 x1 + a22 x2 + a23 x3 5 a31 x1 + a32 x2 + a33 x3 b b 0 と置くと,正規方程式 となる。@ L(å)=@ å= b X0y X 0 X å= 4 = +x1 (a11 x1 + a12 x2 + a13 x3 ) + x2 (a21 x1 + a22 x2 + a23 x3 ) が得られる。X 0 X が非特異 (jX 0 Xj 6= 0) であれ ば,逆行列が存在するので,残差自乗和を最小に b が一意に定まる。これが,最小自乗推定量 する å + x3 (a31 x1 + a32 x2 + a33 x3 ) 5 = a11 x21 + a12 x1 x2 + a13 x1 x3 b = (X 0 X)Ä 1 X 0 y å + a21 x1 x2 + a22 x22 + a23 x2 x3 + a31 x1 x3 + a32 x2 x3 + a33 x23 である。 であるので 2 3 多重共線性 @ y=@ x1 @y 6 7 = 4 @ y=@ x2 5 @x @ y=@ x3 2= " ・X は nÇk 行列であり,n > k であるので,X 0 X が非特異であるためには X の k 個の列ベクトル が1次独立であればよい。通常は,X の k 個の列 2a11 x1 + a12 x2 + a13 x3 + a21 x2 + a31 x3 a12 x1 + a21 x1 + 2a22 x2 + a23 x3 + a32 x3 a13 x1 + a23 x2 + a31 x1 + a32 x2 + 2a33 x3 2 3 # ベクトルが1次独立である(X のランクが k)と 仮定される。 ・X のランクが k Ä 1 以下のとき,jX 0 Xj = 0 と なり,多重共線性の問題があるといわれる。現実 のデータで jX 0 Xj の値が厳密に0となることは, まずないが,0にきわめて近い値になることはあ 6 7 3 = 4 a21 x1 + a22 x2 + a23 x3 5 a31 x1 + a32 x2 + a33 x3 2 3 a11 x1 + a21 x2 + a31 x3 6 7 + 4 a12 x1 + a22 x2 + a32 x3 5 a11 x1 + a12 x2 + a13 x3 り得る。このときも,多重共線性の問題があると いわれる。 b の分布 å b に y = Xå+ u を代入すると ・å 2 a13 x1 + a23 x2 + a33 x3 32 3 a11 a12 a13 x1 6 76 7 4 = 4 a21 a22 a23 5 4 x2 5 a31 a32 a33 x3 2 32 3 a11 a21 a31 x1 6 76 7 + 4 a12 a22 a32 5 4 x2 5 a13 a23 a33 b = (X 0 X)Ä 1 X 0 y å = (X 0 X)Ä 1 X 0 (Xå+ u) = å+ (X 0 X)Ä 1 X 0 u b の平均は ・å x3 5 = Ax + A0 x 12 b = å+ (X 0 X)Ä 1 X 0 E[u] E[å] 2 ここで, 3 ただし,In は n 次の単位行列である。よって, b = (X 0 X)Ä 1 X 0 E[uu0 ]X(X 0 X)Ä 1 V (å) u1 6 7 6 u2 7 7 E[u] = E 6 6 .. 7 4 . 5 2 2 = (X 0 X)Ä 1 X 0 (õ2 In )X(X 0 X)Ä 1 3 = õ2 (X 0 X)Ä 1 X 0 X(X 0 X)Ä 1 2 3 E[u1 ] 0 6 7 6 7 6 E[u2 ] 7 6 0 7 7 6 7 =6 6 .. 7 = 6 .. 7 = 0 4 . 5 4.5 un 3 E[un ] よって 4 = õ2 (X 0 X)Ä 1 b の分布は正規分布 ・正規分布の再生性により,å b = å,V (å) b = õ2 (X 0 X)Ä1 なので であり,E[å] b ò N (å; õ2 (X 0 X)Ä 1 ) å 0 bi の周辺分布は となる。また,å b =å E[å] bi ò N (åi ; õ2 mii ) å b は不偏推定量である。 となり,å b の分散共分散行列は ・å である。ただし,mii は (X 0 X)Ä 1 の第 i 対角要 素を表す。 b = E[(åÄ b E[å])( b åÄ b E[å]) b 0] V (å) b å)(åÄ b å)0 ] 2 = E[(åÄ 残差自乗和の分布 ・行列 M を次のように定義する。 3 = E[(X 0 X)Ä 1 X 0 uu0 X(X 0 X)Ä 1 ] M = In Ä X(X 0 X)Ä 1 X 0 4 = (X 0 X)Ä 1 X 0 E[uu0 ]X(X 0 X)Ä 1 このとき,M には次のような性質がある。 2 ここで, 3 (1) M X = 0 6 7h i 6 u2 7 7 E[uu0 ] = E 6 6 .. 7 u1 u2 ÅÅÅun 4 . 5 un 2 2 3 u1 u1 u2 ÅÅÅu1 un 6 7 6 u2 u1 u22 ÅÅÅu2 un 7 6 2 = E6 . .. . . . 7 7 . .. 5 4 .. . 2 u1 un u1 un u2 ÅÅÅ u2n E[u1 u2 ] 6 6 E[u2 u1 ] E[u22 ] 3=6 .. .. 6 4 . . E[u21 ] (2) M 2 = M ・まず,(1) を示す。 M X = [In Ä X(X 0 X)Ä 1 X 0 ]X = X Ä X(X 0 X)Ä 1 X 0 X = X Ä X = 0 ・次に (2) を示す。 M 2 = [In Ä X(X 0 X)Ä 1 X 0 ] 3 Ç [In Ä X(X 0 X)Ä 1 X 0 ] 7 ÅÅÅE[u2 un ] 7 7 .. .. 7 . 5 . ÅÅÅE[u1 un ] 2 = In Ä X(X 0 X)Ä 1 X 0 Ä X(X 0 X)Ä1 X 0 + X(X 0 X)Ä 1 X 0 X(X 0 X)Ä 1 X 0 3 = In Ä X(X 0 X)Ä 1 X 0 Ä X(X 0 X)Ä1 X 0 E[un u1 ] E[un u2 ] ÅÅÅ E[u2n ] + X(X 0 X)Ä 1 X 0 u1 ; u2 ; :::; un ò N ID(0; õ2 ) から,E[u2i ] = õ2 , E[ui uj ] = 0 (i 6= j) なので 2 2 õ 0 ÅÅÅ0 6 6 0 õ2 ÅÅÅ0 E[uu0 ] = 6 6 .. .. . . .. . . 4 . . 0 0 ÅÅÅõ2 4 = In Ä X(X 0 X)Ä 1 X 0 = M 3 7 7 7 = õ2 In 7 5 性質 (2) のように,自乗したときもとの行列にも どる行列をベキ等行列という。 ・行列 M を使うと,残差は次のようになる。 13 b e = y Ä Xå 2 = y Ä X(X 0 X)Ä 1 X 0 y ・行列 M = In Ä X(X 0 X)Ä 1 X 0 はベキ等行列で あるので,その固有値は1または0である。以下 では,M の固有値のうち,n Ä k 個が1であり, 3 = [In Ä X(X 0 X)Ä 1 X 0 ]y 4 = [In Ä X(X 0 X)Ä 1 X 0 ](Xå+ u) 残りの k 個が0であることを示す。 ・行列 A のトレースを T r(A) とすると, 5 = M (Xå+ u) 6 = M Xå+ M u (1) T r(A + B) = T r(A) + T r(B) (M X = 0 なので) (2) T r(AB) = T r(BA) 7 = Mu (積 AB と BA が定義できるとき) よって,残差自乗和は n X が成り立つ。この性質を使って,M のトレースを 求めると e2t = e0 e = (M u)0 (M u) T r(M ) = T r(In Ä X(X 0 X)Ä 1 X 0 ) t=1 2 = u0 M M u = u0 M 2 u (性質 (1) から) (M 2 = M なので) 2 = T r(In ) Ä T r(X(X 0 X)Ä 1 X 0 ) 3 = u0 M u (性質 (2) から) 3 = T r(In ) Ä T r((X 0 X)Ä 1 X 0 X) となる。 ・残差の分布を求めるため,まず次の定理を示す。 4 = T r(In ) Ä T r(Ik ) = n Ä k となる。 ・固有値の和とトレースは等しいので(注) 定理 8.1. ベキ等行列の固有値は 0 または 1 で ある ï1 + ï2 + ÅÅÅ+ ïn = n Ä k 証明.ベキ等行列を A とし,その固有値を ï,固 有ベクトルを x とすると,固有値の定義から ïi は0か1であり,その総和が n Ä k であるので, ï1 ; ï2 ; :::; ïn のうち,n Ä k 個が1であり,残 りの k 個が0である。 Ax = ïx (注)n = 2 として,T r(A) = ï1 +ï2 ,jAj = ï1 ï2 であることを示す。 ・両辺に左から A を掛けると A2 x = ïAx ・n = 2 のとき固有方程式は jA Ä ïI2 j å" # " #å å a a 10 å å 11 12 å 2 =å Äï å å a21 a22 01 å å å åa Ä ï a å å 11 12 å 3 =å å å a21 a22 Ä ïå A2 = A,Ax = ïx なので,左辺は A2 x = Ax = ïx 右辺は ïAx = ï(ïx) = ï2 x 4 = (a11 Ä ï)(a22 Ä ï) Ä a12 a21 5 = a11 a22 Ä (a11 + a22 )ï+ ï2 Ä a12 a21 となる。よって, 6 = ï2 Ä (a11 + a22 )ï+ a11 a22 Ä a12 a21 ïx = ï2 x 7 = ï2 Ä T r(A)ï+ jAj = 0 となるので, であるので,方程式 ï2 Ä T r(A)ï+ jAj = 0 の2 ï(ïÄ 1)x = 0 解を ï1 ,ï2 とすると,解と係数の関係から T r(A) = ï1 + ï2 が得られる。固有ベクトルは非ゼロベクトル (x 6= 0) であるので,ï= 0 または ï= 1 である。// jAj = ï1 ï2 14 が得られる。 となる。z の分散共分散行列は V (z) = E[(z Ä E[z])(z Ä E[z])0 ] ・ここで,証明は省略するが,行列に関する2 つの定理を示す。 (E[z] = 0 なので) 2 = E[zz 0 ] = E[Q0 uu0 Q] 定理 8.2. 行列 A が半正値定符号 (positive semi- 3 = Q0 E[uu0 ]Q deånite) であるための必要十分条件は,A のすべ ての固有値が非負であり,少なくとも1つは正で (E[uu0 ] = õ2 In なので) 4 = Q0 (õ2 In )Q = õ2 Q0 Q あることである。 (Q0 Q = In なので) 定理 8.3 行列 A が半正値定符号であるならば, 2 3 ï1 0 ÅÅÅ 0 6 7 6 0 ï2 ÅÅÅ 0 7 7 Q0 AQ = 6 6 .. .. . . .. 7 . . 5 4 . . 5 = õ2 In ・z = Qu0 は u の1次関数であり,u の分布は正 規分布であるので,正規分布の再生性により,z の 分布も正規分布である。また,E[z] = 0,V (z) = 0 0 ÅÅÅïn õ2 In であるので を満たす直交行列 Q が存在する。ただし,ïi は z ò N (0; õ2 In ) A の固有値である。 となる。すなわち, ・M = In Ä X(X 0 X)Ä 1 X 0 の固有値は1と0であ るので,定理 8.2 によって M は半正値定符号で ある。よって,定理 8.3 により nÄ k k z}|{ z}|{ 2 3 1 0 ÅÅÅ0 0 ÅÅÅ0 6 7 6 0 1 ÅÅÅ0 0 ÅÅÅ0 7 6 7 6 .. .. . . .. .. .. 7 6. . . . . 7 . 6 7 6 7 0 Q M Q = É = 6 0 0 ÅÅÅ1 0 ÅÅÅ0 7 6 7 6 0 0 ÅÅÅ0 0 ÅÅÅ0 7 6 7 6. . .. .. . . .. 7 6 .. .. . . . .7 4 5 0 0 ÅÅÅ0 0 ÅÅÅ0 z1 ; z2 ; :::; zn ò N ID(0; õ2 ) である。このことから,残差自乗和は e0 e = u0 QÉQ0 u 2 = z 0 Éz h i 3 = z1 z2 ÅÅÅznÄ k znÄ k+1 ÅÅÅzn 2 3 3 1 0 ÅÅÅ0 0 ÅÅÅ0 2 z 1 6 7 6 0 1 ÅÅÅ0 0 ÅÅÅ0 7 6 7 6 7 6 z2 7 6 .. .. . . .. .. 7 6 . .. 7 6 ÅÅÅ 7 6. . . . . 7 6 76 7 6 76 7 Ç 6 0 0 ÅÅÅ1 0 ÅÅÅ0 7 6 znÄ k 7 6 76 7 6 0 0 ÅÅÅ0 0 ÅÅÅ0 7 6 znÄ k+1 7 6 76 7 6. . 6 7 .. .. . . .. 7 6 .. .. 7 Å Å Å 4 5 . . . .5 4 z n 0 0 ÅÅÅ0 0 ÅÅÅ0 h i 4= z1 z2 ÅÅÅznÄ k znÄ k+1 ÅÅÅzn 2 3 z1 6 7 6 z2 7 6 7 6 ÅÅÅ 7 6 7 6 7 Ç 6 znÄ k 7 6 7 6 0 7 6 7 6 7 Å Å Å 4 5 0 を満たす直交行列 Q が存在する。ただし,É にお いて,1は n Ä k 個あり,0は k 個である。 ・Q は直交行列であるので,Q0 Q = QQ0 = In で ある。この性質を使うと残差自乗和は e0 e = u0 M u = u0 In M In u = u0 QQ0 M QQ0 u = u0 Q(Q0 M Q)Q0 u (定理8:3 から,Q0 M Q = Éなので) = u0 QÉQ0 u となる。 z = Q0 u と置くと,z の平均は E[z] = E[Q0 u] = Q0 E[u] = Q0 0 = 0 2 5 = z12 + z22 + ÅÅÅ+ znÄ k 15 zi ò N (0; õ2 ) から zi =õò N (0; 1) であるので, ここで, z1 z2 znÄ k ; ; :::; ò N ID(0; 1) õ õ õ となる。よって,定理 5.5 から ê z ë2 ê z ë2 êz ë2 e0 e 1 2 nÄ k = + + ÅÅÅ+ ò ü2nÄ k 2 õ õ õ õ が得られる。すなわち,e0 e=õ2 は自由度 n Ä k の b = å+ (X 0 X)Ä 1 X 0 E[u] = å E[å] E[e] = E[M u] = M E[u] = 0 から カイ自乗分布に従う。 b e) = E[(åÄ b å) e0 ] Cov(å; 2 = E[(X 0 X)Ä 1 X 0 uu0 M ] 3 = (X 0 X)Ä1 X 0 E[uu0 ]M 誤差分散の不偏推定量 ・e0 e=õ2 が自由度 n Ä k のカイ自乗分布に従う 4 = (X 0 X)Ä1 X 0 (õ2 In )M ので, h e0 e i E 2 = nÄk õ よって õ b2 = とすると 5 = õ2 (X 0 X)Ä 1 X 0 M = 0 (M X = 0 なので X 0 M = 0) b と e が独立であるので,åと b õ ・å b2 = e0 e=(n Äk) も独立である。 e0 e nÄk t値 bi の周辺分布は ・å h e0 e i nÄk h e0 e i õ2 = E 2 nÄk õ õ2 = (n Ä k) = õ2 nÄk bi ò N (åi ; õ2 mii ) å E[b õ2 ] = E であるので bi Ä åi å p ò N (0; 1) õ mii となり,b õ2 は,õ2 の不偏推定量であることが分 ただし,mii は (X 0 X)Ä 1 の第 i 対角要素を表す。 かる。 b と e の独立性 å ・å の最小自乗推定量と残差は次のようであった。 b = (X 0 X)Ä1 X 0 y å 0 Ä1 = å+ (X X) b e = y Ä Xå ・また, e0 e ò ü2nÄ k õ2 bi と e0 e=õ2 は独立であるので,定理 5.7 であり,å 0 より Xu p bi Ä åi )=(õ mii ) (å p e0 e=[õ2 (n Ä k)] p bi Ä åi )= mii (å 2 = p e0 e=(n Ä k) p bi Ä åi )= mii (å p 3 = õ b2 bi Ä åi å 4 = p ò tnÄ k õ b mii p bi の標準誤差であり, ここで,分母の õ b mii は å p bi ) = õ Se(å b mii = Mu ただし, M = In Ä X(X 0 X)Ä 1 X 0 b も e も,ともに u の1次関数であり,u が正 å 規分布であるので,正規分布の再生性により正規 分布である。正規分布の場合,無相関と独立性は b と e の相関が0であることを 同値であるので,å b と e の相関 示せば,これらの独立性が示せる。å (共分散行列)は次のように定義される。 b e) = E[(åÄ b E[å])(e b Cov(å; Ä E[e])0 ] と書かれる。 16 ・帰無仮説 H0 : åi = åi0 を検定するときの検定 統計量は bi Ä åi0 å bi ) Se(å であり,特に åi0 = 0 のとき,t 値といわれる。 自由度修正済み決定係数 ・重回帰の残差を b1 x1t + å b2 x2t + . . . + å bk xkt ) et = Yt Ä (å とすると,決定係数は2変数線形回帰モデルの場 合と同様に定義される。 Pn e2 R2 = 1 Ä Pnt=1 t2 t=1 yt ・R2 は説明変数の数(k)を増やせば,大きくな る。 (厳密には,小さくなることはない。)このこ とは,無意味な説明変数を追加しても決定係数は 増大する可能性が高いことを意味するが,これで モデルの当てはまりが良くなった訳ではない。 Pn Pn ・ t=1 yt2 の自由度は n Ä 1, t=1 e2t の自由度 は n Ä k であるので,決定係数の第2項の分子と 分母をそれぞれの自由度で割ると次の自由度修正 済み決定係数が得られる。 Pn 1 2 2 t=1 et nÄ k R = 1 Ä 1 Pn 2 t=1 yt nÄ 1 Pn n Ä 1 t=1 e2t P = 1Ä n Ä k nt=1 yt2 nÄ1 = 1Ä (1 Ä R2 ) nÄk 変数の数(k)が増加するとき, k ") R2 ") 1 Ä R2 # nÄ1 k ") n Ä k #) " nÄk から,これらの積 nÄ1 (1 Ä R2 ) nÄk は大きくなることも小さくなることもあり得る。 ・R2 の増加(1ÄR2 の減少)の効果が (nÄ1)=(nÄ 2 k) 増加の効果よりも大きければ,R が増加する と考えられる。このとき,新しく追加された変数 は意味のある変数と解釈できる。ただし,実際の データを扱うときは,無意味な変数を追加しても 2 R が増加することは十分あり得る。 17 解.中央値を m と置くと、 Z m P (X > m) = ïeÄ ïx dx 問題回答 第1章 0 = 1 Ä eÄ ïm = 問1.連続型確率変数 X の確率密度関数が f (x) = ax + b (0 < =x< = 2) =0 (それ以外) から、 eÄ ïm = であり、その期待値が E[X] = 2=3 であるとする。 m=Ä (1) a と b の値を求めよ。 (2) P (X > c) = 1=4 となるような c の値を求め よ。ただし、P (A) は事象 A の起こる確率である。 R2 解.(1) 0 f (x) dx = 1、E[X] = 2=3 であるので、 Z 2 Z 2 f (x) dx = (ax + b) dx ha 0 = E[X] = Z m mÄ1 Ä xm =ã x e (x > = 0) ã =0 (x < ç) f (x) = i2 x2 + bx であるとき、X の分布はワイブル分布 (Weibull distribution) と呼ばれる。このワイブル分布の平 均と分散を求めよ。 (m = 1、ã = 1=ïのとき、ワ 2 x(ax + b) dx イブル分布は指数分布になる。 ) 0 = 2 ha 解.k 次のモーメントは Z 1 m mÄ1 Ä xm =ã E[X k ] = xk x e dx ã 0 Z m 1 m+kÄ 1 Äxm =ã = x e dx ã 0 (ax2 + bx) dx b 2 i2 x 3 2 0 8a 4b 8a = + = + 2b 3 2 3 2 = 3 0 = x3 + ここで、y = xm =ã とおくと、x = (ãy)1=m = ã1=m y1=m であるので、 となり、 ö 2a + 2b = 1 8a 3 + 2b = dx = ã1=m 2 3 1 (1=m)Ä 1 y dy m よって これを解くと、a = Ä1=2; b = 1。 (2) log(1=2) log 2 = ï ï 問2.連続型確率変数 X の密度関数が 2 0 = 2a + 2b = 1 Z 1 2 よって、 ただし、a と b は定数である。 0 1 2 E[X k ] = Z cê ë 1 Ä x + 1 dx 2 0 2 c 1 = Äc+1 = 4 4 m ã Z 1 (ã1=m y1=m )m+kÄ1 0 ã1=m (1=m)Ä 1 y dy m m (m+kÄ 1)=m ã1=m = ã ã Z m Ç eÄ y P (X > c) = から c2 Ä 4c + 3 = 0。これを解くと、c = 1; 3 で あるが、0 < =c< = 2 から、c = 1。 1 Ç y (m+kÄ 1)=m+(1=m)Ä 1 eÄ y dy 0 Ä 1+1+(k=m)Ä (1=m)+(1=m) =ã Z Ç 1 y 1+(k=m)Ä 1 eÄ y dy ê kë = ãk=m Ä 1 + m 第2章 0 問1.パラメータ ïの指数分布の中央値を求めよ。 18 解.・X の周辺密度は Z 1 h 1 i1 f1 (x) = (x + y) dy = xy + y2 2 0 0 1 = x+ 2 ・同様にして Y の周辺密度は ・上式において k = 1 とおくと平均が得られる。 ê 1ë E[X] = ã1=m Ä 1 + m また、分散は E[X 2 ] Ä (E[X])2 ê 2 ë h 1=m ê 1 ëi2 = ã2=m Ä 1 + Ä ã Ä 1+ m m h ê 2ë ê ê 1 ë ë 2i 2=m = ã Ä 1+ Ä Ä 1+ m m 1 2 ・X の1次と2次のモーメントは Z 1 ê 1ë E[X] = x x+ dx 2 0 Z 1ê 1 ë = x2 + x dx 2 0 h1 i1 1 = x3 + x2 3 4 0 1 1 4+3 = + = 3 4 12 7 = 12 f2 (y) = y + 第3章 問1.領域 D を D :x+y < = 1; x > = 0; y > =0 とするとき、次の積分の値を求めよ。 Z Z x dx dy 解. Z Z x dx dy = D = = = Z Z Z Z 1 dx 0 Z 1Ä x x dy 0 1 0 x [xy]1Ä dx 0 1 x(1 Ä x) dx 0 1 h1 (x Ä x2 ) dx 1 3 i1 x 2 3 0 1 1 1 = Ä = 2 3 6 = 0 Z ê 1ë x2 x + dx 2 0 Z 1ê 1 ë = x3 + x2 dx 2 0 h1 i1 1 = x4 + x3 4 6 0 1 1 3+2 = + = 4 6 12 5 = 12 よって、X の分散は ê 7 ë2 5 V (X) = Ä 12 12 60 49 = Ä 144 144 11 = 144 ・同様にして、Y の分散は E[X 2 ] = D x2 Ä 1 11 144 ・X と Y の共分散を求めるため、E[XY ] を計算 する。 Z 1Z 1 E[XY ] = xy(x + y) dxdy 第4章 V (Y ) = 問1. 2つの連続型確率変数 X と Y が次の同 時確率密度関数をもつものとする。 f (x; y) = x + y; =0 (0 < x < 1; 0 < y < 1) Z 1 hZ 0 (それ以外) = 0 1 i (x2 y + x y 2 ) dy dx Z 1h i1 1 2 2 1 = x y + x y 3 dx 2 3 0 0 0 (1) X と Y の周辺密度関数を求めなさい。 (2) X と Y の相関係数を求めなさい。 19 0 Z 1ê 1 2 1 ë x + x dx 2 3 0 h1 i1 1 = x3 + x2 6 6 0 1 1 1 = + = 6 6 3 であるので、分散は = V (X) = E[X 2 ] Ä (E[X])2 = 4Ä3 1 = 12 12 (2) Y の分布関数は 1 1 Ä 3 4 = よって、共分散は F (y) = P (Y < y) = P (Ä2 log X < y) = P (log X > Äy=2) = P (elog X > eÄ y=2 ) Z 1 = P (X > eÄ y=2 ) = Å 1 Ådx Cov(X; Y ) = E[XY ] Ä E[X]E[Y ] 1 7 7 = Ä Ç 3 12 12 1 49 48 Ä 49 = Ä = 3 144 144 1 =Ä 144 = eÄ y=2 Ä y=2 [x]1eÄ y=2 = 1Äe よって、密度関数は d F (y) dy ê 1ë = 0 Ä Ä eÄ y=2 2 1 Ä y=2 = e 2 これは、自由度2のカイ自乗分布の密度関数である ので、Y の分布は自由度2のカイ自乗分布である。 f (z) = ・相関係数を öとすると ö= p Cov(X; Y ) p V (X) V (Y ) Ä1=144 p = p 11=144 Ç 11=144 Ä1=144 1 = =Ä 11=144 11 問2.次の密度関数をもつ分布を考える。 f (x) = eÄ x ; 第5章 X1 と X2 をこの分布からの無作為標本とすると き、Z = X1 =X2 の分布は F 分布であることを 問1.連続型確率変数 X が、区間 (0, 1) で一様 分布に従うとき、その確率密度関数は、 示せ。 êX ë 1 F (z) = P (Z < z) = P <z X2 Z Z = eÄ (x1 +x2 ) dx1 dx2 解.Z の分布関数は (0 < =x< = 1) f (x) = 1; = 0; (それ以外) で与えられる。 (1) X の平均と分散を求めなさい。 x1 =x2 <z 変数変換 u1 = x1 =x2 、u2 = x2 を行うと、x1 = (2) Y = Ä2 log X とするとき、Y の分布は自由 度2のカイ自乗分布であることを示しなさい。 u1 u2 、x2 = u2 であるので、ヤコビアンは å å å@x =@u @x =@u å å 1 1 1 2å J =å å å@x2 =@u1 @x2 =@u2 å å å åu u å å 2 1å =å å = u2 å0 1 å 解.(1) 平均は Z 1 E[X] = x Å1 Ådx h1 0 = 2 x2 i1 0 = 1 2 よって 2次のモーメントを求めると Z 1 E[X 2 ] = x2 Å1 Ådx h1 0 = 3 x3 i1 0 x>0 F (z) = Z Z 0 = 1 = 3 0 20 z du1 Z Z 0 z du1 0 1 1 u2 eÄ (u1 u2 +u2 ) du2 u2 eÄ (u1 +1)u2 du2 さらに、変数変換 t = (u1 + 1)u2 を行うと、u2 = の MSE を最小にする a の値を求めよ。ただし、 t=(1 + u1 )、du2 = dt=(1 + u1 ) であるので、 Z z Z 1ê t ë Ät 1 F (z) = du1 e dt 1 + u1 1 + u1 0 Z0 z Z 1 1 = du t2Ä 1 eÄ t dt 2 0 (1 + u1 ) 0 Z z 1 = Ä(2) du1 (1 + u1 )2 0 a は未知母数を含んでもよい。 解.X の1次と2次のモーメントは E[X] = ñ 2 E[X ] = V (X) + (E[X])2 = であるので É Z の密度関数は f (z) = = 1 (1 + u1 )2 É2 E[X ] = これは、自由度 (2; 2) の F 分布の密度関数であ = るので、Z の分布は F 分布である。 = (注)F 分布の密度関数 f (x) = Ä((m + n)=2) mm=2 nn=2 Ä(m=2)Ä(n=2) Ç よって É xm=2Ä 1 (x > = 0) (mx + n)(m+n)=2 = E[X = = = É2 É Ä 2ñX + ñ2 ] = E[X ] Ä 2ñE[X ] + ñ2 ê õ2 ë 1 2 = + ñ (1 + a)2 n ê ñ ë Ä 2ñ + ñ2 1+a ê õ2 ë = + ñ2 (1 + a)Ä 2 n Ä 2ñ2 (1 + a)Ä 1 + ñ2 É2 Ä((2 + 2)=2) 22=2 22=2 Ä(2=2)Ä(2=2) x2=2Ä 1 (2x + 2)(2+2)=2 Ä(2) 21 21 Ä(1)Ä(1) x0 Ç (2x + 2)2 Ä(2) Ç 2 Ç 2 1 1Ç1 4(x + 1)2 1 4 Ä(2) 4(1 + x)2 1 Ä(2) (1 + x)2 Ç = É M SE(X ) = E[(X Ä ñ)2 ] に m = n = 2 を代入すると f (x) = h 1 i X 1+a 1 ñ E[X] = 1+a 1+a hê 1 ë 2i E X 1+a ê 1 ë2 2 E[X ] 1+a ê õ2 ë 1 + ñ2 2 (1 + a) n E[X ] = E d F (z) dz = Ä(2) õ2 + ñ2 n É MSE を a で微分すると É d M SE(X ) da ê õ2 ë = Ä2 + ñ2 (1 + a)Ä 3 n + 2ñ2 (1 + a)Ä 2 h ê õ2 ë i 1 = Ä2 + ñ2 + 2ñ2 (1 + a) 3 (1 + a) n h i 2 Ä2 õ = + ñ2 Ä ñ2 Ä ñ2 a 3 (1 + a) n i Ä2 h õ2 = Ä ñ2 a 3 (1 + a) n となり、Z の分布が自由度 (2; 2) の F 分布であ ることが分かる。 第6章 問1.X1 ; X2 ; :::; Xn ò N ID(ñ; õ2 ) のとき、ñ (1) a = õ2 =(n ñ2 ) のとき の推定量 É 1 X = X 1+a d M SE(X ) =0 da É 21 (2) a < õ2 =(n ñ2 ) のとき 解.(1) 尤度関数は É L(í) = f (x1 jí)f (x2 jí) ÅÅÅf (xn jí) d M SE(X ) <0 da = íeÄ íx1 íeÄ íx2 ÅÅÅíeÄ íxn Pn = ín eÄ í i=1 xi (3) a > õ2 =(n ñ2 ) のとき = ín eÄ níx É d M SE(X ) >0 da であるので、対数尤度関数は よって、MSE を最小にする a の値は log L(í) = n log íÄ n íx a = õ2 =(n ñ2 ) íで微分して0と置くと d log L(í) n = Änx dí í ê1 ë =n Äx = 0 í よって、 b 1 í= x (2) 仮説による制約のないときの最大尤度は ê ën ê 1 ë b) = 1 L(í exp Än x x x = (x)Ä n eÄ n である。 É (注)この a の値を X に代入した É 1 X 1 + (õ2 =n ñ2 ) ê n ñ2 ë = X n ñ2 + õ2 X = は、未知母数 ñ と õ2 を含むので厳密には推定量 ではない。 仮説による制約 í= 1 があるときの最大尤度は ・未知母数 ñ と õ2 を不偏推定量で置き換えた推 定量 eÉ = X ê nX 2 2 n X + S2 ë L(í= 1) = eÄ n x よって、尤度比は L(í= 1) ï= b) L(í X の小標本特性が = eÄ n x (x)Ä n eÄ n = (x)n enÄ nx Tompson, J.R. (1968), Some shrinkage techniques for estimating the mean, Journal of the = (x e eÄ x )n American Statistical Association, 63, 113-122. Srivastava, V.K. (1980), A note on the estimation of mean in normal population, Metrika, 37, 99- 問1.次の X と Y に関する5つのデータがある。 102. Xt 2 3 4 5 6 Yt 7 10 8 9 11 このとき、 で論じられている。 Yt = ã+ åXt + ut 問2.x1 ; x2 ; :::; xn を次の密度関数をもつ分布 という回帰モデルを想定して次の問に答えよ。 から抽出された無作為標本とする。 (1) 回帰係数 ã と å の最小自乗推定値を求めよ。 (2) 分散の不偏推定値と t 値を求めよ。 (3) 決定係数を求めよ。 Ä íx f (xjí) = íe (1) íの最尤推定値を求めよ。 解.(1) 回帰係数の最小自乗推定値を計算するた めの表を作ると、 (2) H0 : í= 1 を検定するための尤度比を求めよ。 22 合計 Xt Yt xt yt x2t yt2 xt yt 2 3 7 10 -2 -1 -2 1 4 1 4 1 4 -1 4 5 8 9 0 1 -1 0 0 1 1 0 0 0 6 11 2 2 4 4 4 20 45 0 0 10 10 7 (3) 決定係数の値は P5 e2t 2 R = 1 Ä Pt=1 5 2 t=1 yt = 1 Ä 5:1=10 = 0:490 問2.もとの回帰モデルを この表から、 20 45 X= = 4; Y = = 9; 5 5 P5 b = Pt=1 xt yt = 7 = 0:7 å 5 2 10 t=1 xt b = 9 Ä 0:7 Ç 4 = 6:2 ã b = Y Ä åX Yt = ã+ åXt + ut とする。いま、独立変数 Xt の値をすべて a 倍し たものを改めて独立変数としたモデル Yt = ã+ å(a Xt ) + ut よって、推定された回帰直線は、 Ybt = 6:2 + 0:7Xt の最小自乗推定値は、もとの最小自乗推定値の 1=a 倍になることを示せ。 解.XtÉ = aXt とすると (2) 残差を計算するための表を作ると、 合計 et = Yt Ä Ybt -0.6 1.7 0.36 2.89 Yt 2 3 7 10 7.6 8.3 4 5 8 9 9.0 9.7 -1 -0.7 1.00 0.49 6 11 10.4 0.6 0.36 20 45 0.0 5.10 2 s = s= b = Se(å) = Se(b ã) = = b の t 値は å n 1X Xt = aX n t=1 n =a よって、 É É xÉ t = Xt Ä X = aXt Ä aX = a(Xt Ä X) = a xt P5 独立変数 Xt の値をすべて a 倍したときの最小自 乗推定値は Pn Pn É (axt )yt É t=1 xt yt b P Pt=1 å = n n É2 = 2 x t t=1 (axt ) Pt=1 n a t=1 xt yt = 2P n a x2t Pnt=1 1 t=1 xt yt 1 b Pn = = å 2 a a t=1 xt e2t 5:1 = = 1:7 nÄ2 3 p 1:7 = 1:304 s qP 5 2 t=1 xt p 1:304= 10 = 0:412 v u 2 u1 X t s + P5 2 n t=1 xt r 1 42 1:304 + = 1:749 5 10 t=1 bÉ は å b の 1=a 倍である。 よって、å b å 0:7 = = 1:699 b 0:412 Se(å) ã b の t 値は tb = ã 1X É 1X X = (a Xt ) n t=1 t n t=1 n É X = e2t Xt この表から、 tå b= Ybt ã b 6:2 = = 3:545 Se(b ã) 1:749 23
© Copyright 2025 ExpyDoc