重回帰分析入門 経済データ解析 2011年度 このスライドの内容 重回帰分析とは 因果関係の計量分析によく用いられる手法が回帰分析であるが、 原因が複数ある場合には説明変数が複数の重回帰モデルを用い た分析をおこなう。 3変数(説明変数が2つ)の場合の重回帰モデル 3変数の場合の重回帰モデルは、各点との距離の2乗和が最小に なるような回帰平面である。 自由度修正済み決定係数 決定係数は説明変数の数を増やせば増やすほど、1に近づく。そ のため、モデルのあてはまりのよさを見るためには、自由度修正済 み決定係数も用いる必要がある。 重回帰分析とは これまでの実習で、所得と消費との間に、 Y(消費) = α + β X(所得) ↑ 結果 ↑ 原因 という因果関係の分析をおこなった。これは、 消費額の大小は、所得の大小が原因となっている。 ということであり、このような関係が存在することを、ケインズが 提唱したので、ケインズ型消費関数といわれる。 (例) 毎月のバイト代収入が5万円の人と、3万円の人では、一 般的に5万円の人のほうが多く使うことができる。 しかし、消費額の大小を決定する原因は所得だけでよいであろうか? (例) 毎月のバイト代収入が5万円の人と、3万円の人では、一般的に5万 円の人のほうが多く使うことができる。 ここで、毎月のバイト代が5万円の人が2人いたとしよう。その2人のう ち1人は貯蓄が0円、もう1人は100万円の貯蓄があったとする。 この2人の所得は等しい。なので、消費額は同じぐらいになるはずで あるが、100万円の貯蓄がある人は、その貯蓄を崩して消費することも可 能である。 すなわち、消費額の大小は、所得だけでなく、資産(預貯金以外に、 株式などを含めたもの)の大小によって決定されるのではないであろう か? Y(消費) = α + β X(所得) + γ W(資産) ↑ 結果 ↑ 原因1 † このようなモデルはトービンによって提唱された ↑ 原因2 説明変数が複数ある回帰モデルのことを重回帰モデルとい い、重回帰モデルを用いた分析のことを重回帰分析という。 (説明変数が1つのモデルは単回帰モデル(または単純回帰モデル)と いい、単回帰モデルを用いた分析のことを単回帰分析(または単純 回帰分析)という) 重回帰モデルは次のような式で表される。 1. Y = α + βX + γW + δZ + ・・・ 2. Y = α + β1X1 + β2X2 + β3X3 + ・・・ (説明変数とその係数を添え字つきの変数で表したもの) 3. Y = β0 + β1X1 + β2X2 + β3X3 + ・・・ (上の式の定数の部分も添え字つきの表現をしたもの) 重回帰モデルの中には説明変数が多数のモデルもあるの で、別々のアルファベットで表現するには不十分となり、添 え字つきの変数で表現されることがある。 3変数(説明変数が2つ)の場合の重回帰モデル Y 3変数の場合には回帰直線ではなく、 回帰平面になる。 W × × × この場合、最小2乗法は各点と回帰平 面との垂直方向の距離(これが残差) の2乗和が最小になるように平面を描く ことである。 × 回帰平面 Y=α+βX+cW 最小2乗法で求めた回帰平面の係数推 定値は次のようになる。 X a Y bX cW ( X X )(Y Y ) (W W ) ( X X )(W W ) (W W )(Y Y ) b ( X X ) (W W ) ( ( X X )(W W )) (W W )(Y Y ) ( X X ) ( X X )(W W ) ( X X )(Y Y ) c ( X X ) (W W ) ( ( X X )(W W )) 2 2 2 2 2 2 2 2 自由度修正済み決定係数 単回帰分析において、回帰モデルのあてはまり具合の尺度 として決定係数を紹介した。 重回帰分析においても、決定係数は回帰モデルのあてはま り具合の尺度となる。 しかし、決定係数には次のような欠点がある。 決定係数は、説明変数の数を増やせば増やすほど、 説明変数と被説明変数の間に因果関係が見られな くても1に近づく すなわち、Y(消費)=α+βX(所得)+γW というモデルの変 数Wに、全く関係ないデータ(たとえば、阪神タイガースの順 位のデータとか、交通事故死亡者数のデータとか)を用いて も、単回帰モデルより決定係数が1に近づく。 そこで、決定係数に説明変数の数を考慮して修正を加えた、 自由度修正済み決定係数が用いられる。 自由度修正済み決定係数は次のように定義される。 R 2 1 残差の分散 Yの分散 ただし、 e12 en2 残差の分散 nk k: 変数の数 (Y1 Y ) 2 (Yn Y ) 2 Yの分散 n 1 である。 自由度修正済み決定係数と決定係数には、次のような関係 がある。 R 2 1 n 1 (1 R 2 ) nk 自由度修正済み決定係数 R 2 は負の値をとることもある。 (例) n=4, k=3,R2=0.5 のとき 4 1 R 1 (1 0.5) 1 3 0.5 0.5 43 2 自由度修正済み決定係数は、説明変数の数が異なる複 数のモデルで、どちらのモデルが回帰のあてはまりが良 いかを判断するときなどに用いられる。 たとえば消費関数において、 Y(消費) X(所得) Y(消費) X(所得) W(資産) のいずれのモデルが良いかを判断するためには、決定係 数ではなく、自由度修正済み決定係数が有効である。
© Copyright 2025 ExpyDoc