2001年度 経済統計処理講義内容

第4章 回帰分析の諸問題(1)
ー 計量経済学 ー
第1節 多重共線性
1 多重共線性
第2節 系列相関
1
2
5
4
3
系列相関
系列相関の判定 -ダービン・ワトソン比-
系列相関への対処法(2) -コクラン・オーカット法-
系列相関への対処法(1) -一般化最小2乗法-
ダービンのh統計量
第3節 不均一分散
1
2
3
4
不均一分散
不均一分散の判定
不均一分散の解決法(1)
不均一分散の解決法(2) -加重最小2乗法-
• 前章までの回帰分析では、パラメータ推定値を求める際
に、最小2乗法を用いてきた。しかし、この章で示す
(1) 多重共線性
(2) 系列相関
(3) 不均一分散
といった状況が起こっているときには、最小2乗法によるパ
ラメータ推定値は信頼できない。
そこで、これらの状況が起こっている、[原因][症状][判
定法][対処法]について示す。
たとえば風邪を引いた場合を例に考えてみよう
[原因]
• 寒い中薄着で人混みに出かけた
[症状]
• 発熱、せき、くしゃみ、鼻水
[判定法]
• のどを見ると赤くはれている。
• 体温を測ると、38度ある。
[対処法]
• ゆっくり休む。(根治療法)
• ウイルスを殺す薬を飲む(対処療法)
• 熱を下げる薬を飲む(対処療法)
多重共線性あり
第1節 多重共線性
1 多重共線性
多重共線性とは、重回帰分析に
おいて、説明変数間に強い相関
が見られることである。
Y
W
×
多重共線性なし
×
×
×
回帰平面 Y=a+bX+cW
X
[原因]
• モデルの中に強い相関関係をもつ複数の説明変数を入れてしまった。
[症状]
• 推定値の符号が理論に一致しない。
• 決定係数R2は大きいのに、個々のt値が小さい。
• データの値を少し変えたり、少し追加・削除すると、係数推定値が大きく
変化する。
• 説明変数を増減すると、推定値が大きく変化する。
<完全な多重共線性>
𝑌 = 𝑎 + 𝑏𝑋 + 𝑐𝑊 + 𝑢
というモデルを考える。このモデルにおいて、𝑊 = 𝛼𝑋と
いう関係があったとする。
このとき、正規方程式は次のようになる。
𝑌 = 𝑛𝑎 + 𝑏
𝑋𝑌 = 𝑎
𝛼
𝑋𝑌 = 𝛼𝑎
𝑋 + 𝛼𝑐
𝑋+𝑏
𝑋
𝑋 2 + 𝛼𝑐
𝑋 + 𝛼𝑏
𝑋2
𝑋 2 + 𝛼2𝑐
𝑋2
3本目の方程式は2本目の方程式をα倍したものとなり、
実質的には2本の連立方程式である。
未知数は𝑎, 𝑏, 𝑐 の3つであるのに対し、方程式は2つであ
るので、解を一意に決定することはできない。
(数値例について)
数値例について次のようなことがいえる。
• R2は大きいのに、t値は有意ではない。
• データを少し変化させたときに、係数推定値は大きく変化する。
• Wの係数の符号は負となるので、分析結果からはWが大きくなるとき、
Yは小さくなるという結論が導き出されるが、データをみるとその逆で
ある。(YとWには正の相関がある。R=0.7)
これらが多重共線性の[症状]である。
多重共線性を幾何的に考
えると、1枚の平面を1本
の直線で支えることによっ
ておきる不安定性である。
(右図)
[判定法]
• 相関係数行列
• VIF値
※ VIF(Variance Inflation Factor)値について
VIF値は個々の説明変数について、次のように定義される。
1
VIF𝑖 =
1 − 𝑅𝑖2
ここで、R2i はi番目の説明変数を他の説明変数に対して
回帰した場合の決定係数であり、説明変数が2つのみの
場合には、単相関係数の2乗となる。
このVIFが10を超えるような場合には、多重共線性の疑
いがあるという判断をする。
[対処法]
• 相関の高い説明変数のいずれかを除去する。(根治療法)
• データの期間を延長する、あるいは年次データでだめなら四半期
データや月次データなどを用いて、データの数を増やす。
• 説明変数や被説明変数を階差あるいは比率の形にする。
• 相関の高い説明変数を合成し、新しい説明変数を作る。
• 主成分回帰やリッジ回帰などの方法を用いる。(非常手段)
多重共線性が起こっている場合、相関の高い複数(ここで
は2つとする)の変数のうち、1つをとり除くことが根本的
な解決法である。
しかし、経済理論から考えて、1つをとり除くことが不可能
なこともあり、その場合には下のいくつかの対処法をとる
ことになる。
第2節 系列相関
1 系列相関
撹乱項utには次のような仮定をおいてきた。
① utは正規分布にしたがう。
② utの平均は0である。
③ utの分散は一定値σ2である。
④ 撹乱項utは相互に独立である。
このうちの④の仮定が満たされないことが系列相関である。
すなわち、時系列データにおいて、異なる2時点の撹乱項
utとusの間に相関があるということである。
[原因]
• 重要な説明変数の欠落
• 経済行動における習慣性やショックの影響の継続
• データの加工時
[症状]
• 回帰係数の推定値はBLUEではなく、標準誤差を過小推定してしまう。
⇒ t値、F値、R2などを大きめに計算してしまい、本当は有意でないも
のを誤って有意とみなす。
⇒ 本当は妥当でないモデルを、誤って妥当であると結論づけてしまう
危険がある。
[判定法]
• 残差プロット
• ダービン・ワトソン比(利用できない場合もある)
2 系列相関の判定 -ダービン・ワトソン比-
𝑌𝑡 = 𝑎 + 𝑏𝑋𝑡 + 𝑢𝑡
というモデルを考える。このモデルの誤差項に
𝑢𝑡 = 𝜌𝑢𝑡−1 + 𝜀𝑡
という系列相関が存在していたとする。(これを1階の自己
相関という)
H0: 𝜌 = 0 (系列相関なし)
H1: 𝜌 ≠ 0 (系列相関あり)
という検定が考えられる。このH0: 𝜌 = 0 を検定する代わ
りに用いられるのがダービン・ワトソン(DW)比である。
このとき
ダービン・ワトソン比は残差e1,e2,…,enを用いて次のように
表すことができる。
𝑒2 − 𝑒1 2 + 𝑒3 − 𝑒2 2 + ⋯ + 𝑒𝑛 − 𝑒𝑛−1 2
DW =
𝑒12 + 𝑒22 + ⋯ + 𝑒𝑛2
この統計量は
ut= ρut-1 +εt
のutをetでおきかえて最小2乗法を適用した推定値を𝜌とす
ると、nが十分に大きいとき、
DW ≒ 2 1 − 𝜌
という関係が成り立つ。𝜌 = 0 のとき、DW=2であることか
ら、DWの値が2に近ければ系列相関が存在しないという
判断をする。
正の
系列相関
0
判定
不能
dL
dU
系列相関なし
2
判定
不能
負の
系列相関
4-dU 4-dL
4
<正の系列相関の例>
• ρ>0 ⇔ DW<2
• 正の系列相関がある場合は、残差が同じ符号のまま、ある程度の期
間続く。
標準化残差
正の系列相関の例(DW=0.306)
2
1.5
1
0.5
0
-0.5 0
-1
-1.5
-2
-2.5
5
10
15
20
25
30 時点
<負の系列相関の例>
• ρ<0 ⇔ DW>2
• 負の系列相関がある場合は、残差の符号が+,-, +,-, ・・・とある
程度交互に続く。
標準化残差
負の系列相関の例(DW=3.390)
2.5
2
1.5
1
0.5
0
-0.5 0
-1
-1.5
-2
-2.5
5
10
15
20
25
30 時点
<系列相関のない例>
• ρ≒0 ⇔ DW≒2
• 系列相関がない場合は、正の系列相関と負の系列相関のちょうど中
間になる。
系列相関なしの例(DW=2.256)
3
標準化残差
2
1
0
-1
-2
-3
0
5
10
15
20
25
30 時点
[対処法]
• 重要な説明変数を追加する(根治療法)
• 関数形が正しいか確認する
• ショックの影響がないか確認する(影響がある場合にはダミー変数を
用いる)
以上のようなモデルの妥当性を検証した後で、モデルが妥当である
にもかかわらず、系列相関が存在する場合には、通常の最小2乗法
の代わりに次のような推定法を用いて、係数の推定を行う。
• コクラン・オーカット法
• 一般化最小2乗法
• 最尤法
5 系列相関への対処法(2) -コクラン・オーカット法-
𝑌𝑡 = 𝑎 + 𝑏𝑋𝑡 + 𝑢𝑡
𝑢𝑡 = 𝜌𝑢𝑡−1 + 𝜀𝑡
という誤差項に1階の自己相関を持つモデルを考える。
(テキストの𝛼は、ここでの𝜌に対応します)
ここで、𝑌𝑡 − 𝜌𝑌𝑡−1 を考えると
𝑌𝑡 − 𝜌𝑌𝑡−1 = 𝑎 + 𝑏𝑋𝑡 + 𝑢𝑡 − ρ 𝑎 + 𝑏𝑋𝑡−1 + 𝑢𝑡−1
= 𝑎 1 − 𝜌 + 𝑏 𝑋𝑡 − 𝜌𝑋𝑡−1 + 𝑢𝑡 − ρ𝑢𝑡−1
𝑌𝑡∗
𝜀𝑡
𝑋𝑡∗
𝑌𝑡∗ = 𝑌𝑡 − 𝜌𝑌𝑡−1
∗
∗
とおき、𝑌
を𝑋
𝑡
𝑡 に対して回帰すれば、
𝑋𝑡∗ = 𝑋𝑡 − 𝜌𝑋𝑡−1
誤差項から系列相関の影響が取り除かれる。
<手順1>
𝑌𝑡 を𝑋𝑡 に回帰し、推定値𝑎, 𝑏 を求める。
<手順2>
𝑌𝑡 = 𝑎 + 𝑏𝑋𝑡 を計算し、𝑒𝑡 = 𝑌𝑡 − 𝑌𝑡 を求める。
𝑒𝑡 を𝑢𝑡 の代わりに用い、𝑒𝑡 = 𝜌𝑒𝑡−1 + 𝜀𝑡 とし、𝜌を求める。
<手順3、4>
𝑌𝑡∗ = 𝑌𝑡 − 𝜌𝑌𝑡−1
とし、𝑌𝑡∗ を𝑋𝑡∗ に対して回帰すれば、
∗
𝑋𝑡 = 𝑋𝑡 − 𝜌𝑋𝑡−1
誤差項から系列相関の影響が取り除かれる。
※ 問題点
最初の期のデータは取り除かれてしまう。
4 系列相関への対処法(1) -一般化最小2乗法-
(ここではプレイス・ウインステン変換による一般化最小2乗法を取り上げる)
<コクラン・オーカット法との相違>
• 1期目のデータを作成する
• 定数項を変数とみなし、定数項なしの回帰分析を適用する。
𝑌𝑡 − 𝜌𝑌𝑡−1 = 𝑎 + 𝑏𝑋𝑡 + 𝑢𝑡 − ρ 𝑎 + 𝑏𝑋𝑡−1 + 𝑢𝑡−1
= 𝑎 1 − 𝜌 + 𝑏 𝑋𝑡 − 𝜌𝑋𝑡−1 + 𝑢𝑡 − ρ𝑢𝑡−1
𝑌𝑡∗
𝜀𝑡
𝑍𝑡∗
𝑋𝑡∗
𝑌𝑡∗ = 𝑌𝑡 − 𝜌𝑌𝑡−1
𝑋𝑡∗ = 𝑋𝑡 − 𝜌𝑋𝑡−1 とおき、𝑌𝑡∗ を𝑋𝑡∗ と𝑍𝑡∗ に対して回帰すれ
𝑍𝑡∗ = 1 − 𝜌
ば、誤差項から系列相関の影響が取り除かれる。
コクラン・オーカット法
一般化最小2乗法
3 ダービンのh統計量
系列相関があるかないかの判定基準として、ダービン・ワトソン比が
用いられるが、DW比では正確な判定ができないケースがある。
それは、
𝑌𝑡 = 𝑎 + 𝑏𝑋𝑡 + 𝑐𝑌𝑡−1 + 𝑢𝑡
というように、説明変数として被説明変数の過去の値(ラグつき内生
変数という)を含む場合である。
この場合、DW比は2に偏りを持つ(本当は系列相関のあるモデルを、
誤って「系列相関なし」と判断してしまう)ので、代わりにダービンのh
統計量を用いる。
<ダービンのh統計量>
n: 標本数
𝑠𝑐2 :パラメータ𝑐の分散の推定値
𝑛
ℎ=𝜌
1 − 𝑛𝑠𝑐2
hは標準正規分布にしたがうので、有意水準5%で次のようになる。
負の
系列相関
系列相関なし
-1.96
0
正の
系列相関
1.96
第3節 不均一分散
1 不均一分散
撹乱項utには次のような仮定をおいてきた。
① utは正規分布にしたがう。
② utの平均は0である。
③ utの分散は一定値σ2である。
④ 撹乱項utは相互に独立である。
このうちの③の仮定が満たされないことが不均一分散で
ある。
[原因]
• 変数のレベルが上昇することに伴って、分散が増大することが多い。
(例) 平均が10倍になれば、それにともなって分散も増える。
[症状]
• 回帰係数の標準誤差を過小推定してしまう。
⇒ t値、F値、R2などを大きめに計算してしまい、本当は有意でないも
のを誤って有意とみなす。
⇒ 本当は妥当でないモデルを、誤って妥当であると結論づけてしまう
危険がある。
[判定法]
• 残差プロット
• 各種検定
–
–
–
–
ゴールドフェルド・クォントの検定
ブローシュ・ペーガンの検定
ホワイトの検定
ラグランジュ乗数(LM)検定
企業における管理者数と雇用者数
(データ出典:チャタジー・プライス『回帰分析の実際』第2章)
管理者数(人)
250
200
150
100
50
0
0
500
1000
雇用者数(人)
1500
2000
残差プロット
3
標準化残差
2
1
0
-1
-2
-3
0
500
1000
雇用者数
1500
2000
2 不均一分散の判定
不均一分散の判定は、残差プロットを見ることや、さまざま
な検定をおこなうことによる。
不均一分散の検定の1つにゴールドフェルド・クォントの検
定がある。この検定はデータの期間をいくつかに分割し、
それぞれの期間ごとの誤差項の分散が均一かどうかを
検定するものである。
※ 不均一分散の検定は一般に
H0 : 𝜎𝑖2 = 𝜎 2 𝑖 = 1,2, ⋯
を考える。すなわち、「誤差項の分散が均一である」ということが帰無
仮説であり、「均一分散の検定」といったほうが適切である。
<検定の手順>
• データをXの大きさの順に並べる(重回帰の場合には𝑌の大きさの順
が適当であろう)。
• 全体をn個としたとき、(n-m)/2, m, (n-m)/2 個の3つに分割する。こ
こでmは全体の2割弱程度が適当である。
X1, X2 , ・・・,
・・・ , ・・・, X n-1, Xn
Y1, Y2 , ・・・,
・・・ , ・・・, Y n-1, Yn
└Ⅰ┘
└Ⅱ┘
└Ⅲ┘
• ⅠのグループとⅢのグループで個別に回帰分析をおこない、それぞ
れの残差分散s2をもとめる。Ⅰのグループの残差分散s12とⅢのグ
ループの残差分散s32の比を考えると、その値は自由度((n - m)/2 k, (n - m)/2 - k)のF分布にしたがう。
• よってこの統計量について仮説検定をおこなえばよい。
[対処法]
• 説明変数と被説明変数について、対数変換など変換をおこなう。
• 加重最小2乗法または最尤法を用いる。
3 不均一分散の解決法(1)
撹乱項の分散について
𝜎12 = 𝜎 2 𝑋12
𝜎22 = 𝜎 2 𝑋22
⋮
𝜎𝑛2 = 𝜎 2 𝑋𝑛2
𝑌1 = 𝑎 + 𝑏𝑋1 + 𝑢1
𝑌2 = 𝑎 + 𝑏𝑋2 + 𝑢2
⋮
𝑌𝑛 = 𝑎 + 𝑏𝑋𝑛 + 𝑢𝑛
というように、説明変数
の2乗に比例していると
仮定する。
ここで、𝜀1 =
𝑢1
, … , 𝜀𝑛
𝑋1
=
説明変数と被説明変数をそれぞれXiで割ると、
このように変形できる。
𝑢𝑛
𝑋𝑛
であるので、このモデルの撹乱項の分散はすべて𝜎 2
となる。
𝑌
𝑋
1
𝑋
よって、 を
𝑌1
𝑎
=
+ 𝑏 + 𝜀1
𝑋1 𝑋1
𝑌2
𝑎
=
+ 𝑏 + 𝜀2
𝑋2 𝑋2
⋮
𝑌𝑛
𝑎
=
+ 𝑏 + 𝜀𝑛
𝑋𝑛 𝑋𝑛
に回帰すればよい。
4 不均一分散の解決法(2) -加重最小2乗法-
撹乱項の分散がすべて既知であったとする。
このとき、加重2乗和
1
𝐺 = 2 𝑌1 − 𝑎 + 𝑏𝑋1
𝜎1
2
1
+ ⋯ + 2 𝑌𝑛 − 𝑎 + 𝑏𝑋𝑛
𝜎𝑛
を最小とするものである。
このモデルは、変数をすべて 𝜎𝑖2 で割ったものである。
𝑌
𝑋
このように、 を に回帰すればよい。
𝜎
𝜎
2