1月29日の配布物 - InfoShako

多重共線性 ´ÑÙÐØ ÓÐÐ Ò
Ö Øݵ
多重線形回帰モデルでは、変数を増やしていくとモデルの当てはまり具合は
良くなる。しかし、変数間に相関関係がある時は推定された係数の値に対する
信頼の度合いが低くなる。以下ではこのことを説明変数が2つの場合で示す。
¬¼ · ¬½
½
· ¬¾
·Ù
¾
½
Ò
最小二乗推定量を各係数ごとに書き下すと
¬½ ½ ¬¾
¬¼
ここで、Ý
Ë ´¬½µ
¾
È Ü½ Ý µ´È ܾ¾ µ ´È ܾ Ý µ´È ܾ ܽ µ
´
¬½
´È ܾ½ µ´È ܾ¾ µ ´È ܽ ܾ µ¾
È Ü¾ Ü µ´È ܾ½ µ ´È ܽ Ý µ´È ܾ ܽ µ
´
¬¾
´È ܾ½ µ´È ܾ¾ µ ´È ܽ ܾ µ¾
、ܽ
½ ½ 、ܾ
¾ ¾ 。標準誤差は
×
È
´Ò ¿µ È Ü ´½ Ö µ Ë
È Ü Ü ÔÈ Ü È Ü は
¾
¾
½
¾
´¬¾µ
×
È
´Ò ¿µ È Ü
¾
¾
¾
´½ Ö¾µ
¾
¾
ここで、Ö
½ ¾
½ と ¾ の相関係数である。相関係
½
¾
数 Ö が大きくなると、推定 ¬½ 、¬¾ の標準偏差の不偏推定量である標準誤差
Ë ´¬½ µ、Ë ´¬¾ µ は大きくなる。つまり、
Ø 検定において帰無仮説を棄却しにくくなる。
相関のありそうな変数が同じ回帰モデルに含まれていても、Ø 検定において
帰無仮説を棄却できていれば、それらの変数を説明変数としてよい。しかし、
変数間に多重共線性が存在する場合には、推定期間のわずかなズレによって
推定結果が大きく変わるという傾向がある。
(これは標準誤差が大きくなる
ことの表れ。)多重共線性を見つけるための検定方法もあるが、とりあえず、
互いに関係していそうな変数の相関係数を計算してみよう。
½¼¼±の多重共線性
¾
¬¼ · ¬½
がある時は
¾
¬¼ · ¬½
½
· ¬¾ ´ ·
½
µ
¬¼ · ¬¾ · ´¬ ½ · ¬¾ µ ½
¬¾ 、¬½ ¬ ½ · ¬¾ を推定することになり、変数
より、¬¼ ¬¼ ·
を区別できなくなる。
¼
· ½
½ · ¬¾
¼
½
、
¾