重回帰分析

重回帰分析
複数の説明変数をもつ回帰分析
1
2変数の重回帰式
y    1 x1  2 x2
① y は連続量
② xi が 1 増えると y は i 増える
③ i の値が大きければxi が 1 増えた
ときの y の増加量は大きい
④ x1 , x2 はそれぞれ別々に変化するこ
とができる
2
x2 の違いによる y の差
x1 = 1 , x2 = 0
x1 = 1 , x2 = 1
x1 = 1 , x2 = 2
x1 = 1 , x2 = 3
y    1
y    1   2
y    1  22
y    1  3 2
3
x1 の違いによる y の差
x1 = 0 , x2 = 1
x1 = 1 , x2 = 1
x1 = 2 , x2 = 1
x1 = 3 , x2 = 1
y    2
y    1   2
y    21  2
y    31   2
4
x1軸側から見たx2が変化したときのy
x2 = 2
2 2
x2 = 1
2
x2 = 0
5
x1軸側から見た1 の意味
1 = 2
1 = 1
1 = 0
1 が大きくなると傾きが大きくなる
6
y =  + 1 x1 + 2 x2 のグラフ
y
x2
x1
7
重回帰のパラメータ推定
• 単回帰と同じ手順でパラメータは推定される
①
②
③
④
誤差の二乗和を求める
一次導関数を求める
一次導関数を0とする連立方程式を立てる
連立方程式を解く
• とくに難しい点はなく、煩雑なだけ
8
ダミー変数を使った分析
独立変数間の影響
9
独立変数がダミー変数の場合
ダミー変数とは0または1の値のみをとる変数
質的データを取り扱う時に利用される
x2をダミー変数とする
x2 = 0
x2 = 1
y    1 x1
y    1 x1   2
10
x2 による直線の平行移動
x2 = 1
2
x2 = 0
11
独立変数のトレードオフ
x1 を価格、x2 をチラシの有無、y を
販売個数とする。
ここで x1 は連続量、x2 はチラシがあ
る場合 1 、無い場合 0 となるダミー
変数とする。
ここで、チラシの有無と値引きの効
果を比較することを考える
12
回帰式
チラシあり
y    1 x1   2
チラシなし
y    1 x1
チラシは売上を 2 増加させる効果がある
13
値引きとチラシのトレード・オフ
チラシあり
販
売
個
数
チラシなし
価格
14
問題
前のスライドにおいて赤い線
の長さを求めよ
2

1
15
ダミー変数を使った季節変動の把握
曜日ダミーを分析に加え、季節変動の有無を
分析することが可能
 火曜日ダミー
 水曜日ダミー
 木曜日ダミー
 金曜日ダミー
 土曜日ダミー
 日曜日ダミー
16
連番のデータによる傾向の把握
連続する数字からなる系列を分析に加え傾
向の有無を分析することが可能
連続する数字、例えば 1,2,3,・・・・,n をモデ
ルに加え、傾向の有無ならびにその値を求め
ることが可能
17
独立変数間に相関が高い場合
多重共線性
18
【相当に極端な例】
独立変数に同じ変数を想定した場合
y    1 x1   2 x1
y    1  2 x1
i の組合せは無限に存在するためパラメータ
を一意に求めることができない
19
独立変数間に相関が高い場合
• 少数のデータの追加・削除により回帰式が大きく
変化する。
• 異なるデータに適用すると回帰式が大きく変化
する。
• 回帰係数の符号が先験的な知識と逆になる。
• 回帰式の適合度が良好であるにもかかわらず、
パラメータが有意にならない。
• 回帰式が求められない。
• これらの場合、多重共線性があるという。
20
多重共線性への対応
• 相関の高いデータを分析から除く
• 主観的な基準
– 相関係数
– 分析者の都合
• 客観的な基準
– Variance Inflation Factors(分散拡大要因)
– ステップワイズ法
21