1 モデルの関数型

1
モデルの関数型
これまでは線形モデルを考えていた. つまり二変数の場合,
yi = α + βxi + ui
のモデルを考えた. 線形モデルの適応可能性は非常に限定的にみえるが, 実は回帰分析は 2 つの変数の直線関
係だけに限定されない. 次のように場合も適応可能である.
yi = α + β
1
+ ui
xi
説明変数の逆数 1/x が y と線形関係になるモデルも考えることができる. 逆数をあらたな変数, たとえば z と
して, 通常の回帰分析を実施すれば良い.
他にも y と x の直線関係以外も扱うことができる. たとえば次のモデルを考える.
yi = α + βxi + γx2i + ui
このモデルは二次の項が存在している. これも二次の項を新たな変数と考えて, 通常の 2 変数の回帰分析を実
施すれば良い. なおこのときの X が一単位増加するときの効果は, β でなく, β + γxi である. つまり, xi の水
準に応じて変更する. γ が負のとき, 増分が逓減することを意味している.
なおこのモデルのほうが望ましいのか, 線形の方が望ましいのかは検定することができる. 二次の項を加え
た上記のモデルを推計し, γ = 0 を帰無仮説とした検定をおこなえばよい. より一般的に r 次の項を加えて考
えることができる.
yi = β0 + β1 xi + · · · + βr xri + ui
さて, 二変数の線形モデルに交差項を付け加えた以下のモデルを考える.
yi = α + βxi + γwi + δ(xi × wi ) + ui
このとき, x が一単位増加するときの効果は, β でなく, β + δwi なり, 別の変数の影響によって変化すること
を意味している. この交差項効果が存在するかどうかは, 上記のモデルを推計し, δ = 0 を帰無仮説とした検定
をおこなえばよい. さらにテーラー二次近似のモデルを考えることができる.
yi = α + β1 xi + β2 x2i + γ1 wi + γ2 wi2 + δ(xi × wi ) + ui
こちらのほうが望ましいか, 線形モデルが望ましいかどうかは, 上記のモデルを推計し, β2 = γ2 = δ = 0 を帰
無仮説とした検定をおこなえばよい.
経済データを用いて実証分析は, 変数について対数変換おこなって分析することも多い. 対数を簡単に復習
する. 指数関数を ex とする. このとき e = 2.71828... となる無理数であり, その逆関数を
y = log(x)
と表記して対数関数と呼ぶ. 対数関数は増加関数である. このとき, y を x 対数変換という.
このとき重要な性質は
1
• log(1/x) = − log(x)
• log(ax) = log(a) + log(x)
• log(x/a) = log(x) − log(a)
• log(xa ) = alog(x)
である. また近似として
log(x + ∆x) − log(x) ≈
∆x
x
がよく使われる. つまり 2 つの値の対数変換の差が増加率になる. 時系列データではよく用いられる.
説明変数に対数変換した以下のモデルを考える.
yi = α + β log xi + ui
このとき, 対数微分の性質を用いれば,
∆y = β
β 100∆x
∆x
=
x
100 x
なので, x が 1% 増加すれば, y が β/100 単位増加することを意味する.
同様に被説明変数を対数変換したモデルを考える.
log yi = α + βxi + ui
このときは,
∆y
= β∆x
y
or
100∆y
= 100β∆x
y
なので, x が一単位増加すれば, y が 100β% 増加することを意味する.
両方とも対数変換した 2 つのモデルも考えることができる.
log yi = α + β log xi + ui
このとき β は x が 1% 増加したときの y が β% 増加するかを示している. また y を需要量, x を価格とすれ
ば, 係数 β は価格弾力性を示している.
経済データで正値をとるとき, 対数をとり, 取りうる値を負も含む実数値にすると誤差項が正規分布にした
がう仮定と整合的である. ただ, 失業率などパーセント表示に対数をとることには注意が必要である.
変数 x が 0 から 1 の範囲を取る場合は, 以下のように変換すれば, 取りうる値が実数値となる.
log
x
1−x
この変換をロジスティクス変換という. ロジスティクス関数は, 対数関数と同じように増加関数である. 一様
分布 U [0, 1] にしたがう確率変数のロジスティクス変換も確率変数であり, そうした確率変数はロジスティク
ス分布にしたがうことが知られている.
説明変数をロジスティクス変換したモデル
y = α + β log
x
+u
1−x
のとき, 限界効果は
dy
= x(1 − x)β
dx
2
となり, x に依存することに注意されたい.
なお, 線形モデルが正しいかどうかの検定として RESET (regression specification error test) という検定
が有名である. y を x に回帰した時の予測値を ŷ とすると, 再度, y を x だけでなく, ŷ 2 から ŷ r までの r − 1
個の項を付け足して回帰するモデルを考える.
yi = β0 + β1 xi + β2 ŷi2 + · · · + βr ŷir + ui
以上の回帰モデルを推計し, β2 = · · · = βr = 0 の帰無仮説を検定する. 帰無仮説が棄却されない場合, 線形モ
デルがあやまっている可能性がある. なお, 通常は r = 3 で検定を実施する.
また2つの回帰モデル
yi = α + βxi + ui
yi = α + β log xi + vi
のどちらが望ましいかについては 2 つの検定のやり方がある. ひとつは
yi = α + βxi + γ log xi + ui
を推計して β = 0 の帰無仮説の検定の P 値と γ = 0 の帰無仮説の検定の P 値を比較して, P 値が高い方の帰
無仮設を採択するという方法である. 包含検定ともよばれる.
もうひとつは前者のモデルの予測値を ŷ として
yi = α + β log xi + γ ŷi + vi
について γ = 0 の帰無仮説の検定の P 値と, 逆に後者のモデルの予測値を ŷ として
yi = α + βxi + γ ŷi + vi
について γ = 0 の帰無仮説の検定の P 値を比較して P 値が低い方のモデルの帰無仮説を採択する方法である.
たとえば yi = α + βxi + γ ŷi + vi で γ = 0 の帰無仮説の検定の P 値が低ければ yi = α + βxi + ui のほうを
選択する.
なお被説明変数は同じであることに注意されたい. 被説明変数が違う場合には最尤法のもとでの赤池情報量
などがある. これについてはあとで扱う予定である.
取りうる値が正負の値をとらなければ, とるように変数変換したほうが誤差項が正規分布にしたがうという
仮定に整合的である. つまり正値をとる経済変数は対数変換を, ゼロから 1 の値を取る率の変数はロジスティ
クス変換をおこない. 線形モデルでよいかどうかを RESET 検定で確認し, 望ましくなければ自乗項や三乗項
を加えるようにすればよい.
2
ダミー変数
ある属性を満たしたとき 1 をとり, それ以外は 0 となる変数をダミー変数という.
男か女かの属性をしめすダミー変数を考えよう. 女性のとき 1 をとるダミー変数 D, 賃金を y とし, つぎの
単回帰モデルを考える.
yi = α + βDi + ui
3
このとき男性の時の平均賃金は α であり, 女性の平均賃金は α + β である. 両方に差があるかどうかのとの違
いは β = 0 の仮説検定を実施すればよい.
先の例では属性男女一つであった. たとえば人種 (白人・南米人・その他) のように 3 つの場合は, どうすれ
ばよいだろうか. 結論は 2 つのダミー変数をおけばよい.
yi = α + βD1i + γD2i + ui
南米人のとき 1 をとるダミー変数を D1 に, その他のとき 1 をとるダミーを D2 とすれば, 白人の平均賃金は
α であり, 南米人の平均賃金は α + β であり, その他の平均賃金は α + γ である. 属性が 4 種類ある場合はダ
ミー変数を 3 つおけばよい.
2 つの属性が 2 つある場合, 男女と組合加入の有無の場合も 2 つのダミー変数をおけばよい. 女性のとき 1
をとるダミー変数を D1 , 組合に加入しているとき 1 をとるダミー変数を D2 とする. このとき, 組合未加入の
男性の平均賃金は α, 組合未加入の女性の平均賃金は α + β, 組合加入の男性の平均賃金は α + γ, 組合未加入
の女性の平均賃金は α + β + γ となる. しかしながらこれだと, 組合加入による賃金への効果が男女とも同じ
ということが前提となっている. 男女ごとにその影響が異なることを表したい場合, 積のダミー変数をおけば
よい.
yi = α + βD1i + γD2i + δ(D1i × D2i ) + ui
そうすると, 組合員の女性の平均賃金は α + β + γ でなく, α + β + γ + δ となる.
また x を教育年数で, 女性のとき 1 をとるダミー変数 D, 賃金を y とし次のモデルを考える.
yi = α + βxi + γDi + ui
このとき男性なら回帰式は yi = α + βxi + ui となり, 女性なら yi = α + γ + βxi + ui となる. この D は定数
項ダミーという.
また以下のモデルを考える.
yi = α + βxi + γDi + δ(xi × Di ) + ui
このとき男性なら回帰式は yi = α + βxi + ui となる. 女性なら yi = α + γ + (β + δ)xi + ui となる. 定数項
だけでなく, 傾きも変化するモデルである.
さらに定数項は固定して, 傾きのみが変化するモデルは次のようにすればよい.
yi = α + βxi + γ(xi × Di ) + ui
ただあまり使うことはないだろう.
なお, 従属変数がダミー変数について, 誤差項を正規分布と仮定しているため, このままのモデルでは考えな
い. モデルを拡張して, α + βxi + ui ≥ 0 のとき yi が 1 をとり, そうでなければゼロをとるというモデルを考
えることができる. これをプロビットモデルという. また誤差項を正規分布でなく先にしめしたロジスティク
ス分布と考えたモデルをロジットモデルという. これらのモデルを推計するには最尤法の考え方が必要である.
3
古典的仮定のもとでの時系列データ
古典的仮定のもとでの時系列データについて紹介する. 時系列データのとき慣習的に添字が i でなく t とな
るので, それにしたがい. つぎのようなデータを考える.
yt = α + βxt + ut
4
古典的仮定として xt が非確率で ut が独立で同一分布の正規分布にしたがうとする.
3.1 トレンド項
マクロ時系列データは時間とともに増加することことがおおい. その場合
yt = α + βxt + γt + ut
というトレンド項をつけることがある. 説明変数と被説明変数にトレンドが存在するとき, その部分が強くで
て決定係数は 1 に近い値になることが多い. その場合, トレンドを除去した変数同士で回帰させたほうが説明
変数の説明力を正しく計測できる.
3.2 季節調整ダミー
マクロの月次データや四半期データの場合, 周期性がみられる. この周期性を除く手段として季節ダミーが
ある. 四半期データの場合,
yt = α + βxt + γ1 D1t + γ2 D2t + γ3 D3t + ut
というモデルを考える. Dit は第 i 四半期に 1 をとるダミー変数である. 第 4 四半期のダミー変数がないこと
に注意されたい. それを加えると全てのダミーを足しあわせた値は恒常的に 1 となり, 定数項と同じになり, 完
全な多重共線性が発生するからである.
3.3 構造変化ダミー
構造変化ダミーは t ≥ t0 のとき Dt = 1 となり, それ以外はゼロをとる変数である. これを加えたモデル
yt = α + βxt + γDt + ut
を考える. このとき, t0 時点前後で定数項がことなるモデルである. トレンド項や説明変数と乗じた変数をつ
けくわえることでこれらが変化したかモデルを作ることができる.
そうした構造変化ダミーを付け加えて係数がゼロかどうかの仮説検定を実施することで, 構造変化が存在し
たかどうかの検証が可能となる.
3.4 古典的仮定のもとでの時系列データの注意
古典的仮定のもとで誤差項が系列相関をもつかどうかをダービンワトソン検定により実行し, 系列相関の可
能性があれば, コクランノーカット法により推計することがテキストブックで記載されているが, 現在の実証
ではそのようなことは全く実施されないのでここでは省略する.
なぜ実証で実施されないのかは, 古典的仮定では以下のモデル
yt = α + βyt−1 + ut
が扱えないからである. これは自己回帰モデルといわれるがその説明変数は被説明変数の一期前のラグであり,
明らかに確率変数である. ダービンワトソン検定やこのようなモデルでは実施すると非常に精度が低いことが
知られている.
5
そうしたモデルを扱うためには別の仮定を置く必要がある. そうした仮定についてあとで議論する. ただ,
季節調整や構造変化やトレンド項がある場合, これを加えた場合の分析が数学的に非常に面倒になるので後半
でも分析していない. 最近のマクロモデルでは季節調整済みデータに HP フィルターを用いてトレンド除去済
みの時系列をあつかうことが多い.
6