6.1 OB 分解法

平成 25 年度 ミクロ計量経済学
講義ノート 6: オハカ・ブラインダー分解法
このノートでは、オハカ・ブラインダー分解法 (Oaxaca-Blinder decompostion, OB 分
解法と略す) の解説を行う。OB 分解法とは、異なる二つのグループ間での平均の差を、観
測できる共変量の分布の差と、共変量が同じだったとしてもおこる根本的な構造の差に分解
する方法である。Oaxaca (1973) と Blinder (1973) により提唱された。例えば、男女間の賃
金の差を、男女間での教育年数や勤続年数の差に起因する差と、性差別などの教育年数な
どが同じだったとしても存在している差に、分解する目的で使用される。OB 分解法は、線
形回帰モデルの OLS 推定量から計算することができ、また STATA などではパッケージ化
もされているため、容易に使用することができる。ここでは、OB 分解法の計算法と、その
理論的背景、またその限界について議論する。このノートの議論は、Fortin, Lemieux and
Firpo (2011) によっている。
6.1
OB 分解法
ここでは、OB 分解法を適用する設定と実際の作業を解説する。理論的背景は、次の節で
扱う。
二つのグループがあり、それぞれ g = A, B とし、このグループ間の差異に興味があ
るとする。この二つのグループから、結果変数の Y と説明変数 X の標本を採る。標本を
(Ygi , Xgi ), g = A, B, i = 1, . . . , ng とする。説明変数 X は K 次元のベクトルであり、Xgi =
(Xgi1 , . . . , XgiK ) とする。OB 分解法の目的は、Y のグループ間での際を X の値の差と、X
が Y を決めるメカニズムの差に分解することである。
ˆ µ = Y¯B − Y¯A という、グループ A とグループ B での平均の差
我々が興味があるのは、∆
O
が、何に起因するのか、という問題である。ここで、Y¯B はグループ B における Y の平均で
ある。つまり、
nB
1 ∑
YBi
Y¯B =
nB
(1)
i=1
である。Y¯A は同様に、グループ A 内の Y の平均である。例えば、男女間の賃金格差の問題
ˆ µ という男女間の平均賃金の差を計算す
を考える。この格差は、グループを性別でわけ、∆
O
ることで、表現できる。しかし、平均賃金の差だけでは、男女間の賃金格差の表現として通
常は不十分である。その格差が何に起因しているのか、あるいはどのような属性と関連して
いるのか、を知らなくては、その格差に対する規範的な評価もできず、有効な政策を考える
こともできない。
OB 分解法の作業は、最小二乗法をもとに行う。
Ygi = βg0 +
K
∑
Xgik βgk + vgi
(2)
k=1
という線形回帰モデルをグループごとに推定する。なお、(βA0 , βA1 , . . . , βAK ) の推定には、
(YAi , XAi ), i = 1, . . . , nA というグループ A からのデータのみを使うことに注意すること。
βˆgk を βgk の OLS 推定量とする。
ˆ µ の次のような分解である。
OB 分解とは、∆
O
ˆµ = ∆
ˆµ + ∆
ˆµ
∆
O
S
X
(3)
ただし、
ˆ µ = (βˆB0 − βˆA0 ) +
∆
S
K
∑
k=1
1
¯ Bk (βˆBk − βˆAk )
X
(4)
かつ
ˆµ =
∆
X
K
∑
¯ Bk − X
¯ Ak )βˆAk
(X
(5)
k=1
である。この分解が成り立つことは、OLS 推定量の性質から導出できる。まず、
Y¯g = βˆg0 +
K
∑
¯ gk
X
(6)
k=1
であることは、OLS 推定の残差の平均は 0 であるという結果からわかる。この結果から、
OB 分解法がなりたつことはすぐに証明できる。
ˆµ と ∆
ˆ µ には、
分解の各要素、∆
S
X
ˆ µ : unexplained part (説明されない部分)
• ∆
S
ˆ µ : explained part (説明される部分)
• ∆
X
µ
ˆ には wage
という名称がある。また、OB 分解法は、賃金格差の分析によく使われるため、∆
S
structure effect(賃金構造効果) という名称もある。
ˆ µ は観測される属性によっては説明できない、Y を生成するメカニズムの違いに起因
∆
S
ˆ µ には、
する格差になる。例えば、男女間の賃金格差を考えると、単純な賃金格差である ∆
O
属性の違いと、そもそも労働市場で性別によって属性への評価が異なることの、両方が含ま
ˆ µ は、たとえ同じ属性、つまり学歴や職歴が同じ男女がいたとして、その男女
れている。∆
S
¯ Bk の属性をもつ男女で計算したものである。
の格差を、X
ˆ µ は観測される属性によって説明できる部分である。これは、たとえ Y を生成するメ
∆
X
カニズムが同一であったとしても起こる格差を表現している。男女間の賃金格差でいうと、
通常は、男女間で学歴や職歴はことなる。また賃金は、学歴や職歴が違えば、違ったものに
なるであろう。この属性の差によって起こる格差を、賃金生成のメカニズムが両グループと
ˆ µ である。
も βˆAk によって決まるとして、計算したものが ∆
X
OB 分解法は、最小二乗法をもとにしているために、簡単に計算できる。また、STATA
では、OB 分解法のためのパッケージも開発されている。パッケージを使用する利点は、標
準誤差の計算が簡単にできることであろう。OLS をもとにしているとはいえ、標準誤差の
計算を OLS の推定結果から行うのは、意外と面倒である。
6.2
OB 分解法の理論的背景
この節では、OB 分解法の理論的背景を政策評価法の枠組みを使用して解説する。政策評価
法の理論を使用することで、OB 分解法で推定している対象が明確になり、またその方法を
平均以外の指標の分解への拡張も容易になる。また OB 分解法の依拠する仮定が明確になる
ことで、どのような場合に OB 分解法が有効であるかの理解が深まる。
OB 分解をする際の設定は、政策評価法における処置をグループと読み替えることで、政
策評価法の設定と解釈することができる。つまり、ある個人 i がいて、この個人は潜在的に
YAi と YBi の両方の結果を持ち、その個人がグループ A に入れば、YAi を観測でき、グルー
プ B に入れば、YBi を観測するという設定と考えるのである。なお、こうした枠組みは有用
である一方で、あくまでも理論構築のための便宜的な枠組みであると割り切った方がよい。
例えば、男女間の賃金格差の例の場合、この枠組みでは、ある個人は潜在的には性別をもた
ず、たまたま男性になれば男性の賃金をもらい、たまたま女性になれば女性の賃金をもらう
ということになる。しかし性別はそもそも生まれたときからついてまわるものであり、この
ような解釈に違和感を持つ人も多いであろう。
2
政策評価の枠組みを用いた OB 分解法の目的は次のように記述できる。データから観測
できるグループ間の格差は、
∆µO = E(YB |B) − E(YA |A)
(7)
である。なお、条件付き期待値の条件の B や A はそのグループに属していると観測された
という事象である。これを、
∆µO = ∆µS + ∆µX
(8)
∆µS = E(YB − YA |B)
(9)
∆µX = E(YA |B) − E(YA |A)
(10)
ただし、
かつ
µ
と分解することが、OB 分解法の目的になる。なお、この表記から、∆S は ATT(average
treatment effect on the treated) になることがわかる。
しかし、E(YA |B) などは仮定をおかずには識別できない。そのため、OB 分解法では、
無視可能性の仮定と、条件付き期待値の線形性の仮定をおいて、識別している。
まず、無視可能性の仮定とは、
(YA , YB )⊥g|X
(11)
である。ここで g = A, B は観測されるときにどちらのグループに入っているかを示す変数
である。この仮定の下では、
E(YA |B, X) = E(YA |A, X) = E(YA |X)
(12)
となり、E(YA |A, X) は識別できることから、
E(YA |B) = E(E(YA |B, X)|B) = E(E(YA |X)|B)
(13)
とすることで、E(YA |B) は識別できる。E(YB |A) の識別も同様の議論でなりたつ。つまり、
無視可能性のもとでは、
∆µS = E(YB |B) − E(E(YA |X)|B)
(14)
∆µX = E(E(YA |X)|B) − E(YA |A)
(15)
かつ
として分解の識別ができるのである。
OB 分解法では、さらに線形性の仮定をおいている。つまり、
E(YA |X) = βA0 +
K
∑
βAk Xk
(16)
k=1
と仮定している。同様に、E(YB |X) についても線形の仮定をおく。こうすると、無視可能
性の仮定と合わせて、
∆µS
= (βB0 +
K
∑
βBk E(Xk |B)) − (βA0 +
k=1
= (βB0 − βA0 ) +
K
∑
βAk E(Xk |B))
(17)
k=1
K
∑
(βBk − βAk )E(Xk |B)
k=1
3
(18)
かつ
∆µX
= (βA0 +
K
∑
βAk E(Xk |B)) − (βA0 +
k=1
=
K
∑
K
∑
βAk E(Xk |A))
(19)
k=1
βAk (E(Xk |B) − E(Xk |A))
(20)
k=1
¯ Ak で置き換
となる。OB 分解法は、この表現の β を OLS 推定量で置き換え、E(Xk |A) を X
えて求まる。
6.3
非線形構造
この節では、条件付き期待値が線形にかけない場合の分解法について解説する。着眼点は、
OB 分解法が、ATT の推定に帰着するという、前節で行った考察にある。なお、無視可能性
の仮定は維持し、ここでは単に条件付き期待値が非線形の場合を考察する。非線形モデルの
推定をもとにした方法と、reweighting regression 分解法の二つを紹介する。
6.3.1
回帰補正法による分解
第一の方法は、E(YA |X) と E(YB |X) を推定することである。無視可能性の仮定があるため、
E(YA |X) は A グループに属する観測値のみを使用することで推定できる。同様に E(YB |X)
ˆ A |X)
も B グループに属する観測値のみを使用することで推定できる。これらの推定量を E(Y
ˆ B |X) とする。すると、非線形版の OB 分解は、
と E(Y
nB
nB
∑
∑
ˆ B |XBi ) − 1
ˆ A |XBi )
ˆµ = 1
E(Y
E(Y
∆
S
nB
nB
(21)
nB
nA
∑
∑
ˆµ = 1
ˆ A |XBi ) − 1
ˆ A |XAi )
∆
E(Y
E(Y
X
nB
nA
(22)
i=1
i=1
かつ、
i=1
i=1
µ
ˆ は ATT の回帰補正法による推定値になる。
となる。なお、∆
S
例として、Y が2項変数であり、条件付き期待値のモデルとして probit を使用する場合
を考える。つまり、
E(Yg |X) = Pr(Yg = 1|X) = Φ(X ′ βg )
(23)
というモデルを考える。Φ は標準正規分布関数である。A グループの観測値のみを使用し
た最尤推定で βˆA を計算し、B グループの観測値のみを使用した最尤推定で βˆB を得る。そ
して、
nB
nB
∑
1 ∑
′ ˆ
′ ˆ
ˆµ = 1
∆
Φ(X
β
)
−
Φ(XBi
βA )
Bi B
S
nB
nB
(24)
nB
nA
∑
1 ∑
′ ˆ
′ ˆ
ˆµ = 1
∆
Φ(X
β
)
−
Φ(XAi
βA )
Bi A
X
nB
nA
(25)
i=1
i=1
かつ、
i=1
i=1
として、分解を行うのである。
4
6.3.2
Reweighting regression
第2の方法は、reweighting regression による分解法である。DiNardo, Fortin and Lemiuex
(1996) により提唱された。この方法は、逆確率重み付け法と密接に関連している。なおこの
節では、X は定数項を含むとする。まず、fA (X) を A グループにおける X の密度関数 (X
が離散の場合は確率関数) とする。同様に fB (X) は B グループでの X の密度関数とする。
Ψ(X) =
fB (X)
fA (X)
(26)
ˆ
と定義し、Ψ(X)
をその推定量とする。そして、
C
βˆA
=
(n
A
∑
)−1
ˆ Ai )XAi X ′
Ψ(X
Ai
i=1
nA
∑
ˆ Ai )XAi YAi
Ψ(X
(27)
i=1
かつ
nA
∑
¯C = 1
ˆ Ai )XAi
X
Ψ(X
A
nA
(28)
i=1
とする。reweighting regression による分解は、
′ ˆ
C′ ˆC
ˆµ = X
¯B
¯A
∆
βB − X
βA
S,R
(29)
C′ ˆC
′ ˆ
ˆµ = X
¯A
¯A
∆
βA − X
βA
X,R
(30)
と、
となる。
なぜ reweighting regression により適切な分解ができるのかを理論的に示す。示すべき
¯ C′ βˆC が E(YA |B) の推定量になっていることである。まず、X
¯ ′ βˆB と X
¯ ′ βˆA について
は、X
A A
B
A
¯
¯
は、線形回帰の性質によりそれぞれ YB と YA であり、これらは、E(YB |B) と E(YA |B) の
C を考える。これは、漸近的に、
推定量になっている。次に βˆA
E(Ψ(X)(YA − X ′ β)2 |A)
(31)
C とする。ここで、m (X) = E(Y |X) とする
を最小化する β になる。そのような β を βA
A
A
C
ˆ
と、βA は
E(Ψ(X)(mA (X) − X ′ β)2 |A)
(32)
を最小化する β になる。なお mA (X) は線形でないとしているので、mA (X) = X ′ β となる
β は存在しない。一方で、
∫
′ 2
E(Ψ(X)(mA (X) − X β) |A) =
Ψ(X)(mA (X) − X ′ β)2 fA (X)dX
(33)
∫
=
(mA (X) − X ′ β)2 fB (X)dX
(34)
C は、m (X) の、ひいては、Y のグループ B での、X の分布を考え
となる。よって、X ′ βA
A
A
C は E(Y |B) と
たときの、best linear predictor になっている。このことから、E(X|A)′ βA
A
C
C′
C
¯ によって推定できる。そのため、X
¯ βˆ が E(YA |B) に確率収
同じになる。E(X|A) は X
A
A A
束する。
5
次に Ψ(X) の推定を簡便にするために、Ψ(X) が傾向スコアの関数としてかけることを
示す。
Ψ(X) =
fB (X)
f (X|B)
=
fA (X)
f (X|A)
(35)
であり、ベイズの定理により、
f (X|B) =
f (X, B)
Pr(B|X)f (X)
=
f (B)
Pr(B)
(36)
となる。f (X|A) も同様である。そのため、
Ψ(X) =
Pr(B|X) Pr(A)
Pr(A|X) Pr(B)
(37)
となる。Pr(A)/ Pr(B) はグループ A と B の観測値の比率から推定でき、Pr(B|X) は傾向ス
コアでありプロビットなどで推定できる。
6.4
Detailed decomposition
この節では、detailed decomposition という、グループ間の差異を、各属性ごとの影響にわ
ける方法を解説する。detailed decomposition の作業自体は簡単であるが、とくに属性がダ
ミー変数で表現される場合などでは、解釈に注意が必要となる。
まずは、通常の OB 分解法における detailed decomposition を考える。OB 分解は、
ˆ µ = (βˆB0 − βˆA0 ) +
∆
S
K
∑
¯ Bk (βˆBk − βˆAk )
X
(38)
k=1
と
ˆµ =
∆
X
K
∑
¯ Bk − X
¯ Ak )βˆAk
(X
(39)
k=1
であった。detailed decompsition は、この分解をさらに各説明変数ごとの影響に分解するも
のであり、たとえば、変数 Xk の説明されない部分への影響は、
ˆµ = X
¯ Bk (βˆBk − βˆAk )
∆
S,k
(40)
であり、説明される部分への影響は、
ˆ µ = (X
¯ Bk − X
¯ Ak )βˆAk
∆
X,k
(41)
となる。例えば、男女間の賃金格差において、学歴に関する detailed decomposition により、
男女間の賃金格差のうち、学歴が賃金に与える影響に男女間に違いがあることから起こる格
差と、男女間で学歴の分布が異なっていることからおこる格差、という分解を行うことがで
きる。
OB 分解法における detailed decomposition は、経路独立 (path independence) という
重要な性質を満たす。これは、detailed decomposition を行う際に、どの変数への detailed
decomposition からみていっても同じ結果になるということである。なお、経路独立性を考
える際の detailed decomposition は各要素への分解を足し合わせると全体の分解に一致する
∑
ˆµ
ˆµ
( K
k=1 ∆S,k = ∆S となること) が条件として課されている。
6
非線形モデルの場合には、Reweighting regression で分解を行うならば、経路独立性を
もつことは容易にわかる。一方で、回帰補正法の場合には、経路独立性を持つ detailed decomposition のやり方は定かではない。
説明変数がダミー変数を含む場合には、Oaxaca and Ransom (1999) によって指摘された
ように、detailed decomposition の解釈には注意が必要になる。これは、通常の線形回帰モデ
ルにおけるダミー変数の解釈の問題と同じになる。たとえば、賃金の例で、X が産業ダミー
を含む場合を考える。産業が4つあり、それらを表すダミー変数として、ind1, ind2, ind3,
ind4 とする。これらは、2項変数であり、ind1 + ind2 + ind3 + ind4 = 1 を満たす。この
とき、4つのダミー変数を含むモデルを推定する際には、多重共線性を避けるため、定数項
を含まない。しかしそのときダミー変数は定数項の影響を含むため、detailed decompostion
の ind1B (βˆB,ind1 − βˆA,ind1 ) が、どの程度、産業1における賃金格差を表現しているのかは
定かではない。また4つのダミー変数のどれかを使用せずに、定数項を入れたモデルを考え
るとすると、どのダミー変数を落としたかで定数の推定値が変わるため、やはり、detailed
decomposition を行ってもその意味するところは定かではなくなってしまう。この問題は、
omitted group problem と呼ばれる。
References
[1] A. Blinder. Wage discrimination: Reduced form and structural estimates. Journal of Human
Resources, 8:436–455, 1973.
[2] J. DiNardo, N. M. Fortin, and T. Lemiuex. Labor market instutions and the distribution of
wages, 1973–1992: A semiparametric approach. Econometrica, 64:1001–1044, 1996.
[3] N. Fortin, T. Lemiuex, and S. Firpo. Decomposition methods in economics. In O. Ashenfelter
and D. Card, editors, Handbook of Labor Economics, volume 4a, chapter 1, pages 1–102. Elsevier
B.V., 2011.
[4] R. Oaxaca. Male-female wage differentials in urban labor markets. International Economic
Review, 14:693–709, 1973.
[5] R. L. Oaxaca and M. R. Ransom. Indentifiction in detailed wage decomposition. Review of
Economics and Statistics, 81:154–157, 1999.
7