β - 岡山大学 経済学部

経済情報処理基礎
エクセルでダイナミック・プログラミング
岡山大学経済学部
浅野貴央
平成26年12月09日
2
Key Words
1.職探し (job search)
2.ベルマン方程式 (Bellman’s Equation)
3.ダ イナミック・プログラミング (Dynamic Programming)
3
余談1
1.2010年のノーベル経済学賞はサーチ理論に対して与え
られた。
2.求職者の職探し行動、結婚相手を探す婚活にも応用可能
3.労働市場、結婚市場、不動産市場、貨幣市場、様々なサー
ビス市場に応用可能
4.現実問題に対して応用範囲の広い有用な理論
4
余談2
1.美男美女を賃金で優遇することを正当化できるか?
2.臓器売買なしに臓器移植をスムーズに行うには?
3.イイ男は結婚しているか?
4.カルテルや談合などの違法行為を摘発するには?
5.タイガー・ウッズが出場した試合では、他の選手のパ
フォーマンスが下がる?
上記のトピックはすべて経済学の分析対象
5
アウトライン
1.職探しモデル・パート1 (1978, Sargent) を通じて、ベルマン
方程式のポイントを理解する。
2.職探しモデル・パート2( 1981, McCall )を通じて、ダ イナ
ミック・プログラミングの要点を学び 、エクセルを用いて、ベ
ルマン方程式を解く。
今日の目標:エクセルを使ってベルマン方程式を解けるように
なること!
6
1.職探しモデル・パート 1( 1978, Sargent )
セットアップ
今、仕事を探している労働者の行動を考える。各期各期
(t = 0, 1, 2, . . . ) 、ある確率分布に従って賃金がオファーされる
とする。この意思決定者は、オファーを受け入れると、未来永
劫、その賃金で働き続けることが出来るとする( 解雇はない)
。
もしオファーを拒否した場合は、サーチコスト c (c > 0) を払っ
て次の期まで待ち、同じようにある確率分布に従ってオファー
される賃金を受け入れるか拒否するかの意思決定をする。この
労働者の目的は、生涯所得の期待値を最大化するようにオ
ファーを受け入れるタイミングを決定することである。つまり、
7
1.職探しモデル・パート 1( 1978, Sargent )
( 続き )
⎤
⎡
∞
E⎣
β t yt ⎦
(1)
t=0
を最大化するように、オファーを受けるタイミング T を決定す
る。ここで、E は期待値を表し 、β は割引率を表し 、0 < β < 1
である。また、yt は
−c for t < T
yt =
wT for t ≥ T
で定義される。つまり、賃金オファーを受け入れるまで、サー
チコストを各期各期払い続けるが 、オファーを T で受ければ 、
その期の賃金 wT を所得として未来永劫もらい続けることができ
る、という状況を表している。
8
1.職探しモデル・パート 1( 1978, Sargent )
( 続き )
確率変数 X を考える:
⎧
x1 w.p. p1
⎪
⎪
⎨
x2 w.p. p2
X=
..
..
⎪
⎪
⎩
xn w.p. pn
n
ここで、(∀i = 1, . . . , n) pi ≥ 0 かつ i=1 pi = 1 とする。つまり、
pi は状態 iが起きる確率を表している。確率変数 X の期待値 E[X]
は
n
E[X] =
xipi = μ,
i=1
で定義されることに注意。
9
1.職探しモデル・パート 1( 1978, Sargent )
( 続き )
任意の賃金オファー w に対して、
w
, −c + β V (w )dF (w )
V (w) = max
1−β
で表される方程式( 正確には関数方程式)をベルマン方程式
( Bellaman’s equation )と呼び 、この方程式の解、V を価値関数
( value function )と呼ぶ。V は、職探しをしたとき、この労働者
が得られる生涯賃金の最大値に一致している。ここで、F (w )
は、w 以下の賃金がオファーされる確率を表す。
10
2.職探しモデル・パート 2 (1981, McCall)
w
V (w) = max
, −c + β
1−β
V (w )dF (w )
この式は、一見すると複雑で何を言っているのか意味不明かも
しれないが 、見かけに騙されてはいけないのは数学も人生も同
じである。まず、左辺は、前述したとおり、生涯賃金(の期待
値)の最大値である。右辺の第一項は、賃金 w でオファーを受
け、生涯にわたってその賃金をもらい続けたときの生涯賃金で
ある。つまり、式 (1) に w を代入して計算した値になっている
( 等比数列の和)
。一方、第二項は、賃金オファー w を拒否し 、
サーチコスト c を払って職探しを継続することによって得られる
生涯賃金(の期待値を割引率 β で割り引いた値)を表している。
max の記号は、この二つの項のうち、大きい方を選びなさい、
と言う意味である。
11
2.職探しモデル・パート 2 (1981, McCall)
これ以降の議論は穂刈・飯村・大沼( 2006、筑波大学経済論
集)に基づいている。
セットアップ
先ほどのモデルでは無限期間を考えたが 、ここでは、1期から
50期までの50期間を考える。Aさんは失業中で仕事を探し
ているとする。Aさんの選択は先ほどのモデルと同様、賃金オ
ファーを受け入れて最終期まで働き続けるか、あるいは、サー
チコストを払って次の期にもう一度、賃金オファーを待つか、
である。賃金オファーは 0 ≤ w1 < w2 < · · · < w10 の10種類と
し 、それぞれがオファーされる確率は p1, p2, . . . , p10 とする。A
さんの所得を yt とすると、
⎧
w1 賃金 w1 で働く
⎪
⎪
⎨ .
..
.
yt =
w10 賃金 w10 で働く
⎪
⎪
⎩
−c 次期もサーチする
Aさんの目的は、
12
2.職探しモデル・パート 2 (1981, McCall)( 続き)
最終期までに得られる生涯賃金の期待値
y1 + βy2 + β 2y3 + · · · + β 49y50
を最大にするように賃金オファーを受け入れる最適なタイミングを選ぶこと
である。β は先ほどと同様、0 < β < 1 を満たす割引率である。
t 期に wi の賃金オファーを受けたとする。t 期以降に得られる生涯賃金の期
待値
yt + βyt+1 + β 2yt+2 + · · · + β 50−ty50
の最大値を Vt(wi) とすると( 先ほど 説明した価値関数に対応する。)、
Vt(wi)
51−t
)wi
(1 − β
= max
, −c + β[p1Vt+1(w1) + p2Vt+1(w2) + · · · + p10Vt+1(w10)]
1−β
が成立する。これが有限期間のベルマン方程式である。この式を更に細かく
見てみると、、、
13
2.職探しモデル・パート 2 (1981, McCall)( 続き)
V50(wi) = max{wi, −c}
2
(1 − β )wi
V49(wi) = max
, −c + β[p1V50(w1) + p2V50(w2) + · · · + p10V50(w10)]
1−β
(1 − β 3)wi
, −c + β[p1V49(w1) + p2V49(w2) + · · · + p10V49(w10)]
V48(wi) = max
1−β
.. = ..
50
(1 − β )wi
, −c + β[p1V2(w1) + p2V2(w2) + · · · + p10V2(w10)]
V1(wi) = max
1−β
となる。
14
2.職探しモデル・パート 2 (1981, McCall)( 続き )
一言で言うと、ダ イナミック・プログラミング( 動的計画法)
とは、多期間(ここでは50期)の問題を2期間の問題に分割
し 、最終期(ここでは50期目)から初期(ここでは1期)ま
でバックワードに解いていくことによって、最適な解をもとめ
ようとする方法のことである。
15
2.職探しモデル・パート 2 (1981, McCall)( 続き )
よって、各パラメータ(パラメータとは、モデルを解くことで
得られる解=内生変数とは異なり、事前に決められた値=外生
変数のこと。)の値を決めてあげると、エクセルを用いて Vt(wi)
を計算することが出来る。
結果として、Aさんにとっての、賃金オファーを受け入れる最
適なタイミングを求めることが出来る。β = 0.9, c = 10 として、
Vt(wi) をエクセルで計算し 、accept と reject の領域を色分けする
と、、、
( 講義中の図を参照)
16
宿題
以下の二つのケースについて、Vt(wi) を計算しなさい。ただし 、
(1), (2) ともに、賃金オファーについては、w1 = 10, w2 = 20,
w3 = 30, w4 = 40, w5 = 50, w6 = 60, w7 = 70, w8 = 80, w9 = 90,
w10 = 100 とする。
(1) β = 0.85, c = 15, すべての i = 1, 2, . . . , 10 に対して、pi = 0.1
のケース。
(2) β = 0.9, c = 10, p1 = 0.2, p2 = 0.15, p3 = 0.1, p4 = 0.1,
p5 = 0.1, p6 = 0.1, p7 = 0.1, p8 = 0.05, p9 = 0.05, p10 = 0.05 の
ケース。
提出方法:2014年12月16日火曜日の講義時間。
TAセッションにおいて、TAにプリントアウトして( 紙媒体
で )提出。名前と学籍番号を忘れないこと!