プレーヤー1

上級価格理論II
第10回
2011年後期
中村さやか
今日やること
4. 不完備情報の動学ゲーム
• 4.1 完全ベイジアン均衡への入門
• 4.2 シグナリング・ゲーム
完備不完全情報の動学ゲームの例
R
1
L
M
1
3
2
L’
2
1
R’
L’
0
0
0
2
R’
0
1
プレーヤー1の利得
プレーヤー2の利得
プレーヤー1が L, M, R の中から1つを選ぶ
もしRが選ばれればそこでゲームは終了
もしLかMが選ばれれば、プレーヤーはRが選ばれなかった
ことを知り(LとMのどちらが選ばれたかは知らずに)、L’ と
R’ からどちらかを選ぶ
ゲームの標準形の表現
プレーヤー2
L’
プレーヤー1
R’
L
2, 1 0, 0
M
0, 2 0, 1
R
1, 3 1, 3
• 純粋戦略のナッシュ均衡: (L, L’) (R, R’)
• これらはサブゲーム完全?
サブゲーム完全なナッシュ均衡
R
1
L
M
1
3
2
L’
2
1
R’
L’
0
0
0
2
R’
0
1
純粋戦略のナッシュ均衡: (L, L’) (R, R’)
このゲームにはサブゲームがないので、ナッシュ均衡であれば
サブゲーム完全なナッシュ均衡になる
⇒ サブゲーム完全なナッシュ均衡: (L, L’) (R, R’)
しかし (R, R’) は信憑性のない脅しに依存
もっともらしくない均衡を排除するための条件1
信頼性のない脅しに依存した均衡を排除するために2つの
条件を課す
条件1
• 各情報集合ごとに、そこで手番を持つプレーヤーは、その情
報集合のどの節がゲームのプレーの結果として到達された
たかについてある信念(belief)を持たねばならない
• 複数の節を含む情報集合については、信念とはその情報集
合の節上の確率分布のことである
• 一節のみを含む情報集合については、プレーヤーの信念は
その唯一の決定節に確率1を割り当てることになる
もっともらしくない均衡を排除するための条件2
信頼性のない脅しに依存した均衡を排除するために2つの
条件を課す
条件2
• 信念を所与とするとき、プレーヤーの戦略は逐次合理的
(sequentially rational)でなければならない
⇔各情報集合において、そこで手番を持つプレーヤーのとる行
動(および「そのあとの戦略」)は、そこでの信念と他のプレー
ヤーのそのあとの戦略を所与として最適になっていなければ
ならない
← 「そのあとの戦略」とは、その情報集合にゲームが到達した
後で起こりうる全ての可能な事態に対応する完全な行動計
画のことである
もっともらしくない均衡の排除の例
R
1
2
L’
2
1
L
M
[p]
[1-p]
R’
L’
0
0
0
2
1
3
R’
0
1
条件1より、プレーヤー2が信念(p, 1-p)を持つ
⇒ L’をプレーした時の期待利得=p+2(1-p)=2-p
R’をプレーした時の期待利得=1-p
条件2(逐次合理性)より、プレーヤー2はR’ではなくL’を選ぶ
したがってもっともらしくない均衡(R, R’)は排除される
定義: 均衡経路
定義
• 所与の展開型ゲームにおいて均衡が一つ与えられていると
する
• このゲームが均衡戦略に沿ってプレーされたとき、ある情報
集合が正の確率で到達されるのであれば、その情報集合は
均衡経路上にある(on the equilibrium path)と言う
• このゲームが均衡戦略に沿ってプレーされたとき、ある情報
集合が到達される確率がゼロならば、その情報集合は均衡
経路上にない(off the equilibrium path)と言う
• ここでいう「均衡」とは、ナッシュ均衡、サブゲーム完全なナッ
シュ均衡、ベイジアン均衡、また完全ベイジアン均衡のどれ
をも意味しうる
もっともらしくない均衡を排除するための条件3
条件1: プレーヤーが信念を持つ
条件2: プレーヤーは信念のもとで最適に行動する
+条件3: プレーヤーの信念は理にかなったものである
条件3:
• 均衡経路上にある情報集合については、信念はベイズの公
式とプレーヤーの均衡戦略とによって決定される
均衡経路上の信念の例
R
1
2
L’
2
1
L
M
[p]
[1-p]
R’
L’
0
0
0
2
1
3
R’
0
1
サブゲーム完全なナッシュ均衡(L, L’)においては、プレーヤー1
の均衡戦略はLなので、プレーヤー2の信念はp=1
定義 完全ベイジアン均衡
• 完全ベイジアン均衡(perfect Bayesian Nash Equilibrium)
は条件1から4までを満たす戦略と信念から成る
条件1: 信念
条件2: 逐次合理性
条件3:
• 均衡経路上にある情報集合については、信念はベイズの公
式とプレーヤーの均衡戦略とによって決定される
条件4:
• 均衡経路上にない情報集合については、信念は、それが可
能な場合、ベイズの公式とプレーヤーの均衡戦略とによって
決定される
3人のゲーム①
A
1
2
0
0
D
2
L
R
3
L’
1
2
1
R’
L’
3
3
3
0
1
2
R’
0
1
1
サブゲーム
サブゲームの標準形の表現
プレーヤー2
L’
プレーヤー1
R’
L
2, 1 3, 3
R
1, 2 1, 1
• 純粋戦略のナッシュ均衡: (L, R’)
3人のゲーム①
A
1
サブゲーム
2
0
0
D
2
L
3
L’
1
2
1
R
[p]
[1-p]
R’
L’
3
3
3
0
1
2
R’
0
1
1
唯一のサブゲーム完全なナッシュ均衡: (D, L, R’)
(D, L, R’)は条件1から4も満たすので完全ベイジアン均衡
(到達されない情報集合はないので条件4は問題ではない)
定義 完全ベイジアン均衡
• 完全ベイジアン均衡(perfect Bayesian Nash Equilibrium)
は条件1から4までを満たす戦略と信念から成る
条件1: 信念
条件2: 逐次合理性
条件3:
• 均衡経路上にある情報集合については、信念はベイズの公
式とプレーヤーの均衡戦略とによって決定される
条件4:
• 均衡経路上にない情報集合については、信念は、それが可
能な場合、ベイズの公式とプレーヤーの均衡戦略とによって
決定される
3人のゲーム①
A
1
サブゲーム
D 均衡経路
2
L
3
2
0
0
R
[p]
[1-p]
L’
R’
L’
1
2
1
3
3
3
0
1
2
R’
0
1
1
戦略(A, L, L’)と信念p=0はナッシュ均衡で条件1から3を満たす
が、サブゲーム完全ではなく、条件4が満たされていない
条件4⇒戦略が(A, L, L’)ならばp=1
3人のゲーム②
A
1
D
A’
2
L
3
L’
R
[p]
[1-p]
R’
L’
R’
もし均衡でのプレーヤー2の戦略がA’ならば、条件4はpの値に
何の制約も加えない
もし均衡でのプレーヤー2の戦略がLを確率q1、Rを確率q2、A’
を確率1-q1-q2でプレーすることで、q1+q2>0ならば、条件4より
プレーヤー3の信念はp=q1/(q1+q2)でなければならない
シグナリング・ゲーム
プレーヤー: 送り手(sender, S)と受け手(receiver, R)
1 自然が確率分布 p(ti) に従って可能なタイプの集合 T={t1,
…, tI} から送り手のタイプ ti を決める
∀i, p(ti)>0, p(t1)+…+p(tI) =1
2 送り手は ti を知ったのち、可能なメッセージの集合 M={m1,
…, mJ} からメッセージ mj を1つ選ぶ
3 受け手は mj を知ったのち( ti は知らずに)、可能な行動の
集合 A={a1, …, aK} から行動 akを1つ選ぶ
4 利得が US(ti, mj, ak) と UR(ti, mj, ak) によって決まる
シグナリング・ゲームの応用
分析対象
就職市場 企業への投資
金融政策
送り手
労働者
企業
FRB
(中央銀行)
受け手
企業
投資家
雇用者
送り手のタイプ
生産能力 企業の既存資産 インフレ受容度
の収益性
メッセージ
教育水準 出資者の利益請 第1期のインフ
求権 の大きさ レ率
受け手の行動
賃金
投資の有無
第2期のインフ
レ率の予想
シグナリング・ゲームの例
a1
m1
送り手
t1
a2
p
受け手
a1
1
2
3
4
a2
受け手
自然
1-p
m1
a2
m2
t2
送り手
a1
a1
m2
a2
自然が確率分布 p(ti) に従って送り手のタイプ ti を決める
送り手は ti を知ったのち、メッセージ mj を選ぶ
受け手は mj を知ったのち( ti は知らずに)行動 akを選ぶ
利得が US(ti, mj, ak) と UR(ti, mj, ak) によって決まる
シグナリング・ゲームの例: 純粋戦略
送り手の戦略: m(ti)
タイプがt1の時の行動
タイプがt2の時の行動
戦略1 戦略2 戦略3 戦略4
m1
m1
m2
m2
m1
m2
m1
m2
戦略1と戦略4: 一括型 (pooling)
戦略2と戦略3: 分離型 (separating)
受け手の戦略: a(mj)
戦略1 戦略2 戦略3 戦略4
a1
a1
a2
a2
メッセージがm1の時の行動
a1
a2
a1
a2
メッセージがm2の時の行動
シグナリングの条件1
•
M に属するメッセージ mj を観察した後で、受け手は mjがど
のタイプによって送られてきたかについての信念を形成しな
くてはならない
• その信念を確率分布 μ(ti | mj) で書くと、T に属する各 tiにつ
いて μ(ti | mj) ≧ 0 かつ Σti∊T μ(ti | mj) =1
条件1
• 各情報集合ごとに、そこで手番を持つプレーヤーは、その情
報集合のどの節がゲームのプレーの結果として到達された
たかについてある信念(belief)を持たねばならない
• 複数の節を含む情報集合については、信念とはその情報集
合の節上の確率分布のことである
• 一節のみを含む情報集合については、プレーヤーの信念は
その唯一の決定節に確率1を割り当てることになる
シグナリングの条件2R:送り手
•
M に属する mj のそれぞれについて、その mj をどのタイプ
が送ったかに関する信念 μ(ti | mj)を所与とすると、受け手
の行動 a*(mj) は受け手の期待効用を最大化しなくてはなら
ない
⇒ a*(mj) ∊ arg max ak∊A Σti∊T μ(ti | mj) UR(ti, mj, ak)
条件2
• 信念を所与とするとき、プレーヤーの戦略は逐次合理的
(sequentially rational)でなければならない
⇔各情報集合において、そこで手番を持つプレーヤーのとる行
動(および「そのあとの戦略」)は、そこでの信念と他のプレー
ヤーのそのあとの戦略を所与として最適になっていなければ
ならない
シグナリングの条件2S:受け手
•
T に属する ti のそれぞれについて、送り手のメッセージ
m*(ti) は受け手の戦略 a*(mj)を所与として送り手の効用を
最大化しなければならない
⇒ m*(ti) ∊ arg max mj∊M US(ti, mj, a*(mj))
条件2
• 信念を所与とするとき、プレーヤーの戦略は逐次合理的
(sequentially rational)でなければならない
⇔各情報集合において、そこで手番を持つプレーヤーのとる行
動(および「そのあとの戦略」)は、そこでの信念と他のプレー
ヤーのそのあとの戦略を所与として最適になっていなければ
ならない
メッセージは均衡経路上にあるか?
Tj ≝{ti∊T | m*(ti) = mj }
⇔ Tj は最適戦略m*(ti)としてメッセージ mj を送るタイプの集合
•
•
Tj が非空であれば、メッセージ mj に対応する情報集合は
均衡経路上にある
Tj が空であれば、メッセージ mj はどのタイプによっても送ら
れないので、それに対応する情報集合は均衡経路上にな
い
Tiの例 ①
a1
m1
送り手
t1
a2
p
受け手
a1
a2
受け手
自然
1-p
m1
a2
m2
t2
送り手
a1
a1
m2
a2
Tj ≝{ti∊T | m*(ti) = mj }
⇔ Tj は最適戦略m*(ti)としてメッセージ mj を送るタイプの集合
この例ではT1={t1, t2}, T2=Φ
Tiの例 ②
送り手
t1
a1
m1
a2
m2
p
受け手
a1
a2
受け手
自然
1-p
m1
a2
t2
送り手
a1
a1
m2
a2
Tj ≝{ti∊T | m*(ti) = mj }
⇔ Tj は最適戦略m*(ti)としてメッセージ mj を送るタイプの集合
この例ではT1={t2}, T2={t1}
シグナリングの条件3
•
•
Tj ≝{ti | m*(ti) = mj }
M に属する mj のそれぞれについて、もしm*(ti) = mj となる
ti が T の中に存在するのであれば、 mj に対応する情報集
合での受け手の信念はベイズの公式と送り手の戦略にした
がわねばならず、(ti∊Tj となる ti に対しては)次の式が成立
しなければならない
μ(ti | mj) =p(ti)/[Σti∊Tj p(ti)]
条件3:
• 均衡経路上にある情報集合については、信念はベイズの公
式とプレーヤーの均衡戦略とによって決定される
シグナリング・ゲームにおける
純粋戦略の完全ベイジアン均衡
•
•
シグナリング・ゲームにおける純粋戦略の完全ベイジアン均
衡とは、シグナリングの条件1, 2R, 2S, および3を満たす戦
略m*(ti) , a*(mj) と信念 μ(ti | mj) の組である
(条件4は必ず満たされる)
条件4:
• 均衡経路上にない情報集合については、信念は、それが可
能な場合、ベイズの公式とプレーヤーの均衡戦略とによって
決定される