4.3

経済学のためのゲーム理論入門
第 4 章 不完備情報の動学ゲーム
4.5
本問 4.5 の解答では,練習問題 4.3 の (a),(b) 各ゲームにおける純粋戦略の完全ベイジアン均衡
を全て求める.従って,問題 4.3 の解答についてはこの解答 4.5 に記述するので,以下を参照して
ほしい.
(a)
まず,ベイジアンゲームにおけるプレイヤーの戦略は,「プレイヤーの各タイプ」と「そのタイプ
が実現した時にとる具体的な行動計画」を対応させる関数であることに留意する.t (= t1 , t2 ) を
送り手のタイプだとする.この場合,送り手の戦略は「自分がタイプ t = t1 の時にどんな行動をと
るか」と「タイプ t = t2 の時にどんな行動をとるか」という,2 つのタイプと行動の対応の組から
なる.一方で受け手の戦略は,
「左側の情報集合(uL と表すことにする)でどのような行動をとる
か」と「右側の情報集合(uR と表すことにする)でどのような行動をとるか」という,2 つの情報
集合とそこにおける行動の対応の組からなる.すなわち,このゲームにおいては,戦略の組は以下
のように表記される.
((m1 , m2 ), (rL , rR ))
ここで,mk はタイプが tk (k = 1, 2) の送り手の行動,rL は uL における受け手の行動,rR は uR
における受け手の行動を表している.なお,受け手の信念については,受け手は uL において上
側の意思決定点が到達されている確率を p,下側の意思決定点が到達されている確率を 1 − p と
評価しているとする.これは言い換えれば,ゲームが左側の情報集合 uL に到達したことを受け
手が認識した時,受け手は送り手のタイプが t1 である確率を p,送り手のタイプが t2 である確
率を 1 − p であると見積もっていることを意味する.すなわち,p = Prob(t = t1 |uL ) であり,
1 − p = Prob(t = t2 |uL ) である.一方,uR にゲームが到達したことを受け手が認識した時,受け
手は送り手のタイプが t1 である確率を q ,送り手のタイプが t2 である確率を 1 − q であると見積
もっているとする.つまり,q = Prob(t = t1 |uR ) であり,1 − q = Prob(t = t2 |uR ) である.そし
て,完全ベイジアン均衡においては,(その信念が付随する情報集合が均衡経路上にあろうとなか
ろうと)各プレイヤーに均衡における戦略から単独で逸脱する誘因がないように信念が構築されて
いなければならない*1 .以下では,送り手の戦略について 4 通りの場合分けを行い,それを含む戦
略の組が均衡となりうるかどうかを一つずつ確かめていく.
(Case1) 一括均衡 (m1 , m2 ) = (L, L)
送り手が (m1 , m2 ) = (L, L) をとる時,送り手はどちらのタイプの場合でも L を選択するので,受
*1
Nash 均衡における戦略の最適性による.また,信念に対するこの制約は,本書 4.1 節の条件 4(p180)と対応して
いる.
1
経済学のためのゲーム理論入門
第 4 章 不完備情報の動学ゲーム
け手の信念 p については,
p = P rob(t = t1 |uL ) = P rob(t = t1 ) =
となっている.この信念 p =
1
2
1
2
のもとでは,左側の情報集合 uL において,u をとることによる受
け手の期待利得は,
p · 2 + (1 − p) · 0 = 1
d をとることによる受け手の期待利得は,
p · 0 + (1 − p) · 1 =
1
2
なので,両者を比べれば,uL において,u をとるのが受け手にとって最適になっていることがわか
る.この受け手の行動を踏まえた時,タイプ t2 の送り手については利得 0 が実現する一方,L か
ら R に戦略を変更することにより,確実に(確率 1 で)最低でも 1 の利得を得ることができるの
で,単独で戦略を変更する誘因が生じてしまう.よって,送り手の戦略 (m1 , m2 ) = (L, L) を含む
ような完全ベイジアン均衡の戦略の組は存在しない.
(Case2) 一括均衡 (m1 , m2 ) = (R, R)
送り手はどちらのタイプの場合でも R を選択するので,受け手の信念 q については,q =
1
2
となっ
ている.この信念の下では,右側の情報集合 uR において,u をとることによる受け手の期待利
得が 12 ,d をとることによる期待利得が 1 となっているので,uR においては,d をとるのが受け
手にとっては最適になっている.この受け手の行動を所与とした場合,タイプ t1 の送り手につい
ては利得 3 が実現するので,明らかに単独で戦略を R から L に変更する誘因は存在しない*2 .一
方,タイプ t2 の送り手についてはこの時利得 2 が実現しているが,受け手が左側の情報集合 uL
で d をとった場合には利得 3 が実現するため,戦略を R から L に変更することにより厳密に利
得を向上させることができ,単独で自らの戦略を変更する誘因が生じてしまう.以上の議論から,
信念 p を下にした時に,左側の情報集合 uL における受け手の最適戦略が u となっていることが,
(m1 , m2 ) = (R, R) を含む戦略の組が均衡となっているための必要条件であることがわかる.以下
では,受け手の uL における最適な行動が u となるための,p についての条件を考える.
信念 p を所与とした場合,uL で u をとった時の受け手の期待利得は 2p,d をとった時の受け手の
期待利得は 1 − p となっていることから,受け手にとって u が最適になっているための必要十分条
件は,2p ≥ 1 − p ⇔ p ≥
1
3
であることがわかる.つまり,p ≥
1
3
となっていれば,uL においては,
受け手にとって u を選択するのが最適になっており,そしてこの時タイプ t2 の送り手は,単独で
自らの戦略を R から L に変更する誘因を持たないことがわかる.
従って以上の議論から,送り手の戦略 (m1 , m2 ) = (R, R) について,これと整合的に構築された信
*2
タイプ t1 の送り手が L を選択しても,利得は 1 か 2 にしかならず,3 を下回る.
2
経済学のためのゲーム理論入門
念体系 p ≥ 13 ,q =
1
2
第 4 章 不完備情報の動学ゲーム
の下で*3 ,戦略 (rL , rR ) = (u, d) は受け手にとって最適であり,また受け手
のこの戦略を所与とした場合,送り手も戦略を単独で (m1 , m2 ) = (R, R) から変更する誘因を持た
ない.よって,戦略と信念の組
1
1
((m1 , m2 ), (rL , rR ), p, q) = ((R, R), (u, d), p′ , ) (ただし,p′ ≥ )
2
3
は,完全ベイジアン均衡となっていることがわかる.
(Case3) 分離均衡 (m1 , m2 ) = (L, R)
(m1 , m2 ) = (L, R) のもとで,受け手の信念が整合的となるための条件は p = 1, q = 0 である*4 .
この信念のもとで,受け手の最適な戦略は (rL , rR ) = (u, d) となることが確認できる.ところ
が,この受け手の行動を所与とした場合,タイプ t1 の送り手は L から R に自分の戦略を変更す
ることで,自らの利得を 1 から 3 に改善できるので,単独で戦略を変更する誘因を持つ.従って,
(m1 , m2 ) = (L, R) を含むような完全ベイジアン均衡は存在しない.
(Case4) 分離均衡 (m1 , m2 ) = (R, L)
(m1 , m2 ) = (R, L) のもとで,受け手の信念が整合的であるための条件は p = 0, q = 1.この信念
のもとで,受け手の最適な戦略は (rL , rR ) = (d, u) となっている.ところが,この受け手の行動を
所与とした場合,タイプ t1 の送り手は R から L に自分の戦略を変更することで,自らの利得を 0
から 2 に改善できるので,単独で戦略を変更する誘因を持つ.従って,(m1 , m2 ) = (R, L) を含む
ような完全ベイジアン均衡は存在しない.
以上から,このゲームにおける純粋戦略の完全ベイジアン均衡は
1
1
((m1 , m2 ), (rL , rR ), p, q) = ((R, R), (u, d), p′ , ) (ただし,p′ ≥ )
2
3
の 1 つのみであることがわかる.
(b)
このゲームにおける戦略の組は,((m1 , m2 , m3 ), (rL , rR )) で表すことができる.ここで,mk はタ
イプ tk (k = 1, 2, 3) の送り手が選択する行動,rL は左側の情報集合(uL )における受け手の行動,
rR は右側の情報集合(uR )における受け手の行動を表す.また,受け手の信念については,信念
*3
信念がタイプの共有事前分布,およびプレイヤーの戦略からベイズの公式を用いて正確に計算されているならば,そ
の信念は「整合的である」という.完全ベイジアン均衡においては,均衡における全ての信念は整合的である必要が
ある.今の場合,uL は均衡経路外の情報集合における信念であるために,p の値はベイズの公式を用いて計算する
ことができないが,それゆえ p は定義から「整合的」であることに注意されたい.
*4 (m1 , m2 ) = (L, R) ならば,uL では確実に(確率 1 で)上側の意志決定点が到達されていて,uR では確実に(確
率 1 で)下側の意思決定点が到達されていることがわかるため.
3
経済学のためのゲーム理論入門
第 4 章 不完備情報の動学ゲーム
を p = (p1 , p2 , p3 ), q = (q1 , q2 , q3 ) とし,左側の情報集合にゲームが到達されたことを認識した際,
受け手は,送り手がタイプ tk である確率を pk と評価しているとする(ただし,p1 + p2 + p3 = 1)
.
つまり,pk = Prob(t = tk |uL ) である.同様に,受け手が右側の情報集合にゲームが到達したこ
とを認識した際,受け手は,送り手がタイプ tk である確率を qk と評価しているとする(ただし,
q1 + q2 + q3 = 1).つまり,qk = Prob(t = tk |uR ) である.
まずここでは,左側の情報集合 uL における受け手の行動について考えてみる.受け手にとって
は,uL のどの意志決定点にゲームが到達されていようと,u を選択するのが最適である*5 .つま
り,左側の情報集合にゲームが到達された場合,受け手は常に u をとるのが最適だということであ
る.この受け手の行動を所与とした時,タイプが t1 の送り手については,L を選択した場合に必
ず(確率 1 で)利得 1 を実現できるのがわかる.ところが,R を選択した場合には必ず利得は 0 に
なるので,タイプが t1 の送り手にとっては L を選択するのが常に最適であることがわかる.同様
に,タイプが t2 の送り手についても,L を選択した場合に必ず利得 2 を実現できるのがわかるの
に対し,R を選択した場合は利得は必ず 1(< 2) にしかならないので,L を選択するのが常に最適
であることがわかる.以上の議論から,もしこのゲームに純粋戦略の完全ベイジアン均衡が存在す
るならば,均衡における戦略の組は,
((m1 .m2 , m3 ), (rL , rR )) = ((L, L, ·), (u, ·))
という形をしていなければならない(つまり,均衡における戦略について,m1 = R,m2 = R,
rL = d となっていることはあり得ない).よって,以下ではタイプが t3 の送り手の純粋戦略につ
いて 2 通りの場合分けを行い,それを含む戦略の組が完全ベイジアン均衡となりうるかどうかを一
つずつ確認していく.
(Case1) 一括均衡 (m1 .m2 , m3 ) = (L, L, L)
全てのタイプの送り手が L を選択するので,信念 p について,それが整合的であるためには,
p = ( 13 , 13 , 13 ) となっていなければならない.ここで,タイプ t3 の送り手が L を選択した場合,受
け手は必ず u を選択するので*6 ,タイプ t3 の送り手は利得 1 を得る.しかしながら,もし右側の
情報集合で受け手が d をとる場合,送り手の利得は 2 となるから,タイプ t3 の送り手は戦略を単
独で L から R に変更する誘因が生じてしまう.よって,uR において,u をとるのが受け手にとっ
て最適になっていることが,(m1 , m2 , m3 ) = (L, L, L) を含む戦略の組が完全ベイジアン均衡と
なっているための必要条件であることがわかる.以下では,uR において u をとるのが受け手につ
いて最適になるための条件を考える.受け手の信念 q を所与とした場合,uR において,u を選択
した時の受け手の期待利得は,
1 · q1 + 1 · q2 + 0 · q3 = q1 + q2 = 1 − q3
*5
*6
つまり受け手にとって,左側の情報集合においては,u が支配戦略となっている.
受け手にとって,uL においては u が支配戦略になっていることから.
4
経済学のためのゲーム理論入門
第 4 章 不完備情報の動学ゲーム
である.一方で,d を選択した時の期待利得は,
0 · q1 + 0 · q2 + 1 · q3 = q3
なので,uR において送り手が u を選択するのが最適になっているための必要十分条件は,
1 − q3 ≥ q3 ⇔ q3 ≤
1
2
であることがわかる.つまり,q3 ≤
1
2
となっていれば,送り手にとっては
uR において u を選択することが最適となっていて,その場合タイプ t3 の送り手は,単独で戦略を
L から R に変更する誘因を持たない.従って,戦略と信念の組
e1 = ((m1 , m2 , m3 ), (rL , rR ), p, q) = ((L, L, L), (u, u), p∗ , q ∗ ) ここで,
1 1 1
p∗ = (p1 , p2 , p3 ) = ( , , )
3 3 3
q ∗ = (q1 , q2 , q3 ) (ただし,q3 ≤
1
)
2
は,完全ベイジアン均衡となっている.
(Case2) 分離均衡 (m1 .m2 , m3 ) = (L, L, R)
送り手の戦略 (m1 .m2 , m3 ) = (L, L, R) を所与とした場合,受け手の信念について,それが整合的
となるためには,p = ( 12 , 12 , 0),q = (0, 0, 1) となっていなければならない*7 .uL における受け手
の最適な行動は常に u なので,ここでは次に uR における受け手の行動を考える.uR において,
q = (0, 0, 1) という信念の下では,u を選択する時の受け手の期待利得は,
1 · q1 + 1 · q2 + 0 · q3 = 0
d を選択する時の受け手の期待利得は
0 · q1 + 0 · q2 + 1 · q3 = 1
だから,uR においては,d をとるのが受け手にとって最適である.この時,タイプ t3 の送り手は
利得 2 を得るが,この時 R から L に戦略で変更しても最大で 1 しか利得を得られないので,明ら
かにタイプ t3 について,単独で戦略を変更する誘因は存在しない.従って,
e2 = ((m1 , m2 , m3 ), (rL , rR ), p, q) = ((L, L, R), (u, d), p∗∗ , q ∗∗ )
ここで,
1 1
p∗∗ = (p1 , p2 , p3 ) = ( , , 0)
2 2
q ∗∗ = (q1 , q2 , q3 ) = (0, 0, 1)
は,完全ベイジアン均衡となっている.
以上まとめると,このゲームにおける完全ベイジアン均衡は,上記 e1 ,e2 の 2 つである.
*7
1/3
送り手のタイプの共有事前分布とベイズの公式から,p1 = p2 = 1/3 +1/3 = 12 と計算できる.
5