10.Private Strategies
in Games with
Imperfect Public Monitoring
北木 真
1
アウトライン
Sequential Equilibrium
A Reduced-Form Example
Two-Period Examples
An Infinitely Repeated Prisoners’ Dilemma
2
公的戦略と私的戦略
行動:E(Effort),S(Shirk)
{y,y}:公的シグナル
~
^
Public strategies:σ,σ
公的シグナルによってのみ定まる
Private strategies:σ
シグナルyに続く2期の行動は,1期の行動に依存
3
Sequential Equilibrium
定義
任意の行動aに対するシグナルyの観測確率ρ(y|a)は
正であると仮定
任意の自分の履歴
に対して,
が
に対して最適反応
⇒戦略プロファイルσはsequential equilibrium
(但し,
)
4
アウトライン
Sequential Equilibrium
A Reduced-Form Example
Two-Period Examples
An Infinitely Repeated Prisoners’ Dilemma
5
A Reduced-Form Example
1期目は左,2期目は右のゲームを行う
シグナルyの観測確率ρ
a:行動,y,y:シグナル
p=9/10,q=4/5,r=1/5と仮定
2回のゲームにおける利得:(1-δ)u1+δu2
δ=25/27と仮定
6
各戦略の期待利得
Pure Strategies
1期はEE,2期ではyのときはRR,それ以外はPP
左辺の式より期待利得は1.4815
Public Correlation
1期はE,次はyの観測後はR,yの観測後は確率ΦでRを
選択
Φ=0.5かつ期待利得は1.5556
7
各戦略の期待利得
Mixed Public Strategies
1期は確率αでE,2期はyの観測後はR,yの観測後は確
率ΦでRを選択
Φ=0.567)
より,期待利得は1.5566(α=0.969,
8
各戦略の期待利得
Private Strategies
1期は確率αでEを選択
2期は1期でSが選ばれ,yを観測した後は確率ξでRを選
択,それ以外の場合は必ずRを選択
より,期待利得は1.5864(α=0.916,ξ=0)
9
アウトライン
Sequential Equilibrium
A Reduced-Form Example
Two-Period Examples
An Infinitely Repeated Prisoners’ Dilemma
10
Two-Period Examples
ただ一つのナッシュ均衡を持つゲーム
右のナッシュ均衡
プレイヤ1:r1かr2を等確率
プレイヤ2:c1かc2を等確率
公的シグナルY={y,y}のうち,
-- i j
yが観測される確率ρ(y|r c ):
11
PPEと重複しない均衡
1期の各プレイヤーの行動:
2期のプレイヤ1の行動:
2期のプレイヤ2の行動:
12
PPEと重複しない均衡
何故,1期でプレイヤ1はr3を選択?
均衡戦略がpublic
r2を選択すると,2期でプレイヤ2は確率0.1でc1,0.9で
c2を選択
プレイヤ1の期待利得は,r3の選択より減少
1期の行動は2期の行動に影響を与えないため,最適反
応から外れた戦略を取る誘因が発生しない⇒PPE
一方,プレイヤ2のprivate strategyは2期のゲー
ムにおいてcorrelated equilibriumを構成
2期においてナッシュ均衡を構成する必要はない
13
Correlationによる利得
右のゲームにおける均衡
Nash:(1,1)
Correlation:(3/2,3/2)
各シグナルy1,y2,y3の観測確率:
14
Correlationによる利得
1期は3つの行動を等確率で1つ選択
各プレイヤの2期の行動:
r4=r1,c4=c1,r0=r3,c0=c3とする
2期の戦略はcorrelated equilibirumを構成
15
複数のナッシュ均衡があるゲーム
プレイヤ1は縦,2は横,3は左か右の表から行動を
選択
プレイヤ3にとってRはLを支配
ナッシュ均衡
LRRかRLRを選択:利得(1,1,12)
プレイヤー1と2が1/3でLを選択:利得(1/3,1/3,74/9)16
さらに大きな利得を得る
シグナルY={y0,y1,y2,y3}を考える
l:1期でLを選択したプレイヤの人数
ylの観測確率は1-3ε(ym(m≠l)の観測確率はε)
各プレイヤの1期の行動:
1期では比較的LLLが選択される
17
さらに大きな利得を得る
各プレイヤの2期の行動
εが十分に小さければ,2期はほぼナッシュ均衡となる
18
さらに大きな利得を得る
プレイヤ1と2の
2期の期待利得:
プレイヤ3の2期の期待利得
1期でLを選択:高確率でy3が観測され,利得は12
Rを選択:高確率でy2が観測され,利得は0
ε→0のとき,利得は(6,6,26.22)に近づく
ナッシュ均衡による利得より大きい
19
アウトライン
Sequential Equilibrium
A Reduced-Form Example
Two-Period Examples
An Infinitely Repeated Prisoners’ Dilemma
20
Public Transitions
右の囚人のジレンマを
無限回繰り返す
2つの公的シグナルy,yの
うち,yの観測確率ρ:
ここではp>0,q=0と仮定
戦略のオートマトン表現
wR:確率αでEを選択
wP:Sを選択
各プレイヤは常に
同じ状態
21
Public Transitions
wRにおける期待利得V(wR)
Eを選択した場合:
Sを選択した場合:
wPにおける期待利得は0
wRにおける行動が無差別⇒
このとき,
各プレイヤが辛抱強い(δが1に近い)とき,αは1に近づき,
V(wR)は2に近づく
この場合,PPEによって達成可能な利得2-(1-p)/pより
大きい
22
q>0のとき
q=0のときと同じ戦略は均衡ではない
プレイヤ1の履歴Ey,(Ey)kを考える
Ey観測後,プレイヤ2が
状態wRである確率β0(q)
β0(0)=1
同様にして次の確率βk(q)
を考える:
k→∞のとき,βk(q)は0に近づく
プレイヤ1はプレイヤ2がほぼ確実にwPの状態であると
考え,Eの選択をやめる
23
Belief-free Equilibrium
右の囚人のジレンマにおける
Belief-free equilibrium
(14章で述べられる)を示す
2つの公的シグナルy,yのうち,
yの観測確率ρ:
24
Belief-free Equilibrium
戦略のオートマトン表現
wR:確率αRでE
を選択
WP:Sを選択
Vxi(ai):プレイヤjの状態がwxで,プレイヤiがai選
択をした場合のプレイヤiの利得
VRi(E)=Vri(S)≡VR,VPi(E)=Vpi(S)≡VP
25
Belief-free Equilibrium
VRについて:
VPについて:
これらの等式を解くことにより,確率βが求められる
26
Belief-free Equilibrium
βによって,次の等式が導かれる
δ=1,αR=1は等式を満たす
p=1/2,q=1/2-ε,r=ε,bは2に近い場合を考える
このとき,1に近いδ<1について,1に近いαR<1が存在
し,それは上の等式を満たす
27
© Copyright 2026 ExpyDoc