メモ欄なし小PDF

解答例(1)
先週の問題
2
1
A
B
a
(0,0)
b
(3,1)
a
b
C
(1,0)
(2,1)
(2,2)
• ナッシュ均衡
解答例(2)
– 戦略の組 A、b
プレイヤー2
1.戦略系で表現
2.ナッシュ均衡を求める
C、a
• このゲームのサブゲームは、ゲーム全体
– どちらの均衡もサブゲーム完全均衡
– 均衡(C、a)はから脅しが成功
–
→ おかしな均衡
–
→ 後で
クールノー・モデル
プレイヤー1
a
b
A
0,0
3,1
B
1,0
2,1
C
2,2
2,2
ベイジアン・ゲーム
• 相手の正体が不明の場合
– どのようにモデル化するか?
• ベイジアン・ゲーム
– Harsanyiの理論
– 利得構造が異なれば、違うプレイヤーと考える
– タイプの違いは、期待値をもって対応
• プレイヤーのタイプ
– 利得関数が異なる
– 戦略、手番などは同じ
完備情報ゲーム
• ベイジアン・ゲーム
• 利得(利潤)
 1  Px1  C1  (3  x1  x2 ) x1
• クールノー複占(完備情報)
• 最適反応
 1
 2
 3  2 x1  x2  0,
 3  x1  2 x2  0
x1
x2
• ナッシュ均衡
x1  1, x2  1
– タイプを導入
不完備情報ゲーム → 不完全情報ゲーム
–
– 市場需要
P  5  ( x1  x2 )
– 費用関数
C1  2 x1 , C2  2 x2
 2  Px2  C2  (3  x1  x2 ) x2
1
ナッシュ均衡
ベイジアン・ゲーム
• クールノー複占のベイジアン・ゲーム
x2
x1
高コストタイプの戦略
– 限界費用の大きさで、戦略(供給量)が変化する
ので、限界費用が異なれば、違うプレイヤーと考
える
– 企業1の費用は 2x1
– 企業2の費用は
– 50%の確率で CH=3xH (高コストタイプ)
– 50%の確率で CL=xL (低コストタイプ)
低コストタイプの戦略
• 利得(利潤)
• 利得(利潤)
• 最適反応
• 最適反応
 H  Px H  CH  ( 2  x1  xH ) xH
 H
 2  x1  2 xH  0
xH
企業1の戦略
• 企業1は相手の費用がわからないので、期待利得
(利潤)を最大化
• 高コストタイプが相手のとき
 1H  Px1  C1  (3  x1  xH ) x1
• 低コストタイプが相手のとき
 1L  Px1  C1  (3  x1  xL ) x1
• 期待利得
1
1
x  xL 

 1    1H   1L   3  x1  H
  x1
2
2
2 

 L  Px L  CL  ( 4  x1  xL ) xL
 L
 4  x1  2 xL  0
xL
ベイジアン・ナッシュ均衡(1)
• 期待利潤の最大化
 1
x  xL
 3  2 x1  H
0
x1
2
• ベイジアン・ナッシュ均衡
– ベイジアンゲームの均衡
– すべてのタイプが最適反応、すべてのタイプにわたって、
期待利得の最大化
x1  1, x H 
1
3
, xL 
2
2
2
ベイジアン・ナッシュ均衡(2)
x2
x1
ブランコをめぐる駆け引き
• 太郎と次郎がブランコを取り合う
– 一方がブランコに残り、もう一方がブランコをあき
らめる場合、残ったほうの利得は1、あきらめたほ
うの利得は-1
– 2人ともブランコに残った場合喧嘩になり、勝った
ほうがブランコ。勝った方の利得は1、負けた方
の利得は-2
– 2人ともブランコをあきらめた場合利得はゼロ
情報の不完備性
強い次郎とのゲーム
• 太郎の喧嘩の強さは、次郎は知っている。
• 次郎の喧嘩の強さは、太郎にはわからない
強い次郎
– 太郎は喧嘩しても勝つか負けるかはわからない。
– 次郎は喧嘩に勝つか負けるかがわかる
• ベイジアンゲーム
– 喧嘩の強い次郎 確率 p
– 喧嘩の弱い次郎 確率 1-p
– どちらかの次郎とのゲーム
ブランコ
他の遊び
ブランコ
-2、1
1、-1
他の遊び
-1、1
0、0
太郎
弱い次郎とのゲーム
展開形
強い次郎
残る
残る
弱い次郎
去る
強い p
ブランコ
太郎
他の遊び
1、-2
-1、1
(0、0)
1、-1
0、0
(-1、1)
去る
他の遊び
自然
ブランコ
(-2、1)
(1、-1)
太郎
(1、-2)
弱い次郎
弱い
1-p
(1、-1)
残る
残る
(-1、1)
(0、0)
去る
去る
3
弱い次郎の最適戦略(1)
強い次郎の最適戦略
• 強い次郎は喧嘩に勝てる
– 太郎が残ろうが、去ろうが、ブランコに残るほうが
よい
– フランコに残ることが支配戦略
• 弱い次郎には、支配戦略がない
– 弱い次郎は喧嘩に勝てない
– 太郎が残れば、去ったほうがよい
– 太郎が去れば、残ったほうがよい
• 混合戦略
– 弱い次郎がブランコに残る確率 a
– 太郎がブランコに残る確率 b
弱い次郎の最適戦略(2)
弱い次郎の反応関数
• 弱い次郎の期待利得
b
EU j  ab  ( 2)  (1  a )b  ( 1)  a (1  b)  1  (1  a )(1  b)  0
1
 2ab  a  b  (1  2b)a  b
– 期待利得はaの1次関数
–
→ 傾きが正ならa=1、傾きが負ならa=0のとき最大
• 最適反応戦略
1
2
1

b
1,
2

1

a  [0,1], b 
2

1

0
,
b


2
O
太郎の最適戦略(1)
太郎の最適戦略(2)
• 太郎の期待利得
– 次郎が強いか弱いか不明なので混合戦略
– 期待利得=p×次郎が強い場合の利得
+(1-p)×次郎が弱い場合の利得
–
強い次郎
EU t  pb  ( 2)  (1  b)  ( 1)
 (1  p )ab  1  (1  a )b  1  a (1  b)  ( 1)  (1  a )(1  b)  0
 (1  3 p )b  p  (1  p )a(1  b)
 1  2 p  (1  p )ab  p  (1  p )a
a
1
弱い次郎
ブランコ
他の遊
び
ブランコ 他の遊び
ブラ
ンコ
-2、1
1、-1
1、-2
1、-1
他の
遊び
-1、1
0、0
-1、1
0、0
太
郎
4
太郎の反応関数

2 p 1
a
1,
1 p

2p 1

b  [0,1], a 
1 p


2p 1
0
,
a


1 p

b
1
O
2 p 1
1 p
a
1
ベイジアン・ナッシュ均衡(2)
b
p
1
b
p
1
1
2
1
2
2 p 1 O
1 p
1
a
ベイジアン・ナッシュ均衡(3)
b
2
3
1
2
 p
2
3
1
1
2
O
ベイジアン・ナッシュ均衡(1)
1
2
1
2 p 1
1 p
a
O
2 p 1
1 p
1
a
今日の問題
5