解答例(1) 先週の問題 2 1 A B a (0,0) b (3,1) a b C (1,0) (2,1) (2,2) • ナッシュ均衡 解答例(2) – 戦略の組 A、b プレイヤー2 1.戦略系で表現 2.ナッシュ均衡を求める C、a • このゲームのサブゲームは、ゲーム全体 – どちらの均衡もサブゲーム完全均衡 – 均衡(C、a)はから脅しが成功 – → おかしな均衡 – → 後で クールノー・モデル プレイヤー1 a b A 0,0 3,1 B 1,0 2,1 C 2,2 2,2 ベイジアン・ゲーム • 相手の正体が不明の場合 – どのようにモデル化するか? • ベイジアン・ゲーム – Harsanyiの理論 – 利得構造が異なれば、違うプレイヤーと考える – タイプの違いは、期待値をもって対応 • プレイヤーのタイプ – 利得関数が異なる – 戦略、手番などは同じ 完備情報ゲーム • ベイジアン・ゲーム • 利得(利潤) 1 Px1 C1 (3 x1 x2 ) x1 • クールノー複占(完備情報) • 最適反応 1 2 3 2 x1 x2 0, 3 x1 2 x2 0 x1 x2 • ナッシュ均衡 x1 1, x2 1 – タイプを導入 不完備情報ゲーム → 不完全情報ゲーム – – 市場需要 P 5 ( x1 x2 ) – 費用関数 C1 2 x1 , C2 2 x2 2 Px2 C2 (3 x1 x2 ) x2 1 ナッシュ均衡 ベイジアン・ゲーム • クールノー複占のベイジアン・ゲーム x2 x1 高コストタイプの戦略 – 限界費用の大きさで、戦略(供給量)が変化する ので、限界費用が異なれば、違うプレイヤーと考 える – 企業1の費用は 2x1 – 企業2の費用は – 50%の確率で CH=3xH (高コストタイプ) – 50%の確率で CL=xL (低コストタイプ) 低コストタイプの戦略 • 利得(利潤) • 利得(利潤) • 最適反応 • 最適反応 H Px H CH ( 2 x1 xH ) xH H 2 x1 2 xH 0 xH 企業1の戦略 • 企業1は相手の費用がわからないので、期待利得 (利潤)を最大化 • 高コストタイプが相手のとき 1H Px1 C1 (3 x1 xH ) x1 • 低コストタイプが相手のとき 1L Px1 C1 (3 x1 xL ) x1 • 期待利得 1 1 x xL 1 1H 1L 3 x1 H x1 2 2 2 L Px L CL ( 4 x1 xL ) xL L 4 x1 2 xL 0 xL ベイジアン・ナッシュ均衡(1) • 期待利潤の最大化 1 x xL 3 2 x1 H 0 x1 2 • ベイジアン・ナッシュ均衡 – ベイジアンゲームの均衡 – すべてのタイプが最適反応、すべてのタイプにわたって、 期待利得の最大化 x1 1, x H 1 3 , xL 2 2 2 ベイジアン・ナッシュ均衡(2) x2 x1 ブランコをめぐる駆け引き • 太郎と次郎がブランコを取り合う – 一方がブランコに残り、もう一方がブランコをあき らめる場合、残ったほうの利得は1、あきらめたほ うの利得は-1 – 2人ともブランコに残った場合喧嘩になり、勝った ほうがブランコ。勝った方の利得は1、負けた方 の利得は-2 – 2人ともブランコをあきらめた場合利得はゼロ 情報の不完備性 強い次郎とのゲーム • 太郎の喧嘩の強さは、次郎は知っている。 • 次郎の喧嘩の強さは、太郎にはわからない 強い次郎 – 太郎は喧嘩しても勝つか負けるかはわからない。 – 次郎は喧嘩に勝つか負けるかがわかる • ベイジアンゲーム – 喧嘩の強い次郎 確率 p – 喧嘩の弱い次郎 確率 1-p – どちらかの次郎とのゲーム ブランコ 他の遊び ブランコ -2、1 1、-1 他の遊び -1、1 0、0 太郎 弱い次郎とのゲーム 展開形 強い次郎 残る 残る 弱い次郎 去る 強い p ブランコ 太郎 他の遊び 1、-2 -1、1 (0、0) 1、-1 0、0 (-1、1) 去る 他の遊び 自然 ブランコ (-2、1) (1、-1) 太郎 (1、-2) 弱い次郎 弱い 1-p (1、-1) 残る 残る (-1、1) (0、0) 去る 去る 3 弱い次郎の最適戦略(1) 強い次郎の最適戦略 • 強い次郎は喧嘩に勝てる – 太郎が残ろうが、去ろうが、ブランコに残るほうが よい – フランコに残ることが支配戦略 • 弱い次郎には、支配戦略がない – 弱い次郎は喧嘩に勝てない – 太郎が残れば、去ったほうがよい – 太郎が去れば、残ったほうがよい • 混合戦略 – 弱い次郎がブランコに残る確率 a – 太郎がブランコに残る確率 b 弱い次郎の最適戦略(2) 弱い次郎の反応関数 • 弱い次郎の期待利得 b EU j ab ( 2) (1 a )b ( 1) a (1 b) 1 (1 a )(1 b) 0 1 2ab a b (1 2b)a b – 期待利得はaの1次関数 – → 傾きが正ならa=1、傾きが負ならa=0のとき最大 • 最適反応戦略 1 2 1 b 1, 2 1 a [0,1], b 2 1 0 , b 2 O 太郎の最適戦略(1) 太郎の最適戦略(2) • 太郎の期待利得 – 次郎が強いか弱いか不明なので混合戦略 – 期待利得=p×次郎が強い場合の利得 +(1-p)×次郎が弱い場合の利得 – 強い次郎 EU t pb ( 2) (1 b) ( 1) (1 p )ab 1 (1 a )b 1 a (1 b) ( 1) (1 a )(1 b) 0 (1 3 p )b p (1 p )a(1 b) 1 2 p (1 p )ab p (1 p )a a 1 弱い次郎 ブランコ 他の遊 び ブランコ 他の遊び ブラ ンコ -2、1 1、-1 1、-2 1、-1 他の 遊び -1、1 0、0 -1、1 0、0 太 郎 4 太郎の反応関数 2 p 1 a 1, 1 p 2p 1 b [0,1], a 1 p 2p 1 0 , a 1 p b 1 O 2 p 1 1 p a 1 ベイジアン・ナッシュ均衡(2) b p 1 b p 1 1 2 1 2 2 p 1 O 1 p 1 a ベイジアン・ナッシュ均衡(3) b 2 3 1 2 p 2 3 1 1 2 O ベイジアン・ナッシュ均衡(1) 1 2 1 2 p 1 1 p a O 2 p 1 1 p 1 a 今日の問題 5
© Copyright 2025 ExpyDoc