ゲーム理論 (上級 I)/ゲーム理論特論 I（2015 年度）教授清水大昌第 3 回 2015 年 10 月 12 日 [email protected] http://www-cc.gakushuin.ac.jp/˜20060015/lecture/game2015.html 問題（再掲） • (2) ナッシュ均衡が偶数個あるゲームを提示してください。なお、無限個は偶数でも奇数でもありません。逐次手番ゲーム • 今までは各プレーヤーが同時に行動するゲームを考えていた。それに対して時間や行動する順番が重要なゲームも考えられる。それを逐次手番ゲームという。 • ゲームの定義の際、プレーヤー、戦略、利得のほかにゲームの構造、もしくは手番情報が必要となる。 • ゲームの木としての表記が一般的。展開型ゲームと呼ぶ。ゲームの木の各点をノードと呼ぶ。ゲームの局面というイメージ。誰がどのような行動を取れるかを表記する。 • 情報集合：同時手番の状況のように、相手の状況が良く分からない場合、プレーヤーはある情報集合の中にいる（つまり、情報集合の中にあるノードのどこかにいる）ことは分かるが、どこにいるかは分からない。よって、同じ情報集合内のノードではプレーヤーと戦略は同様である。 • 全ての情報集合の非空要素が単一の場合（つまり、上記の不明な点がない場合）、このゲームを完全情報ゲームと呼ぶ。将棋、チェス、囲碁、オセロ、チェッカー、連珠など。そうでないゲームを不完全情報ゲームと呼ぶ。同時手番ゲームは不完全情報ゲームである。 • つまり、同時手番ゲームではプレーヤーは同時に行動する必要はない。自分が戦略を決める際、相手の行動が見えなければ良いのである。 • 偶然手番、または自然: プレーヤーの意志ではなく、確率によってゲームが進むことを描写する。例えばトランプで配ったカードやサイコロを振る行為を描写する際必要となる。サブゲーム完全均衡 • 逐次手番ゲームでの一般的な均衡概念はサブゲーム完全均衡である。 • ある単一ノードから見たゲームのことをサブゲームもしくは部分ゲームと呼ぶ。複数の要素がある情報集合に属するノードから始まるゲームは、その部分で分析が閉じないのでサブゲームとは言えない。逆に全体ゲームはサブゲームでもある。 • サブゲーム完全均衡では、全てのサブゲームにおいてナッシュ均衡が成立している。つまり、ゲームがどのような展開になっても各プレーヤーは合理的に行動している。 1 • 逐次手番ゲームでナッシュ均衡ではあるがサブゲーム完全均衡ではない例として、参入ゲームの空脅しの状況があげられる。 • サブゲーム完全均衡を求める方法として、ゲームを一番最後のサブゲームから逆に解いていく、バックワードインダクション (後方帰納法) の考え方がある。 • ツェルメロ (Zermelo) の定理: 各プレーヤーが交互に行動し、偶然手番が存在しないような全ての 2 人、有限、完全情報ゲームでは、必ず先手か後手に必勝法がある、もしくは引き分けに持ち込める戦略が存在する。 • バックワードインダクションで解けるような気がしますよね。 • 実際には局面が膨大にあり実用的ではないが、存在証明ではある。 • 三目並べ (○× ) は引き分け。五目並べで禁手がない場合は先手必勝である。 • どうぶつしょうぎは 78 手で後手の勝ち。(解析済み）禁手を入れた、いわゆる連珠も先手必勝のようだが、解析は出来ていない。 6 × 6 のオセロはお互い最適に行動するとコンピュータにより 16 対 20 により後手の勝ちとなることが解析されている。8 × 8 の普通のオセロでも後手が有利だが 32 対 32 になるか 31 対 33 になるかと言われている。チェッカーは 2007 年に解明され、引き分けとなるようだ。5,000,000,000,000,000,000,000 通りの局面があるらしいです。もちろん、チェス、将棋、囲碁の順番で局面数は増えていきます。 • 動学的非整合性について。逐次手番ゲームの問題点 • 完全記憶の仮定：プレーヤーは過去の行動と整合的に行動するか？未来の合理性を仮定して今の行動を決めることは合理的か？ • むかでゲーム：(1,0) (0,3) (3,2) (2,5) (5,4) (4,7) での均衡は？最後が (6,7) では？ • (梶井・松井より): 一人の君主とその座を狙う n 人の大臣がいる。大臣たちは、1 から n まで序列があり、君主を暗殺することが可能なのは、大臣 1 のみである。大臣 1 が君主を暗殺すると自ら君主となるが、今度は次の大臣である大臣 2 にその地位を狙われることとなる。一般に君主となった (元) 大臣 k (k = 1, · · · , n − 1) を暗殺できるのは、大臣 k + 1 のみである。(君主となる前の大臣を暗殺することはできず、また君主暗殺計画は上記の範囲で必ず成功するとする。) それぞれの大臣にとっては、自分が君主となって、そのまま暗殺されないことが最も望ましく、ついで大臣のままでいることがよく、自分が君主になって暗殺されるのが最悪である。このとき、n = 2 でのサブゲーム完全均衡を求めよ。 n = 3 では？一般の n では？ • このように、逐次手番ゲームの妥当性には議論の余地がある。 2 ベルトラン均衡 • ここから企業間競争を考えていこう。ベルトラン均衡はナッシュ均衡の一つで、企業の戦略が価格設定になっている状況。 • 消費者は安い財から購入する。同価格ならある割合 (半々とか) で購入する。 • 企業数と企業の限界費用分布によって均衡は変わっていく。 • 一番強い企業が二番目に強い企業の限界費用で価格付けするのがナッシュ均衡の結果として出てくる。この結果はセカンドプライスオークションの結果と非常に似ている。 • もし固定費用が存在したら？限界費用が一定ではなく増加凸関数であれば？純粋戦略均衡が存在しなくなる場合もある。これを Bertrand-Edgeworth paradox という。クールノー均衡 • クールノー均衡はナッシュ均衡で戦略が数量競争のものを表す。企業が市場に生産物を運び、総数量から価格が逆算され、企業は利潤を得られる。企業は数量を動かして、相手の数量を所与として自社の利潤を最大にする。 • クールノー · ナッシュ均衡の性質 – 自社の均衡数量と均衡利潤は市場規模、他社の限界費用の増加関数；自社の限界費用、企業数の減少関数。 – 価格は市場規模、限界費用の増加関数；企業数の減少関数。 – 限界費用が低い企業の方が、数量が高くなる。 Π1 Π2 ∂Π1 q1 ∂Π2 q2 = p(q) · q1 − c1 (q1 ) p(q) · q2 − c2 (q2 ) ∂p(q) = · q1 + p(q) − M C1 (q1 ) = 0 q1 ∂p(q) = · q2 + p(q) − M C2 (q2 ) = 0 q2 =⇒ M C1 < M C2 ⇐⇒ q1 > q2 = – 企業数を無限に飛ばすと完全競争に近づく。（クールノーの極限定理）企業数が１なら独占と一致する。 – 独占や共同利潤最大化の状況より、市場総生産量は増えている。競争によりというイメージ。経済学的には、自らの数量増大が価格に与えその後相手の利潤に与える影響（負の外部性）を考慮せず（内部化せず）に利潤最大化をしているからという解釈 (Business-stealing eﬀect: 客奪取効果)。共同利潤最大化のことをイメージすると分かりやすい。 • 「せり人」は非現実的？ 3 • 次のゲームの解はクールノー均衡の解と一致する。(Kreps and Scheinkman (1983)) 第１期に各企業は生産規模を決める。第２期に価格競争を行う。 • あまり生産規模を多くしてしまうと第２期での価格競争が激しくなり、利潤は０になる。それを防ぐため、企業は第１期に生産規模を抑えておく。どこに設定するかと言うと、クールノーと一致することになる。 • 数量にコミット出来れば数量競争、つまり数量より価格の変化が容易な場合には数量競争になる。現実はこちらの方が多いと思われる。(Friedman (1988)) シュタッケルベルグ均衡 • 企業が逐次的に戦略変数を決める。まず数量競争を扱う。 • 逐次手番ということは、最初に動く企業 (企業 1) は自分の生産量にコミットできることを仮定しているわけである。 • バックワードインダクションを使ってサブゲーム完全均衡を求める。その際最適反応関数を用いる。 • 限界費用が 0 の場合、企業ごとに生産量は半々になっていくことが分かる。 • 企業１にとって、シュタッケルベルグ均衡のリーダー利潤の方がクールノー均衡利潤より高く、企業２にとってはクールノーよりシュタッケルベルグ均衡のフォロアー利潤は低い。 • 生産量も同様。 • (差別化された) 価格競争では、フォロアー ≥ リーダー ≥ ベルトランとなる。 • どちらにせよ、リーダー ≥ ナッシュとはなる。戦略的代替性、戦略的補完性 • 戦略的代替 (strategic substitutes): 反応関数の傾きが右下がり。戦略的補完 (strategic complements): 反応関数の傾きが右上がり。 • 反応関数は、一階の条件の式で、傾きは交差微分で表される。当然負の場合は右下がり。正は右上がりである。 F N • クールノー均衡は一般的には戦略的代替。この場合には xL1 > xN 1 , x2 > x2 となる。利潤も同様になるため、リーダーが得をする場合が多い。これを First mover advantage という。 N F • クールノー均衡でも特殊ケースで戦略的補完となりえる。この場合には xL1 < xN 1 , x2 < x2 F となる。またその場合には一般的に xL 1 < x2 となる。これを Second mover advantage という。 • 差別化されたベルトラン均衡は戦略的補完。Second mover advantage になりますね。 4