経済学のためのゲーム理論入門 第 3 章 不完備情報の静学ゲーム 3.4 ゲーム 1 が選択される確率は 1 2 であり,同様にゲーム 2 が選択される確率も 1 2 である*1 .この ゲームの場合,プレイヤー 1 の戦略は 2 つの要素から構成される.それはゲーム 1 における行動 と,ゲーム 2 における行動の 2 つである.一方でプレイヤー 2 はゲーム 1 と 2 のどちらがプレイ されるかを知らないため,戦略は 1 つの要素(L をとるか,R をとるか)のみによって構成され る*2 . 以降,戦略の組を ((a11 , a21 ), a2 ) で表す.ここで,a11 はゲーム 1 におけるプレイヤー 1 の行動,a21 はゲーム 2 におけるプレイヤー 1 の行動,a2 はプレイヤー 2 の行動を表す. 次に,ベイジアン・ナッシュ均衡の存在を確かめていく.プレイヤー 1 の戦略 (a11 , a21 ) の種類に よって場合分けして,Nash 均衡をしらみつぶしに見つけていくが,その際プレイヤー 2 はゲーム 1 がプレイされる確率とゲーム 2 がプレイされる確率をそれぞれ 1 2 であると常に見積もること,そ して,均衡ではプレイヤー同士が互いの戦略に対して常に最適に反応していることに留意する. ここで,「最適に反応している」ということがどういうことなのかが以下の解答を通して重要にな るので,準備として「最適反応」の概念について触れておく. ゲームを ⟨I, Si , ui ⟩(i ∈ I) と定式化する.この時, (定義 1) 「プレイヤー i の戦略 s∗i ∈ Si が,他のプレイヤーの戦略の組 s−i ∈ S−i に対する最適反応である」 とは, ∀si ∈ Si , ui (s∗i , s−i ) ≥ ui (si , s−i ) ということを意味する. *1 不完備情報ゲームにおいては,各プレイヤーのタイプや,タイプが従う共有事前分布と,そこから導かれるプレイ ヤーの信念が重要になる.この問題では,何が「タイプ」なのか一見すると明らかではないが,以下のように考える とよいだろう.プレイヤー 1,2 のタイプはそれぞれ 2 種類存在する.すなわち,ゲーム 1 におけるような利得構造 を持つタイプと,ゲーム 2 におけるような利得構造を持つタイプである.プレイヤー 1 のみ,自分のタイプと相手 のタイプを両方把握してから意思決定を行うが,プレイヤー 2 は自分のタイプも相手のタイプも知らない状態で意思 決定を行う. *2 静学ゲームではあるものの,このゲームは情報集合を用いた展開型表現(本書第 4 章を参照)によって表すこともで きる.付属のファイルにこのゲームの展開型表現を示した.各プレイヤーの戦略の構成要素は,そのプレイヤーが 持っている情報集合の数だけあるが,これは各情報集合に 1 つの行動の選択肢を割り当てる「行動戦略」の考え方と も共通している.詳しくは,岡田「ゲーム理論」 (有斐閣) ,pp67-70 を参照のこと. 1 経済学のためのゲーム理論入門 第 3 章 不完備情報の静学ゲーム (定義 2) プレイヤー i の,他のプレイヤーの戦略の組 s−i ∈ S−i に対する最適反応の集合 BRi (s−i ) は, BRi (s−i ) = {si ∈ Si | ∀s′i , ui (si , s−i ) ≥ ui (s′i , s−i )} で定義される.ここで,BRi : S−i → Si であり,BRi は S−i の各要素 s−i に対して,それに対し て最適反応となっている si の集合を対応させるものである. (定義 3)「戦略の組 s∗ ∈ S が Nash 均衡である」ことの必要十分条件は, ∀i ∈ I, s∗i ∈ BRi (s∗−i ) 以下では, 「最適な戦略」や「最適な行動」という表現が繰り返し登場するが,その都度「最適な行 動,戦略」が,(期待利得をも考慮した広い意味で)上で定義した最適反応な戦略の集合に含まれ ることを確認されたい*3 . (Case1) (a11 , a21 ) = (T, T ) の場合 プレイヤー 2 の L をとることによる期待利得が 得は 0.よって,(a11 , a21 ) 1 2 であるのに対して,R をとることによる期待利 = (T, T ) というプレイヤー 1 の戦略の下では,プレイヤー 2 は L で反 応するのが最適である.次に,このプレイヤー 2 の反応をもとにした時に,プレイヤー 1 の戦略 (a11 , a21 ) = (T, T ) が最適な反応になっているかどうかを確かめる.これは容易に確かめられて,プ レイヤー 2 が両方のゲームで確実に(確率 1)で L をとることが分かっている場合,ゲーム 1 で もゲーム 2 でも T をとるようなプレイヤー 1 の戦略は,最適反応な戦略の集合に含まれている*4 . ゆえに,戦略の組 ((a11 , a21 ), a2 ) = ((T, T ), L) は,ベイジアン・ナッシュ均衡としてふさわしい. (Case2) (a11 , a21 ) = (B, B) の場合 プレイヤー 2 の L をとることによる期待利得は 0,R をとることによる期待利得は 1 なので,R を とるのが最適.プレイヤー 2 の戦略 R に対して,(a11 , a21 ) = (B, B) は最適反応な戦略の集合に含 まれていることが確認できるので*5 ,((a11 , a21 ), a2 ) = ((B, B), R) はベイジアン・ナッシュ均衡で ある. (Case3)(a11 , a21 ) = (T, B) の場合 プレイヤー 2 の L をとることによる期待利得は 21 ,R をとることによる期待利得は 1 なので,R をとるのが最適.プレイヤー 2 の戦略 R に対して,(a11 , a21 ) = (T, B) は最適反応な戦略の集合に *3 最適反応に関する詳しい議論については,グレーヴァ「非協力ゲーム理論」 (知泉書館) ,pp31-36 を参照のこと ここで,プレイヤー 2 が L をとる場合,プレイヤー 1 の最適な戦略の集合は,(a11 , a21 ) = {(T, T ), (T, B)} である. *5 プレイヤー 2 が R をとる場合,プレイヤー 1 の最適な戦略の集合は (a1 , a2 ) = {(B, B), (T, B)} である. 1 1 *4 2 経済学のためのゲーム理論入門 第 3 章 不完備情報の静学ゲーム 含まれていることが確認できるので,((a11 , a21 ), a2 ) = ((T, B), R) はベイジアン・ナッシュ均衡で ある. (Case4)(a11 , a21 ) = (B, T ) の場合 プレイヤー 2 について,L をとろうが R とろうが期待利得は 0 なので,L も R も最適な戦略の集 合に含まれる.ところが,L を所与とした場合のプレイヤー 1 の最適な戦略の集合にも,R を所与 とした場合のプレイヤー 1 の最適な戦略の集合にも,(a11 , a21 ) = (B, T ) は含まれていない.よっ て,(a11 , a21 ) = (B, T ) を含むようなベイジアン・ナッシュ均衡は存在しないことがわかる. 以上まとめて,ベイジアン・ナッシュ均衡は以下の 3 つ. ((a11 , a21 ), a2 ) = ((T, T ), L), ((B, B), R), ((T, B), R) 参考までに,このゲームの展開表現を図(別ファイル参照)に表す.終点の下に付してある数字に ついて,上の段がプレイヤー 1 の利得,下の段がプレイヤー 2 の利得である. 状態 T k (k = 1, 2) においては,両プレイヤーともゲーム k のような利得構造を持つタイプであり, T 1 と T 2 の両方について,自然 N によって選択される確率はそれぞれ 1 2 である.また,uim でプ レイヤー i の m 番目の情報集合を表す. 一般に,不完備情報のゲームにおいては,タイプ空間から行動空間への関数(Si : Ti → Ai )という 形で特定化されたものがプレイヤーの戦略になる.つまり,「プレイヤー i の戦略を決める」とは, タイプ空間 Ti の各要素と行動空間 Ai の各要素を対応させる関数 Si を一意に特定すること(Ti の 各要素と Ai の各要素の対応ルール Si を 1 つに決定すること)である. 以上のことを踏まえると, ((a11 , a21 ), a2 ) = ((s1 (t11 ), s2 (t21 ), s2 ) で戦略の組が表されることが分かる*6 .ここで,tki はゲーム k におけるプレイヤー i(i = 1, 2) の タイプを表す(但し,k = 1, 2) . *6 プレイヤー 2 は自分のタイプを知らずに意思決定を行うため,戦略空間 S2 はタイプ空間から行動空間への関数とい う形で特定化されるのではなく,行動空間 A2 と一致すると考えてよい.そのため,このゲームの戦略における表 記においては,a2 = s2 としてある.また,ここでの戦略の組の定義の方法が,本解答の最初に提案した戦略の組 ((a11 , a21 ), a2 ) の定義の仕方と整合的であることを確認されたい, 3
© Copyright 2024 ExpyDoc