完備情報の静学ゲーム Yuta IKUBO http://ikubo.official.jp/ 最終更新日:平成 27 年 11 月 4 日 目次 1 完備情報の静学ゲーム 5 1.1 完備情報の静学ゲーム . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 1.1.1 ゲーム . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 1.1.2 非協力ゲーム . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 1.1.3 静学ゲーム . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 1.1.4 完備情報ゲーム . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 1.1.5 完備情報の静学ゲーム . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 戦略型ゲーム . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 1.2.1 プレイヤー . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 1.2.2 行動 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 1.2.3 利得 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 1.2.4 戦略型ゲーム . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 1.3.1 純戦略 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 1.3.2 合理性の仮定 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 1.3.3 純戦略均衡 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 パレート効率性 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 1.4.1 強パレート効率性 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 1.4.2 弱パレート効率性 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 1.2 1.3 1.4 2 純戦略均衡 混合拡張 23 2.1 混合戦略 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 2.1.1 混合戦略 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 2.1.2 混合戦略集合 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 2.1.3 非空性 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 2.1.4 凸性 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 2.1.5 コンパクト性 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 期待利得 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 2.2 1 2.3 2.4 3 2.2.1 期待利得 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 2.2.2 連続性 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 混合戦略均衡 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 2.3.1 混合拡張 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 2.3.2 期待効用仮説 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 2.3.3 混合戦略均衡 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 パレート効率性 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 2.4.1 強パレート効率性 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 2.4.2 弱パレート効率性 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 ナッシュ均衡 43 3.1 最適反応 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 3.1.1 純最適反応 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 3.1.2 混合最適反応 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 3.1.3 混合最適反応の特徴づけ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 最適反応対応 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 3.2.1 最適反応対応 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 3.2.2 非空値 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 3.2.3 凸値 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 3.2.4 上半連続性 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 ナッシュ均衡 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 3.3.1 純ナッシュ均衡 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 3.3.2 混合ナッシュ均衡 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57 3.3.3 ナッシュ均衡の特徴付け . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 3.4.1 角谷の不動点定理 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 3.4.2 純ナッシュ均衡の存在 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 3.4.3 混合ナッシュ均衡の存在 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 ナッシュ均衡の正当性 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64 3.5.1 唯一の均衡概念 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64 3.5.2 推論プロセスの終着点 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 3.5.3 合理化可能性 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 3.5.4 フォーカルポイント . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71 3.5.5 自己拘束的な合意 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72 3.5.6 安定的な社会的慣習 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 3.5.7 利得支配 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 3.5.8 リスク支配 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 3.2 3.3 3.4 3.5 ナッシュ均衡の存在 2 4 戦略の逐次消去 74 4.1 戦略の支配関係 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 4.1.1 純戦略の支配関係 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 4.1.2 混合戦略の支配関係 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76 4.1.3 支配関係の特徴付け . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76 戦略の逐次消去 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 4.2.1 戦略の逐次消去 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 4.2.2 共有知識としての合理性 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85 4.2.3 逐次消去の順番 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86 ナッシュ均衡との関係 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88 4.3.1 ナッシュ均衡は支配される戦略を含まない . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88 4.3.2 ナッシュ均衡は逐次消去されない . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 4.3.3 逐次消去の一意的な解はナッシュ均衡 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90 4.2 4.3 5 支配戦略均衡 93 5.1 支配戦略 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93 5.1.1 純支配戦略 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93 5.1.2 混合支配戦略 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94 5.1.3 支配戦略の特徴付け . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94 支配戦略均衡 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 5.2.1 純支配戦略均衡 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 5.2.2 混合支配戦略均衡 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96 5.2.3 支配戦略均衡の特徴付け . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 他の均衡概念との関係 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 5.3.1 ナッシュ均衡との関係 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 5.3.2 逐次消去との関係 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 5.2 5.3 6 2 人ゲーム 99 6.1 ゼロ和ゲーム . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 6.1.1 ゼロ和ゲーム . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 6.1.2 鞍点 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100 6.2 6.3 ミニマックス定理 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103 6.2.1 マックスミニ戦略 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103 6.2.2 ミニマックス戦略 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 6.2.3 ミニマックス定理 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107 ラベル法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 6.3.1 ラベル . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 6.3.2 ラベルとナッシュ均衡 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115 6.3.3 ラベル法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118 3 7 7.1 7.2 7.3 7.4 8 119 分析例 囚人のジレンマ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119 7.1.1 囚人のジレンマ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119 7.1.2 ナッシュ均衡 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121 クールノー競争 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121 7.2.1 クールノー競争 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121 7.2.2 クールノー均衡 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125 7.2.3 戦略の逐次消去 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134 7.2.4 企業数の変化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135 ベルトラン競争 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135 7.3.1 ベルトラン競争 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135 7.3.2 ベルトラン均衡 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138 7.3.3 企業数の変化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144 7.3.4 製品差別化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144 ホテリング・モデル . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145 7.4.1 ホテリング・モデル . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145 7.4.2 ナッシュ均衡 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147 7.4.3 製品差別を含む価格競争 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149 7.4.4 均衡の効率性 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155 7.4.5 価格規制 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158 7.4.6 消費者の分布が偏っている場合 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159 演習問題 160 4 1 完備情報の静学ゲーム 1.1 完備情報の静学ゲーム 1.1.1 ゲーム 戦略的相互依存関係 • 古典的なミクロ経済学のモデルでは,消費者や生産者などの経済主体が,外生的に与えられた経済環境において自 身の利益を最大化するような選択を行うものと仮定し,そのような意志決定の帰結として経済全体でどのような結 果が実現するかを分析しようとする.具体的には,消費者は与えられた財の価格体系と所得のもとで自身の選好な いし効用を最大化するような消費行動を行い,生産者は与えられた財の価格体系と生産技術のもとで自身の利潤を 最大化するような生産行動を行い,その帰結として実現する市場均衡において社会的余剰は最大化される. • 古典的なミクロ経済モデルが想定する経済主体の意志決定問題はいずれも,外生的なパラメーターによって表現さ れる経済環境を制約条件とする制約付き最大化問題として定式化される.例えば,消費者が直面する効用最大化問 題は予算制約のもとで効用関数を最大化する問題として定式化され,生産者が直面する利潤最大化問題は技術的制 約のもとで利潤を最大化する問題として定式化される.だが,現実の経済において経済主体が直面するあらゆる問 題が制約付き最大化問題として定式化され得るとは限らない. • 例えば,ある財の複占市場において競争する 2 つの企業が自身の利益を最大化するように行動するとき,それぞれ の企業は競争相手の行動を外生的に与えられたパラメータとみなすことはできない.なぜなら,それぞれの企業に とってどのような行動が最適であるかは相手の行動に依存して変化し,また,相手にとっての最適な行動もまた自 分の行動に依存して変化するなど,両者は互いに相互依存的な状況に直面しているから.ゆえに,それぞれの企業 が直面する意志決定問題を,外生的なパラメータのもとでの制約付き最大化問題として記述することはできない. • 複占市場において互いに競い合う 2 つの企業が直面する状況のように,複数の主体が関わり合う状況であり,なお かつ,それぞれの主体の厚生が自身の行動や選択のみによって決まるのではなく,他の主体の行動や選択にも依存 するするような状況を戦略的相互依存関係(strategic interdependence)と呼ぶ.ゲーム理論(game theory)は戦 略的相互依存関係を明示的に扱う学問であり,古典的なミクロ経済の主要ツールである制約付き最大化問題として は必ずしも表現し得ないような意志決定問題を分析対象とする. • ちなみに,ゲーム理論にもとづく複占市場の分析例としては,数量競争を念頭においたクールノーモデル(第節) や,価格競争を念頭においたベルトランモデル(第節)などがある. ゲームとルール • 戦略的相互依存関係が成立する状況は,あたかも複数の主体がそれぞれの目的に向かって互いに競い合い,時に は協力しあう一種のゲームのようである.そこで,戦略的相互依存が成立する状況を定式化するモデルをゲーム (game)と呼ぶ. • ゲームとして表現される戦略的相互依存関係は多様であり,ゆえにそれらを表現するモデルもまた多様である.だ が,戦略的相互依存関係を表現モデルはいずれも以下の要素を備えている.個々のゲームを特徴付けるこれらの要 素をゲームのルール(rule)と呼ぶ: 5 1. プレイヤー(player).すなわち,戦略的相互依存関係の下で意志決定を行う主体. 2. プレイヤーたちが意志決定を行う順番(turn). 3. 行動(action).すなわち,プレイヤーが意志決定を行う際に与えられている選択肢. 4. プレイヤーが意志決定を行う際に与えられている情報(information). 5. プレイヤーたちの意志決定がもたらす結果(outcome). 6. 利得(payoff).すなわち,それぞれの結果に対するプレイヤーたちの評価. • プレイヤーたちは自身が行動する順番になったら,その時点において得られる情報を活用しつつ,何らかの行動原 理にしたがって与えられた選択肢の中から特定の行動を選択する.すべてのプレイヤーによる意志決定が終了する と,選ばれた行動の組み合わせに応じて特定の結果が実現し,プレイヤーたちは実現した結果から利得を得る. 1.1.2 非協力ゲーム 協力ゲームと非協力ゲーム • 戦略的相互依存関係に直面したプレイヤーたちは,自身にとってより望ましい結果を導くために,最終的な意志決 定を行う前に互いに事前交渉を行う可能性がある.事前交渉の結果に対してプレイヤーたちの間に拘束的な合意が 成立するのであれば,プレイヤーたちは集団を形成して互いに協力的な意志決定を行う可能性があり,その場合の 意志決定の内容は拘束的な合意が成立しない場合のものとは異なる可能性がある.ゆえに,戦略的相互依存関係を 分析する際には,そこにおいてプレイヤーの間に拘束的な合意が成立するか否かを事前に明らかにしておく必要が ある. • ただし,分析対象である戦略的相互依存関係に直面したときに,そこにおいてプレイヤーの間に拘束的な合意が成 立しているか否かを実際に観察することは困難である.ゆえに,分析を行う上で重要な点は,現実に拘束的合意が 成立しているか否かを特定することではなく,分析の前提として,拘束的合意が成立しているものとみなすか否か の立場をあらかじめ明らかにしておくことである.そこで,プレイヤーたちの間に拘束的な合意が成立するという 前提のもとで分析が行われるゲームを協力ゲーム(cooperative game)と呼び,逆に,プレイヤーたちの間に拘束 的な合意が成立しないという前提のもとで分析が行われるゲームを非協力ゲーム(non-cooperative game)と呼ぶ. 本稿の対象は非協力ゲームである. • プレイヤー間に拘束的合意が成立する場合には,プレイヤーたちは提携(coalition)と呼ばれる集団を形成して互 いに協力的な意志決定を行うことが可能である.したがって,協力ゲームにおいては,プレイヤーどうしの戦略的 相互依存関係だけでなく,提携どうしの戦略的相互依存関係を分析することができる.一方,拘束的な合意が成立 しない場合には,それぞれのプレイヤーの意志決定は,他のプレイヤーたちの意志決定から独立した形で行われる. ゆえに,参加するプレイヤーたちがそれぞれ独立に意志決定を行うゲームとして非協力ゲームを定義することもで きる. • 協力ゲームとは言っても,プレイヤーたちの対立が完全に解消された状況を必ずしも含意しない.そこでは依然と して,プレイヤーや提携の間で競争が行われる.実際,協力ゲームにおける提携行動は,そのような行動を通じて, 提携に参加するプレイヤーの利得が増加する場合に行われるものと考えられる.逆に,非協力ゲームとは言っても, 6 参加するプレイヤーたちは必ずしも互いに対立している必要はない.例えば,互いに協力的なプレイヤーたちが拘 束的な合意を形成した上でゲームに望もうとしたが,何らかの技術的理由によって彼らが互いに事前に連絡を取れ ず,そのまま意志決定を行わなければならないのであれば,その状況は非協力ゲームとして記述される.つまり, ゲームに参加するプレイヤーの間に対立が存在することと,そのゲームが非協力ゲームであることとは,概念とし て必ずしも一致しない. • 非協力ゲームとは言っても,プレイヤーたちが協力する状況をすべて排除するわけではない.例えば,プレイヤー たちは事前交渉を行わず,それゆえ拘束的合意もまた成立しない状況においても,ゲームにおいてプレイヤーたち の間に暗黙の協力が生じる場合には,それは非協力ゲームである.したがって,協力が発生しないことと非協力 ゲームであることもまた概念として必ずしも一致しない. • プレイヤーたちが事前交渉を行う場合でも,交渉結果が拘束力を持たない場合には,それは非協力ゲームとして記 述される.つまり,ゲームに参加するプレイヤーが事前交渉を行わないことと,そのゲームが非協力ゲームである こととは,概念として必ずしも一致しない. 1.1.3 静学ゲーム 静学ゲームと動学ゲーム • ゲームのルールを構成する要素の中でも順番に注目することで,ゲームを 2 種類に分類することができる.1 つ目 はすべてのプレイヤーが同時に意志決定を行うゲームであり,これを静学ゲーム(static game)や同時手番ゲーム (simultaneous move game)などと呼ぶ.2 つ目はプレイヤーたちが順番に意志決定を行うゲームであり,これを 動学ゲーム(dynamic game)や逐次手番ゲーム(sequential game)などと呼ぶ.本稿の対象は静学ゲームである. • 静学ゲームはゲームのルールの中でも順番にもとづくゲームの分類であるが,これをルールの別の要素である情報 によって特徴付けることもできる.具体的には,プレイヤーたちが同時に意志決定を行うことは,それぞれのプレ イヤーが意志決定を行う際に,他のプレイヤーたちの意志決定の内容を事前に観察できないことと実質的に等しい. したがって,静学ゲームとは,それぞれのプレイヤーが意志決定を行う際に,他のプレイヤーたちの意志決定の内 容に関する情報を与えられないゲームとみなすこともできる. • 一方,動学ゲームを情報によって特徴付けることはできない.なぜなら,プレイヤーたちが順番に意志決定を行う ことは,それぞれのプレイヤーが意志決定を行う際に,自分より前に意志決定を行ったプレイヤーの意志決定の内 容を事前に観察できることを必ずしも含意しないから.ちなみに,動学ゲームは情報によって 2 種類に分類できる. 具体的には,それぞれのプレイヤーが意志決定を行うすべての時点において,それ以前に行われたすべてのプレイ ヤーによる意志決定の内容を観察できる動学ゲームを完全情報ゲーム(game of perfect information)と呼び,逆 に,あるプレイヤーが意志決定を行うある時点において,それ以前に行われた少なくとも 1 人のプレイヤーによる 意志決定の内容を観察できない動学ゲームを不完全情報ゲーム(game of imperfect information)と呼ぶ. • ちなみに,完全情報ゲームにおいて,プレイヤーは観察した情報や,自分が過去に行った意志決定の内容をすべて 正確に記憶しているとは限らない.そのような視点から,すべてのプレイヤーが過去に知り得た情報と自分の過去 の意志決定の内容をすべて憶えているような動学ゲームを完全記憶ゲーム(game of perfect recall)と呼び,逆に, あるプレイヤーが過去に知り得た情報や自分の過去の意志決定の内容を完全に憶えていない動学ゲームを不完全記 憶ゲーム(game of imperfect recall)と呼ぶ. 7 1.1.4 完備情報ゲーム 相互知識と共有知識 • すべてのプレイヤーがある事実 P を知っているならば,事実 P はプレイヤーたちの相互知識(mutual knowledge) であると言う. • すべてのプレイヤーがある事実 P を知っており,さらに,すべてのプレイヤーが P を知っているという事実を P1 で 表し,すべてのプレイヤーが事実 P1 を知っているという事実を P2 で表す.事実 P3 , P4 , · · · などについても同様に 考える.このような無限個の事実が成立する場合には,事実 P はプレイヤーたちの共有知識(common knowledge) であると言う. • ある事実がプレイヤーたちの共有知識であるならば,それは明らかにプレイヤーたちの相互知識でもある.だが, 以下に示すように,その逆は成立するとは限らない.すなわち,相互知識は共有知識であるとは限らない. 例 1.1 (相互知識だが共有知識ではない事実) • 赤い帽子をかぶった A, B の 2 人が向き合っている.A, B はともに,相手の帽子は見えるが,自分の帽子は見えな い.このとき,事実 P を以下のように定める. P : 少なくとも 1 人の帽子の色は赤である. • 事実 P は A, B の相互知識である.理由は以下の通り: – A は B の帽子が赤であることが確認できるので,A は P を知っている. – B は A の帽子が赤であることが確認できるので,B は P を知っている. – したがって,P は A, B の相互知識である. • P は A, B の共有知識ではない.理由は以下の通り: – B は A の帽子が赤であることが確認できるので,B は P を知っている. – P が共有知識ならば,このとき, 「B が P を知っている」ことを A は知っているはず.そして,それは,以下 の少なくとも一方が成立することを意味する. (a) 「B は B の帽子が赤だと知っている」ことを A は知っている. (b) 「B は A の帽子が赤だと知っている」ことを A は知っている. – (a) は成り立たない.なぜなら,B が B の帽子を見られないことを A は知っているから. – (b) も成り立たない.なぜなら,A は A の帽子を見られないので,B が見ている A の帽子が赤であることを A は確認できないから. – したがって,P は A, B の共有知識ではない. 8 完備情報ゲームと不完備情報ゲーム • 戦略的相互依存関係に直面したプレイヤーは,自分が直面している状況を常に正確に把握できるとは限らない.例 えば,先の複占市場の例であれば,それぞれの企業は競争相手の生産コストを知っているとは限らず,知っている 場合とそうでない場合とでは意志決定の内容が異なる可能性がある.ゆえに,戦略的相互依存関係を分析する際に は,そこにおいてプレイヤーたちがゲームのルールについてどの程度精通しているかを事前に明らかにしておく必 要がある. • ゲームのルールがすべてのプレイヤーの共有知識であるようなゲームを完備情報ゲーム(game of complete information)と呼び,逆に,ゲームのルールを構成する要素がプレイヤーたちの共有知識ではないゲームを不完備情報 ゲーム(game of incomplete information)と呼ぶ.実際には,他のプレイヤーの利得を知らないプレイヤーが存 在するゲームを不完備情報ゲームと呼ぶことが多い. • 完備情報ゲームと名称が似た概念として完全情報ゲームがあるが,先に説明したように,完全情報ゲームは動学 ゲームの 1 つのカテゴリーであり,完備情報ゲームとは異なる概念であることに注意せよ.例えば,ある動学ゲー ムのルールがすべてのプレイヤーにとって完備情報ゲームである場合においても,少なくとも 1 人のプレイヤーが 意志決定を行う時点において,それ以前に行われた他のプレイヤーの意志決定の内容を観察できない場合には,そ れは完備情報かつ不完全情報ゲームである. 1.1.5 完備情報の静学ゲーム 完備情報の静学ゲーム • ルールを構成する要素の中でも,順番と情報の 2 つの軸によってゲームを以下のように分類することができる: 順番 情報 完備情報 不完備情報 静学 完備情報の静学ゲーム 不完備情報の静学ゲーム 動学 完備情報の動学ゲーム 不完備情報の動学ゲーム • 本稿の対象は非協力かつ静学かつ完備情報であるようなゲームであり,このようなゲームを完備情報の静学ゲーム (static games of complete information)と呼ぶ.そこではプレイヤーたちの間に拘束的な合意が成立せず,すべて のプレイヤーにとってゲームのルールは共有知識であり,なおかつ,すべてのプレイヤーは同時に意志決定を行う. • 完備情報の静学ゲームを記述するためには,ルールの残りの要素であるプレイヤー,行動,結果,利得などを特定 する必要があるが,これらは戦略型ゲーム(game in strategic form)と呼ばれる概念を用いて記述される.そこ で,次節では戦略型ゲームについて説明しよう. 1.2 1.2.1 戦略型ゲーム プレイヤー プレイヤー 9 • 本節では,完備情報の静学ゲームを記述するモデルについて説明する.まず,完備情報の静学ゲームにおいて意志 決定を行う主体をプレイヤー(player)と呼ぶ. • ゲームに参加するすべてのプレイヤーからなる集合をプレイヤー集合(player set)やプレイヤー空間(player space) などと呼び,これを N で表す. • 戦略的相互依存関係が存在する状況は,複数のプレイヤーが存在することで初めて生じるので,プレイヤーの人数 が複数であるということはゲームの基本的な条件となる.そこで多くの場合,プレイヤーの人数 n ∈ N について n ≥ 2 と仮定し,n 人のプレイヤーが参加するゲームを n 人ゲーム(n-players game)と呼ぶ. • n 人ゲームのプレイヤー集合を, N = {1, · · · , n} で表し,i (= 1, · · · , n) 番目のプレイヤーをプレイヤーi(player i)と呼ぶ.i ∈ N である. プレイヤーの単位 • プレイヤーの単位は,分析対象となる状況に応じて,個人,組織,国家など様々である.プレイヤーの単位を決定 する上で最も重要な点は,それがゲームにおいて自立的な意志決定を行う上での最小単位であるということである. • 例えば,ある複占市場において競争している 2 つの複占企業は,各自が自立的な意志決定を行い,なおかつ,両者 は戦略的相互依存の関係におかれている.したがって,2 つの複占企業はゲームのプレイヤーである. • プレイヤーであるためのもう一つの重要な要素は,その主体が他の主体と戦略的相互依存の関係に置かれており, そのような状況を踏まえた上で意志決定を行うという点である.したがって,他の主体との関係性の中で意志決定 を行うのではなく,外生的に変化する状況に対応する形でのみ意志決定を行う主体はプレイヤーではなく,モデル の環境変数とみなされる. • 例えば,先述の複占市場において生産される財の消費者はプレイヤーとはみなされない.なぜなら,消費者は市場 におけるプライス・テイカーであり,複占企業どうしの競争の結果として外生的に与えられる財の価格に応じて最 適な消費を決定する主体であり,消費者と企業は戦略的相互依存の関係を形成していないから. • 複占市場のプレイヤーである複占企業にとって,市場の需要曲線は外生的に与えられる要因であり,消費者は市場 の需要曲線を形成する環境変数と位置づけられる. 1.2.2 行動 行動 • 完備情報の静学ゲームにおいて,プレイヤーが意志決定を行う際に与えられている選択肢を行動(action)と呼ぶ. • プレイヤー i が選択する行動を ai で表し,プレイヤー i が選択可能なすべての行動からなる集合を行動集合(action set)や行動空間(action space)と呼び,これを Ai で表す.ai ∈ Ai である. 10 • すべてのプレイヤーの行動からなる組を a = (a1 , · · · , an ) で表し,プレイヤー i 以外のプレイヤーたちの行動の組 を a−i = (a1 , · · · , ai−1 , ai+1 , · · · , an ) で表す.a = (ai , a−i ) である. • すべてのプレイヤーの行動集合の直積を A = A1 × · · · × An で表す.また,A−i = A1 × · · · × Ai−1 × Ai+1 × · · · × An で表す.a ∈ A, a−i ∈ A−i である. 1.2.3 利得 選好関係 • 完備情報の静学ゲームにおいて,それぞれのプレイヤーは起こり得る結果どうしを比較する選好(preference)を 持つ.ただし,プレイヤーたちが行動の組 a = (a1 , · · · , an ) ∈ A を選ぶと,ゲームのルールによって a に対応する ゲームの結果(outcome)が定まるという意味で,行動の組には結果が 1 つずつ対応しているので,プレイヤーの 選好は,ゲームにおいて起こり得る行動の組どうしを比較する A 上の選好関係(preference relation)として定式 化できる. • 具体的には,プレイヤー i がゲームの結果を比較する選好関係は,A 上の二項関係 %i として定式化される.その 上で,2 つの行動の組 a, a′ ∈ A に対して, a %i a′ が成り立つ場合には,プレイヤー i は a のもとで実現する結果を a′ のもとで実現する結果以上に好ましいと考え ているものと解釈される. • 選好関係 %i をもとに,厳密な選好関係(strict preference relation)≻i と無差別関係(indifference relation)∼i をそれぞれ以下のように定義する.すなわち,任意の 2 つの行動の組 a, a′ ∈ A に対して, a ≻i a′ ⇔ {a %i a′ ∧ ¬ (a′ %i a)} a ∼i a′ ⇔ (a %i a′ ∧ a′ %i a) である.ちなみに,a ≻i a′ が成り立つことは,プレイヤー i が a のもとで実現する結果を a′ のもとで実現する結 果よりも好ましいと考えているものと解釈され,a ∼i a′ が成り立つことは,プレイヤー i にとってそれら 2 つの 結果が同じ程度に望ましいと考えているものと解釈される. 利得関数 • プレイヤー i の A 上の選好関係 %i と,関数 ui : A → R が与えられたとき,任意の行動の組 a, a′ ∈ A に対して, ui (a) ≥ ui (a′ ) ⇔ a %i a′ という関係が成り立つならば,ui のことを %i を表現する利得関数(payoff)と呼ぶ.さらに,プレイヤー i の利 得関数 ui が行動の組 a に対して定める値 ui (a) を,プレイヤー i が a から得る利得(payoff)と呼ぶ. 11 • 一般に,プレイヤーの選好関係を表す利得関数は存在するとは限らないが,選好関係に関して一定の仮定をおけば, 利得関数の存在を保証できる1 . • ui (a) = ui (ai , a−i ) であるから,ui はプレイヤー i 自身の行動 ai だけを変数として持つのではなく,i 以外のプレ イヤーたちの行動の組 a−i をも変数として持つ.つまり,プレイヤー i が獲得する利得 ui (a) は自身の選択 ai に依 存するだけでなく,他のプレイヤーたちの選択 a−i にも依存するので,利得関数の定義域を A とすることは,プ レイヤーどうしの戦略的相互依存関係を想定していることを意味する. 利得の序数性 • プレイヤー i の利得関数 ui : A → R が A 上の選好関係 %i を表す利得関数であるとき,狭義の単調増加関数 f : R → R と ui の合成関数に関しても,任意の a, a′ ∈ A に対して, (f ◦ ui ) (a) ≥ (f ◦ ui ) (a′ ) ⇔ a %i a′ という関係が成立するので,f ◦ ui : A → R もまた %i を表す利得関数である. • さらに,f は狭義の単調増加関数であるから,任意の a ∈ A に対して, (f ◦ ui ) (a) ≥ ui (a) という関係が成り立つ.つまり,同一の選好関係のもとで,同一の結果に対して定まる利得水準は必ずしも一意的 ではない. • つまり,それぞれの結果に対して割り当てられる利得の絶対的な水準は,どのような利得関数を選ぶかに依存し, しかも,同一の選好を表す複数の利得関数が存在するため,利得の絶対的な水準に相当する基数的効用(cardinal utility)には重要な意味はない.例えば,2 つの行動の組 a, a′ ∈ A がもたらすそれぞれの結果に対して利得関数 ui の定める値が, ui (a) = 100, ui (a′ ) = 50 (1) であったとしても,プレイヤー i は a のもとでの結果を a′ のもとでの結果よりも 2 倍望ましいと考えているとは 言えない. • 一方,任意の a, a′ ∈ A に対して a %i a′ が成り立つとき, (f ◦ ui ) (a) ≥ (f ◦ ui ) (a′ ) ⇔ ui (a) ≥ ui (a′ ) という関係が成り立つ.つまり,複数の結果に対して定まる利得の相対的な大小関係は,利得関数が変わっても保 存される. • つまり,それぞれの結果に割り当てられる利得の相対的な大小関係は,どのような利得関数を選ぶかに依存しない ため,利得の相対的な水準に相当する序数的効用(ordinal utility)には重要な意味がある.例えば,先ほどの関係 (1) が成り立つ場合には,プレイヤー i は a のもとでの結果を a′ のもとでの結果よりも 2 倍望ましいと考えている とは言えないが,プレイヤー i は前者を後者よりも望ましいと考えているとは言える. 1 詳細な議論は,消費者理論のテキスト(https://sites.google.com/site/ikuboyuta/note/consumertheory)を参照せよ. 12 1.2.4 戦略型ゲーム 戦略型ゲームによる完備情報の静学ゲームの表現 • 以上の議論を踏まえると,完備情報の静学ゲームのルールは,以下の要素によって集約的に表現できる: 1. プレイヤー集合 N = {1, · · · , n}. 2. プレイヤーたちの行動集合からなる組 {Ai }i∈N . 3. プレイヤーたちの利得関数からなる組 {ui }i∈N . • 以上の 3 つの要素からなる組を戦略型ゲーム(game in strategic form)や標準型ゲームなどと呼び,これを G = (N, {Ai }i∈N , {ui }i∈N ) で表す.ゲームの完備性より,G を構成する要素はいずれもプレイヤーたちの共有知識である. • ゲームの静学性より,プレイヤーたちの意志決定は以下の手順で進行する: 1. それぞれのプレイヤー i ∈ N は,自身が選択可能な行動集合 Ai の中から特定の行動 ai ∈ Ai を同時に選択 する. 2. プレイヤーたちが選択した行動の組 a = (a1 , · · · , an ) に対して,ゲームのルールが結果を定める. 3. ゲームの結果に応じて,プレイヤー i は利得 ui (a) を獲得する. • つまり,完備情報の静学ゲームを表す戦略型ゲーム G が与えられたとき,G を構成するすべての要素はプレイヤー たちの共有知識であるが,それぞれのプレイヤーはそこで他のプレイヤーたちがどの純戦略を選択するかを事前に 観察することはできない. 有限ゲームと利得行列 • 戦略型ゲームを構成するプレイヤー集合とすべてのプレイヤーの行動集合が有限集合である場合には,そのような ゲームを有限ゲーム(finite game)と呼ぶ. • 有限な 2 人ゲームの戦略型ゲームは行列を用いて表現できる.具体的には,例えば,2 人のプレイヤー 1, 2 の行動 集合が以下の有限集合 A1 = {a11 , a12 } , A2 = {a21 , a22 } として与えられる場合には,戦略型ゲームを以下の行列を用いて集約的に表現できる.これを利得行列(payoff matrix)と呼ぶ. 1\2 a21 a22 a11 u1 (a11 , a21 ) , u2 (a11 , a21 ) u1 (a11 , a22 ) , u2 (a11 , a22 ) a12 u1 (a11 , a21 ) , u2 (a11 , a21 ) u1 (a12 , a22 ) , u2 (a12 , a22 ) 13 • プレイヤー 1 は行を選択し,プレイヤー 2 は列を選択する.利得行列の i 行 j 列(i, j = 1, 2)成分 (u1 (a1i , a2j ) , u2 (a1i , a2j )) ∈ R2 は,プレイヤー 1 が行動 a1i を選び,プレイヤー 2 が行動 a2j を選んだときに実現する結果から両者が得る利得の 組み合わせを表している. • ちなみに,戦略型ゲームを構成するプレイヤー集合や,あるプレイヤーの行動集合が無限集合であるならば,そ のようなゲームを無限ゲーム(infinite game)と呼ぶ.通常,利得行列を用いて無限ゲームを表現することはでき ない. 1.3 1.3.1 純戦略均衡 純戦略 完備情報の静学ゲームにおける純戦略 • 一般に,プレイヤーの戦略(strategy)とは,プレイヤーがゲームにおいて意志決定を行うそれぞれの局面におい て,そこで所与とされる情報と選択可能な行動を踏まえた上で,どの行動を選ぶかをあらかじめ包括的に定める行 動計画のことである. • プレイヤーたちが順番に意志決定を行うゲームにおけるプレイヤーの戦略とは,自分とは異なるタイミングで意志 決定を行う他のプレイヤーたちの選択の結果として実現し得るすべての経路を想定した上で,各経路において自分 がどのような行動を選ぶかをあらかじめ包括的に定める行動計画に相当する.一方,静学ゲームでは,すべてのプ レイヤーが同時に 1 度だけ意志決定を行うため,それぞれのプレイヤーは複数の経路を想定する必要がない. • ゲームのルールが共有知識ではないゲームにおいては,プレイヤーはゲームのルールについて確かな認識を持って いない.ゆえに,そこでのプレイヤーの戦略とは,実現し得るルールのあらゆる状態を想定した上で,それぞれの 状態において自分がどのような行動を選ぶかをあらかじめ包括的に定める行動計画に相当する.一方,完備情報 ゲームでは,プレイヤーはゲームのルールについて確かな認識を持っているため,それぞれのプレイヤーは実現し 得る複数の状態を想定する必要がない. • 以上を踏まえると,完備情報の静学ゲームにおけるプレイヤーの戦略とは,単純に,プレイヤーが選択可能な行動 の中から 1 つの行動を選ぶことを意味する.言い換えると,完備情報の静学ゲームでは,プレイヤーが 1 つの戦略 を選ぶことは,1 つの行動を選ぶことと実質的に等しい.そこで,プレイヤー i が確定的にある行動を選択するこ とをプレイヤー i の戦略(strategy)や純戦略(pure strategy)などと呼び,これを si で表す. • すべてのプレイヤーの戦略の組を s = (s1 , · · · , sn ) で表し,プレイヤー i 以外の n − 1 人のプレイヤーの戦略の組 を s−i = (s1 , · · · , si−1 , si+1 , · · · , sn ) で表す.s = (si , s−i ) である. • プレイヤー i が選択可能なすべての戦略からなる集合をプレイヤー i の戦略集合(strategy set)や戦略空間(strategy space)などと呼び,これを Si で表す.si ∈ Si である. 14 • 完備情報の静学ゲームにおけるそれぞれのプレイヤー i の戦略は,選択可能な行動の中から 1 つの行動を確定的に 選択することを意味する.ゆえに,プレイヤー i の行動集合を Ai とすると, Si = Ai という関係が成立する.つまり,戦略集合は行動集合と一致する.ゆえに,戦略型ゲームを, G = (N, {Si }i∈N , {ui }i∈N ) と表現することもできる. • すべてのプレイヤーの戦略集合の直積を S = S1 × · · · × Sn で表す.また,S−i = S1 × · · · Si−1 × Si+1 × · · · × Sn で表す.s ∈ S, s−i ∈ S−i である. 1.3.2 合理性の仮定 合理性の仮定 • ゲームに参加するプレイヤーはそれぞれ明確な目的を持ち,その目的を達成するために最適な行動を選択するもの と仮定される.この意味で,ゲームにおけるプレイヤーは合理的(rational)であると仮定される. • プレイヤーの目的は多くの場合,自己の利得の最大化と仮定される.つまり,ゲームに参加するプレイヤーたちは 意志決定を行う際に他のプレイヤーたちが獲得する利得を考慮せず,自分の利得の最大化をめざすという意味にお いて利己的(selfish)であると仮定する. • プレイヤーの行動原理に関して合理性と利己性を仮定することは,プレイヤーが自己の利得を最大化するために最 適な行動を選択することを意味するが,これら 2 つの仮定をまとめて合理性の仮定と呼ぶことが多い.本稿でも以 降はその流儀にしたがう. • 完備情報の静学ゲームを表す戦略型ゲーム G において合理性の仮定を満たすためには,より具体的に以下を仮定 する必要がある.ゆえに,以下の条件によって合理性を定義することもできる: 1. それぞれのプレイヤーは自分がプレーしているゲーム G において起こり得るすべての事象を把握しているも のとする.具体的には,それぞれのプレイヤーはすべてのプレイヤーの戦略集合の直積 S = S1 × · · · × Sn に 属するすべての要素を把握している. 2. それぞれのプレイヤーはゲームにおいて起こり得るそれぞれの事象 s ∈ S から自身が得る利得 ui (s) ∈ R を 把握しており,その上で,自身の利得を最大化するような戦略 si ∈ Si を選択する. • これらの条件によってプレイヤーの合理性を定義することは,プレイヤーは起こり得る事象 S を把握する情報収 集能力を持ち,また,意志決定を行う時点において利用可能な情報をすべて活用し,さらに,自身の選択可能なそ れぞれの戦略がもたらすであろう最終的な自己の利得を計算する能力を備えていることを暗に仮定していることに なる. 15 • 多くの場合,プレイヤーの合理性は相互知識であると仮定される.すなわち,すべてのプレイヤーが合理的である ことをすべてのプレイヤーが知っているものと仮定する.さらに,プレイヤーの合理性を共有知識と仮定する場合 もある.つまり,すべてのプレイヤーが合理的であることをすべてのプレイヤーが知っており,なおかつ,その事 実をすべてのプレイヤーが知っており,· · · ,という仮定を無限に積み重ねる場合もある. 1.3.3 純戦略均衡 完備情報の静学ゲームにおける均衡 • 完備情報の静学ゲームを表現する戦略型ゲーム G に直面したプレイヤー i は,合理性の仮定のもとでは,自身が選 択可能な戦略の集合 Si の中から,自身の利得を最大化する戦略 s∗i ∈ Si を選ぶ.このような戦略 s∗i をプレイヤー i の最適戦略(best strategy)と呼ぶ. • プレイヤーたちが最適戦略を選ぶ目的は自身の利得の最大化だが,最適戦略の具体的な内容はゲーム G の要素と は別に外生的に与える必要がある.つまり,ゲームの分析家は最適戦略の意味をあらかじめ規定した上で,そこで 規定された最適戦略の概念のもとでプレイヤーたちが具体的にどのように振る舞い,そこからどのような結果がも たらされるかを分析しようとする. • 最適戦略の意味を規定することとは,ゲーム G に対して最適戦略の組 s∗ = (s∗1 , · · · , s∗n ) ∈ S を定める概念を外生的に与えることを意味する.そこで,そのような概念をゲームの均衡概念(equilibrium concept) や解の概念(solution concept)などと呼ぶ.また,均衡を構成する個々の最適戦略 s∗1 , · · · , s∗n を均衡戦略(equilibrium strategies)と呼ぶ. • ゲーム G に対して均衡概念が均衡 s∗ を定めると,戦略の組 s∗ に対してゲームのルールが結果を定める.その結 果を G の均衡結果(equilibrium outcome)と呼ぶ.さらに,均衡結果からプレイヤーたちが得る利得の組を, u∗ = (u∗1 (s∗ ) , · · · , u∗n (s∗ )) ∈ Rn で表す. • よりフォーマルには,任意のゲーム G に対して,そこでの均衡 s∗ をそれぞれ定める写像が均衡概念である.ただ し,ある均衡概念を定めたとき,その均衡概念のもとで,任意のゲームに対して均衡は存在するとは限らない.ま た,均衡が存在する場合にも,それは一意的に定まるとは限らない.したがって,より正確には,均衡概念とは, それぞれのゲームに対して,そこでの均衡の集合を定める対応と定義される. 古典的経済学における均衡との比較 16 • 例えば,古典的経済学の一般均衡モデル(general equilibrium model)における均衡とは,個々の経済主体が最適 な行動を選択した結果として得られる価格の集合である.一方,ゲーム理論における均衡とは,ゲームに対する最 適戦略の組を定める写像ないし対応に相当する概念である. • したがって,一般均衡モデルをゲーム論的に解釈するならば,個々の経済主体による商品の売買ルールが均衡に相 当し,その結果として得られる価格の集合は均衡そのものではなく,均衡結果に相当する. 1.4 1.4.1 パレート効率性 強パレート効率性 強パレート効率的な純戦略の組 • 戦略型ゲーム G において,2 つの純戦略の組 s, s′ ∈ S の間に, (a) ∀i ∈ N : ui (s) ≥ ui (s′ ) (b) ∃i ∈ N : ui (s) > ui (s′ ) という関係がともに成り立つならば,s は s′ を弱パレート支配する(weakly Pareto dominate)すると言う.ま た,ある純戦略の組 s が他のいかなる純戦略の組によっても弱パレート支配されないならば,s は強パレート効率 的(strongly Pareto efficient)であるとか強パレート最適(strongly Pareto optimal)であると言う. • 強パレート効率的な純戦略の組 σ が与えられたとき,それに対して, ui (s) > ui (s′ ) を満たす純戦略の組 s′ とプレイヤー i を任意にとる.強パレート効率性の定義より,s′ は s を弱パレート支配しな いことから, ∀j ∈ N : uj (s) ≥ uj (s′ ) は成り立たない.すなわち, ∃j ∈ N : uj (s′ ) > uj (s) が成り立つ.つまり,強パレート効率的な純戦略の組 s を基準に,あるプレイヤー i の状態を改善させようとする と,他の少なくとも 1 人のプレイヤー j の状態が悪化する. 例 1.2 (強パレート効率的な純戦略の組) • 以下の利得行列で表される戦略型ゲームについて考える. 12 s21 s22 s11 5, 5 0, 8 s12 8, 0 2, 2 17 • 上のゲームにおいて,純戦略の組 (s12 , s22 ) は強パレート効率的ではない.なぜなら,(s12 , s22 ) は他の純戦略の組 (s11 , s21 ) によって支配されるから.すなわち,(s12 , s22 ) から (s11 , s21 ) へ移行することによって,2 人のプレイヤー の状態を同時に改善することができる.一方,(s12 , s22 ) 以外の純戦略の組を任意に選んだとき,そこを基準として 他の任意の純戦略の組へ移行すると,少なくとも 1 人のプレイヤーの利得は減少する.ゆえに,(s12 , s22 ) 以外の純 戦略の組 (s11 , s21 ) , (s11 , s22 ) , (s12 , s21 ) はいずれも強パレート効率的である. • 続いて,以下の利得行列で表される戦略型ゲームについて考える. 12 s21 s22 s11 5, 5 0, 5 s12 5, 0 2, 2 • この新たなゲームにおいても,(s12 , s22 ) は (s11 , s21 ) によって弱支配されるため,(s12 , s22 ) は強パレート効率的で はない.続いて,(s11 , s22 ) について考えよう.例えば,そこから (s11 , s21 ) へ移行すると,プレイヤー 2 の利得は 変化せず 5 のままだが,プレイヤー 1 の利得は 0 から 5 へ増加する.ゆえに,(s11 , s21 ) は (s11 , s22 ) を弱支配する ため,(s11 , s22 ) は強パレート効率的ではない.同様に,(s11 , s21 ) は (s12 , s21 ) を弱支配するため,(s12 , s21 ) もまた 強パレート効率的ではない.ゆえに,強パレート効率的な純戦略の組は (s11 , s21 ) だけである. 強パレート効率的な利得の組 • 戦略型ゲーム G において,純戦略の組 s ∈ S においてプレイヤーたちが得る利得の組は (ui (s))i∈N で与えられる. 以上を踏まえた上で,ゲーム G の実現可能集合(feasible set)を, { } U = (ui (s))i∈N |s ∈ S と定義する.また,プレイヤーたちの利得ベクトル u = (ui )i∈N が, u∈U を満たすならば,u は実現可能(feasible)であると言う. • 戦略型ゲーム G の実現可能集合 U に属する 2 つの利得ベクトルの組 u = (ui )i∈N , u′ = (u′i )i∈N ∈ U の間に, (a) ∀i ∈ N : ui ≥ u′i (b) ∃i ∈ N : ui > u′i という関係がともに成り立つならば,u は u′ を弱パレート支配する(weakly Pareto dominate)すると言う.また, 実現可能な利得ベクトル u が他のいかなる実現可能な利得ベクトルによっても弱パレート支配されないならば,u は強パレート効率的(strongly Pareto efficient)であるとか強パレート最適(strongly Pareto optimal)であると 言う. • 戦略型ゲーム G において純戦略の組 s ∈ S が強パレート最適であるならば,そこでプレイヤーたちが得る利得の 組 (ui (s))i∈N ∈ U は一意的に定まり,かつ,それは明らかに強パレート最適である.一方,強パレート最適な利 18 得の組 u = (ui )i∈N ∈ U が与えられたとき,これを実現する純戦略の組 s ∈ S は一意的に定まるとは限らない.す なわち,u ∈ U に対して, ∀i ∈ N : ui (s) = ui を満たす s ∈ S は一意的に定まるとは限らない.だが,強パレート最適な u ∈ U に対して,上の条件を満たす任意 の s ∈ S は明らかに強パレート最適である. 例 1.3 (強パレート効率的な利得の組) • 以下の利得行列で表される戦略型ゲームについて考える. 12 s21 s22 s11 5, 5 0, 8 s12 8, 0 2, 2 • 上の戦略型ゲームの実現可能集合は, U = {(u1 (s) , u2 (s)) |s ∈ S } = {(5, 5) , (0, 8) , (8, 0) , (2, 2)} である.利得ベクトルの組 (2, 2) ∈ U は強パレート効率的ではない.なぜなら,この利得ベクトルは他の実現可能 な利得ベクトル (5, 5) ∈ U によって弱支配されるから.すなわち,(2, 2) から (5, 5) へ移行することによって,2 人 のプレイヤーの状態を同時に改善することができる.一方,(2, 2) 以外の任意の実現可能な利得ベクトルの組は強 パレート効率的である. • 上の例において,強パレート効率的な純戦略の組は (s11 , s21 ) , (s11 , s22 ) , (s12 , s21 ) の 3 つであり,これらはそれぞ れ強パレート効率的な利得ベクトルと 1 対 1 で対応している.だが,このような性質は一般的に成り立つとは限ら ない.例えば,以下の利得行列で表される戦略型ゲームについて考える. 12 s21 s22 s11 5, 5 8, 0 s12 8, 0 2, 2 • 上の新たなゲームにおいて,強パレート効率的な純戦略の組は, (s11 , s21 ) , (s11 , s22 ) , (s12 , s21 ) の 3 つである.一方,このゲームの実現可能集合は, U = {(u1 (s) , u2 (s)) |s ∈ S } = {(5, 5) , (8, 0) , (2, 2)} であるから,強パレート効率的な利得ベクトルは, (5, 5) , (8, 0) 19 の 2 つである.ゆえに,この例では,強パレート効率的な純戦略の組と,強パレート効率的な利得ベクトルが 1 対 1 で対応していない. 1.4.2 弱パレート効率性 弱パレート効率的な純戦略の組 • 戦略型ゲーム G において,2 つの純戦略の組 s, s′ ∈ S の間に, ∀i ∈ N : ui (s) > ui (s′ ) という関係が成り立つならば,s は s′ を強パレート支配する(strongly Pareto dominate)すると言う.また,ある 純戦略の組 s が他のいかなる純戦略の組によっても強パレート支配されないならば,s は弱パレート効率的(weakly Pareto efficient)であるとか弱パレート最適(weakly Pareto optimal)であると言う. • 弱パレート効率的な純戦略の組 s が与えられたとき,それに対して, ui (s) > ui (s′ ) を満たす純戦略の組 s′ とプレイヤー i を任意にとる.弱パレート効率性の定義より,s′ は s を強パレート支配しな いことから, ∀j ∈ N : uj (s) > uj (s′ ) は成り立たない.すなわち, ∃j ∈ N : uj (s′ ) ≥ uj (s) が成り立つ.つまり,弱パレート効率的な純戦略の組 s を基準に,あるプレイヤー i の状態を改善させようとする と,他の少なくとも 1 人のプレイヤー j の状態が改善されない. 例 1.4 (弱パレート効率性) • 以下の利得行列で表される戦略型ゲームについて考える. 12 s21 s22 s11 5, 5 0, 5 s12 5, 0 2, 2 • まず,純戦略の組 (s12 , s22 ) は別の純戦略の組 (s11 , s21 ) によって強支配されるため,弱パレート効率的ではない. (s12 , s22 ) 以外の純戦略の組を任意に選んだとき,そこから他の任意の純戦略の組へ移行しても,2 人の利得を同時 に増加させることはできないため,これらはいずれも弱パレート効率的である. 20 強パレート効率性と弱パレート効率性の関係 • 繰り返しになるが,戦略型ゲーム G において純戦略の組 s が強パレート効率であることは,s を基準にあるプレ イヤー i の状態を改善させようとすると,他の少なくとも 1 人のプレイヤーの状態が悪化することを意味する.ま た,プレイヤーの状態が悪化することは,そのプレイヤーの状態が改善されないことを含意する.ゆえに,s が強 パレート効率であることは,s を基準にあるプレイヤー i の状態を改善させようとすると,他の少なくとも 1 人の プレイヤーの状態が改善されないことを含意するが,これは s が弱パレート最適であることの定義に他ならない. ゆえに,強パレート効率的な純戦略の組は弱パレート効率的でもある. ) ( 命題 1.1 戦略型ゲーム G = N, {Si }i∈N , {ui }i∈N において,純戦略の組 s ∈ S が強パレート効率的であるならば,s は弱パレート効率的でもある. • 上の命題の逆は成立するとは限らない.つまり,弱パレート効率的な純戦略の組は強パレート効率的であるとは限 らない.例えば,以下の利得行列で表されるゲームについて考える. 12 s21 s22 s11 5, 5 0, 5 s12 5, 0 2, 2 • 先に確認したように,純戦略の組 (s11 , s21 ) は強パレート最適かつ弱パレート最適である.また,(s11 , s22 ) , (s12 , s21 ) はともに弱パレート効率的だが,強パレート効率的ではない.最後に,(s12 , s2 ) は強パレート効率的でも弱パレー ト効率的でもない. 弱パレート効率的な利得の組 ( ) • 戦略型ゲーム G = N, {Si }i∈N , {ui }i∈N の実現可能集合を,先ほどと同様に, { } U = (ui (s))i∈N |s ∈ S と定義する.このとき,実現可能な 2 つの利得ベクトルの組 u = (ui )i∈N , u′ = (u′i )i∈N ∈ U の間に, ∀i ∈ N : ui > u′i という関係が成り立つならば,u は u′ を強パレート支配する(strongly Pareto dominate)すると言う.また,あ る利得ベクトル u が他のいかなる利得ベクトルによっても強パレート支配されないならば,u は弱パレート効率的 (weakly Pareto efficient)であるとか弱パレート最適(weakly Pareto optimal)であると言う. • 戦略型ゲーム G において純戦略の組 s ∈ S が弱パレート最適であるならば,そこでプレイヤーたちが得る利得の 組 (ui (s))i∈N ∈ U は一意的に定まり,かつ,それは明らかに弱パレート最適である.一方,弱パレート最適な利 得の組 u = (ui )i∈N ∈ U が与えられたとき,これを実現する純戦略の組 s ∈ S は一意的に定まるとは限らない.す なわち,u ∈ U に対して, ∀i ∈ N : ui (s) = ui 21 を満たす s ∈ S は一意的に定まるとは限らない.だが,弱パレート最適な u ∈ U に対して,上の条件を満たす任意 の s ∈ S は明らかに弱パレート最適である. 例 1.5 (弱パレート効率性) • 以下の利得行列で表される戦略型ゲームについて考える. 12 s21 s22 s11 5, 5 0, 5 s12 5, 0 2, 2 • 純戦略の組 (s12 , s22 ) は弱パレート効率的ではない.なぜなら,この純戦略の組は他の純戦略の組 (s11 , s21 ) によっ て弱支配されるから.すなわち,(s12 , s22 ) から (s11 , s21 ) へ移行することによって,2 人のプレイヤーの状態を同 時に改善することができる.一方,(s12 , s22 ) 以外の任意の純戦略の組は強パレート効率的である. • 上の戦略型ゲームの実現可能集合は, U = {(u1 (s) , u2 (s)) |s ∈ S } = {(5, 5) , (0, 8) , (8, 0) , (2, 2)} である.利得ベクトルの組 (2, 2) ∈ U は強パレート効率的ではない.なぜなら,この利得ベクトルは他の実現可能 な利得ベクトル (5, 5) ∈ U によって弱支配されるから.すなわち,(2, 2) から (5, 5) へ移行することによって,2 人 のプレイヤーの状態を同時に改善することができる.一方,(2, 2) 以外の任意の実現可能な利得ベクトルの組は強 パレート効率的である. • 上の例では,強パレート効率的な純戦略の組と,強パレート効率的な利得ベクトルが 1 対 1 で対応しているが,こ のような性質は一般的に成り立つとは限らない.例えば,以下の利得行列で表される戦略型ゲームについて考える. 12 s21 s22 s11 5, 5 8, 0 s12 8, 0 2, 2 • 上の新たなゲームにおいて,強パレート効率的な純戦略の組は,先ほどと同様に, (s11 , s21 ) , (s11 , s22 ) , (s12 , s21 ) の 3 つである.一方,このゲームの実現可能集合は, U = {(u1 (s) , u2 (s)) |s ∈ S } = {(5, 5) , (8, 0) , (2, 2)} であるから,強パレート効率的な利得ベクトルは, (5, 5) , (8, 0) の 2 つである.ゆえに,この例では,強パレート効率的な純戦略の組と,強パレート効率的な利得ベクトルが 1 対 1 で対応していない. 22 2 混合拡張 2.1 2.1.1 混合戦略 混合戦略 混合戦略 • 戦略型ゲーム G によって表現される完備情報の静学ゲームにおいて,プレイヤー i の戦略集合 Si は行動集合と一 致するため,プレイヤー i の純戦略とは,Si に含まれる特定の行動を確定的に選択することを意味する.だが,そ れぞれのプレイヤー i が,Si に含まれる行動の中からある確率分布にしたがって特定の行動を選択するような戦略 を考えることもできる.このような戦略を混合戦略(mixed strategy)と呼ぶ. • 具体的には,まず,プレイヤー i が有限 m ∈ N 個の純戦略を持っているものとしよう.すなわち, Si = {si1 , · · · , sim } である.このとき,プレイヤー i の混合戦略とは,Si に属するそれぞれの純戦略 sij ∈ Si (j = 1, · · · , m) に対し て,それが選ばれる確率 σi (sij ) ∈ [0, 1] を指定する確率分布 σi : S i → R として定義される.ただし,確率分布の定義より,σi は以下の性質を満たす: (a) ∀j = 1, · · · , m : 0 ≤ σi (sij ) ≤ 1 m ∑ (b) σi (sij ) = 1 j=1 • 条件 (a) は,混合戦略 σi のもとで Si に属するそれぞれの純戦略が選ばれる確率が 0 以上 1 以下であることを意味 し,条件 (b) は,混合戦略 σi のもとで Si に属するそれぞれの純戦略が選ばれる確率をすべて足すと 1 になること を意味する. • 確率分布 σi : Si → R を指定することは,Si に属するそれぞれの純戦略が選ばれる確率からなるベクトル σi = (σi (si1 ), · · · , σi (sim )) を指定することと実質的に等しい.ゆえに,上のベクトルによって混合戦略を表現してもよい.このベクトルもま た先の条件 (a) , (b) をともに満たす. • n 人のプレイヤーの混合戦略の組を σ = (σ1 , · · · , σn ) で表し,i 以外の n − 1 人のプレイヤーの混合戦略の組を σ−i = (σ1 , · · · , σi−1 , σi+1 , · · · , σn ) で表す.σ = (σi , σ−i ) である. 特殊な混合戦略としての純戦略 • プレイヤー i の純戦略集合を Si とするとき,プレイヤー i のある純戦略 si ∈ Si は,純戦略 si にのみ確率 1 を付与 し,Si に含まれる他の任意の純戦略に対して確率 0 を付与する混合戦略と実質的に等しい. 23 • ゆえに,純戦略は特別な混合戦略であり,逆に,純戦略を一般化した概念が混合戦略であると言える. 例 2.1 (混合戦略) • 以下の利得行列で表されるゲームについて考える. 12 C D C 5, 5 0, 8 D 8, 0 2, 2 • プレイヤー i (= 1, 2) の純戦略集合はともに Si = {C, D} であるから,その混合戦略は, (a) 0 ≤ σi (C) ≤ 1 (b) 0 ≤ σi (D) ≤ 1 (c) σi (C) + σi (D) = 1 を満たす確率分布 σi : Si → R である. • 例えば,C と D を等確率で選択するというプレイヤー i の混合戦略 σi は, ( (σi (C), σi (C)) = 1 1 , 2 2 ) と表現されるが,実際には,純戦略は C, D の 2 つだけであるから,σi (C) さえ与えられれば, σi (D) = 1 − σi (C) と言う形で σi (D) は特定されるので,このゲームにおけるプレイヤー i の混合戦略を指定するためには,プレイヤー i が C を選ぶ確率のみを指定すればよい.このような事情を踏まえた上で,このようなゲームにおいては σi = σi (C) としてもよい.このとき,σi (D) = 1 − σi となる. 2.1.2 混合戦略集合 混合戦略集合 • 戦略型ゲーム G によって表現される完備情報の静学ゲームにおいて,有限な戦略集合 Si = {si1 , · · · , sim } (m ∈ N) を持つプレイヤー i が選択可能なすべての混合戦略 σi : Si → R からなる集合を, ¯ ¯∑ m ¯ ∆ (Si ) = (σ1i , · · · , σmi ) ∈ Rm ¯¯ σij = 1, ∀j = 1, · · · , m : 0 ≤ σji ≤ 1 ¯ j=1 で表し,これを戦略集合Si の混合拡張(mixed extension of Si )や混合戦略集合(mixed strategy set)などと呼ぶ. • つまり,純戦略集合 Si の混合拡張 ∆ (Si ) とは,Si 上の確率分布をすべて集めてできる集合である.σi ∈ ∆ (Si ) で ある. 24 • すべてのプレイヤーの戦略集合の混合拡張の直積を ∆ (S) = ∆ (S1 ) × · · · × ∆ (Sn ) で表す.また,∆ (S−i ) = ∆ (S1 ) × · · · × ∆ (Si−1 ) × ∆ (Si+1 ) × · · · × ∆ (Sn ) で表す.σ ∈ ∆ (S) , σ−i ∈ ∆ (S−i ) である. • 多くの場合,各プレイヤーの混合戦略に相当する確率分布 σ1 , · · · , σn は統計的に互いに独立と仮定する.ただし, プレイヤーの混合戦略どうしが相関を持つケースについて考察する場合もある. • ある集合上に定義される確率分布は無限通り存在する.つまり,戦略集合 Si が有限集合である場合でも,Si 上の 確率分布は無限通り存在するため,∆ (Si ) は無限集合になる.つまり,プレイヤーが混合戦略を選択する場合には, プレイヤーは無限個の選択肢に直面することになる. • 純戦略集合 Si が無限集合の場合には,混合戦略は無限集合上の確率分布として定義されるので,扱いが面倒にな る.このような面倒を回避するため,多くの場合,すべてのプレイヤーの純戦略集合 S1 , · · · , Sn は有限集合である と仮定する. 基本単体としての混合戦略集合 • 有限ゲームにおいては,それぞれのプレイヤーは有限個の純戦略を持つ.そこで,プレイヤー i が有限 m ∈ N 個 の純戦略を持つ場合について考えよう.すなわち,Si = {si1 , · · · , sim } である.この場合のプレイヤー i の混合戦 ¯ ¯∑ m ¯ σij = 1 , ∀j = 1, · · · , m : 0 ≤ σji ≤ 1 ∆ (Si ) = (σ1i , · · · , σmi ) ∈ Rm ¯¯ ¯ 略集合は, j=1 となる.m 次元ユークリッド空間 Rm のこのような集合を,m − 1 次元の基本単体(standard m − 1 simplex)と 呼ぶ. • 例えば,プレイヤー i が有限 2 個の純戦略を持つ場合の混合戦略集合に相当する 1 次元の基本単体は, { } ∆ (Si ) = (σ1i , σ2i ) ∈ R2 |σ1i + σ2i = 1, ∀j = 1, 2 : 0 ≤ σji ≤ 1 となり,これは左下図において実線で描かれた線分として図示できる.ただし,端点を含む. σ3i σ2i 1 1 σ2i 1 0 0 1 σ1i 【1 次元の基本単体】 1 【2 次元の基本単体】 25 σ1i • また,プレイヤー i が有限 3 個の純戦略を持つ場合の混合戦略集合に相当する 2 次元の基本単体は, { } ∆ (Si ) = (σ1i , σ2i , σ3i ) ∈ R3 |σ1i + σ2i + σ3i = 1 , ∀j = 1, 2, 3 : 0 ≤ σji ≤ 1 となり,これは右上図においてグレーの領域として描かれている.ただし,境界も含む. • 図から明らかであるように,これらはいずれも非空な凸のコンパクト集合である.任意の有限次元についても同様 の性質が成り立つことを後ほど示すが,基本単体である混合戦略集合が満たすこれらの性質は,後にナッシュ均衡 の存在を証明する際で重要な役割を果たす(第 3.4 節). 2.1.3 非空性 混合戦略集合は非空集合 • 有限ゲームの混合拡張における混合戦略集合が基本単体であることを先に指摘し,1 次元ないし 2 次元の場合には 非空性,凸性,コンパクト性を満たすことを視覚的に確認したが,以下では,これらの性質が任意の有限次元に関 して成り立つことを示しておこう. • まず,有限ゲームの混合拡張における混合戦略集合は非空集合である. 命題 2.1 有限ゲーム G において,任意のプレイヤー i ∈ N の混合戦略集合 ∆ (Si ) は非空集合である. • つまり,プレイヤーの純戦略の個数が有限であれば,そのプレイヤーは少なくとも 1 つの混合戦略を持つというこ とである. 証明: • 有限ゲーム G において,プレイヤー i ∈ N が有限 m ∈ N 個の純戦略を持っているものとする.すなわち,Si = {si1 , · · · , sim } である. • このとき,プレイヤー i の混合戦略集合は, ¯ ¯∑ m ¯ σij = 1, ∀j = 1, · · · , m : 0 ≤ σji ≤ 1 ∆ (Si ) = (σ1i , · · · , σmi ) ∈ Rm ¯¯ ¯ j=1 となるが,これは明らかに非空集合である.実際,例えば, (1, 0, · · · , 0) ∈ ∆ (Si ) である. • 一般に,非空集合どうしの直積もまた非空集合である.ゆえに,上の命題から以下が導かれる. 26 系 2.1 有限ゲーム G において,すべてのプレイヤーの混合戦略集合の直積 ∆ (S) = ∆ (S1 ) × · · · × ∆ (Sn ) は非空集合 である. • つまり,すべてのプレイヤーの純戦略の個数が有限であれば,すべてのプレイヤーは少なくとも 1 つの混合戦略を 持っているため,ゆえに,全員の混合戦略の組が少なくとも 1 つは存在するということである. 2.1.4 凸性 混合戦略集合は凸集合 • 有限ゲームの混合拡張における混合戦略集合は凸集合である. 命題 2.2 有限ゲーム G における任意のプレイヤー i ∈ N の混合戦略集合 ∆ (Si ) は凸集合である. • つまり,プレイヤーが選択可能な混合戦略を任意に 2 つ選んだとき,混合戦略は確率分布であるからそれらを所与 の割合で混ぜることができるが,どのような割合で混ぜた場合でも,そこから得られるものはやはり選択可能な混 合戦略であるということである. • 例えば,あるプレイヤーが 2 つの純戦略を持つとき,2 つの混合戦略 これらを 3 : 1 の割合で混ぜると, 3 4 ( 1 1 , 2 2 ) + 1 4 ( 1 2 , 3 3 ) ( = (1 1 2, 2 11 13 , 24 24 ) (1 2) , 3 , 3 を適当に選んだ上で,例えば ) となるが,これは確率分布としての条件を満たしているため混合戦略である.上の命題は,このような性質が任意 の 2 つの混合戦略を任意の割合で混ぜた場合にも成立すると主張している. 証明: • 有限ゲーム G において,プレイヤー i ∈ N が有限 m ∈ N 個の純戦略を持っているものとする.すなわち,Si = {si1 , · · · , sim } である.このときのプレイヤー i の混合戦略集合は, ¯ ¯∑ m ¯ ∆ (Si ) = (σ1i , · · · , σmi ) ∈ Rm ¯¯ σij = 1, ∀j = 1, · · · , m : 0 ≤ σji ≤ 1 ¯ j=1 となる. • 2 つの混合戦略 ai = (a1i , · · · , ami ) , bi = (b1i , · · · , bmi ) ∈ ∆ (Si ) を任意にとる.すると混合戦略の定義より, (a) (b) (c) (d) m ∑ j=1 aij = 1 ∀j = 1, · · · , m : 0 ≤ aji ≤ 1 m ∑ bij = 1 j=1 ∀j = 1, · · · , m : 0 ≤ bji ≤ 1 27 などがいずれも成り立つが,このとき,上で任意にとった ai , bi ∈ ∆ (Si ) と任意の t ∈ [0, 1] に対して, tai + (1 − t) bi ∈ ∆ (Si ) (1) を示せば ∆ (Si ) が凸であることを言える. • まず,上でとった任意の ai , bi , t に対して, tai + (1 − t) bi = (ta1i + (1 − t) b1i , · · · , tami + (1 − t) bmi ) となるが,このベクトルの第 j (= 1, · · · , m) 成分については,(b) , (d) より, taji + (1 − t) bji ≥ 0 (2) が成り立つ.また, m ∑ [taji + (1 − t) bji ] = t j=1 m ∑ aji + (1 − t) j=1 = t + (1 − t) m ∑ bij j=1 ∵ (b) , (d) =1 (3) である. • ∆ (Si ) の定義を踏まえると,(2) , (3) は (1) を含意する.ゆえに,目標は達成された. • 一般に,有限個の凸集合どうしの直積もまた凸集合である.ゆえに,上の命題から以下が導かれる. 系 2.2 有限ゲーム G において,すべてのプレイヤーの混合戦略集合の直積 ∆ (S) = ∆ (S1 ) × · · · × ∆ (Sn ) は凸集合で ある. • つまり,すべてのプレイヤーの混合戦略の組を 2 つ任意に選び,それらを任意の割合で混ぜると,それもまたプレ イヤーたちの混合戦略の組になる. 2.1.5 コンパクト性 混合戦略集合はコンパクト集合 • 有限ゲームの混合拡張における混合戦略集合はコンパクト集合である. 命題 2.3 有限ゲーム G における任意のプレイヤー i の混合戦略集合 ∆ (Si ) はコンパクト集合である. 28 証明: • 有限ゲームにおいて,プレイヤー i ∈ N が有限 m ∈ N 個の純戦略を持っているものとする.すなわち,Si = {si1 , · · · , sim } である.このときのプレイヤー i の混合戦略集合は, ¯ ¯∑ m ¯ ∆ (Si ) = (σ1i , · · · , σmi ) ∈ Rm ¯¯ σij = 1, ∀j = 1, · · · , m : 0 ≤ σji ≤ 1 ¯ j=1 となる. • ∆ (Si ) は明らかに有界である.実際,例えば,m 次元の直方体 [0, 1] × · · · × [0, 1] が存在して, ∆ (Si ) ⊂ [0, 1] × · · · × [0, 1] とすることができる. • また,∆ (Si ) は ≤ を用いて定義されており,ゆえにその境界点はすべて ∆ (Si ) に属することから,∆ (Si ) は明ら かに閉集合となる. • ∆ (Si ) は有界な閉集合であることが示されたが,これは ∆ (Si ) がコンパクト集合であることを意味する. • 一般に,コンパクト集合どうしの直積もまたコンパクト集合である.ゆえに,上の命題は以下の系を含意する. 系 2.3 有限ゲーム G において,すべてのプレイヤーの混合戦略集合の直積 ∆ (S) = ∆ (S1 ) × · · · × ∆ (Sn ) はコンパク ト集合である. 2.2 2.2.1 期待利得 期待利得 クジとしての混合戦略の組 • 完備情報の静学ゲームにおいてプレイヤーたちが純戦略を採用すると,全員の純戦略の組に対してゲームのルール は一意的な結果を定める.それぞれのプレイヤーは他のプレイヤーが選ぶ純戦略を事前に観察できないため,どの 結果が実現するかは自身が意志決定を行う時点においては不明ではあるが,ひとたび全員の純戦略が明らかになれ ば,それに対して 1 つの結果が確定的に定まる.したがって,それぞれのプレイヤーが直面し得る状況の数は,純 戦略の組の数に等しい.このような事情を背景として,すべてのプレイヤーが純戦略を採用する場合には,プレイ ヤーは純戦略の組どうしを比較する選好関係を持っているものとみなした(第 1.2.3 節). • 一方,プレイヤーたちが混合戦略を採用する場合には話がやや複雑になる.なぜなら,ゲームのルールは相変わら ず純戦略の組に対して一意的な結果を定めるが,プレイヤーたちが混合戦略を採用する場合には,全員の混合戦略 の組に対して実現する純戦略の組が一意的に定まらず,ゆえに,混合戦略の組に対して実現する結果が一意的には 29 定まらないからである.このような事情を踏まえた上で,プレイヤーが混合戦略を選ぶ場合にはプレイヤーの選好 関係をどのように定義すべきか以下で考えよう. • ゲームのルールは純戦略の組に対して一意的な結果を定めるので,ゲームにおいて起こりすべての結果からなる集 合は,すべての純戦略の組からなる集合 S = S1 × · · · × Sn と 1 対 1 で対応する.ゆえに,S を結果集合と同一視できる.さて,プレイヤーたちが混合戦略の組を選ぶ場合に は,S の中のどの純戦略の組が実際に起こるかは不確実だが,純戦略のそれぞれの組がどの程度の確率で起こるか は客観的に知り得る.具体的には,プレイヤー i が混合戦略 σi のもとで純戦略 si を選ぶ確率は σi (si ) であるから, 混合戦略の組 σ = (σ1 , · · · , σn ) のもとで,ある純戦略の組 s = (s1 , · · · , sn ) が実現する確率を, σ (s) = n ∏ σj (sj ) = σ1 (s1 ) × · · · × σn (sn ) j=1 で表す. • 繰り返しになるが,混合戦略の組 σ が与えられれば,それぞれの純戦略の組 s が実現する確率 σ (s) を計算できる. ゆえに,純戦略のすべての組からなる集合 S とある混合戦略の組 σ が与えられれば,σ のもとで S に属するそれ ぞれの純戦略の組が実現する確率からなるベクトル (σ (s))s∈S を特定できる.ただし,このベクトルは以下の条件を満たす: (a) (b) ∀s ∈ S : 0 ≤ σ (s) ≤ 1 ∑ σ (s) = 1 s∈S つまり,(σ (s))s∈S は S 上の確率関数に他ならない. • 純戦略のすべての組からなる集合 S と,混合戦略の組 σ ∈ ∆ (S) から確率関数 (σ (s))s∈S は特定されるが,S と (σ (s))s∈S の組 ( ) S, (σ (s))s∈S をクジ(lottery)と呼ぶ.つまり,クジとは,起こり得るすべての結果からなる集合 S と,それぞれの結果が起こ る確率を特定する S 上の確率分布 (σ (s))s∈S からなる組であり,これは S とある σ のもとでプレイヤーが直面す る不確実な状況を表現する概念である. • 結果集合 S が与えられたとき,プレイヤーたちが選択する混合戦略の組 σ が変化すれば,S 上の確率関数 (σ (s))s∈S もまた変化するため,プレイヤーが直面する不確実な状況を表すクジも変化する.ゆえに,混合戦略の組とクジは 1 対 1 で対応しているため,S が所与の場合には,混合戦略の組をクジと同一視できる. クジを比較する選好関係 • 繰り返しになるが,結果集合 S を所与とするとき,プレイヤーたちの混合戦略の組 σ が変化すれば,S 上の確率関 数 (σ (s))s∈S もまた変化するため,プレイヤーは以前とは異なる不確実な状況に直面する.それゆえ,プレイヤー 30 たちが戦略型ゲームの混合拡張において意志決定をする際には,それぞれのプレイヤーは,自分が直面し得る不確 実な状況どうしを比較せざるを得ない.つまり,プレイヤーはクジを比較する選好を持つ.さらに言えば,混合戦 略の組に対してクジは 1 つずつ定まるため,結局,プレイヤーがクジどうしを比較する選好は,ゲームにおいて起 こり得る混合戦略の組どうしを比較する ∆ (S) 上の選好関係とみなすことができる. • 具体的には,混合拡張 G∗ においてプレイヤー i が直面し得る不確実な状況どうしを比較する選好関係は,混合戦略 のすべての組からなる集合 ∆ (S) 上の二項関係 %i として定式化される.その上で,2 つの混合戦略の組 σ, σ ′ ∈ ∆ (S) に対して, σ %i σ ′ ( ) が成り立つ場合には,プレイヤー i は σ のもとで直面する不確実な状況を表すクジ S, (σ (s))s∈S を,σ ′ のもとで ( ) 直面する不確実な状況を表すクジ S, (σ ′ (s))s∈S 以上に好ましいと考えているものと解釈する. 期待利得関数 • プレイヤー i の ∆ (S) 上の選好 %i と,関数 Fi : ∆ (S) → R が与えられたとき,任意の混合戦略の組 σ, σ ′ ∈ ∆ (S) に対して, σ % σ ′ ⇔ Fi (σ) ≥ Fi (σ ′ ) という関係が成り立つならば,Fi のことを %i を表す期待利得関数(expected utility function)と呼ぶ.さらに, プレイヤー i の期待利得関数 Fi が混合戦略の組 σ に対して定める値 Fi (σ) を,プレイヤー i が σ から得る期待利 得(expected utility)と呼ぶ. • 一般に,プレイヤーがクジどうしを比較する期待利得関数は存在するとは限らないが,選好関係に関して一定の仮 定をおけば,期待利得関数の存在を保証できる.さらにそのとき,期待利得関数は以下の形状を持つ2 . Fi (σ) = ∑ s∈S = ∑ s1 ∈S1 n ∏ σj (sj ) · ui (s) j=1 ∑ ··· [{σ1 (s1 ) × · · · × σn (sn )} · ui (s1 , · · · , sn )] sn ∈Sn ただし,ui : S → R はプレイヤー i が純戦略の組どうしを比較する利得関数である. • 期待利得関数の意味を考えよう.まず,プレイヤーたちが混合戦略を採用する場合には,すべてのプレイヤーの混 合戦略の組 σ = (σ1 , · · · , σn ) ∈ ∆ (S1 ) × · · · × ∆ (Sn ) = ∆ (S) が得られる.プレイヤー i が混合戦略 σi のもとで純戦略 si ∈ Si を選ぶ確率は σi (si ) であるから,混合戦略の組 σ = (σ1 , · · · , σn ) のもとで,ある純戦略の組 s = (s1 , · · · , sn ) が実現する確率は, σ (s) = n ∏ σj (sj ) = σ1 (s1 ) × · · · × σn (sn ) j=1 2 詳細な議論は,期待効用理論のテキスト(http://)を参照せよ. 31 である.さらに,この組 s においてプレイヤー i は利得 ui (s) を得るので,σ のもとでプレイヤー i が s から得る 利得の期待値は, n ∏ σj (sj ) · ui (s) j=1 となる.これをすべての純戦略の組 s ∈ S に関して求めた上でそれらをすべて足し合わせれば,σ のもとでのプレ イヤー i の期待利得が, Fi (σ) = ∑ n ∏ σj (sj ) · ui (s) j=1 s∈S として得られる.これはプレイヤー i が混合戦略の組 σ から得る期待利得に他ならない. 例 2.2 (期待利得) • 以下の利得行列で表されるゲームについて考える.ただし,A, B はプレイヤー 1, 2 が共有する純戦略である. 1r2 A B A −1, 1 1, −1 B 1, −1 −1, 1 • プレイヤーが適当に定めた確率分布にしたがって A か B を選ぶならば,その確率分布が混合戦略に相当する.そ こで,プレイヤー i (= 1, 2) の混合戦略を σi = (σi , 1 − σi ) (0 ≤ σi ≤ 1) で表す.ただし,σi は混合戦略 σi のもと でプレイヤー i が A を選ぶ確率 σi (A) である. • 2 人が混合戦略を用いるときに,純戦略の各組が選ばれる確率は以下の通り.これは利得の確率分布に相当する. 1r2 A B A σ 1 σ2 σ1 (1 − σ2 ) B (1 − σ1 )σ2 (1 − σ1 )(1 − σ2 ) • プレイヤー 1 が効用 1 を得る確率は σ1 (1 − σ2 ) + (1 − σ1 )σ2 であり,効用 −1 を得る確率は σ1 σ2 + (1 − σ1 )(1 − σ2 ) であり,それ以外の確率は 0 であるから,混合戦略の組 (σ1 , σ2 ) におけるプレイヤー 1 の期待利得は, F1 (σ1 , σ2 ) = 1 · {σ1 (1 − σ2 ) + (1 − σ1 )σ2 } + (−1){σ1σ2 + (1 − σ1 )(1 − σ2 )} = − (2σ1 − 1) (2σ2 − 1) となる. • プレイヤー 2 が効用 1 を得る確率は σ1 σ2 + (1 − σ1 )(1 − σ2 ) であり,効用 −1 を得る確率は σ1 (1 − σ2 ) + (1 − σ1 )σ2 であり,それ以外の確率は 0 であるから,混合戦略の組 (σ1 , σ2 ) におけるプレイヤー 2 の期待利得は, F2 (σ1 , σ2 ) = 1 · {σ1 σ2 + (1 − σ1 )(1 − σ2 ))} + (−1){σ1 (1 − σ2 ) + (1 − σ1 )σ2 } = (2p1 − 1) (2p2 − 1) となる. 32 • 例えば,1 が混合戦略 σ1 = ( 12 , 12 ) を選び,2 が混合戦略 σ2 = ( 13 , 23 ) を選ぶとき,この混合戦略の組 (σ1 , σ2 ) にお ける両者の期待利得は以下の通りである. ( )( 1 F1 (σ1 , σ2 ) = − 2 · − 1 2· 2 ( )( 1 F1 (σ1 , σ2 ) = − 2 · − 1 2· 2 2.2.2 ) 1 −1 =0 3 ) 1 −1 =0 3 連続性 期待利得関数の連続性 • 期待利得関数は連続関数である.ちなみに,後ほど詳しく説明するが,期待利得関数が連続であるという事実は, 後に混合最適反応対応が非空値をとること(第 3.2.2 節)や,混合最適反応対応の直積から構成される対応が上半 連続であること(第 3.2.4 節)を示すための布石となる.また,混合最適反応対応が満たすこれらの性質は,ナッ シュ均衡の存在を証明する際に役に立つ(第 3.4 節). 命題 2.4 任意のプレイヤー i の期待利得関数 Fi : ∆ (S) → R は ∆ (S) 上の連続関数である. 証明: • プレイヤー i の期待利得関数 Fi : ∆ (S) → R の変数 σ ∈ ∆ (S) は,プレイヤーたちの混合戦略の組 σ = (σ1 , · · · , σn ) ∈ ∆ (S1 ) × · · · × ∆ (Sn ) であるが,これはさらに, ( ) σ = (σ1 (s1 ))s1 ∈S1 , · · · , (σn (sn ))sn ∈Sn (1) という,|S1 | × · · · × |Sn | 個の成分からなるベクトルに他ならない. • 上の混合戦略の組 σ に対して,期待利得関数 Fi が定める値は, Fi (σ) = ∑ s∈S n ∏ σj (sj ) · ui (s) j=1 であり,これは,(1) の |S1 | × · · · × |Sn | 個の成分を変数とし,各項の係数が ui (s) であるような特別な多項式であ る3 .一般に,多項式は連続関数であるから,Fi (σ) もまた ∆ (S) 上で連続である. 3 多変数の多項式の連続性については,ユークリッド空間に関するテキスト(https://sites.google.com/site/ikuboyuta/note/euclideanspace)を 参照せよ. 33 2.3 2.3.1 混合戦略均衡 混合拡張 戦略型ゲームの混合拡張 ) ( • 完備情報の静学ゲームを表現する戦略型ゲーム G = N, {Si }i∈N , {ui }i∈N において,それぞれのプレイヤー i が 混合戦略 σi を選択するとき,プレイヤーたちが選択するそれぞれの混合戦略の組 σ = (σ1 , · · · , σn ) に対して,そ こからプレイヤー i が得る期待利得は,期待利得関数 Fi : ∆ (S) → R が定める値 Fi (σ) ∈ R として定まる. • このような状況は,もとの戦略型ゲーム G と同様のプレイヤー集合 N ,すべてのプレイヤーの混合戦略の組 ∆ (S) = {∆ (Si )}i∈N ,すべてのプレイヤーの期待利得関数の組 F = {Fi }i∈N の 3 つの要素 ( ) G∗ = N, {∆ (Si )}i∈N , {Fi }i∈N によって集約的に表現される.これを G の混合拡張(mixed extension)と呼ぶ. • 完備情報の静学ゲームにおいては,それを表す戦略型ゲーム G のすべての要素が共有知識であるだけでなく,G の 要素から間接的に定義される混合戦略の組 ∆ (S) = {∆ (Si )}i∈N や期待利得関数の組 {Fi }i∈N もまた共有知識とさ れる.ゆえに,G の混合拡張 G∗ のすべての要素もまた共有知識である. • ゲームの静学性より,プレイヤーたちの意志決定は以下の手順で進行する: 1. それぞれのプレイヤー i ∈ N は,自身が選択可能な混合戦略の集合 ∆ (Si ) の中から特定の混合戦略 σi ∈ ∆ (Si ) を同時に選択する. 2. プレイヤーたちが選択した混合戦略の組 σ = (σ1 , · · · , σn ) に対して,それぞれの純戦略の組(すなわち行動 の組)が実現する確率分布が定まるが,ゲームのルールはそれぞれの純戦略の組に対する結果を定めるので, 結局,それぞれの結果が実現する確率分布が定まる. 3. 結果の確率分布に応じて,それぞれのプレイヤー i の期待利得 Fi (σ) が定まる. • つまり,完備情報の静学ゲームを表す戦略ゲーム G においてプレイヤーが混合戦略を選択可能である場合にはプレ イヤーたちは G の混合拡張 G∗ に直面するが,このとき,G∗ のすべての要素はプレイヤーたちの共有知識である が,それぞれのプレイヤーはそこで他のプレイヤーたちがどの混合戦略を選択するかを事前に観察することはでき ない. 2.3.2 期待効用仮説 期待効用仮説 • 繰り返しになるが,プレイヤーの行動原理に関して合理性を仮定することは,プレイヤーが自己の利益を最大化す るために最適な行動を選択することを意味するが,特に,完備情報の静学ゲームを表す戦略ゲームにおいてプレイ ヤーたちが純戦略を選択する場合には,合理性の仮定とは,それぞれのプレイヤーが他のプレイヤーたちが選択す る純戦略のそれぞれの組に対して,自分のそれぞれの純戦略がもたらす利得を計算する能力を備えており,その計 算にもとづいて,自身の利得を最大化するような純戦略を選択することを仮定することを意味するのであった. 34 • さらに,完備情報の静学ゲームにおいてプレイヤーが混合戦略を選択可能である場合に合理性の仮定を満たすため には,より具体的に以下を仮定する必要があるため,その場合の合理性を以下の条件によって定義することもでき る.混合戦略の可能性を考慮したこのような合理性の仮定を期待効用仮説(expected utility hypothesis)と呼ぶ: 1. それぞれのプレイヤーは自分がプレーしているゲーム G において起こり得るすべての事象を把握しているも のとする.具体的には,それぞれのプレイヤーはすべてのプレイヤーの行動集合の直積すなわち純戦略集合の 直積 S = S1 × · · · × Sn に属するすべての要素を把握している. 2. それぞれのプレイヤーはプレイヤーたちの混合戦略のそれぞれの組のもとで,それぞれの事象 s ∈ S が起こ る確率を特定する確率分布を把握している. 3. それぞれのプレイヤーはゲームにおいて起こり得るそれぞれの事象 s ∈ S から自身が得る利得 ui (s) ∈ R を把 握しており,さらに先の確率分布を踏まえた上で,それぞれの混合戦略の組 σ ∈ ∆ (S) のもとで自分が得る期 待利得 Fi (σ) ∈ R を計算することができ,その上で,自身の期待利得を最大化するような混合戦略 σi ∈ ∆ (Si ) を選択する. • 期待効用仮説を仮定することは,プレイヤーは起こり得る事象 S を把握する情報収集能力を持ち,また,意志決定 を行う時点において利用可能な情報をすべて活用し,さらに,他のプレイヤーたちが選択する混合戦略のそれぞれ の組に対して,自分のそれぞれの混合戦略がもたらす期待利得を計算する能力を備えていることを暗に仮定してい ることになる. • 多くの場合,期待効用仮説はプレイヤーの合理性は相互知識であると仮定される.すなわち,すべてのプレイヤー が期待効用仮説にもとづいて意志決定することをすべてのプレイヤーが知っているものと仮定する.さらに,期待 効用仮説を共有知識と仮定する場合もある.つまり,すべてのプレイヤーが期待効用仮説にもとづいて意志決定す ることをすべてのプレイヤーが知っており,なおかつ,その事実をすべてのプレイヤーが知っており,· · · ,という 仮定を無限に積み重ねる場合もある. 2.3.3 混合戦略均衡 混合拡張における均衡 • 完備情報の静学ゲームを表現する戦略型ゲーム G の混合拡張 G∗ に直面したプレイヤー i は,期待効用仮説のもと では,自身が選択可能な混合戦略の集合 ∆ (Si ) の中から,自身の期待利得を最大化する混合戦略 σi∗ ∈ ∆ (Si ) を選ぶ.このような混合戦略 σi∗ が混合戦略を許容した場合のプレイヤー i の最適戦略である. • プレイヤーたちが最適戦略を選ぶ目的は自身の期待利得の最大化だが,戦略型ゲーム G の場合と同様に混合拡張 G∗ の場合においても,最適戦略の具体的な内容はゲーム G∗ の要素とは別に外生的に与える必要がある.つまり, ゲームの分析家は最適戦略の意味をあらかじめ規定した上で,そこで規定された最適戦略の概念のもとでプレイ ヤーたちが具体的にどのように振る舞い,そこからどのような結果がもたらされるかを分析しようとする. 35 • 混合拡張 G∗ における最適戦略の意味を規定することとは,ゲーム G∗ に対して最適戦略の組 σ ∗ = (σ1∗ , · · · , σn∗ ) ∈ ∆ (S) を定める概念を外生的に与えることを意味する.そのような概念が G∗ の均衡概念や解の概念であり,均衡を個性 する個々の最適戦略 σ1∗ , · · · , σn∗ が均衡戦略である. • ゲーム G∗ に対して均衡概念が均衡 σ ∗ を定めると,そのときにそれぞれの純戦略の組 s ∈ S が実現する確率を規定 する確率分布が定まる.さらに,それぞれの純戦略の組 s に対してゲームのルールはゲームの結果を定めるので, 結局,均衡 σ ∗ が与えられるとそのときにそれぞれの結果が実現する確率を規定する確率分布が定まる.そのよう な確率分布が G∗ の均衡結果に相当する. • 混合拡張 G∗ における均衡 σ ∗ と,任意のプレイヤー i の期待利得関数 Fi : ∆ (S) → R が与えられたとき,G∗ の均 衡結果においてプレイヤー i が得る期待利得は, Fi (σ ∗ ) ∈ R となる.さらに,均衡結果からプレイヤーたちが得る期待利得の組を, F ∗ = (F1 (σ ∗ ) , · · · , Fn (σ ∗ )) ∈ Rn で表す. • 戦略型ゲーム G の場合と同様に,その混合拡張 G∗ における均衡概念とは,それぞれのゲーム G∗ に対してそこで の均衡 σ ∗ を定める写像として定式化される.ただし,ある均衡概念を定めたとき,その均衡概念のもとで,任意 の混合拡張に対して均衡は存在するとは限らない.また,均衡が存在する場合にも,それは一意的に定まるとは限 らない.したがって,より正確には,均衡概念とはそれぞれの混合拡張に対して,そこでの均衡の集合を定める対 応と定義される. 2.4 2.4.1 パレート効率性 強パレート効率性 強パレート効率的な純戦略の組 • 戦略型ゲーム G の混合拡張 G∗ において,2 つの混合戦略の組 σ, σ ′ ∈ ∆ (S) の間に, (a) ∀i ∈ N : Fi (σ) ≥ Fi (σ ′ ) (b) ∃i ∈ N : Fi (σ) > Fi (σ ′ ) という関係がともに成り立つならば,σ は σ ′ を弱パレート支配する(weakly Pareto dominate)すると言う.ま た,ある混合戦略の組 σ が他のいかなる混合戦略の組によっても弱パレート支配されないならば,σ は強パレート 効率的(strongly Pareto efficient)であるとか強パレート最適(strongly Pareto optimal)であると言う. 36 • 強パレート効率的な混合戦略の組 σ が与えられたとき,それに対して, Fi (σ) > Fi (σ ′ ) を満たす混合戦略の組 σ ′ とプレイヤー i を任意にとる.強パレート効率性の定義より,σ ′ は σ を弱パレート支配 しないことから, ∀j ∈ N : Fj (σ) ≥ Fj (σ ′ ) は成り立たない.すなわち, ∃j ∈ N : Fj (σ ′ ) > Fj (σ) が成り立つ.つまり,強パレート効率的な混合戦略の組 σ を基準に,あるプレイヤー i の状態を改善させようとす ると,他の少なくとも 1 人のプレイヤー j の状態が悪化する. 例 2.3 (強パレート効率性) • 以下の利得行列で表される戦略型ゲームについて考える. 12 s21 s22 s11 5, 5 0, 8 s12 8, 0 2, 2 • 上のゲームにおいて,純戦略の組 (s12 , s22 ) は強パレート効率的ではない.なぜなら,(s12 , s22 ) は他の純戦略の組 (s11 , s21 ) によって支配されるから.すなわち,(s12 , s22 ) から (s11 , s21 ) へ移行することによって,2 人のプレイヤー の状態を同時に改善することができる.一方,(s12 , s22 ) 以外の純戦略の組を任意に選んだとき,そこを基準として 他の任意の純戦略の組へ移行すると,少なくとも 1 人のプレイヤーの利得は減少する.ゆえに,(s12 , s22 ) 以外の純 戦略の組 (s11 , s21 ) , (s11 , s22 ) , (s12 , s21 ) はいずれも強パレート効率的である. • 続いて,以下の利得行列で表される戦略型ゲームについて考える. 12 s21 s22 s11 5, 5 0, 5 s12 5, 0 2, 2 • この新たなゲームにおいても,(s12 , s22 ) は (s11 , s21 ) によって弱支配されるため,(s12 , s22 ) は強パレート効率的で はない.続いて,(s11 , s22 ) について考えよう.例えば,そこから (s11 , s21 ) へ移行すると,プレイヤー 2 の利得は 変化せず 5 のままだが,プレイヤー 1 の利得は 0 から 5 へ増加する.ゆえに,(s11 , s21 ) は (s11 , s22 ) を弱支配する ため,(s11 , s22 ) は強パレート効率的ではない.同様に,(s11 , s21 ) は (s12 , s21 ) を弱支配するため,(s12 , s21 ) もまた 強パレート効率的ではない.ゆえに,強パレート効率的な純戦略の組は (s11 , s21 ) だけである. 弱パレート効率的な純戦略の組 37 • 戦略型ゲーム G において,2 つの純戦略の組 s, s′ ∈ S の間に, ∀i ∈ N : ui (s) > ui (s′ ) という関係が成り立つならば,s は s′ を強パレート支配する(strongly Pareto dominate)すると言う.また,ある 純戦略の組 s が他のいかなる純戦略の組によっても強パレート支配されないならば,s は弱パレート効率的(weakly Pareto efficient)であるとか弱パレート最適(weakly Pareto optimal)であると言う. • 弱パレート効率的な純戦略の組 s が与えられたとき,それに対して, ui (s) > ui (s′ ) を満たす純戦略の組 s′ とプレイヤー i を任意にとる.弱パレート効率性の定義より,s′ は s を強パレート支配しな いことから, ∀j ∈ N : uj (s) > uj (s′ ) は成り立たない.すなわち, ∃j ∈ N : uj (s′ ) ≥ uj (s) が成り立つ.つまり,弱パレート効率的な純戦略の組 s を基準に,あるプレイヤー i の状態を改善させようとする と,他の少なくとも 1 人のプレイヤー j の状態が改善されない. 例 2.4 (弱パレート効率性) • 以下の利得行列で表される戦略型ゲームについて考える. 12 s21 s22 s11 5, 5 0, 5 s12 5, 0 2, 2 • まず,純戦略の組 (s12 , s22 ) は別の純戦略の組 (s11 , s21 ) によって強支配されるため,弱パレート効率的ではない. (s12 , s22 ) 以外の純戦略の組を任意に選んだとき,そこから他の任意の純戦略の組へ移行しても,2 人の利得を同時 に増加させることはできないため,これらはいずれも弱パレート効率的である. 強パレート効率性と弱パレート効率性の関係 • 繰り返しになるが,戦略型ゲーム G において純戦略の組 s が強パレート効率であることは,s を基準にあるプレ イヤー i の状態を改善させようとすると,他の少なくとも 1 人のプレイヤーの状態が悪化することを意味する.ま た,プレイヤーの状態が悪化することは,そのプレイヤーの状態が改善されないことを含意する.ゆえに,s が強 パレート効率であることは,s を基準にあるプレイヤー i の状態を改善させようとすると,他の少なくとも 1 人の プレイヤーの状態が改善されないことを含意するが,これは s が弱パレート最適であることの定義に他ならない. ゆえに,強パレート効率的な純戦略の組は弱パレート効率的でもある. 38 ( ) 命題 2.5 戦略型ゲーム G = N, {Si }i∈N , {ui }i∈N において,純戦略の組 s ∈ S が強パレート効率的であるならば,s は弱パレート効率的でもある. • 上の命題の逆は成立するとは限らない.つまり,弱パレート効率的な純戦略の組は強パレート効率的であるとは限 らない.例えば,以下の利得行列で表されるゲームについて考える. 12 s21 s22 s11 5, 5 0, 5 s12 5, 0 2, 2 • 先に確認したように,純戦略の組 (s11 , s21 ) は強パレート最適かつ弱パレート最適である.また,(s11 , s22 ) , (s12 , s21 ) はともに弱パレート効率的だが,強パレート効率的ではない.最後に,(s12 , s2 ) は強パレート効率的でも弱パレー ト効率的でもない. 2.4.2 弱パレート効率性 強パレート効率的な利得の組 ( ) • 戦略型ゲーム G = N, {Si }i∈N , {ui }i∈N において,純戦略の組 s ∈ S においてプレイヤーたちが得る利得の組は (ui (s))i∈N で与えられる.以上を踏まえた上で,ゲーム G の実現可能集合(feasible set)を, { } U = (ui (s))i∈N |s ∈ S と定義する.また,プレイヤーたちの利得ベクトル u = (ui )i∈N が, u∈U を満たすならば,u は実現可能(feasible)であると言う. • 戦略型ゲーム G の実現可能集合 U に属する 2 つの利得ベクトルの組 u = (ui )i∈N , u′ = (u′i )i∈N ∈ U の間に, (a) ∀i ∈ N : ui ≥ u′i (b) ∃i ∈ N : ui > u′i という関係がともに成り立つならば,u は u′ を弱パレート支配する(weakly Pareto dominate)すると言う.また, 実現可能な利得ベクトル u が他のいかなる実現可能な利得ベクトルによっても弱パレート支配されないならば,u は強パレート効率的(strongly Pareto efficient)であるとか強パレート最適(strongly Pareto optimal)であると 言う. • 戦略型ゲーム G において純戦略の組 s ∈ S が強パレート最適であるならば,そこでプレイヤーたちが得る利得の 組 (ui (s))i∈N ∈ U は一意的に定まり,かつ,それは明らかに強パレート最適である.一方,強パレート最適な利 得の組 u = (ui )i∈N ∈ U が与えられたとき,これを実現する純戦略の組 s ∈ S は一意的に定まるとは限らない.す 39 なわち,u ∈ U に対して, ∀i ∈ N : ui (s) = ui を満たす s ∈ S は一意的に定まるとは限らない.だが,強パレート最適な u ∈ U に対して,上の条件を満たす任意 の s ∈ S は明らかに強パレート最適である. 例 2.5 (強パレート効率性) • 以下の利得行列で表される戦略型ゲームについて考える. 12 s21 s22 s11 5, 5 0, 8 s12 8, 0 2, 2 • 上の戦略型ゲームの実現可能集合は, U = {(u1 (s) , u2 (s)) |s ∈ S } = {(5, 5) , (0, 8) , (8, 0) , (2, 2)} である.利得ベクトルの組 (2, 2) ∈ U は強パレート効率的ではない.なぜなら,この利得ベクトルは他の実現可能 な利得ベクトル (5, 5) ∈ U によって弱支配されるから.すなわち,(2, 2) から (5, 5) へ移行することによって,2 人 のプレイヤーの状態を同時に改善することができる.一方,(2, 2) 以外の任意の実現可能な利得ベクトルの組は強 パレート効率的である. • 上の例において,強パレート効率的な純戦略の組は (s11 , s21 ) , (s11 , s22 ) , (s12 , s21 ) の 3 つであり,これらはそれぞ れ強パレート効率的な利得ベクトルと 1 対 1 で対応している.だが,このような性質は一般的に成り立つとは限ら ない.例えば,以下の利得行列で表される戦略型ゲームについて考える. 12 s21 s22 s11 5, 5 8, 0 s12 8, 0 2, 2 • 上の新たなゲームにおいて,強パレート効率的な純戦略の組は, (s11 , s21 ) , (s11 , s22 ) , (s12 , s21 ) の 3 つである.一方,このゲームの実現可能集合は, U = {(u1 (s) , u2 (s)) |s ∈ S } = {(5, 5) , (8, 0) , (2, 2)} であるから,強パレート効率的な利得ベクトルは, (5, 5) , (8, 0) の 2 つである.ゆえに,この例では,強パレート効率的な純戦略の組と,強パレート効率的な利得ベクトルが 1 対 1 で対応していない. 40 弱パレート効率的な利得の組 ( ) • 戦略型ゲーム G = N, {Si }i∈N , {ui }i∈N の実現可能集合を,先ほどと同様に, { } U = (ui (s))i∈N |s ∈ S と定義する.このとき,実現可能な 2 つの利得ベクトルの組 u = (ui )i∈N , u′ = (u′i )i∈N ∈ U の間に, ∀i ∈ N : ui > u′i という関係が成り立つならば,u は u′ を強パレート支配する(strongly Pareto dominate)すると言う.また,あ る利得ベクトル u が他のいかなる利得ベクトルによっても強パレート支配されないならば,u は弱パレート効率的 (weakly Pareto efficient)であるとか弱パレート最適(weakly Pareto optimal)であると言う. • 戦略型ゲーム G において純戦略の組 s ∈ S が弱パレート最適であるならば,そこでプレイヤーたちが得る利得の 組 (ui (s))i∈N ∈ U は一意的に定まり,かつ,それは明らかに弱パレート最適である.一方,弱パレート最適な利 得の組 u = (ui )i∈N ∈ U が与えられたとき,これを実現する純戦略の組 s ∈ S は一意的に定まるとは限らない.す なわち,u ∈ U に対して, ∀i ∈ N : ui (s) = ui を満たす s ∈ S は一意的に定まるとは限らない.だが,弱パレート最適な u ∈ U に対して,上の条件を満たす任意 の s ∈ S は明らかに弱パレート最適である. 例 2.6 (弱パレート効率性) • 以下の利得行列で表される戦略型ゲームについて考える. 12 s21 s22 s11 5, 5 0, 5 s12 5, 0 2, 2 • 純戦略の組 (s12 , s22 ) は弱パレート効率的ではない.なぜなら,この純戦略の組は他の純戦略の組 (s11 , s21 ) によっ て弱支配されるから.すなわち,(s12 , s22 ) から (s11 , s21 ) へ移行することによって,2 人のプレイヤーの状態を同 時に改善することができる.一方,(s12 , s22 ) 以外の任意の純戦略の組は強パレート効率的である. • 上の戦略型ゲームの実現可能集合は, U = {(u1 (s) , u2 (s)) |s ∈ S } = {(5, 5) , (0, 8) , (8, 0) , (2, 2)} である.利得ベクトルの組 (2, 2) ∈ U は強パレート効率的ではない.なぜなら,この利得ベクトルは他の実現可能 な利得ベクトル (5, 5) ∈ U によって弱支配されるから.すなわち,(2, 2) から (5, 5) へ移行することによって,2 人 のプレイヤーの状態を同時に改善することができる.一方,(2, 2) 以外の任意の実現可能な利得ベクトルの組は強 パレート効率的である. 41 • 上の例では,強パレート効率的な純戦略の組と,強パレート効率的な利得ベクトルが 1 対 1 で対応しているが,こ のような性質は一般的に成り立つとは限らない.例えば,以下の利得行列で表される戦略型ゲームについて考える. 12 s21 s22 s11 5, 5 8, 0 s12 8, 0 2, 2 • 上の新たなゲームにおいて,強パレート効率的な純戦略の組は,先ほどと同様に, (s11 , s21 ) , (s11 , s22 ) , (s12 , s21 ) の 3 つである.一方,このゲームの実現可能集合は, U = {(u1 (s) , u2 (s)) |s ∈ S } = {(5, 5) , (8, 0) , (2, 2)} であるから,強パレート効率的な利得ベクトルは, (5, 5) , (8, 0) の 2 つである.ゆえに,この例では,強パレート効率的な純戦略の組と,強パレート効率的な利得ベクトルが 1 対 1 で対応していない. 42 3 ナッシュ均衡 3.1 3.1.1 最適反応 純最適反応 純最適反応 • 戦略型ゲーム G において,プレイヤー i ∈ N が他のプレイヤーたちの純戦略のある組 s−i ∈ S−i に直面したとき に,自分のある純戦略 s∗i ∈ Si が自分の利得を最大化するならば,すなわち, ∀si ∈ Si : ui (s∗i , s−i ) ≥ ui (si , s−i ) が成り立つならば,s∗i は s−i に対する最適戦略であると定める.このような最適戦略を最適反応(best response) や純最適反応(pure best response),もしくは弱最適反応(weakly best response)などと呼ぶ. • プレイヤー i の純戦略 s∗i が他のプレイヤーたちの純戦略の組 s−i に対する純最適反応であることは,s∗i が以下の 最大化問題の解であることを意味する. max ui (si , s−i ) si ∈Si 言い換えると,プレイヤー i について, s∗i ∈ argmax ui (si , s−i ) si ∈Si が成り立つということである. • ここで定義されたプレイヤー i の純最適反応は,他のプレイヤーたちの特定の純戦略の組 s−i に対して定義される 概念である点に注意する必要がある.したがって,s−i に対する純最適反応 s∗i であるとき,別の戦略の組 s′−i に対 する純最適反応は s∗i と一致するとは限らない. • 特に,プレイヤー i が他のプレイヤーたちの純戦略のある組 s−i に直面したときに,自分のある純戦略 s∗i が自分 の利得を狭義に最大化する場合には,すなわち, ∀si ∈ Si : ui (s∗i , s−i ) > ui (si , s−i ) が成り立つ場合には,s∗i は s−i に対する狭義最適反応(strictly best response)であると言う. • s∗i が s−i に対する狭義最適反応であるならば,それは同時に s−i に対する最適反応でもある.だが,その逆は成立 するとは限らない. 例 3.1 (純最適反応) • 以下の利得行列によって表されるゲームについて考える. 12 s21 s22 s11 5, 5 0, 8 s12 8, 0 2, 2 43 • プレイヤー 1 にとって,プレイヤー 2 の純戦略 s21 に対する狭義最適反応は s12 であり,純戦略 s22 に対する狭義 最適反応もまた s12 である.一方,プレイヤー 2 にとって,プレイヤー 1 の純戦略 s11 に対する狭義最適反応は s22 であり,純戦略 s12 に対する狭義最適反応もまた s22 である. • 純最適反応は一意的に定まるとは限らない.例として,以下の利得行列によって表されるゲームについて考える. 12 s21 s22 s11 5, 5 0, 5 s12 5, 0 2, 2 • 上のゲームにおいて,プレイヤー 1 にとって,プレイヤー 2 の純戦略 s21 に対する狭義最適反応は存在しない.一 方,s11 , s12 はともに s21 に対する弱最適反応である.プレイヤー 2 に関しても,プレイヤー 1 の純戦略 s11 に対す る狭義最適反応は存在しないが,s21 , s22 はともに s11 に対する弱最適反応である. 3.1.2 混合最適反応 混合最適反応 • 最適反応の概念は戦略型ゲーム G の混合拡張 G∗ においても容易に拡張される.具体的には,プレイヤー i ∈ N が 他のプレイヤーたちの混合戦略のある組 σ−i ∈ ∆ (S−i ) に直面したときに,自分のある混合戦略 σi∗ ∈ ∆ (Si ) が自 分の期待利得を最大化するならば,すなわち, ∀σi ∈ ∆ (Si ) : Fi (σi∗ , σ−i ) ≥ Fi (σi , σ−i ) が成り立つならば,σi∗ は σ−i に対する最適戦略であると定める.このような最適反応を混合最適反応(mixed best response)や弱最適反応(weakly best response)などと呼ぶ. • σi∗ が σ−i に対する混合最適反応であることは,σi∗ が以下の最大化問題の解であることを意味する. max Fi (σi , σ−i ) σi ∈∆(Si ) 言い換えると,プレイヤー i について, σi∗ ∈ argmax Fi (σi , σ−i ) σi ∈∆(Si ) が成り立つということである. • ここで定義されたプレイヤー i の混合最適反応は,他のプレイヤーたちの特定の混合戦略の組 σ−i に対して定義さ れる概念である点に注意する必要がある.したがって,σ−i に対する混合最適反応が σi∗ であるとき,別の混合戦 ′ 略の組 σ−i に対する混合最適反応は σi∗ と一致するとは限らない. • 特に,プレイヤー i が他のプレイヤーたちの混合戦略のある組 σ−i に直面したときに,自分のある混合戦略 σi∗ が 自分の期待利得を狭義に最大化する場合には,すなわち, ∀σi ∈ ∆ (Si ) : Fi (σi∗ , σ−i ) > Fi (σi , σ−i ) 44 が成り立つ場合には,σi∗ は σ−i に対する狭義最適反応(strictly best response)であるという. • ちなみに,σi∗ が σ−i に対する狭義最適反応であるならば,それは同時に σ−i に対する最適反応でもある.だが,そ の逆は成立するとは限らない. • 純戦略は特別な混合戦略であるから,上の定義は,純戦略の組に対する最適な純戦略である純最適反応や,純戦略 の組に対する最適な混合戦略である混合最適反応,また,混合戦略の組に対する最適な純戦略である混合最適反応 などをも包括的に含んでいる.そこで,以降では混合最適反応をシンプルに最適反応と呼ぶ. 3.1.3 混合最適反応の特徴づけ 最適混合反応で選ばれる純戦略の最適性 • プレイヤー i のある混合戦略 σi∗ が他のプレイヤーたちの混合戦略のある組 σ−i に対する最適反応であるならば, σi∗ において正の確率が与えられている任意の純戦略もまた,σ−i に対する最適反応である. • つまり,σ−i に対する最適反応 σi∗ が与えられたとき,σi∗ において正の確率が与えられている任意の純戦略は,い ずれも σi∗ と等しい期待利得をプレイヤー i にもたらす.ゆえに,プレイヤー i にとって,これらの混合戦略と純 戦略は無差別である. 命題 3.1 戦略型ゲーム G の混合拡張 G∗ において,あるプレイヤー i のある混合戦略 σi∗ ∈ ∆ (Si ) が,他のプレイヤー たちの混合戦略のある組 σ−i ∈ ∆ (S−i ) に対する最適反応であるならば,σi∗ において正の確率を与えられている任意の 純戦略もまた σ−i に対する最適反応である. 証明: • σi∗ が σ−i に対する最適反応ならば,任意の σi ∈ ∆ (Si ) に対して以下が成り立つ. Fi (σi∗ , σ−i ) ≥ Fi (σi , σ−i ) すなわち, ∑ {σi∗ (si ) · Fi (si , σ−i )} ≥ si ∈Si ∑ {σi (si ) · Fi (si , σ−i )} si ∈Si • σi∗ において正の確率が与えられている純戦略 s∗i ∈ Si を任意にとる.すなわち,σi∗ (s∗i ) > 0 である.また,s∗i と は異なる純戦略 s′i ∈ Si \ {s∗i } を任意にとる.このとき,上の不等式は以下のように言い換えられる. σi∗ (s∗i ) · Fi (s∗i , σ−i ) + σi∗ (s′i ) · Fi (s′i , σ−i ) + ∑ ′ si ∈Si \{s∗ i ,si } {σi∗ (si ) · Fi (si , σ−i )} ≥ σi (s∗i ) · Fi (s∗i , σ−i ) + σi (s′i ) · Fi (s′i , σ−i ) + ∑ ′ si ∈Si \{s∗ i ,si } {σi (si ) · Fi (si , σ−i )} すなわち,σi∗ (s∗i ) > 0 より, Fi (s∗i , σ−i ) ∑ σi (s′i ) − σi∗ (s′i ) σi (s∗ ) · Fi (s′i , σ−i ) + ≥ ∗ i∗ · Fi (s∗i , σ−i ) + ∗ ∗ σi (si ) σi (si ) ′ si ∈Si \{s∗ i ,si } 45 { } σi (si ) − σi∗ (si ) · Fi (si , σ−i ) (1) σi∗ (s∗i ) • σi は任意であるから,上の s∗i ∈ Si , s′i ∈ Si \ {s∗i } に対して,以下の条件を満たす σi に注目する: (a) σi (s∗i ) = 0 (b) ∀si ∈ Si \{si∗ , s′i } : σi (si ) = σi∗ (si ) このとき, σi (s′i ) = 1 − ∑ σi (si ) si ∈Si \{s′i } ∑ = 1 − σi (s∗i ) − ∑ =1− σi (si ) ′ si ∈Si \{s∗ i ,si } σi∗ (si ) (2) ∵ (a) , (b) ′ si ∈Si \{s∗ i ,si } • 以上を踏まえると, Fi (s∗i , σ−i ) ≥ 1− 1− = ∑ ′ si ∈Si \{s∗ i ,si } ∑ si ∈Si \{s∗ i} σi∗ (si ) − σi∗ (s′i ) σi∗ (s∗i ) · Fi (s′i , σ−i ) ∵ (1) , (2) σi∗ (si ) σi∗ (s∗i ) σ ∗ (s∗ ) = i∗ ∗i · Fi (s′i , σ−i ) σi (si ) · Fi (s′i , σ−i ) = Fi (s′i , σ−i ) が得られるが,任意の s′i ∈ Si \ {s∗i } に対して同様の議論が成立するため, ∀s′i ∈ Si \ {s∗i } : Fi (s∗i , σ−i ) ≥ Fi (s′i , σ−i ) が得られる.ゆえに,s∗i もまた σ−i に対する最適反応である. • σi∗ において正の確率が与えられている任意の純戦略 s∗i ∈ Si について同様の議論が成立するため,目標は達成さ れた. 純最適反応を選ぶ混合戦略 • 上の命題とは逆に,i 以外のプレイヤーたちの混合戦略の組 σ−i に対するプレイヤー i の最適反応であるような純 戦略がいくつか存在する場合には,そのような純戦略にのみ正の確率を付与する混合戦略もまた,σ−i に対する最 適反応になる. 命題 3.2 戦略型ゲーム G の混合拡張 G∗ において,プレイヤー i ∈ N が他のプレイヤーたちの混合戦略の組 σ−i ∈ ∆ (S−i ) に対する最適反応であるような複数の純戦略を持っているとき,それらの純戦略には非負の確率を割り当て,その他の 純戦略には確率 0 を割り当てるプレイヤー i の任意の混合戦略もまた σ−i に対する最適反応になる. 46 証明: • プレイヤー i の純戦略の中でも,σ−i に対する最適反応であるものからなる集合を Si′ ⊂ Si で表す. • 最適反応の定義より以下が成り立つ. (a) ∀s′i , s′′i ∈ Si′ : Fi (s′i , σ−i ) = Fi (s′′i , σ−i ) (b) ∀si ∈ Si , ∀s′i ∈ Si′ : Fi (s′i , σ−i ) ≥ Fi (si , σ−i ) (1) • Si′ に含まれる純戦略にのみ正の確率を振り分ける混合戦略を σi′ : Si → R で表す.σi′ は以下を満たす. (a) ∀s′i ∈ Si′ : σi′ (s′i ) ≥ 0 ∑ ′ ′ σi (si ) = 1 (b) (2) s′i ∈Si′ (c) ∀si ∈ Si \Si′ : σi′ (s′i ) = 0 • このとき,以下が成り立つ. Fi (σi′ , σ−i ) = = ≥ ∑ si ∈Si ∑ s′i ∈Si′ ∑ s′i ∈Si′ σi′ (si )Fi (si , σ−i ) σi′ (s′i )Fi (s′i , σ−i ) ∵ (2) − (c) σi′ (s′i ) min Fi (s′i , σ−i ) ′ ′ si ∈Si = min Fi (s′i , σ−i ) ′ ′ ∵ (2) − (b) ≥ max Fi (si , σ−i ) ∵ (1) − (b) si ∈Si si ∈Si ≥ ∑ si ∈Si σi (si )Fi (si , σ−i ) = Fi (σi , σ−i ) したがって,σi′ もまた σ−i に対する最適戦略である. 最適反応の特徴付け • 以上の命題を踏まえると,最適反応を以下のように特徴付けられる. 命題 3.3 戦略型ゲーム G の混合拡張 G∗ において,プレイヤー i ∈ N のある混合戦略 σi ∈ ∆ (Si ) において正の確率を 与えられている任意の純戦略が,他のプレイヤーたちの混合戦略のある組 σ−i ∈ ∆ (Si ) に対する最適反応であることは, σi が σ−i に対する最適反応であるための必要十分条件である. 47 証明: • σi が σ−i に対する最適反応であるならば,命題 3.1 より,σi において正の確率を与えられている任意の純戦略もま た σ−i に対する最適反応である. • 逆に,σi において正の確率を与えられている任意の純戦略が σ−i に対する最適反応であるならば,命題 3.2 より, それらの純戦略に正の確率を与える混合戦略 σi′ もまた σ−i に対する最適反応である. 3.2 3.2.1 最適反応対応 最適反応対応 純最適反応対応 • 戦略型ゲーム G において,プレイヤー i ∈ N 以外のプレイヤーたちの純戦略のある組 s−i に対するプレイヤー i の 純最適反応は一意的に定まるとは限らない.そこで,s−i に対するプレイヤー i の純最適反応からなる集合を, bi (s−i ) = {s∗i ∈ Si |ui (s∗i , s−i ) = max ui (si , s−i )} si ∈Si で表す. • プレイヤー i について,他のプレイヤーたちのそれぞれの戦略の組 s−i ∈ S−i に対して,s−i に対する純最適反応 からなる集合 bi (s−i ) ⊂ Si を定める対応 bi : S−i ³ Si を,プレイヤー i の最適反応対応(best response correspondence)や純最適反応対応(pure best response corre- spondence)などと呼ぶ. • ちなみに,すべてのプレイヤーの最適反応対応 {bi }i∈N が与えられれば,それぞれの純戦略の組 s = (s1 , · · · , sn ) ∈ S に対して, b (s) = b1 (s−1 ) × · · · × bn (s−n ) ⊂ S1 × · · · × Sn = S を像として定める対応 b:S³S を構成できる.この対応 b は,後に純ナッシュ均衡について考える際に重要な役割を果たす(第 3.3.1 節). 混合最適反応対応 • 最適反応対応の考え方は,混合拡張においても容易に拡張される.具体的には,戦略型ゲーム G の混合拡張 G∗ に おいて,i 以外のプレイヤーたちのある混合戦略の組 σ−i に対するプレイヤー i の混合最適反応は一意的に定まる 48 とは限らない.そこで,σ−i に対するプレイヤー i の混合最適反応からなる集合を, bi (σ−i ) = {σi∗ ∈ ∆ (Si ) |Fi (σi∗ , σ−i ) = max Fi (σi , σ−i )} σi ∈Si で表す. • プレイヤー i について,他のプレイヤーたちのそれぞれの混合戦略の組 σ−i ∈ ∆ (S−i ) に対して,σ−i に対する混 合最適反応からなる集合 bi (σ−i ) ⊂ ∆ (Si ) を定める対応 bi : ∆ (S−i ) ³ ∆ (Si ) を,プレイヤー i の最適反応対応や混合最適反応対応(mixed best response correspondence)などと呼ぶ. • ちなみに,すべてのプレイヤーの混合最適反応対応 {bi }i∈N が与えられれば,それぞれの混合戦略の組 σ = (σ1 , · · · , σn ) ∈ ∆ (S) に対して, b (σ) = b1 (σ−1 ) × · · · × bn (σ−n ) ⊂ ∆ (S1 ) × · · · × ∆ (Sn ) = ∆ (S) を像として定める対応 b : ∆ (S) ³ ∆ (S) を構成できる.この対応 b は,後に混合ナッシュ均衡について考える際に重要な役割を果たす(第 3.3.2 節). • 純戦略は特別な混合戦略であるから,上の定義は,純最適反応対応を包括的に含んでいる.そこで,以降では混合 最適反応対応をシンプルに最適反応対応と呼ぶ. 3.2.2 非空値 最適反応対応は非空値をとる • 以降では,最適反応対応や,すべてのプレイヤーの最適反応対応の直積から形成される対応が満たす性質をいくつ か指摘しよう.これらの性質はいずれも,後にナッシュ均衡の存在を証明するための布石となる(第 3.4 節). • まず,有限ゲームに関して以下の命題が成り立つ. 命題 3.4 有限ゲーム G の混合拡張 G∗ において,プレイヤー i ∈ N 以外のプレイヤーたちの混合戦略の組 σ−i ∈ ∆ (S−i ) に対するプレイヤー i の最適反応からなる集合 bi (σ−i ) ⊂ ∆ (Si ) は非空集合である. 証明: • 有限ゲーム G の混合拡張 G∗ において,i 以外のプレイヤーたちのそれぞれの混合戦略の組 σ−i ∈ ∆ (S−i ) に対す る,プレイヤー i の最適反応からなる集合は, bi (σ−i ) = {σi∗ ∈ ∆ (Si ) |Fi (σi∗ , σ−i ) = である. 49 max Fi (σi , σ−i )} σi ∈∆(Si ) • 有限ゲームにおいて,すべてのプレイヤーの混合戦略集合の直積 ∆ (S) = ∆ (S1 ) × · · · × ∆ (Sn ) は非空(系 2.1) なコンパクト集合(系 2.3)である.また,期待利得関数 Fi : ∆ (S) → R は連続関数である(命題 2.4). • 一般に,非空なコンパクト集合上に定義された連続関数は,定義域において最大値や最小値をとる.ゆえに,Fi : ∆ (S) → R に関する以下の最大化問題 max Fi (σi , σ−i ) σi ∈∆(Si ) もまた解を持つ.ゆえに,その解集合は bi (σ−i ) ̸= φ を満たす. • 一般に,対応 f : X ³ Y による点 x ∈ X の像 f (x) ⊂ Y が非空集合であるならば,f は x において非空値をとる (nonempty valued at x)と言う.また,f が定義域 X の任意の点において非空値をとるならば,f は非空値をと る(nonempty valued)と言う. • 上の命題は,i 以外のプレイヤーたちの任意の混合戦略の組 σ−i に関して成り立つため,以下が得られる. 系 3.1 有限ゲーム G の混合拡張 G∗ において,任意のプレイヤー i の最適反応対応 bi : ∆ (S−i ) ³ ∆ (Si ) は非空値を とる. • すべてのプレイヤーの最適反応対応 {bi }i∈N が与えられれば,それぞれの σ = (σ1 , · · · , σn ) ∈ ∆ (S) に対して, b (σ) = b1 (σ−1 ) × · · · × bn (σ−n ) ∈ ∆ (S1 ) × · · · × ∆ (Sn ) = ∆ (S) を像として定める新たな対応 b : ∆ (S) ³ ∆ (S) を構成できる. • 一般に,非空集合の直積もまた非空であることを踏まえると,上の系から以下が導かれる. 系 3.2 有限ゲーム G の混合拡張 G∗ において,対応 b : ∆ (S) ³ ∆ (S) は非空値をとる. 関連項目 • 有限ゲームにおいて混合ナッシュ均衡は常に存在する(第 3.4 節). 3.2.3 凸値 最適反応対応は凸値をとる 50 • 有限ゲームに関しては,以下の命題が成り立つ. 命題 3.5 有限ゲーム G の混合拡張 G∗ において,プレイヤー i ∈ N 以外のプレイヤーたちの混合戦略の組 σ−i ∈ ∆ (S−i ) に対するプレイヤー i の混合最適反応からなる集合 bi (σ−i ) ⊂ ∆ (Si ) は凸集合である. 証明: • 有限ゲーム G の混合拡張 G∗ において,i 以外のプレイヤーたちのそれぞれの混合戦略の組 σ−i ∈ ∆ (S−i ) に対す る,プレイヤー i の混合最適反応からなる集合は, bi (σ−i ) = {σi∗ ∈ ∆ (Si ) |Fi (σi∗ , σ−i ) = max Fi (σi , σ−i )} σi ∈∆(Si ) である. • そこで,あるプレイヤー i について,他のプレイヤーたちの混合戦略のある組 σ−i に対して,bi (σ−i ) が凸集合で はないと仮定して矛盾を導く.すなわち, ∃αi , βi ∈ bi (σ−i ), ∃t ∈ [0, 1] : tαi + (1 − t) βi ̸∈ bi (σ−i ) を仮定する.つまり,σ−i に対する混合最適反応 αi , βi をある一定の割合で組み合わせて得られる混合戦略 tαi + (1 − t) βi は σ−i に対する混合最適反応でないものとする. • i 以外のプレイヤーたちが σ−i を選び,プレイヤー i がそれに対する混合最適反応を選んだ場合に,プレイヤー i が 得る期待利得を, Fi (σi∗ , σ−i ) = Fi (αi , σ−i ) = Fi (βi , σ−i ) (1) で表す. • すると,プレイヤー i が tαi + (1 − t) βi を選び,他のプレイヤーたちが σ−i を選んだ場合に,プレイヤー i が得る 期待利得は, Fi (tαi + (1 − t) βi , σ−i ) = ∑ ∏ (tαi + (1 − t) βi ) (si ) · σj (sj ) · ui (s) s∈S j̸=i ∏ ∑ ∏ tαi (si ) · σj (sj ) · ui (s) + (1 − t) βi (si ) · σj (sj ) · ui (s) = s∈S j̸=i j̸=i ∑ ∑ ∏ ∏ =t αi (si ) · σj (sj ) · ui (s) + (1 − t) βi (si ) · σj (sj ) · ui (s) s∈S s∈S j̸=i j̸=i = tFi (αi , σ−i ) + (1 − t) Fi (βi , σ−i ) = tFi (σi∗ , σ−i ) + (1 − t) Fi (σi∗ , σ−i ) ∵ (1) = Fi (σi∗ , σ−i ) となる.ゆえに,tαi + (1 − t) βi もまた σ−i に対する混合最適反応となり,矛盾である.ゆえに,背理法より bi (σ−i ) は凸集合である. 51 • 一般に,対応 f : X ³ Y による点 x ∈ X の像 f (x) ⊂ Y が凸集合であるならば,f は x において凸値をとる (convex valued at x)と言う.また,f が定義域 X の任意の点において凸値をとるならば,f は凸値をとる(convex valued)と言う. • 上の命題は,i 以外のプレイヤーたちの任意の混合戦略の組 σ−i に関して成り立つため,以下が得られる. 系 3.3 有限ゲーム G の混合拡張 G∗ において,任意のプレイヤー i の混合最適反応対応 bi : ∆ (S−i ) ³ ∆ (Si ) は凸値を とる. • 繰り返しになるが,すべてのプレイヤーの混合最適反応対応 {bi }i∈N が与えられれば,それぞれの σ = (σ1 , · · · , σn ) ∈ ∆ (S) に対して, b (σ) = b1 (σ−1 ) × · · · × bn (σ−n ) ∈ ∆ (S1 ) × · · · × ∆ (Sn ) = ∆ (S) を像として定める新たな対応 b : ∆ (S) ³ ∆ (S) を構成できる. • 一般に,凸集合の直積もまた凸集合であることを踏まえると,上の系から以下が導かれる. 系 3.4 有限ゲーム G の混合拡張 G∗ において,対応 b : ∆ (S) ³ ∆ (S) は凸値をとる. 関連項目 • 有限ゲームにおいて混合ナッシュ均衡は常に存在する(第 3.4 節). 3.2.4 上半連続性 上半連続な対応 • 一般に,対応 f : X ³ Y と点 x ∈ X が与えられたときに,f (x) ⊂ U を満たす開集合 U ⊂ Y を任意にとったと きに, (a) x∈V (b) ∀v ∈ V : f (v) ⊂ U を満たす開集合 V ⊂ X が存在する場合には,f は x において上半連続(upper hemi-continuous at x)であると 言う.さらに,f が定義域 X の任意の点において上半連続であるならば,f は上半連続(upper hemi-continuous) であると言う. 52 • 対応 f : X ³ Y と点 x ∈ X が与えられたとき,x に収束する X の点列 {xi }i∈N ⊂ X を任意にとる.また,その 点列 {xi }i∈N に対して,任意の i ∈ N に対して yi ∈ f (xi ) を満たし,なおかつ,Y の点 y ∈ Y に収束する Y の点 列 {yi }i∈N ⊂ Y を任意にとる.このとき,この 2 つの点列の極限の間に, y ∈ f (x) が成り立つ場合には,f は x において閉じている(closed at x)と言う. • 実は,対応 f : X ³ Y において Y がコンパクト集合であり,さらに,f が点 x ∈ X において閉じている場合には, f は x において上半連続になる. 最適反応対応の直積対応の上半連続性 • 有限ゲーム G の混合拡張 G∗ においてすべてのプレイヤーの最適反応対応 {bi }i∈N が与えられれば,それぞれの σ = (σ1 , · · · , σn ) ∈ ∆ (S) に対して, b (σ) = b1 (σ−1 ) × · · · × bn (σ−n ) ∈ ∆ (S1 ) × · · · × ∆ (Sn ) = ∆ (S) を像として定める対応 b : ∆ (S) ³ ∆ (S) を構成できる. • この対応 b は上半連続性を満たす.ただし,対応 b の終集合 ∆ (S) はコンパクト集合であることを踏まえると(系 2.3),この事実は,b が任意の点 σ ∈ ∆ (S) において閉じていることを意味する. 命題 3.6 有限ゲーム G の混合拡張 G∗ において,対応 b : ∆ (S) ³ ∆ (S) は上半連続性を満たす. 証明: • 対応 b : ∆ (S) ³ ∆ (S) の終集合 ∆ (S) はコンパクト集合であるから(系 2.3),b が任意の点 σ ∈ ∆ (S) において 閉じていることを示せば目標は達成される.そこで,b がある点 σ ∈ ∆ (S) において閉じていないものと仮定して 矛盾を導く. • 具体的には,σ に収束する ∆ (S) のある点列 {σ v }v∈N ⊂ ∆ (S) と,この点列 {σ v }v∈N に対して,任意の v ∈ N に 対して τ v ∈ b (σ v ) を満たし,なおかつ,∆ (S) の点 τ に収束する ∆ (S) のある点列 {τ v }v∈N ⊂ ∆ (S) を選んだと き,この 2 つの点列の極限の間に, τ ̸∈ b (σ) が成り立つものと仮定する. 53 • τ = (τ1 , · · · , τn ) ∈ ∆ (S) , σ = (σ1 , · · · , σn ) ∈ ∆ (S) とおくと,上の事実は, (τ1 , · · · , τn ) ̸∈ b1 (σ−1 ) × · · · × bn (σ−n ) と表現できる.ゆえにこのとき,あるプレイヤー i ∈ N について, τi ̸∈ bi (σ−i ) が成り立つ. • つまり,上のプレイヤー i にとって,τi は σ−i に対する混合最適反応ではないため,ある混合戦略 τi′ ∈ ∆ (Si ) が 存在して, Fi (τi′ , σ−i ) > Fi (τi , σ−i ) (1) が成り立つ. • 一方,任意の v ∈ N に対して τ v ∈ b (σ v ) であることは,τ = (τ1v , · · · , τnv ) , σ v = (σ1v , · · · , σnv ) とおくと, ( v ) ( v ) (τ1v , · · · , τnv ) ∈ b1 σ−1 × · · · × bn σ−n が成り立つことを意味するため,先のプレイヤー i についても, ( v ) ∀v ∈ N : τiv ∈ bi σ−i v が成り立つ.ゆえに,σ−i に対する混合戦略として τiv と先の τi′ を比較すると, ( ) ( ) v v ∀v ∈ N : Fi τiv , σ−i ≥ Fi τi′ , σ−i が成り立つ. ) ( v → (τi , σ−i ) であることを踏まえると, • ここで,v → ∞ のときの極限をとると,Fi は連続であり,また, τiv , σ−i Fi (τi , σ−i ) ≥ Fi (τi′ , σ−i ) が得られるが,これは (1) と矛盾である.ゆえに,背理法より,b は上半連続性を満たす. 関連項目 • 有限ゲームにおいて混合ナッシュ均衡は常に存在する(第 3.4 節). 54 3.3 3.3.1 ナッシュ均衡 純ナッシュ均衡 純ナッシュ均衡 • 戦略型ゲーム G において,プレイヤー i の純戦略 s∗i ∈ Si が他のプレイヤーたちの純戦略の組 s−i ∈ S−i に対する 純最適反応であるとは, ∀si ∈ Si : ui (s∗i , s−i ) ≥ ui (si , s−i ) が成り立つことを意味する.このような意味での純最適反応の組 s∗ を G の純ナッシュ均衡(pure Nash equilibrium) などと呼ぶ. • 具体的には,戦略の組 s∗ = (s∗1 , · · · , s∗n ) がゲーム G の純ナッシュ均衡であるとは,s∗ に含まれる戦略がお互いに 純最適反応になっているということであり, ( ) ( ) ∀i ∈ N, ∀si ∈ Si : ui s∗i , s∗−i ≥ ui si , s∗−i または, ) ( ∀i ∈ N : s∗i ∈ argmax ui si , s∗−i si ∈Si が成り立つことを意味する. • プレイヤー i の純最適反応対応を bi : S−i ³ Si で表すならば,σ ∗ が混合ナッシュ均衡であることは,任意のプレ イヤー i について, s∗i ∈ bi (s∗−i ) が成り立つこととして表現できる. 不動点としての純ナッシュ均衡 • 一般に,n 次元ユークリッド空間の部分集合 X ⊂ Rn が与えられたときに,それぞれの点 x ∈ X に対して,X 自 身の部分集合 f (x) ⊂ X を定める対応 f : X ³ X を考える.このとき,ある点 x∗ ∈ X が存在して, x∗ ∈ f (x∗ ) が成り立つ場合には,この点 x∗ を f の不動点(fixed point)と呼ぶ.実は,純ナッシュ均衡は不動点として解釈 できる. • 戦略型ゲーム G において,i 以外のプレイヤーたちの純戦略の組 s−i ∈ S−i に対して,プレイヤー i の純最適反応 からなる集合 bi (s−i ) = {s∗i ∈ Si |ui (s∗i , s−i ) = max ui (si , s−i )} si ∈Si 55 を定める対応 bi : S−i ³ Si を,プレイヤー i の純最適反応対応と呼んだ.さらに,全員の純最適反応対応 {bi }i∈N が与えられたとき,全員の 純戦略の組の s = (s1 , · · · , sn ) ∈ S に対して, b (s) = n ∏ bi (s−i ) = b1 (s−1 ) × · · · × bn (b−n ) i=1 を像として定める対応 b:S³S を構成できる.純ナッシュ均衡はこの対応 b の不動点として特徴付けられる. 命題 3.7 戦略型ゲーム G において,プレイヤー i (= 1, · · · , n) の純最適反応対応を bi : S−i ³ Si で表す.その上で,そ れぞれの純戦略の組 s = (s1 , · · · , sn ) ∈ S に対して, b (s) = n ∏ bi (s−i ) i=1 を像として定める対応 b : S ³ S を構成する.このとき,純戦略の組 s∗ ∈ S に対して, s∗ ∈ b (s∗ ) が成り立つことは,s∗ が G の純ナッシュ均衡であるための必要十分条件である. 証明: • s∗ が G の純ナッシュ均衡であるとは,任意のプレイヤー i にとって,s∗i が s∗−i に対する純最適反応であることを 意味するが,これは,プレイヤー i の最適反応対応 bi を用いて, ( ) ∀i ∈ N : s∗i ∈ bi s∗−i すなわち, ( ) ( ) (s∗1 , · · · , s∗n ) ∈ b1 s∗−1 × · · · × bn s∗−n が成り立つこととして表現できる. • 対応 b の定義より,上の命題は, (s∗1 , · · · , s∗n ) ∈ b (s∗1 , · · · , b∗n ) すなわち, s∗ ∈ b (s∗ ) と言い換えられる.ゆえに,目標は達成された. 56 3.3.2 混合ナッシュ均衡 混合ナッシュ均衡 • ナッシュ均衡の概念は,混合戦略に関しても容易に拡張される.すなわち,戦略型ゲーム G の混合拡張 G∗ におい て,プレイヤーの混合戦略の組 σ ∗ = (σ1∗ , · · · , σn∗ ) が混合ナッシュ均衡(mixed Nash equilibrium)であるとは,任 ∗ 意のプレイヤー i について,混合戦略 σi∗ が他のプレイヤーの混合戦略の組 σ−i に対する混合最適反応であること, すなわち, ∗ ∗ ∀i ∈ N, ∀σi ∈ ∆ (Si ) : Fi (σi∗ , σ−i ) ≥ Fi (σi , σ−i ) が成り立つことを意味する. • プレイヤー i の混合最適反応対応を bi : ∆ (S−i ) ³ ∆ (Si ) で表すならば,σ ∗ が混合ナッシュ均衡であることは, ∗ ∀i ∈ N : σi∗ ∈ bi (σ−i ) が成り立つことと表現できる. • 純戦略は特別な混合戦略であるから,混合ナッシュ均衡の概念は純ナッシュ均衡を包含している.そこで以降では, 混合ナッシュ均衡をシンプルにナッシュ均衡(Nash equilibrium)と呼ぶこともある. 不動点としての混合ナッシュ均衡 • 戦略型ゲーム G の混合拡張 G∗ において,i 以外のプレイヤーたちの混合戦略の組 σ−i ∈ ∆ (S−i ) に対して,プレ イヤー i の混合最適反応からなる集合 bi (σ−i ) = {σi∗ ∈ ∆ (Si ) |Fi (σi∗ , σ−i ) = max Fi (σi , σ−i )} σi ∈Si を定める対応 bi : S−i ³ Si を,プレイヤー i の混合最適反応対応と呼んだ.さらに,全員の純最適反応対応 {bi }i∈N が与えられたとき,全員 の混合戦略の組の σ = (σ1 , · · · , σn ) ∈ ∆ (S) に対して, b (σ) = n ∏ σi (σ−i ) = b1 (σ−1 ) × · · · × bn (σ−n ) i=1 を像として定める対応 b : ∆ (S) ³ ∆ (S) を構成できる.混合ナッシュ均衡はこの対応 b の不動点として特徴付けられる. 命題 3.8 戦略型ゲーム G の混合拡張 G∗ において,プレイヤー i (= 1, · · · , n) の混合最適反応対応を bi : ∆ (S−i ) ³ ∆ (Si ) で表す.その上で,それぞれの混合戦略の組 σ = (σ1 , · · · , σn ) ∈ ∆ (S) に対して, b (σ) = n ∏ i=1 57 σi (σ−i ) を像として定める対応 b : ∆ (S) ³ ∆ (S) を構成する.このとき,混合戦略の組 σ ∗ ∈ ∆ (S) に対して, σ ∗ ∈ b (σ ∗ ) が成り立つことは,σ ∗ が G∗ の混合ナッシュ均衡であるための必要十分条件である. 証明: ∗ • σ ∗ が G∗ の純ナッシュ均衡であるとは,任意のプレイヤー i にとって,σi∗ が σ−i に対する混合最適反応であるこ とを意味するが,これは,プレイヤー i の混合最適反応対応 bi を用いて, ( ∗ ) ∀i ∈ N : σi∗ ∈ bi σ−i すなわち, ( ∗ ) ( ∗ ) (σ1∗ , · · · , σn∗ ) ∈ b1 σ−1 × · · · × bn σ−n が成り立つこととして表現できる. • 対応 b の定義より,上の命題は, (σ1∗ , · · · , σn∗ ) ∈ b (σ1∗ , · · · , σn∗ ) すなわち, σ ∗ ∈ b (σ ∗ ) と言い換えられる.ゆえに,目標は達成された. 例 3.2 (ジャンケン) • 以下の利得行列で表される戦略型ゲームについて考える. 12 R S P R 0, 0 1, −1 −1,1 S −1,1 0, 0 1, −1 P 1, −1 −1,1 0, 0 • このゲームはジャンケンを表している.すなわち,2 人のプレイヤーが共通に持つ 3 つの純戦略は,ジャンケンに おけるグー(R : Rock ), チョキ(S : Scissors),パー(P : P aper)にそれぞれ対応している.また,ジャンケ ンの勝者の利得は 1,敗者の利得は −1,あいこの場合の利得は 0 と定めている. • 利得行列から明らかであるように,このゲームには純戦略ナッシュ均衡は存在しない.そこで,プレイヤー i = 1, 2 の混合戦略を, σi = (σi (R) , σi (S) , σi (P )) というベクトルで表す.ただし,例えば,σi (R) はプレイヤー i が混合戦略 σi のもとで R を選択する確率である. 58 • プレイヤー 2 が σ2′ = (1 1 1 3, 3, 3 ) という混合戦略を選ぶ場合に,プレイヤー 1 がそれぞれの純戦略から得る期待利得 はそれぞれ以下の通りである. 1 3 R: 1 3 ·0+ S: 1 3 · (−1) + P : 1 3 ·1+ 1 3 ·1+ 1 3 1 3 · (−1) = 0 ·0+ 1 3 ·1=0 · (−1) + 1 3 ·0=0 • つまり,σ2′ に対してプレイヤー 1 の任意の純戦略は等しい期待利得 0 を与えるため,プレイヤー 1 の任意の混合 戦略 σ1 が σ2′ に対して与える期待利得は常に 0 である.したがって,プレイヤー 1 の任意の混合戦略 σ1 は σ2′ に ( ) 対する混合最適反応である.ということは,σ1′ = 13 , 13 , 13 という特定の混合戦略もまた σ2′ に対する混合最適反応 である. • 同様の議論により,プレイヤー 2 の混合戦略 σ2′ はプレイヤー 1 の混合戦略 σ1′ に対する混合最適反応の 1 つである (( ) ( )) ことが明らかになる.ゆえに,(σ1′ , σ2′ ) = 13 , 13 , 13 , 13 , 13 , 13 は混合最適反応の組であるから,これは混合ナッ シュ均衡である. • つまり,上の利得行列で表される利得構造を持つジャンケンにおいては,それぞれのプレイヤーがグー・チョキ・ パーを等しい確率でランダムに出し合うことが混合戦略ナッシュ均衡であり,均衡における 2 人の期待利得はとも に 0 となる. 3.3.3 ナッシュ均衡の特徴付け ナッシュ均衡の特徴付け • 命題 3.3 より,混合ナッシュ均衡は以下のように言い換えられる. 命題 3.9 戦略型ゲーム G の混合拡張 G∗ において,混合戦略の組 σ ∗ = (σ1∗ , · · · , σn∗ ) ∈ ∆ (S) が混合ナッシュ均衡であるこ ∗ とは,任意のプレイヤー i ∈ N について,σi∗ ∈ ∆ (Si ) において正の確率を与えられている任意の純戦略が σ−i ∈ ∆ (S−i ) に対する純最適反応であることを意味する. • すなわち,混合ナッシュ均衡 σ ∗ = (σ1∗ , · · · , σn∗ ) では,任意のプレイヤー i にとって,他のプレイヤーたちの混合 ∗ 最適反応の組 σ−i が与えられたときに,σi∗ において正の確率で選ばれる任意の純戦略は無差別であり,また,そ れらの純戦略から得られる期待利得は,σi∗ において選ばれない純戦略からの期待利得以上になる. • 例えば,以下の利得行列で表される戦略型ゲームについて考えよう. 12 A B C A 1, −1 −1,1 −10, −10 B −1,1 1, −1 −10, −10 C −10,−10 −10,−10 −20, −20 • 利得行列から明らかであるように,このゲームには純戦略ナッシュ均衡は存在しない.そこで,プレイヤー i = 1, 2 の混合戦略を, σi = (σi (A) , σi (B) , σi (C)) 59 というベクトルで表す.例えば,σi (A) はプレイヤー i が混合戦略 σi のもとで純戦略 A を選択する確率である.計 算のプロセスは省略するが, (σ1∗ , σ2∗ ) (( = ) ( )) 1 1 1 1 , ,0 , , ,0 2 2 2 2 が混合ナッシュ均衡であり,そこでの期待利得は, F1 (σ1∗ , σ2∗ ) = F2 (σ1∗ , σ2∗ ) = 0 となる. • さて,プレイヤー 2 が σ2∗ を選ぶ場合に,プレイヤー 1 がそれぞれの純戦略から得る期待利得はそれぞれ以下の通 りである. F1 (A, σ2∗ ) = 1 2 ·1+ F1 (B, σ2∗ ) = 1 2 · (−1) + F1 (C, σ2∗ ) = 1 2 · (−10) + 1 2 · (−1) + 0 · (−10) = 0 1 2 · 1 + 0 · (−10) = 0 1 2 · (−10) + 0 · (−20) = −10 • 上の結果は,σ2∗ に対するプレイヤー 1 の純最適反応は A と B であるが,これらはいずれも σ1∗ において正の確率 を与えられた純戦略である.しかも,これらの純最適反応から得られる期待利得 0 はナッシュ均衡 σ ∗ における期 待利得 0 に等しく,また,ナッシュ均衡において確率 0 が付与された純戦略 C から得られる期待利得 −10 は,純 最適反応 A, B から得られる期待利得以下になっている.プレイヤー 2 に関しても同様の議論が成立するため,こ の例は上の定理の内容と整合的である. 3.4 ナッシュ均衡の存在 3.4.1 角谷の不動点定理 角谷の不動点定理 • 戦略型ゲーム G の純戦略ナッシュ均衡や,その混合拡張 G∗ における混合戦略ナッシュ均衡などはいずれも,数 学的には対応の不動点として表現できることが明らかになった(命題 3.7,3.8).ゆえに,完備情報の静学ゲームに ナッシュ均衡が常に存在することを保証するためには,任意のゲームから定義される対応に不動点が存在すること を示せばよい.そこでまずは,一般の対応が不動点を持つための条件を明らかにしよう.これを角谷の不動点定理 (Kakutani’s fixed point theorem)と呼ぶ4 . • n 次元ユークリッド空間 Rn の部分集合 X ⊂ Rn を共通の定義域と終集合として持つ対応 f : Rn ⊃ X ³ X につ いて考える.この対応 f が不動点を持つために満たすべき 1 つ目の条件は,集合 X が非空(nonempty)であるこ と,すなわち, X ̸= φ が成り立つことである. • 対応 f : Rn ⊃ X ³ X が不動点を持つために満たすべき 2 つ目の条件は,集合 X が Rn におけるコンパクト集合 (compact set)であることである.コンパクト集合は有界な閉集合として特徴付けられるが,それを点列を用いて 4 本節に登場する諸概念に関する詳細については,n 次元ユークリッド空間に関するテキスト(https://sites.google.com/site/ikuboyuta/note/euclideanspace) と,対応に関するテキスト()をぞれぞれ参照せよ. 60 表現することもできる.すなわち,X ⊂ Rn がコンパクト集合であるとは,X の任意の点列が X の点に収束する 部分列を持つことを意味する.具体的には, ∀v ∈ N : xv ∈ X を満たす点列 {xv }v∈N を任意に選んだときに,それに対して, lim xl(v) ∈ X v→∞ { } を満たす部分列 xl(v) v∈N が必ず存在するということである.より正確には,点列に関する上の条件を点列コンパ クト性(sequentially compactness)と呼ぶが,集合 X が点列コンパクトであることとコンパクトであることは同 値である. • 対応 f : Rn ⊃ X ³ X が不動点を持つために満たすべき 3 つ目の条件は,X が Rn における凸集合(convex set) であることである.具体的には,X が凸集合であるとは,X に属する任意の 2 つの点を結んで得られる線分上の 任意の点もまた X の点であることを意味し,これは, ∀x, x′ ∈ X, ∀λ ∈ [0, 1] : λx + (1 − λ) x′ ∈ X が成り立つこととして表現できる. • 対応 f : Rn ⊃ X ³ X が不動点を持つために満たすべき 4 つ目の条件は,定義域に属する任意の点 x ∈ X の f に よる像が非空であること,すなわち, ∀x ∈ X : f (x) ̸= φ が成り立つことである. • 対応 f : Rn ⊃ X ³ X が不動点を持つために満たすべき 5 つ目の条件は,定義域に属する任意の点 x ∈ X の f に よる像もまた凸集合であることである.具体的には,点 x ∈ X を任意にとったとき,その像 f (x) ∈ X に属する 任意の 2 つの点を結んで得られる線分上の任意の点もまた f (x) の点であることを意味し,これは, ∀x ∈ X, ∀x′ , x′′ ∈ f (x) , ∀λ ∈ [0, 1] : λx′ + (1 − λ) x′′ ∈ f (x) が成り立つこととして表現できる.ちなみに,対応が満たすべきこの性質を凸値(convex valued)と呼ぶ. • 対応 f : Rn ⊃ X ³ X が不動点を持つために満たすべき 6 つ目の条件は,f が上半連続(upper hemi-continy)であ ることである.すなわち,対応 f が上半連続であるとは,定義域に属するそれぞれの点 x ∈ X に対して,f (x) ⊂ U を満たす開集合 U ⊂ X を任意にとったときに,それに対して, (a) x∈V (b) ∀v ∈ V : f (v) ⊂ U を満たす開集合 V ⊂ X が存在することを意味する.ただし,X がコンパクト集合である場合には,f が上半連続 であることは点列を用いて以下のように表現できる.すなわち,コンパクト集合 X に関して対応 f : Rn ⊃ X ³ X 61 が上半連続であるとは,X の要素からなる 2 つの点列 {xv }v∈N , {yv }v∈N のうち, (a) lim xv = x. v→∞ (b) lim yv = y. v→∞ (c) ∀v ∈ N : yv ∈ f (xv ) . を満たす任意の 2 つの点列に対して,その極限の間に, y ∈ f (x) が成り立つことを意味する. • 以上の条件が満たされるとき,対応は不動点を持つ.これを角谷の不動点定理(Kakutani’s fixed point theorem) と呼ぶ. 定理 3.1 対応 f : Rn ⊃ X ³ X について,X は非空かつコンパクトかつ凸であるとする.さらに,f は非空値かつ凸値 をとり,上半連続性を満たすものとする.このとき, x∗ ∈ f (x∗ ) を満たす f の不動点 x∗ ∈ X が少なくとも 1 つは存在する. 3.4.2 純ナッシュ均衡の存在 純ナッシュ均衡は存在するとは限らない • 一般に,戦略型ゲーム G に純ナッシュ均衡は存在するとは限らない.以下に反例を提示する. • 以下の利得行列で表されるゲームについて考える.これは硬貨合わせ(matching pennies)と呼ばれるゲームで ある. 1r2 A B A −1, 1 1, −1 B 1, −1 −1, 1 • プレイヤー 2 の純戦略 A に対するプレイヤー 1 の純最適反応は B であり,純戦略 B に対する純最適反応は A で ある.上の表では,プレイヤー 1 がプレイヤー 2 のそれぞれの純戦略に対して純最適反応を選んだ場合に得られる 利得の下に線が引かれている.プレイヤー 2 についても同様に考える. • 上の表から明らかなように,純最適反応の組は存在しないので,このゲームには純ナッシュ均衡は存在しない. 不動点定理からの解釈 62 • 繰り返しになるが,戦略型ゲーム G において,プレイヤー i (= 1, · · · , n) の純最適反応対応を bi : S−i ³ Si で表 す.すなわち,i 以外のプレイヤーたちの純戦略の組 s−i ∈ S−i に対する i の純最適反応は bi (s−i ) ∈ Si である.そ ∏n の上で,それぞれの純戦略の組 s = (s1 , · · · , sn ) ∈ i=1 Si = S に対して,その組を構成する他のプレイヤーたち の純戦略の組に対するそれぞれのプレイヤーの純最適反応からなる組 b (s) = n ∏ n ∏ bi (s−i ) ∈ i=1 Si = S i=1 を像として定める対応 b : S ³ S を構成する.このとき,ある純戦略の組 s∗ ∈ S が b の不動点であることは,す なわち, s∗ ∈ b (s∗ ) が成り立つことは,s∗ が G の純ナッシュ均衡であるための必要十分条件である(命題 3.7). • 任意の戦略型ゲーム G に純ナッシュ均衡が存在することを保証するためには,上の対応 b に関して角谷の不動点定 理が成り立つことを示せばよいが,不動点定理が成り立つためには以下の条件が要請されるのであった: 1. S は非空集合である. 2. S はコンパクト集合である. 3. S は凸集合である. 4. b は非空値をとる. 5. b は凸値をとる. 6. b は上半連続性を満たす. • だが,上の例で明らかになったように,戦略型ゲーム G は常に純ナッシュ均衡を持つとは限らない.例えば,一般 に,戦略型ゲーム G を構成するそれぞれのプレイヤー i の純戦略集合 Si には位相は設定されていないため,それ ∏n らの直積 S = i=1 Si は必ずしもコンパクトであるとは限らない.したがって,戦略型ゲームに関しては角谷の不 動点定理を適用できないのである. 3.4.3 混合ナッシュ均衡の存在 ナッシュの定理 • 繰り返しになるが,戦略型ゲーム G の混合拡張 G∗ において,プレイヤー i (= 1, · · · , n) の混合最適反応対応を bi : ∆ (S−i ) ³ ∆ (Si ) で表す.すなわち,i 以外のプレイヤーたちの混合戦略の組 σ−i ∈ ∆ (S−i ) に対する i の混合 ∏n 最適反応は bi (σ−i ) ∈ ∆ (Si ) である.その上で,それぞれの混合戦略の組 σ = (σ1 , · · · , σn ) ∈ i=1 ∆ (Si ) = ∆ (S) に対して,その組を構成する他のプレイヤーたちの混合戦略の組に対するそれぞれのプレイヤーの混合最適反応か らなる組 b (σ) = n ∏ σi (σ−i ) ∈ n ∏ ∆ (Si ) = ∆ (S) i=1 i=1 を像として定める対応 b : ∆ (S) ³ ∆ (S) を構成する.このとき,ある混合戦略の組 σ ∗ ∈ ∆ (S) に対して, σ ∗ ∈ b (σ ∗ ) 63 が成り立つことは,σ ∗ が G∗ の混合ナッシュ均衡であるための必要十分条件である(命題 3.8). • 任意の戦略型ゲーム G の混合拡張 G∗ に混合ナッシュ均衡が存在することを保証するためには,上の対応 b に関し て角谷の不動点定理が成り立つことを示せばよいが,不動点定理が成り立つためには以下の条件が要請されるので あった: 1. ∆ (S) は非空集合である(命題 2.1). 2. ∆ (S) はコンパクト集合である(命題 2.3). 3. ∆ (S) は凸集合である(命題 2.2). 4. b は非空値をとる(系 3.2). 5. b は凸値をとる(系 3.4). 6. b は上半連続性を満たす(命題 3.6). • 有限な戦略型ゲーム G の混合拡張 G∗ に関して上記の 6 つの条件がいずれも満たされていることは,カッコ内に記 された命題として既に示した.ゆえに,角谷の不動点定理より,有限な戦略型ゲームの混合拡張には必ず混合ナッ シュ戦略が存在する.この命題をナッシュの定理(Nash’s theorem)と呼ぶ. 定理 3.2 (ナッシュの定理) 任意の有限な戦略型ゲーム G に対して,その混合拡張 G∗ には少なくとも 1 つの混合ナッ シュ均衡が存在する. 3.5 3.5.1 ナッシュ均衡の正当性 唯一の均衡概念 ナッシュ均衡は唯一の均衡概念 • 完備情報の静学ゲームを表す戦略型ゲーム G やその混合拡張 G∗ において,他のプレイヤーたちの戦略の組に対し て,あるプレイヤーが自分の利得や期待利得を最大化するような戦略を最適戦略とみなした.さらに,その意味に おける最適戦略の組としてナッシュ均衡を定義したが,ナッシュ均衡にはゲームの均衡概念としてどのような正当 性があるだろうか. • ナッシュ均衡の正当性は,完備情報の静学ゲームにおいて,ナッシュ均衡以外に均衡概念は存在し得ないという点 にある.例えば,ナッシュ均衡とは異なる均衡概念にもとづく均衡戦略の組 s′ = (s′1 , · · · , s′n ) が戦略型ゲーム G に 存在すると仮定しよう.s′i はナッシュ均衡とは異なる均衡概念にもとづくプレイヤー i の最適戦略である.仮定よ り s′ はナッシュ均衡ではないので,ナッシュ均衡を特徴付ける条件の否定に相当する以下の命題 ( ) ( ) ∃i ∈ N, ∃si ∈ Si : ui s′i , s′−i < ui si , s′−i が成立する. 64 • だが,合理性の仮定のもとでは,上のプレイヤー i は最適戦略 s′i から逸脱してそれとは異なる上の戦略 si を選ぶ 動機がある.なぜなら,合理的なプレイヤーは自身の利得を最大化するように意志決定を行うから.この事実は s′i が最適戦略であることと矛盾するため,s′ は均衡概念として不適であることを意味する.すなわち,ナッシュ均衡 とは異なる概念は完備情報の静学ゲームの均衡概念にはなり得ないのである.混合拡張 G∗ におけるナッシュ均衡 に関しても同様の議論が成立する. • つまり,完備情報の静学ゲームを表す戦略型ゲーム G やその混合拡張 G∗ において何らかの均衡概念が得られる場 合には,合理性の仮定や期待効用仮説を想定する限りにおいて,その均衡概念はナッシュ均衡でなければならない. この意味において,ナッシュ均衡は最も広い均衡概念である. ナッシュ均衡は実際にプレーされるか? • 合理性の仮定のもとでは,ナッシュ均衡は完備情報の静学ゲームにおける唯一の均衡概念であることが明らかに なったが,これはあくまで分析者の視点にもとづく考え方であり,実際にゲームをプレーするプレイヤーの視点に 立って考えてみると,話はやや複雑になる. • 合理的なプレイヤーたちがナッシュ均衡をプレーしているとき,それぞれのプレイヤーは,他のプレイヤーたちが 均衡戦略にしたがう限りにおいて,自分は均衡戦略から逸脱しても得することができない.つまり,ナッシュ均衡 ではプレイヤーどうしの戦略が互いに最適戦略になっているため,誰もがそこから逸脱する動機を持たない.だが, プレイヤーたちがそもそもナッシュ均衡を実際にプレーすることを保証するためには,それぞれのプレイヤーが, 他のプレイヤーたちが均衡戦略にしたがうことを正しく予想する必要があるが,これはどのような理屈によって正 当化されるのだろうか. 12 L R T 5, 5 0,8 B 8, 0 2,2 • 例えば,上の利得行列で表されるゲームについて考えてみよう.分析者の視点から上のゲームを見ると,純戦略ナッ シュ均衡は (B, R) であることが明らかである.続いて,このゲームをプレーするプレイヤーたちの視点に立って 考えてみよう.プレイヤー 1 にとって,プレイヤー 2 が L, R のどちらを選ぶかに関わらず,自分は T よりも B を 常に選んだほうが得である.ゆえに,プレイヤー 1 が合理的であれば B を常に選ぶ.つまり,この例においてプ レイヤー 1 はプレイヤー 2 の行動を予想する必要がない.プレイヤー 2 についても同様に,プレイヤー 1 の行動を 予想する必要はなく,プレイヤー 2 が合理的であれば R を常に選ぶ.したがって,このゲームにおいては,プレイ ヤーの合理性のみからナッシュ均衡 (B, R) が実際にプレーされることを保証できる. 12 L C R T 5, 2 2, 4 4,5 M 4,6 3,6 2, 5 B 3,3 1, 2 7, 2 • 続いて,上の利得行列で表されるゲームについて考えよう.純戦略ナッシュ均衡は (M, C) である.先の例ではプ レイヤーたちは相手の行動を予測せずとも実際にナッシュ均衡がプレーされることを合理性の仮定から保証できた 65 が,このゲームでナッシュ均衡 (M, C) が実際プレーされるためには,プレイヤー 1 はプレイヤー 2 の行動 C を正 しく予測し,同時に,プレイヤー 2 はプレイヤー 1 の行動 M を正しく予測する必要がある.合理性の仮定はプレ イヤーたちが正しい予測を行うことを保証できるだろうか.以降ではこのような問題について考えよう. 3.5.2 推論プロセスの終着点 ナッシュ均衡は推論プロセスの終着点 • 2 人のプレイヤーから構成される戦略型ゲーム G について考える.ゲームのルールとプレイヤーの合理性が共有知 識であるあるならば,以下のような推論が成立し得る: 1. プレイヤー 1 はプレイヤー 2 の戦略 s02 を予測し,それに対する最適反応 s11 を選ぶ.同様に,2 は 1 の戦略 s01 を予測し,それに対する最適反応 s12 を選ぶ. 2. 1 は 2 の推論を辿ることで 2 の戦略を s12 と予測し,それに対する最適反応 s21 を選ぶ.同様に,2 は 1 の推論 を辿ることで 1 の戦略を s11 と予測し,それに対する最適反応 s22 を選ぶ. 3. このような戦略の読み合いはさらに続く. • このような読み合いは無限に続きそうであるが,仮に 2 人の予想と最適応答が一致するならば,プレイヤーの推論 が停止し,そのとき,最適応答の組がナッシュ均衡になる: – 先ほどの推論が進んだ結果,1 は 2 の推論を辿ることで 2 の戦略を sn2 と予測し,それに対する最適反応 sn+1 1 n+1 を選んだとする.同様に,2 は 1 の推論を辿ることで 1 の戦略を sn を 1 と予測し,それに対する最適反応 s2 選んだとする. , sn+1 – この時点において,2 人が互いに予想する相手の戦略 (sn1 , sn2 ) と,予想に対する 2 人の最適反応 (sn+1 ) 1 2 が一致したとする.すなわち, sn1 = sn+1 , 1 sn2 = sn+1 2 (1) が成立する場合を想定する. – 次の段階では,1 は 2 の推論を辿ることで 2 の戦略を sn+1 と予測するが,(1) よりそれは sn 2 に等しい.した 2 がって,それに対する 1 の最適反応は先ほどと同様に sn+1 になる.同様に,2 は 1 の推論を辿ることで 1 の 1 戦略を sn+1 と予想するが,(1) よりそれは sn 1 に等しい.したがって,それに対する 2 の最適反応は先ほどと 1 同様に sn+1 になる. 2 – 以降もまた同じことの繰り返しであるから,推論が収斂する.つまり,sn+1 は sn+1 に対する最適反応であ 1 2 り,sn+1 は sn+1 に対する最適反応であるから,(sn+1 , sn+1 ) はナッシュ均衡である. 2 1 1 2 • 以上の議論を踏まえると,プレイヤーの予想と最適応答が一致し,プレイヤーの推論のプロセスが停止する均衡の みをプレイヤーの合理的な意思決定の帰結とみなす解の概念としてナッシュ均衡を解釈することができる. – 例えば, – プレイヤー 1 がプレイヤー 2 の戦略を正しく C と予想し,プレイヤー 2 もまたプレイヤー 1 の戦略を正しく M と予想するならば, 66 • 逆に,ナッシュ均衡以外の戦略の組では,プレイヤーの推論のプロセスが停止しないため,上のような推論の任意 の時点において,少なくとも一方のプレイヤーは戦略を変更したほうが得をすることになる. 例 3.3 (推論プロセスの終着点としてのナッシュ均衡) • 前節において例として挙げた以下のゲームについて考えよう.ゲームのルールとプレイヤーの合理性が共有知識で あるものとする.ナッシュ均衡は (M, C) である. 12 L C R T 5, 2 2, 4 4,5 M 4,6 3,6 2, 5 B 3,3 1, 2 7, 2 • ナッシュ均衡とは異なる戦略の組 (T, L) が出発点である場合には,以下のような推論が成立する: 1. プレイヤー 1 はプレイヤー 2 の戦略を L と予想するならば,それに対する最適戦略 T を選ぶ.同様に,2 は 1 の戦略を T と予想するならば,それに対する最適戦略 R を選ぶ. 2. 1 は 2 の推論を辿ることで 2 の戦略を R と予想し,それに対する最適戦略 B を選ぶ.同様に,2 は 1 の推論 を辿ることで 1 の戦略を T と予想し,それに対する最適戦略 R を選ぶ. 3. 1 は 2 の推論を辿ることで 2 の戦略を R と予想し,それに対する最適戦略 B を選ぶ.同様に,2 は 1 の推論 を辿ることで 1 の戦略を B と予想し,それに対する最適戦略 L を選ぶ. 4. 1 は 2 の推論を辿ることで 2 の戦略を L と予想し,それに対する最適戦略 T を選ぶ.同様に,2 は 1 の推論 を辿ることで 1 の戦略を B と予想し,それに対する最適戦略 R を選ぶ. 5. ステップ 4 における最適戦略の組 (T, R) は,ステップ 1 における最適戦略の組 (T, R) と一致するため,推論 は永遠に循環してしまう. • ナッシュ均衡 (M, C) が出発点である場合には,以下のような推論が成立する: 1. プレイヤー 1 はプレイヤー 2 の戦略を C と予想するならば,それに対する最適戦略 M を選ぶ.同様に,2 は 1 の戦略を M と予想するならば,それに対する最適戦略 C を選ぶ. 2. 1 は 2 の推論を辿ることで 2 の戦略を C と予想し,それに対する最適戦略 M を選ぶ.同様に,2 は 1 の推論 を辿ることで 1 の戦略を C と予想し,それに対する最適戦略 M を選ぶ. 3. 2 人の予想と最適反応が一致するため,プレイヤーたちの推論が収斂し,そのときの最適反応の組がナッシュ 均衡になる. 複数均衡の問題 67 • プレイヤーたちの推論プロセスの終着点としてナッシュ均衡を解釈する方法は非常に説得力があるが,実は,ゲー ムに複数のナッシュ均衡が存在する場合には問題が生じる.例えば,下の利得行列で表されるゲームについて考え よう.ナッシュ均衡は (T, L) と (B, R) である. 12 L R T 2,1 0, 0 B 0, 0 1,2 • 先のような推論プロセスの出発点として (T, L) を選択した場合には,推論プロセスの終着点として定まるナッシュ 均衡は (T, L) であるが,(B, R) を出発点とした場合の終着点は (B, R) である.つまり,ナッシュ均衡が複数存在 する場合には,その中のどれを推論の出発点とするかによって到達し得るナッシュ均衡が異なるが,推論プロセス の考え方そのものからは,出発点としてどの点が選ばれるかという指針を得ることができない. 3.5.3 合理化可能性 合理化可能性 • プレイヤーは他のプレイヤーの様々な戦略の組に直面するが,仮にプレイヤーが合理的であるならば,それらのい ずれの組に対しても最適戦略ではないような戦略が自分の戦略集合に含まれている場合,そのような戦略を選択し ないであろう. • そこで,与えられたゲームにおいて,それぞれのプレイヤーが決して最適戦略にならない戦略を持つ場合には,その プレイヤーの選択肢からそのような戦略を消去することを通じて,プレイヤーたちが選択し得る戦略の組を絞り込 む手法を,最適戦略にならない戦略の逐次消去(iterated removal of strategies that are never a best response)と 呼ぶ.また,最適戦略にならない戦略の逐次消去によって消去されずに残る戦略を合理化可能戦略(rationalizable strategy)と呼ぶ. • 以下の双行列で表される戦略型ゲーム G (= G0 ) について考える.ただし,ゲームのルールとプレイヤーの合理性 は共有知識であるものと仮定する. G0 = 12 b1 b2 b3 b4 a1 0,7 2, 5 7, 0 0, 1 a2 5, 2 3,3 5, 2 0, 1 a3 7, 0 2, 5 0,7 0, 1 a4 0,0 0, −2 0,0 10, −1 • 上のゲーム G0 において,プレイヤー 2 の戦略 b4 はプレイヤー 1 のいかなる戦略に対しても最適戦略にはならな 68 いため,それを消去すれば以下の双行列で表される新たな戦略型ゲーム G1 を得る. G1 = 12 b1 b2 b3 a1 0,7 2, 5 7, 0 a2 5, 2 3,3 5, 2 a3 7, 0 2, 5 0,7 a4 0,0 0, −2 0,0 • ただし,ゲームが G0 から G1 へと移行し,2 人がそのことを互いに認識し合っている状態を達成するためには以 下の仮定が必要であるが,これらは合理性が共有知識であることから成立する. 1. 2 の合理性を仮定する.このとき,自身の利得を最大化する 2 は,G0 において自身が b4 を選ばないと判断で きるため,2 は自身が直面するゲームが G0 から G1 へ移行することを認識できる. 2. 1 が「2 が合理的である」ことを知っているものと仮定する.このとき,1 は 2 が G0 において b4 を選ばない と判断できるため,1 は自分と相手が直面するゲームが G0 から G1 へ移行することを認識できる. 3. 2 が「1 が「2 は合理的である」ことを知っている」ことを知っているものと仮定する.このとき,2 は「1 は 「2 は G0 において b4 を選ばない」と考える」と判断できるため,2 は空いたが直面するゲームが G0 から G1 へ移行することを認識できる. • 上のゲーム G1 において,プレイヤー 1 の戦略 a4 はプレイヤー 2 のいかなる戦略に対しても最適戦略にはならない ため,それを消去すれば以下の双行列で表される新たな戦略型ゲーム G2 を得る.ただし,ゲームが G1 が G2 へ 移行し,2 人がそのことを互いに認識し合っている状態を達成するためには先のような合理性に関する仮定を重ね る必要があるが,それらはいずれも合理性が共有知識であることから成立する. G2 = 12 b1 b2 b3 a1 0,7 2, 5 7, 0 a2 5, 2 3,3 5, 2 a3 7, 0 2, 5 0,7 • ゲーム G2 に残された戦略はいずれも,相手の少なくとも 1 つの戦略に対する最適戦略になり得るため,これ以上 戦略を消去することはできない.ゆえに,G2 に残された戦略がそれぞれのプレイヤーの合理化可能戦略である. 合理化可能戦略均衡としてのナッシュ均衡 • ナッシュ均衡という概念は,ゲームを観察する分析者が外生的に与える解概念であり,実際にプレイヤーたちが他 のプレイヤーたちの戦略を正しく予想することでナッシュ均衡が実現するか否かということは,別に考えるべき問 題である.そこで,ゲームのルールとプレイヤーの合理性が共有知識であるという仮定のもとで,プレイヤーたち が具体的に行い得る推論を最適戦略にならない戦略の逐次消去というアルゴリズムで表現した.ゆえに,逐次消去 によって残る戦略の組がナッシュ均衡であると言えるのであれば,合理化可能性という概念はナッシュ均衡の実現 69 可能性を上手く説明できているということになる. 12 L R U 5, 5 0,8 D 8, 0 2,2 • 例えば,上の利得行列で表されるゲームについて考えてみよう.プレイヤー 2 の戦略 L は最適戦略になることはな いため,最適戦略にならない戦略の逐次消去によって消去される.すると以下のゲームが得られる. 12 R U 0,8 D 2,2 • 上の新たなゲームにおいて,プレイヤー 1 の戦略 U は最適戦略になることはないため,最適戦略にならない戦略 の逐次消去によって消去される.すると以下のゲームが得られる. 12 R D 2,2 • 残された戦略の組はもとのゲームのナッシュ均衡である.ゆえに,ゲームのルールとプレイヤーの合理性が共有知 識であるという仮定のもとでは,ナッシュ均衡は合理化可能戦略均衡として解釈できる.ただし,後に述べるよう に,このような解釈は常に可能であるとは限らない. 複数均衡の問題 • ナッシュ均衡が実際にプレーされる理由を合理化可能性に求める立場には複数の問題がある.1 つ目の問題は,最 適戦略にならない戦略の逐次消去は解を導く手法としては荒すぎるという点である.例えば,本節の冒頭において 例として挙げた以下のゲームのナッシュ均衡は (a2 , b2 ) であるが,最適戦略にならない戦略の逐次消去によって最 終的に残るプレイヤー 1 の戦略は {a1 , a2 , a3 } であり,プレイヤー 2 の戦略は {b1 , b2 , b3 } であるから,その結果か ら (a2 , b2 ) が実際にプレーされることを保証することができない. 12 b1 b2 b3 b4 a1 0,7 2, 5 7, 0 0, 1 a2 5, 2 3,3 5, 2 0, 1 a3 7, 0 2, 5 0,7 0, 1 a4 0,0 0, −2 0,0 10, −1 • 2 つ目の問題は複数均衡の問題である.まず,先に考えた左下のゲームに最適戦略にならない戦略の逐次消去を適 用すると,最終的に残る戦略の組は (D, R) であり,これはもとのゲームのナッシュ均衡と一致する.つまり,合 理化可能戦略均衡が一意的に定まるゲームにおいては,ナッシュ均衡が実際にプレーされることを合理化可能性の 70 概念で説明することができる. 12 L R 12 L R U 5, 5 0,8 U 2,1 0, 0 D 8, 0 2,2 D 0, 0 1,2 • 一方,右上のゲームには複数のナッシュ均衡 (U, L) , (D, R) が存在するが,このゲームに対して最適戦略にならな い戦略の逐次消去を適用しても,戦略を消去することはできない.ゆえに,合理化可能性の概念はナッシュ均衡が 実際にプレーされることを必ずしも保証することはできない. 3.5.4 フォーカルポイント フォーカルポイント • ナッシュ均衡が実際にプレーされることを保証するための根拠として推論プロセスの終着点や合理化可能性などの 概念について考えてきたが,ゲームに複数のナッシュ均衡が存在する場合などには,これらの概念は説明力を失っ てしまうことが明らかになった.ゆえに,複数均衡が存在する場合にその中のどれが実際にプレーされる均衡であ るかを説明する別の体系が必要になる. • 複数のナッシュ均衡が存在するゲームにおいて,ある均衡が他の均衡よりもプレイヤーたちの注意を引くものであ る場合には,プレイヤーたちはその均衡をプレーするものと予想される.このような均衡をフォーカルポイント (focal point)と呼ぶ. • 複数のナッシュ均衡の中のどれがフォーカルポイントになるかは,プレイヤーたちが属する社会の慣習や法律など, ゲームのルールとして記述されない要素によって決定される. • 例えば,下の利得行列で表されるゲームについて考えよう.このゲームには複数のナッシュ均衡 (R, R) , (L, L) が 存在するため,プレイヤーたちがどちらの均衡をプレーするかを合理性の仮定のみから予想することはできない. 1\2 R L R 1,1 0, 0 L 0, 0 1,1 • だが,このゲームに以下のような文脈を与えたらどうなるだろうか.トンネルを通過する 2 車線に分かれた車道を 車で走行する 2 人がプレイヤーである.ただし,2 人は互いに向き合う方向に走行中であり,数分後には同じ地点 に到達する.それぞれのプレイヤーは,右車線を走る R か左車線 L を走るかの 2 つの戦略が与えられている.2 人 が同じ戦略を選択すれば 2 台の車はすれ違うことができ,2 人はそれぞれ利得 1 を得る.一方,2 人が異なる戦略 を選択すれば 2 台の車は衝突し,2 人はそれぞれ利得 0 を得る.トンネルは薄暗いため,2 人は直前にハンドルを 切ることができない.このようなゲームを一般に調整ゲーム(coordination game)と呼ぶ. • この場合には,2 人とも右車線を走行することと,2 人とも左車線を走行することがともにナッシュ均衡である.だ が,仮にゲームの舞台が日本であれば,日本では車は左通行と法で定められており,そのことが広く知れ渡ってい るため,2 人とも左車線を走行することがフォーカルポイントとして実際にプレーされる.一方,舞台がアメリカ であれば,2 人とも右車線を走行することがフォーカルポイントになる. 71 3.5.5 自己拘束的な合意 自己拘束的な合意はナッシュ均衡 • 完備情報の静学ゲームの定義は,それが非協力ゲームであることを含むため,そこではプレイヤーたちの間に拘束 的な合意が成立しないという前提のもとで分析を行う.だが,拘束的な合意を成立させるためにはプレイヤーたち が事前交渉を行う必要があるが,非協力ゲームはプレイヤーたちが事前交渉を行う可能性までは排除していない. つまり,プレイヤーたちが事前交渉を行う場合でも,そこでの合意に拘束力がないものとみなされるならば,それ はやはり非協力ゲームとみなされる. • 一方,プレイヤーたちが行う事前交渉の結果として成立した合意に拘束力が存在しないにも関わらず,その合意 がプレイヤーたちによっておのずと守られる場合がある.報酬や罰則など,プレイヤーたちが合意にしたがうこ とを外部から強制する要因が存在しないにも関わらず,プレイヤーたちによって守られる合意を自己拘束的な合意 (self-enforcing agreement)と呼ぶ. • プレイヤーたちが事前交渉によってある戦略の組をプレーすることに合意したとき,たとえその合意に拘束力が存 在しない場合でも,合意した戦略の組がナッシュ均衡である場合には,プレイヤーたちはそこから逸脱する動機を 持たない.ゆえに,それは自己拘束的な合意となる.一方,合意した戦略の組がナッシュ均衡でない場合には,少な くとも 1 人はそこから逸脱することによって得することができるが,合意には拘束力がないため,そのプレイヤー は実際に合意から逸脱するであろう.ゆえに,それは自己拘束的な合意にはならない.つまり,事前交渉によって 得られた合意がナッシュ均衡であることは,その合意が自己拘束的であるための必要条件である. 1\2 L R U 2,1 0, 0 B 0, 0 1,2 • 例えば,上の利得行列で表されるゲームについて考えよう.このゲームには 2 つのナッシュ均衡 (U, L) , (B, R) が 存在する.仮にプレイヤーたちが事前交渉において (U, L) をプレーするよう合意したとする.ただし,この合意に 拘束力は存在しない. • 2 つのナッシュ均衡を比べると,プレイヤー 1 には (U, L) のほうが望ましく,プレイヤー 2 には (B, R) のほうが 望ましい.だが,2 つのナッシュ均衡はそれ以外のすべての戦略の組をパレート支配しているため,ナッシュ均衡 ではない戦略の組が実現するよりは,どちらかのナッシュ均衡が実現するほうがましであるという点において 2 人 の利害は一致している. • 事前交渉においてプレイヤー 1 が自分は U をプレーすると相手に伝える状況を思い浮かべよう.それに対してプレ イヤー 2 が L をプレーすると約束したとき,プレイヤー 1 はそれを文字通り信じることができるだろうか.プレ イヤー 2 が L をプレーする意志を持っている場合には,プレイヤー 1 が U をプレーすることは自分にとっても望 ましい.一方,プレイヤー 2 が R をプレーする意志を持っている場合には,プレイヤー 1 が B をプレーすること のほうが自分にとって望ましい.ゆえに,プレイヤー 2 が合意 (U, L) に同意することは,自分が L をプレーする 意志だけでなく,プレイヤー 1 に U をプレーしてもらいたいという意志を表明していることを意味するため,こ の合意は自己拘束的となる.同様に考えると,事前交渉によって (B, R) をプレーするよう合意した場合にも,そ れは自己拘束的となる. 72 • 以上の議論を別の視点から捉えると,自己拘束的な合意となり得るナッシュ均衡が複数存在する場合には,その中 からプレイヤーたちが事前交渉によって合意に至ったものが実際にプレーされることになる.つまり,そのような 条件のもとで合意されたナッシュ均衡は,ある種のフォーカルポイントとなるのである.自己拘束的な合意という 概念は,一定の条件のもとでは,複数均衡問題への解を与える手がかりとなり得る. ナッシュ均衡は自己拘束的な合意になるとは限らない • ある合意が自己拘束的であるためにはそれがナッシュ均衡でなければならないが,その逆の関係は成立するとは限 らない.つまり,プレイヤーたちがナッシュ均衡であるような戦略の組をプレーするように合意した場合でも,そ れは自己拘束的であるとは限らない.ゆえに,そのナッシュ均衡がプレーされるとは限らない.つまり,事前交渉 によって得られた合意がナッシュ均衡であることは,その合意が自己拘束的であるための十分条件ではない. 1\2 L R U 9,9 0, 8 B 8, 0 7,7 • 例えば,上の利得行列で表されるゲームについて考えよう(Aumann, 1990).このゲームには 2 つのナッシュ均 衡 (U, L) , (B, R) が存在する.(U, L) は (B, R) をパレート支配しているため,2 人にとって (U, L) のほうが望まし い均衡である.そこで,プレイヤーたちは事前交渉によって (U, L) をプレーするよう合意した場合を想定しよう. ただし,この合意に拘束力は存在しない. • だが,実際にゲームをプレーする段階になって,プレイヤー 1 は相手が裏切って R をプレーする可能性を考慮する かもしれない.なぜなら,仮に相手もまた自分が裏切って B を選ぶ可能性を考慮している可能性があると 1 が考 えるならば,相手は合意通りに L をプレーして 0 を得るよりも,裏切って R をプレーして 7 を確保したほうが安 全だと考えられるから.このような推測を踏まえると,プレイヤー 1 は相手の R に対抗して自分も裏切って B を 選ぶべきと考えるかもしれない.さらに,プレイヤー 1 は自身がこのように推測する可能性があることを相手が気 づく可能性があることに思い至るならば,相手はやはり R を選ぶであろうというさらなる確信を得ることになる. • さらに注目したいことは,事前交渉においてプレイヤーたちが (U, L) に合意したときに,プレイヤー 1 は相手がど のような意図を持って合意したかを観察できない点である.そのことを説明するために,事前交渉においてプレイ ヤー 1 が自分は U をプレーすると相手に伝える状況を思い浮かべよう.このとき,プレイヤー 2 が L と R のどち らをプレーする意志を持っている場合でも,プレイヤー 1 には U をプレーしてもらいたい動機があるため,プレ イヤー 2 は自分の実際の意図には関わらず,自分もまた合意にしたがって L をプレーすると約束するであろう.言 い換えると,プレイヤー 2 が合意にしたがって L をプレーすると約束するとき,プレイヤー 1 は相手の真の意図 を見破ることができないのである.したがって,実際に (U, L) がプレーされると保証できない. 3.5.6 安定的な社会的慣習 3.5.7 利得支配 3.5.8 リスク支配 73 4 戦略の逐次消去 4.1 4.1.1 戦略の支配関係 純戦略の支配関係 純戦略の支配関係 • 戦略型ゲーム G において,i 以外のプレイヤーたちがいかなる純戦略の組 s−i ∈ S−i を選んだ場合においても,プ レイヤー i が純戦略 s′i ∈ Si を選んだときに得る利得が別の純戦略 si ∈ Si を選んだときに得る利得よりも大きけれ ば,すなわち,異なる 2 つの純戦略 si , s′i ∈ Si に対して, ∀s−i ∈ S−i : ui (s′i , s−i ) > ui (si , s−i ) が成り立つならば,s′i は si を強支配する(strictly dominate)とか支配する(dominate),もしくは,si は s′i に 強支配される(strictly dominated)とか支配される(dominated)などと言う. • 戦略型ゲーム G において,i 以外のプレイヤーたちがいかなる純戦略の組 s−i ∈ S−i を選んだ場合においても,プ レイヤー i が純戦略 s′i ∈ Si を選んだときに得る利得は別の純戦略 si ∈ Si を選んだときに得る利得以上であると同 時に,ある純戦略の組 s′−i ∈ S−i に対しては,プレイヤー i が s′i を選んだときに得る利得が si を選んだときに得 る利得よりも大きければ,すなわち,異なる 2 つの純戦略 si , s′i ∈ Si に対して, (a) ∀s−i ∈ Si : ui (s′i , s−i ) ≥ ui (si , s−i ) (b) ∃s′−i ∈ Si : ui (s′i , s′−i ) > ui (si , s′−i ) が成り立つならば,s′i は si を弱支配する(weakly dominate)とか,si は s′i に弱支配される(weakly dominated) などと言う. • プレイヤー i にとって s′i が si を強支配するならば,s′i は明らかに si を弱支配する.だが,その逆は成立するとは 限らない.つまり,s′i が si を弱支配するとき,s′i は si を強支配するとは限らない.以下に反例を示す. 1/2 L R U 0, 0 3, −1 D 0, 3 1, 1 • 上の利得行列で表される戦略型ゲームについて考えよう.プレイヤー 1 にとって U は D を弱支配する戦略である が,U は D を強支配する戦略ではない.なぜなら,プレイヤー 2 が L を選んだ場合には,プレイヤー 1 は U, D の どちらを選んでも同じ利得 0 しか得られないから. プレイヤーが強支配される戦略を選ばない理由 • 合理的なプレイヤーは強支配される戦略を選ばない.なぜなら,プレイヤーは強支配される戦略を選ぶ代わりに, その戦略を強支配する戦略を選べば,他のプレイヤーがどのような戦略を選んだ場合においても,自分はより大き 74 な利得を得られるから.ゆえに,合理的なプレイヤーの目的が自己の利得の最大化である限りにおいて,プレイ ヤーが強支配される戦略を選ぶことは合理性と矛盾する. 1/2 α β α 0, 0 3, −1 β −1, 3 1, 1 • 例えば,上の利得行列で表される戦略型ゲームについて考えよう.両プレイヤーにとって β は α に強支配される戦 略であるから,合理性の仮定のもとでは,2 人がともに α を選ぶことが合理的な帰結と考えられる.その結果,2 人はともに利得 0 を獲得する. • 仮に 2 人がともに強支配される戦略 β を選べば,2 人はともに利得 1 を獲得し,これは 2 人が支配する戦略 α を選 んだときに得る利得 0 よりも大きい.したがって,2 人は支配される戦略を選ぶべきと考えるかもしれない.だが, この考えは誤りである.理由は以下の通り. • 静学ゲームにおいてプレイヤーは互いに相談せずに自分の戦略を選ばなければならない.したがって,仮に自分が β を選んだとしても,相手に対して自分と同じように β を選ぶように仕向けることはできない.自分が β を選んだ ときに仮に相手が α を選べば,自分の利得は −1 となり,最悪の結果が待っている.一歩譲って,仮に相手に対し て β を選ぶように仕向けることに成功した場合においても,その場合には今度は自分が a を選べば最大の利得であ る 3 を得られるので,自分は α を選んだ方がよい. プレイヤーが弱支配される戦略を選ばない理由 • 強支配される戦略が選ばれない根拠としてはプレイヤーの合理性だけで十分であるが,弱支配される戦略が選ばれ ない理由は,プレイヤーの合理性だけでは説明がつかない. 1/2 L R U 5, 1 4, 0 M 6, 0 3, 1 D 6, 4 4, 4 • 例えば,上の双行列ゲームについて考えよう.プレイヤー 1 にとって,U, M はともに D に弱支配される戦略であ る.仮に,プレイヤー 2 が L を選ぶことをプレイヤー 1 が確信しているならば,プレイヤー 1 は M と D のどち らを選んでも得られる利得は 6 であるから,合理性の観点からだけでは M を選ぶ可能性を排除できない. • しかし,仮に,プレイヤー 2 が R を選ぶ確率が少しでも存在するとプレイヤー 1 が考えるならば,プレイヤー 1 は D ではなく M を選んでおいた方が良いと考えるであろう.したがって,このような警戒心(caution)の視点を加 えれば,弱支配戦略が選ばれない確固たる根拠が生まれる. 75 4.1.2 混合戦略の支配関係 混合戦略の支配関係 • 純戦略どうしの支配関係は,混合戦略どうしの関係としても容易に拡張できる.具体的には,戦略型ゲーム G の 混合拡張 G∗ において,i 以外のプレイヤーたちがいかなる混合戦略の組 σ−i ∈ ∆ (S−i ) を選んだ場合においても, プレイヤー i が混合戦略 σi′ ∈ Si を選んだときに得る期待利得が別の混合戦略 σi ∈ ∆ (Si ) を選んだときに得る期 待利得よりも大きければ,すなわち,異なる 2 つの混合戦略 σi , σi′ ∈ ∆ (Si ) に対して, ∀σ−i ∈ ∆ (S−i ) : Fi (σi′ , σ−i ) > Fi (σi , σ−i ) が成り立つならば,σi′ は σi を強支配するとか支配するなどと言ったり,もしくは,σi は σi′ に強支配されるとか支 配されるなどと言う. • 戦略型ゲーム G の混合拡張 G∗ において,i 以外のプレイヤーたちがいかなる混合戦略の組 σ−i ∈ ∆ (S−i ) を選ん だ場合においても,プレイヤー i が混合戦略 σi′ ∈ ∆ (Si ) を選んだときに得る期待利得は別の混合戦略 σi ∈ ∆ (Si ) ′ を選んだときに得る期待利得以上であると同時に,ある混合戦略の組 σ−i ∈ ∆ (S−i ) に対しては,プレイヤー i が σi′ を選んだときに得る期待利得が σi を選んだときに得る期待利得よりも大きければ,すなわち,異なる 2 つの混 合戦略 σi , σi′ ∈ ∆ (Si ) に対して, (a) ∀σ−i ∈ ∆ (S−i ) : Fi (σi′ , σ−i ) ≥ Fi (σi , σ−i ) ′ ′ ′ (b) ∃σ−i ∈ ∆ (S−i ) : Fi (σi′ , σ−i ) > Fi (σi , σ−i ) が成り立つならば,σi′ は σi を弱支配するとか,σi は σi′ に弱支配されるなどと言う. • プレイヤー i にとって σi′ が σi を強支配するならば,σi′ は明らかに σi を弱支配する.だが,その逆は成立すると は限らない.つまり,σi′ が σi を弱支配するとき,σi′ は σi を強支配するとは限らない. • 純戦略は特別な混合戦略であるから,上の定義は,純戦略を支配する混合戦略や,混合戦略を支配する純戦略,ま た,純戦略を支配する純戦略などをも包括的に含んでいる.そこで,以降では混合支配戦略をシンプルに支配戦略 と呼ぶ. 4.1.3 支配関係の特徴付け 支配関係の特徴付け • 混合戦略どうしの支配関係を以下のように特徴づけられる. 命題 4.1 戦略型ゲーム G の混合拡張 G∗ において,プレイヤー i の異なる 2 つの混合戦略 σi , σi′ ∈ ∆ (Si ) に対して, ∀s−i ∈ S−i : Fi (σi′ , s−i ) > Fi (σi , s−i ) が成り立つことは,σi′ が σi を支配する戦略であるための必要十分条件である. 76 • プレイヤー i のある混合戦略 σi′ が別の混合戦略 σi を支配することは,他のプレイヤーたちの任意の混合戦略の組 に対して,σi′ は常に σi よりも大きな期待利得をもたらすことを意味するが,このことは,他のプレイヤーたちの 任意の純戦略の組に対して,σi′ は常に σi よりも大きな期待利得をもたらすことと同値であると,この命題は主張 している.ゆえに,あるプレイヤーの混合戦略どうしの支配関係について考える際には,他のプレイヤーたちがと り得る戦略を純戦略に限定してもよい. 必要性の証明: • プレイヤー i の異なる 2 つの混合戦略 σi , σi′ ∈ ∆ (Si ) に対して,σi′ が σi を支配するものと仮定する.すなわち, ∀σ−i ∈ ∆ (S−i ) : Fi (σi′ , σ−i ) > Fi (σi , σ−i ) (1) が成り立つものとする. • i 以外のプレイヤーの純戦略の組 s−i = (s1 , · · · , si−1 , si+1 , · · · , sn ) ∈ S−i を任意に選ぶ.これに対して, σj′ (sj ) = 1 (j ∈ N \ {i}) (2) ( ) ′ ′ ′ = σ1′ , · · · , σi−1 を満たす混合戦略の組 σ−i , · · · , σn′ ∈ ∆ (S−i ) を考える. , σi+1 ′ に対しても (1) は成り立つ.すなわち, • この σ−i ′ ′ Fi (σi′ , σ−i ) > Fi (σi , σ−i ) • (2) より,これは以下を意味する. ∑ [σi′ (si ) · ui (xi , s−i )] > ∑ [σi (si ) · ui (xi , s−i )] si ∈Si si ∈Si すなわち, Fi (σi′ , s−i ) > Fi (σi , s−i ) • 同様の議論は任意の s−i について成立するため,目標は達成された. 十分性の証明: • プレイヤー i の異なる 2 つの混合戦略 σi , σi′ ∈ ∆ (Si ) に対して, ∀s−i ∈ S−i : Fi (σi′ , s−i ) > Fi (σi , s−i ) (1) が成り立つものとする. • 期待利得関数 Fi : ∆ (S) → R の定義より, Fi (σi′ , σ−i ) − Fi (σi , σ−i ) = ∑ s−i ∈S−i = ∑ s−i ∈S−i ∏ σj (sj ) · Fi (σi′ , s−i ) − j∈N \{i} ∏ ∑ s−i ∈S−i σj (sj ) · [Fi (σi′ , s−i ) − Fi (σi , s−i )] j∈N \{i} 77 ∏ σj (sj ) · Fi (σi , s−i ) j∈N \{i} (2) と表せる. • (1) より,任意の s−i に対して,(2) の右辺の Fi (σi′ , s−i ) − Fi (σi , s−i ) は正である.さらに,混合戦略の定義より, ∏ 任意の j ∈ N \ {i} について σj (sj ) ∈ [0, 1] であるから,任意の s−i に対して (2) の右辺の j∈N \{i} σj (sj ) は非負 ∏ であり,少なくとも 1 つの s−i について j∈N \{i} σj (sj ) は正になる.ゆえに,(2) の右辺は正であるから, Fi (σi′ , σ−i ) − Fi (σi , σ−i ) > 0 すなわち, Fi (σi′ , σ−i ) > Fi (σi , σ−i ) が成り立つため,目標は達成された. 弱支配戦略の特徴付け • 弱支配戦略に関しても同様の言い換えが可能である.ゆえに,あるプレイヤーの混合戦略どうしの弱支配関係につ いて考える際にも,他のプレイヤーたちが取りえる戦略を純戦略に限定してもよい.証明は命題 4.1 と同様である. 命題 4.2 戦略型ゲーム G の混合拡張 G∗ において,プレイヤー i の異なる 2 つの混合戦略 σi , σi′ ∈ ∆ (Si ) に対して, (a) ∀s−i ∈ S−i : Fi (σi′ , s−i ) ≥ Fi (σi , s−i ) (b) ∃s′−i ∈ S−i : Fi (σi′ , s′−i ) > Fi (σi , s′−i ) が成り立つことは,σi′ が σi を弱支配する戦略であるための必要十分条件である. 純戦略に支配されない純戦略を支配する混合戦略 • 戦略型ゲーム G においていかなる純戦略によっても支配されない純戦略が,混合拡張 G∗ において混合戦略に支配 されることは起こり得る. • 具体的には,以下の双行列で表される戦略型ゲーム G について考えよう.プレイヤー 1 には,純戦略の範囲では 支配される戦略は存在しない. 12 L R U 2, 0 −1, 0 M 0, 0 0, 0 D −1, 0 2, 0 • 一方,上のゲーム G の混合拡張 G∗ におけるプレイヤー 1 の混合戦略 σ1 として, ( σ1 = (σ1 (U ), σ1 (M ), σ1 (D)) = について考える.この混合戦略 σ1 は純戦略 M を支配する. 78 1 1 , 0, 2 2 ) • 具体的には,プレイヤー 2 の純戦略 L, R に対して, 1 1 · 2 + · (−1) = 2 2 1 1 F1 (σ1 , R) = · (−1) + · 2 = 2 2 F1 (σ1 , L) = 1 > 0 = F1 (M, L) 2 1 > 0 = F1 (M, R) 2 がそれぞれ成り立つが,先の命題 4.1 より,この事実は σ1 が M を支配することを意味する. 混合戦略に支配される純戦略に正の確率を与える混合戦略は支配される • 支配される純戦略に対して正の確率を割り当てる混合戦略もやはり支配される. 命題 4.3 戦略型ゲーム G の混合拡張 G∗ において,プレイヤー i ∈ N の純戦略 s′i ∈ Si が何らかの混合戦略によって支 配されるとき,s′i に正の確率を与える任意の混合戦略もまた,何らかの混合戦略によって支配される. 証明: • 戦略型ゲーム G の混合拡張 G∗ において,プレイヤー i の純戦略 s′i が混合戦略 σi′ に支配されるものとしよう.命 題 4.1 より,これは, ∀s−i ∈ S−i : Fi (σi′ , s−i ) > Fi (s′i , s−i ) (1) が成り立つことを意味する. • 上の純戦略 s′i に正の確率を与える混合戦略 σi∗ を任意に選ぶ.すなわち, σi∗ (s′i ) > 0 (2) である.この σi∗ を支配する混合戦略の存在を示したい. • このとき,任意の s−i ∈ S−i に対して, Fi (σi∗ , s−i ) = ∑ si ∈Si {σi∗ (si ) · ui (si , s−i )} = σi∗ (s′i ) · Fi (s′i , s−i ) + ∑ si ∈Si \{s′i } < σi∗ (s′i ) · Fi (σi′ , s−i ) + {σi∗ (si ) · ui (si , s−i )} ∑ si ∈Si \{s′i } {σi∗ (si ) · ui (si , s−i )} ∵ (1), (2) (3) が成り立つ. • そこで,確率 σi∗ (s′i ) で混合戦略 σi′ を選び,確率 σi∗ (si ) で純戦略 si ∈ Si \{s′i } を選ぶ混合戦略 σi′′ を新たに構成す れば,任意の s−i ∈ S−i に対して, Fi (σi′′ , s−i ) = σi∗ (s′i ) · Fi (σi′ , s−i ) + 79 ∑ si ∈Si \{s′i } {σi∗ (si ) · ui (si , s−i )} となるため,これと (3) より,任意の s−i ∈ S−i に対して, Fi (σi∗ , s−i ) < Fi (σi′′ , s−i ) が成り立つ.ゆえに,σi′′ は σi∗ を支配する混合戦略であるから,目標は達成された. • 純戦略は特別な混合戦略であるから,この命題から以下を導ける. 系 4.1 戦略型ゲーム G において,プレイヤー i ∈ N の純戦略 s′i ∈ Si が何らかの純戦略によって支配されるとき,G の 混合拡張 G∗ において,s′i に正の確率を与える任意の混合戦略は,何らかの混合戦略によって支配される. 純戦略に支配されない純戦略に正の確率を与える混合戦略は支配され得る • 他の純戦略に支配されない純戦略だけに正の確率を与える混合戦略が,純戦略によって支配されることは起こり 得る. • 具体的には,以下の双行列で表される戦略型ゲーム G について考えよう.プレイヤー 1 にとって,U や D を支配 する純戦略は存在しない. 12 L R U 1, 3 −2, 0 M −2, 0 1, 3 D 0, 1 0, 1 • 一方,上のゲーム G の混合拡張 G∗ において,先の純戦略に支配されない戦略 U, D に正の確率を与える混合戦略 σ1 として, ( σ1 = (σ1 (U ), σ1 (M ), σ1 (D)) = ) 1 1 , ,0 2 2 について考える.この混合戦略 σ1 は純戦略 D に支配される. • 具体的には,プレイヤー 2 の純戦略 L, R に対して, 1 1 1 · 1 + · (−2) = − < 0 = F1 (D, L) 2 2 2 1 1 1 F1 (σ1 , R) = · (−2) + · 1 = − < 0 = F1 (D, R) 2 2 2 F1 (σ1 , L) = がそれぞれ成り立つが,先の命題 4.1 より,この事実は D が σ1 を支配することを意味する. 4.2 4.2.1 戦略の逐次消去 戦略の逐次消去 強支配される戦略の逐次消去 80 • 合理的なプレイヤーは強支配される戦略を選択しない.また,一般に,何らかの混合戦略によって支配される純戦 略が存在する場合には,その純戦略に正の確率を与える任意の混合戦略もまた,何らかの混合戦略によって支配さ れる(命題 4.3).ゆえに,混合戦略に支配される純戦略が,単独ないし混合戦略の一部としてプレイヤーに選ば れる可能性はないため,それをプレイヤーの選択肢から消去しても問題は生じない. • そこで,与えられたゲームにおいて,それぞれのプレイヤーが何らかの混合戦略によって強支配される戦略を持つ場 合には,そのプレイヤーの選択肢から強支配される純戦略を消去することを通じて,プレイヤーたちが選択し得る 戦略の組を絞り込む手法を,強支配される戦略の逐次消去(iterated elimination of strictly dominated strategies) と呼ぶ. • では,強支配される戦略の逐次消去をアルゴリズムとして定義しよう.まず,与えられた戦略型ゲーム G = (N, {Si }i∈N , {ui }i∈N ) とその混合拡張 G∗ = (N, {∆ (Si )}i∈N , {Fi }i∈N ) を,アルゴリズムの第 0 ステップにお けるゲームとみなした上で,そこでのプレイヤー i の純戦略集合や混合戦略集合を, (A0 ) (B0 ) Si0 = Si ( ) ∆ Si0 = ∆ (Si ) などで表す.その上で,これらを純戦略集合ないし混合戦略集合として持つ初期ゲームを, { } (C0 ) G0 = (N, Si0 i∈N , {ui }i∈N ) { ( )} (D0 ) G∗0 = (N, ∆ Si0 i∈N , {Fi }i∈N ) などで表す.G0 = G かつ G∗0 = G∗ である. • ゲーム G∗0 においてプレイヤー i の純戦略 si ∈ Si0 が何らかの混合戦略によって支配されることは, ( ) 0 ∃σi ∈ ∆ Si0 , ∀s−i ∈ S−i : Fi (σi , s−i ) > Fi (si , s−i ) ( ) が成り立つことを意味する.ゆえに,純戦略 si ∈ Si0 が混合戦略集合 ∆ Si0 に属するいかなる混合戦略にも支配 されないことは,上の命題の逆に相当する, ( ) 0 ∀σi ∈ ∆ Si0 , ∃s−i ∈ S−i : Fi (σi , s−i ) ≤ Fi (si , s−i ) が成り立つことを意味する.そこで,G∗0 においてプレイヤー i が持つ支配される純戦略を消去して得られる新た ( ) な戦略集合を Si1 で表し,Si1 上の混合戦略を ∆ Si1 で表す.すなわち, { ( ) } 0 (A1 ) Si1 = si ∈ Si0 |∀σi ∈ ∆ Si0 , ∃s−i ∈ S−i : Fi (σi , s−i ) ≤ Fi (si , s−i ) ( ) { ( ) } (B1 ) ∆ Si1 = σi ∈ ∆ Si0 |σi (si ) > 0 ⇒ si ∈ Si1 である.その上で,これらを純戦略集合ないし混合戦略集合として持つ第 1 ステップのゲームを, { } (C1 ) G1 = (N, Si1 i∈N , {ui }i∈N ) { ( )} (D1 ) G∗1 = (N, ∆ Si1 i∈N , {Fi }i∈N ) で表す. • G∗1 においてプレイヤー i が持つ支配される純戦略を消去して得られる新たな戦略集合を Si2 で表し,Si2 上の混合 81 ( ) 戦略を ∆ Si2 で表す.すなわち, ( ) } { 1 : Fi (σi , s−i ) ≤ Fi (si , s−i ) (A2 ) Si2 = si ∈ Si1 |∀σi ∈ ∆ Si1 , ∃s−i ∈ S−i ( ) { ( ) } (B2 ) ∆ Si2 = σi ∈ ∆ Si1 |σi (si ) > 0 ⇒ si ∈ Si2 である.その上で,これらを純戦略集合ないし混合戦略集合として持つ第 2 ステップのゲームを, { } (C2 ) G2 = (N, Si2 i∈N , {ui }i∈N ) { ( )} (D2 ) G∗2 = (N, ∆ Si2 i∈N , {Fi }i∈N ) で表す. • 同様のプロセスを繰り返して,第 t − 1 ステップのゲーム Gt−1 , G∗t−1 まで定まったとき,G∗t−1 においてプレイヤー i が持つ支配される純戦略を消去して得られる新たな戦略集合を Sit で表し,Sit 上の混合戦略を ∆ (Sit ) で表す.す なわち, { ( ) } t−1 (At ) Sit = si ∈ Sit−1 |∀σi ∈ ∆ Sit−1 , ∃s−i ∈ S−i : Fi (σi , s−i ) ≤ Fi (si , s−i ) { ( } ) (Bt ) ∆ (Sit ) = σi ∈ ∆ Sit−1 |σi (si ) > 0 ⇒ si ∈ Sit である.その上で,これらを純戦略集合ないし混合戦略集合として持つ第 t ステップのゲームを, (Ct ) Gt = (N, {Sit }i∈N , {ui }i∈N ) (Dt ) G∗t = (N, {∆ (Sit )}i∈N , {Fi }i∈N ) で表す. • 強支配される戦略の逐次消去とは,上のように,強支配される純戦略を逐次的に消去しながら, G = G0 → G1 → G2 → · · · → Gt−1 → Gt → · · · としてゲームを縮小していくプロセスのことである.その上で,最終的に強支配されずに残る純戦略からなる純戦 略集合を持つ戦略型ゲームを, G∞ = (N, {Si∞ }i∈N , {ui }i∈N ) で表し,それに対応する混合拡張を, G∗∞ = (N, {∆ (Si∞ )}i∈N , {Fi }i∈N ) で表す. • 初期ゲーム G に対して強支配される戦略の逐次消去を行った結果,すべてのプレイヤーについて,1 つの純戦略の みが消去されずに残る場合には,すなわち,最終ゲーム G∞ において, ∀i ∈ N : # |Si∞ | = 1 が成り立つ場合には,ゲーム G は逐次強支配によって解ける(solvable by iterated strict dominance)と言う. • 初期ゲーム G (= G0 ) が有限ゲームである場合には,強支配される純戦略を逐次消去していくと,必ず有限ステッ 82 プ内にプレイヤーの純戦略を消去できなくなる.すなわち,ある番号 m ∈ N が存在して, Gm−1 = Gm = G∞ が成り立つ.ただし,上の G∞ においてそれぞれのプレイヤーに複数の純戦略が残されている可能性があるため, たとえ G が有限ゲームである場合でも,それは逐次強支配によって解けるとは限らない点に留意せよ. 弱支配される戦略の逐次消去 • 弱支配される戦略の逐次消去(iterated elimination of weakly dominated strategies)についても同様に考えるこ とができる.すなわち,それぞれのステップにおいて,それぞれのプレイヤーについて,何らかの混合戦略によっ て弱支配される純戦略を消去するプロセスを,弱支配される戦略の逐次消去と呼ぶ. • 初期ゲーム G に対して弱支配される戦略の逐次消去を行った結果,すべてのプレイヤーについて,1 つの純戦略の みが消去されずに残る場合には,すなわち,最終ゲーム G∞ において, ∀i ∈ N : # |Si∞ | = 1 が成り立つ場合には,ゲーム G は逐次弱支配によって解ける(solvable by iterated weak dominance)と言う. 例 4.1 (強支配される戦略の逐次消去) • 以下の双行列で表される戦略型ゲーム G (= G0 ) について考える. 12 L M R U 1, 0 1, 2 0, 1 D 0, 3 0, 1 2, 0 • 上のゲーム G0 において,プレイヤー 1 は何らかの戦略に強支配される純戦略を持たないが,プレイヤー 2 にとっ て R は M に強支配される.そこで,プレイヤー 2 の純戦略 M を消去すると,以下の双行列で表される新たな戦 略型ゲーム G1 が得られる 12 L M U 1, 0 1, 2 D 0, 3 0, 1 • 上のゲーム G1 において,プレイヤー 2 は何らかの戦略に強支配される純戦略を持たないが,プレイヤー 1 にとっ て D は U に強支配される.そこで,プレイヤー 1 の純戦略 D を消去すると,以下の双行列で表される新たな戦略 型ゲーム G2 が得られる. 12 L M U 1, 0 1, 2 83 • 上のゲーム G1 において,プレイヤー 2 にとって L は M に強支配される.そこで,プレイヤー 2 の純戦略 L を消 去すると,以下の双行列で表される新たな戦略型ゲーム G3 が得られる.これ以上消去できないため,G∞ = G3 と なる. 12 M U 1, 2 例 4.2 (数字当てゲーム) • 以下の戦略型ゲームについて考える: – プレイヤーは 100 人である. – それぞれのプレイヤーは 1 から 100 までの整数の中から 1 つを選ぶ. – 全員の数値の平均の 2 3 に最も近い値を選んだ者が利得 1 を獲得し,他のプレイヤーたちは利得 0 を獲得する. • 上の強支配される戦略の逐次消去を適用する: 1. 全員が最大の 100 を選んだ場合の平均の のもとでの平均の 2 3 2 3 は 2 3 · 100·100 100 = 66.67 であるから,他の任意の戦略の組み合わせ はこれよりも小さくなる.ゆえに,それぞれのプレイヤーにとって,他のプレイヤーた ちがどの戦略を選ぶかに関わらず,67 はそれより大きい任意の数字を強支配する.ゆえに,すべてのプレイ ヤーの純戦略集合から 68 より大きい数を消去できる. 2. 新たに得られたゲームにおいて,全員が最大の 67 を選んだ場合の平均の 他の任意の戦略の組み合わせのもとでの平均の 2 3 2 3 は 2 3 · 100·67 100 = 44.67 であるから, はこれよりも小さくなる.ゆえに,それぞれのプレイヤー にとって,他のプレイヤーたちがどの戦略を選ぶかに関わらず,45 はそれより大きい任意の数字を強支配す る.ゆえに,すべてのプレイヤーの純戦略集合から 45 より大きい数を消去できる. 3. 新たに得られたゲームにおいて,全員が最大の 45 を選んだ場合の平均の の任意の戦略の組み合わせのもとでの平均の 2 3 2 3 は 2 3 · 100·45 100 = 30 であるから,他 はこれよりも小さくなる.ゆえに,それぞれのプレイヤーに とって,他のプレイヤーたちがどの戦略を選ぶかに関わらず,30 はそれより大きい任意の数字を強支配する. ゆえに,すべてのプレイヤーの純戦略集合から 30 より大きい数を消去できる. 4. 同様のプロセスを繰り返すことで,最終的に残る戦略は 1 だけである.ゆえに,このゲームは逐次強支配に よって解くことができて,最終的に得られる解は全員が 1 を選ぶという戦略の組み合わせである. 関連項目 • ホテリングモデルにおける強支配される戦略の逐次消去 • クールノー競争における強支配される戦略の逐次消去 84 4.2.2 共有知識としての合理性 共有知識としての合理性 • 前節では,支配される戦略の逐次消去をアルゴリズムとして提示したが,プレイヤーによる意志決定と照らし合わ せた際に,逐次消去にどのような正当性があるかについては何も語らなかった.本節では,逐次消去の正当性につ いて考えてみよう. • 実は,合理的なプレイヤーによる意志決定の帰結として,支配される戦略の逐次消去を完遂させるためには,プレ イヤーの合理性が共有知識であることを仮定しなければならない.すなわち,すべてのプレイヤーが合理的であり, すべてのプレイヤーは他のすべてのプレイヤーが合理的であることを知っており,さらに,そのことをすべてのプ レイヤーが知っており,という仮定を積み重ねる必要がある.例を用いてその意味を具体的に考えてみよう. • 以下の双行列で表される戦略型ゲーム G (= G0 ) について考える. 12 L M R U 1, 0 1, 2 0, 1 D 0, 3 0, 1 2, 0 G0 = • 上のゲーム G0 において,プレイヤー 1 は何らかの戦略に強支配される純戦略を持たないが,プレイヤー 2 は M に 強支配される純戦略 R を持つ.そこで,G0 に対して数学的アルゴリズムとしての逐次消去を適用すれば,プレイ ヤー 2 の純戦略 M が消去され,以下の双行列で表される新たな戦略型ゲーム G1 を得る. G1 = 12 L M U 1, 0 1, 2 D 0, 3 0, 1 • だが,ゲームが G0 から G1 へ移行し,2 人がそのことを互いに認識し合っている状態を達成するためには,以下 の仮定が必要である: 1. 2 の合理性を仮定する.このとき,自身の利得を最大化する 2 は,G0 において自身が M を選ばないと判断で きる.ゆえに,2 は自身が直面するゲームが G0 から G1 へ移行することを認識できる. 2. 1 が「2 が合理的である」ことを知っているものと仮定する.このとき,1 は 2 が G0 において M を選ばない と判断できる.ゆえに,1 は自分と相手が直面するゲームが G0 から G1 へ移行することを認識できる. 3. 2 が「1 が「2 は合理的である」ことを知っている」ことを知っているものと仮定する.このとき,2 は「1 は 「2 は G0 において M を選ばない」と考える」と判断できる.ゆえに,2 は相手が直面するゲームが G0 から G1 へ移行することを認識できる. • 上のゲーム G1 において,プレイヤー 2 は何らかの戦略によって強支配される純戦略を持たないが,プレイヤー 1 は U に強支配される純戦略 D を持つ.そこで,G1 に対して数学的アルゴリズムとしての逐次消去を適用すれば, プレイヤー 1 の純戦略 D が消去され,以下の双行列で表される新たな戦略型ゲーム G2 を得る. G2 = 12 L M U 1, 0 1, 2 85 • だが,ゲームが G1 から G2 へ移行し,2 人がそのことを互いに認識し合っている状態を達成するためには,以下 の仮定が必要である: 1. 1 の合理性を仮定する.このとき,自身の利得を最大化する 1 は,G1 において自身が D を選ばないと判断で きる.ゆえに,1 は自身が直面するゲームが G1 から G2 へ移行することを認識できる. 2. 2 が「1 が合理的である」ことを知っていると仮定する.このとき,2 は 1 が G1 において D を選ばないと判 断できる.ゆえに,2 は自分と相手が直面するゲームが G1 から G2 へ移行することを認識できる. 3. 1 が「2 が「1 が合理的である」ことを知っている」ことを知っているものと仮定する.このとき,1 は「2 は 「1 は G1 において D を選ばない」と考える」と判断できる.ゆえに,1 は相手が直面するゲームが G1 から G2 へ移行することを認識できる. • 上のゲーム G2 において,プレイヤー 2 は M によって強支配される純戦略 L を持つ.そこで,G2 に対して数学的 アルゴリズムとしての逐次消去を適用すれば,プレイヤー 2 の純戦略 L が消去され,以下の双行列で表される新た な戦略型ゲーム G3 を得る. G3 = 12 M U 1, 2 • だが,ゲームが G2 から G3 へ移行し,2 人がそのことを互いに認識し合っている状態を達成するためには,先ほ どと同様の仮定を積み重ねる必要がある.詳細は省略する.ゆえに,以上の推論のもとでは,(U, M ) という戦略 の組み合わせが最終的な答えとなる. 4.2.3 逐次消去の順番 強支配される戦略の逐次消去における消去の順番 • 第 4.2.1 節において定義した支配される戦略の逐次消去では,それぞれのステップにおいて,すべてのプレイヤー のすべての支配される戦略を同時に消去する.一方,そのような方法とは別に,複数の支配される純戦略の中から 1 つずつ順番に消去したり,消去できる純戦略を持つプレイヤーたちが順番に戦略を消去することも原理的には可 能である.だが,その際には以下で指摘する問題が生じ得る. • あるプレイヤーが複数の支配される戦略を持つ場合には,以下の点が問題になる: 1. 支配される複数の戦略を 1 つずつ消去する場合と,それらを同時に消去する場合とでは,最終的に生き残る 戦略の組み合わせに変化は生じるか. 2. 支配される複数の戦略を 1 つずつ順番に消去する場合に,消去する戦略の順番によって,最終的に生き残る 戦略の組み合わせに変化は生じるか. • 複数のプレイヤーが支配される戦略を持つ場合には,以下の点が問題になる: 1. 1 人ずつ順番に消去する場合と,全員が同時に消去する場合とでは,最終的に生き残る戦略の組み合わせに変 化は生じるか. 2. 1 人ずつ順番に消去する場合に,消去するプレイヤーの順番によって,最終的に生き残る戦略の組み合わせに 変化は生じるか. 86 • 何らかの戦略によって強支配される純戦略のみを逐次消去する場合には,あるステップにおいて消去可能なある純 戦略を残しておいて,別の消去可能な純戦略だけを先に消去した場合でも,残しておいた純戦略が強支配される戦 略であることに変わりはないので,最終的にはどこかのステップにおいて消去される.ゆえに,以下の命題が成り 立つ. 命題 4.4 戦略型ゲーム G の混合拡張 G∗ において,強支配される純戦略を逐次消去する際には,消去する順番とは関係 なく,最終的に消去されずに生き残る戦略の組み合わせは常に一定である. • 強支配戦略の逐次消去を行う場合には,消去を行うプレイヤーの順番に関わらず,最終的に得られる結果は同じで あるという事実は,逐次消去を動学ゲームと解釈したときに,プレイヤーが行動する順番が結果に影響を与えない ことを意味する. 弱支配される戦略の逐次消去における消去の順番 • 強支配される純戦略だけでなく,弱支配される純戦略をも逐次消去の対象とする場合には,消去する順番に依存し て最終的に生き残る戦略の組が変化し得る. • まずは,消去する順番に依存しない例として,以下の双行列で表される戦略型ゲームについて考えよう. 1/2 L R U 1, 1 10, 0 D 0, 10 10, 10 • 上のゲームにおいて,2 人とも強支配される純戦略を持たないが,プレイヤー 1 は U に弱支配される純戦略 D を 持ち,プレイヤー 2 は L に弱支配される純戦略 R を持つ.ここで,消去する順番に依存せず,最終的に得られる 結果が同じであることを確認する: 1. 2 人が弱支配される戦略 D, R を同時に消去すると,戦略の組 (U, L) だけが残る. 2. プレイヤー 1 にとって弱支配される戦略 D だけを先に消去すると,後に続くゲームでは,プレイヤー 2 にとっ て R は L に弱支配されるために消去される.その結果,残る戦略の組は (U, L) だけである. 3. プレイヤー 2 にとって弱支配される戦略 R だけを先に消去すると,後に続くゲームでは,プレイヤー 1 にとっ て D は U に弱支配されるために消去される.その結果,残る戦略の組は (U, L) だけである. • 続いて,消去する順番に依存する例として,以下の双行列で表される戦略型ゲームについて考えよう. 1/2 L R U 0, 0 0, 1 D 1, 0 0, 0 • 上のゲームにおいて,2 人とも強支配される純戦略を持たないが,プレイヤー 1 は D に弱支配される純戦略 U を 持ち,プレイヤー 2 は R に弱支配される純戦略 L を持つ.ここで,消去する順番によって,最終的に得られる結 果が変化し得ることを確認する: 87 1. 2 人の弱支配される戦略 U, L を同時に消去すると,戦略の組 (D, R) だけが残る. 2. プレイヤー 1 にとって弱支配される戦略 U だけを先に消去すると,後に続くゲームでは,プレイヤー 2 には 弱支配される戦略が存在しないため,残る戦略の組は (D, L) と (D, R) の 2 つである. 3. プレイヤー 2 にとって弱支配される戦略 L だけを先に消去すると,後に続くゲームでは,プレイヤー 1 には 弱支配される戦略が存在しないため,残る戦略の組は (U, R) と (D, R) の 2 つである. • 弱支配戦略の逐次消去を行う場合には,消去を行うプレイヤーの順番次第で,最終的に得られる結果が変わり得る という事実は,逐次消去を動学ゲームと解釈したときに,プレイヤーが行動する順番が重要な意味を持つことを意 味する. 4.3 ナッシュ均衡との関係 4.3.1 ナッシュ均衡は支配される戦略を含まない ナッシュ均衡は支配される戦略を含まない • プレイヤーが支配される戦略を持つ場合には,その戦略は他のプレイヤーの任意の戦略の組に対して最適反応では ない.一方,ナッシュ均衡は最適反応の組である.ゆえに,支配される戦略を含む戦略の組は,ナッシュ均衡には なり得ない. 命題 4.5 戦略型ゲーム G の混合拡張 G∗ におけるナッシュ均衡を σ ∗ = (σ1∗ , · · · , σn∗ ) ∈ ∆ (S) とするとき,任意のプレ イヤー i ∈ N について σi∗ ∈ ∆ (Si ) は強支配される戦略ではない. 証明: • 背理法で示す.すなわち,あるプレイヤー i について,σi∗ を強支配する混合戦略 σi′ ∈ ∆ (Si ) が存在するものと仮 定して矛盾を導く. ∗ • この仮定のもとでは,i 以外のプレイヤーの戦略の組 σ−i ∈ ∆ (S−i ) に関して, Fi (σi′ , σ−i ) > Fi (σi∗ , σ−i ) が成り立つ. • 上の事実は,プレイヤー i にとって σi∗ が σ−i に対する最適反応でないことを意味するが,これは σ ∗ がナッシュ均 衡であることと矛盾する.ゆえに,背理法より,任意のプレイヤー i について,σi∗ を強支配する混合戦略は存在し ない. • 純戦略は特別な混合戦略であるから,上の命題から以下が導かれる. 88 系 4.2 戦略型ゲーム G の純ナッシュ均衡を s∗ = (s∗1 , · · · , s∗n ) ∈ S とするとき,任意のプレイヤー i について s∗i は強支 配される戦略ではない. 4.3.2 ナッシュ均衡は逐次消去されない ナッシュ均衡は強支配される逐次消去によって消去されない • 強支配される戦略の逐次消去を行う過程において,ナッシュ均衡が消去されることはない. 命題 4.6 戦略型ゲーム G にナッシュ均衡 s∗ ∈ S が存在する場合には,G の混合拡張 G∗ に強支配される戦略の逐次消 去を適用して残る戦略の組の中に s∗ が必ず含まれる. 証明: • 強支配される戦略の逐次消去によって,G のナッシュ均衡 s∗ = (s∗1 , · · · , s∗n ) が消去されるものと仮定して矛盾を 導く. • そこで,s∗ を構成する最適戦略 s∗1 , · · · , s∗n の中で,強支配される逐次消去によって最初に消去される戦略を s∗i で 表し,s∗i が消去された逐次消去の段階をステップ k と呼ぶ.ステップ k においては,s∗1 , · · · , s∗i−1 , s∗i+1 , · · · , s∗n は まだ消去されていない. • s∗i が逐次消去によって消去されたということは,ステップ k − 1 が終わった段階において,プレイヤー i にとって s∗i を強支配する混合戦略 σi ̸= s∗i が存在することを意味する.すなわち,ステップ k − 1 までに消去されていない 他のプレイヤーの任意の戦略の組 s−i に対して, Fi (σi , s−i ) > Fi (s∗i , s−i ) (1) が成り立つ. • s∗1 , · · · , s∗i−1 , s∗i+1 , · · · , s∗n はいずれもステップ k − 1 までに消去されていないので,(1) は s∗−i に対しても成り立つ. すなわち, ( ) ( ) Fi σi , s∗−i > Fi s∗i , s∗−i が成り立つが,これは,s∗i が s∗−i に対する最適反応であることと矛盾する.ゆえに,背理法より,強支配される戦 略の逐次消去によって s∗ は消去されない. • 純戦略は特別な混合戦略であることを踏まえた上で,上の命題において,消去の対象を何らかの純戦略によって強 支配される純戦略に限定すると,以下が導かれる. 89 系 4.3 戦略型ゲーム G にナッシュ均衡 s∗ ∈ S が存在する場合には,G に強支配される戦略の逐次消去を適用して残る 戦略の組の中に s∗ が必ず含まれる. 逐次消去でナッシュ均衡以外の組も生き残ることがある • 上の命題は,強支配される戦略の逐次消去によってナッシュ均衡が消去されないことを主張しているが,逐次消去 の結果によって,ナッシュ均衡とは異なる戦略の組もまた消去されずに残ることはある. • 以下の双行列で表される戦略型ゲームについて考えよう.このゲームのナッシュ均衡は (B, R) である.一方,両 プレイヤーは支配される純戦略を持たないため,支配される戦略の逐次消去を行っても戦略を消去できない. A/B L C R T 0, 4 4, 0 5, 3 M 4, 0 0, 4 5, 3 B 3, 5 3, 5 6, 6 • 上の事実は,ナッシュ均衡が強支配される戦略の逐次消去よりも,より強いゲームの解の概念であることを示唆し ている. 4.3.3 逐次消去の一意的な解はナッシュ均衡 逐次消去の結果とナッシュ均衡が一致する場合 • ゲームが逐次強支配によって解ける場合には,すなわち,強支配される戦略の逐次消去を行った結果として,すべ てのプレイヤーに純戦略が 1 つだけ残される場合には,その純戦略の組はもとのゲームのナッシュ均衡である.し かも,それはゲームの一意的なナッシュ均衡である. 命題 4.7 有限な戦略型ゲーム G が逐次強支配によって解ける場合には,最終的に生き残る純戦略の組は G の一意的な ナッシュ均衡である. 証明: 【逐次強支配の解がナッシュ均衡であることの証明】 • 逐次強支配によって解ける戦略型ゲーム G に対して,強支配される戦略の逐次消去を適用すると,唯一の純戦略 の組 s∗ = (s∗1 , · · · , s∗n ) が生き残る.これが G のナッシュ均衡でないと仮定して矛盾を導く. • s∗ が G のナッシュ均衡でないことは,以下が成り立つことを意味する. ∃i ∈ N, ∃si ∈ Si : ui (s∗i , s∗−i ) < ui (si , s∗−i ) 90 (1) • s∗ が逐次消去において唯一残った戦略の組であるならば,上の si もまた逐次消去の過程で消去されたはずである. そこで,si が消去される段階をステップ k と呼ぶならば,プレイヤー i にとって,ステップ k − 1 が終わった段階 で残っている他のプレイヤーたちの任意の戦略の組 s−i に対して, ∃s′i ∈ Si : ui (si , s−i ) < ui (s′i , s−i ) (2) が成り立つはずである.つまり,ステップ k の冒頭において,プレイヤー i にとって,si は s′i に支配される戦略 である. • s∗1 , · · · , s∗i−1 , s∗i+1 , · · · , s∗n は逐次消去で消去されないので,(2) は s∗−i に対しても成立する.すなわち, ∃s′i ∈ Si : ui (si , s∗−i ) < ui (s′i , s∗−i ) (3) • s′i はステップ k において生き残る戦略であり,一方,s∗i は逐次消去で消去されない.そこで,s′i が s∗i と一致する 場合とそうでない場合に分けた上で,いずれにおいても矛盾が生じることを示す. • s′i = s∗i の場合には,(3) より, ui (si , s∗−i ) < ui (s∗i , s∗−i ) が成り立つが,これは (1) と矛盾する. • s′i ̸= s∗i の場合には,逐次消去によって最後に残るのは s∗i であることを踏まえると,それとは異なる s′i は途中で 消去される.そこで,そこで,s′i が消去される段階をステップ k ′ (> k) と呼ぶならば,プレイヤー i にとって,ス テップ k ′ − 1 が終わった段階で残っている他のプレイヤーたちの任意の戦略の組 s−i に対して以下が成り立つはず である. ∃s′′i ∈ Si : ui (s′i , s−i ) < ui (s′′i , s−i ) (4) • s∗1 , · · · , s∗i−1 , s∗i+1 , · · · , s∗n は逐次消去で消去されないので,(4) は s∗−i に対しても成立する.すなわち, ∃s′′i ∈ Si : ui (s′i , s∗−i ) < ui (s′′i , s∗−i ) (5) • s′′i = s∗i の場合には,(5) より, ui (si , s∗−i ) < ui (s∗i , s∗−i ) が成り立つが,これは (1) と矛盾する. • s′′i ̸= s∗i の場合には,同様の議論を繰り返せばよい.だが,Si は有限集合であることと,逐次消去において最終的 に残るのは s∗i であることから,同様の議論を繰り返すと,結局は, ui (si , s∗−i ) < ui (s∗i , s∗−i ) となり,これは (1) と矛盾する. • したがって,逐次消去において唯一残った戦略の組 s∗ はナッシュ均衡である. 【逐次強支配の解が一意的なナッシュ均衡であることの証明】 91 • s∗ とは異なるナッシュ均衡 s∗∗ が存在するものと仮定して矛盾を導く. • s∗ は逐次消去において唯一残った戦略の組であるから,s∗∗ は逐次消去の過程で消去されているはずである.だが, ナッシュ均衡 s∗∗ が強支配される戦略の逐次消去によって消去されることは,先の命題 4.6 と矛盾する. • ゆえに,背理法より,s∗ はゲームの一意的なナッシュ均衡である. 92 5 支配戦略均衡 5.1 支配戦略 5.1.1 純支配戦略 純支配戦略 • 試みとして,戦略型ゲーム G におけるプレイヤー i の最適戦略を以下のように定義してみよう.すなわち,プレイ ヤー i にとって,自分のある純戦略 s∗i が自分の他の任意の純戦略を弱支配するならば,すなわち, (a) ∀s−i ∈ S−i , ∀si ∈ Si : ui (s∗i , s−i ) ≥ ui (si , s−i ) (b) ∃s′−i ∈ S−i , ∀si ∈ Si : ui (s∗i , s′−i ) > ui (si , s′−i ) がともに成り立つ場合に,s∗i はプレイヤー i の最適戦略であると定める.このような最適戦略 s∗i を弱支配戦略 (weakly dominant strategy)と呼ぶ. • 特に,プレイヤー i にとって,自分のある純戦略 s∗i が自分の他の任意の純戦略を強支配するならば,すなわち, ∀s−i ∈ S−i , ∀si ∈ Si : ui (s∗i , s−i ) > ui (si , s−i ) もしくは, ∀s ∈ S : ui (s∗i , s−i ) > ui (s) が成り立つ場合に,s∗i はプレイヤー i の最適戦略であると定める.このような最適戦略 s∗i を強支配戦略(strictly dominant strategy)や純支配戦略(pure dominant strategy)などと呼ぶ. • プレイヤー i が戦略型ゲーム G において弱支配戦略や強支配戦略 s∗i を持つ場合には,他のプレイヤーたちの戦略 の組 s−i がどのようなものであるかに関わらず,プレイヤー i にとって戦略 s∗i は常に自分の利得を最大化する.し たがって,プレイヤー i に支配戦略が存在する場合には,プレイヤー i は他のプレイヤーたちの行動について何も 考える必要はない.純ナッシュ均衡を構成する最適反応は,他のプレイヤーたちの特定の純戦略の組を所与とする 概念であるのに対し,支配戦略はそうではない点が特徴的である. • プレイヤー i にとって s∗i が強支配戦略であるならば,s∗i は明らかに弱支配戦略である.だが,弱支配関係は必ず しも強支配関係を含意しないため,弱支配戦略は必ずしも強支配戦略であるとは限らない. 例 5.1 (支配戦略) • 以下の利得行列で表される戦略型ゲームについて考える. 12 A B A 5, 5 0, 8 B 8, 0 2, 2 • プレイヤー 2 が A, B のどちらの純戦略を選んだ場合においても,プレイヤー 1 は A よりも B を選べば常により大 きな利得を得られる.ゆえに,プレイヤー 1 にとって B は支配戦略である.プレイヤー 2 についても同様である. 93 5.1.2 混合支配戦略 混合支配戦略 • 支配戦略の概念は,戦略型ゲーム G の混合拡張 G∗ においても容易に拡張される.具体的には,プレイヤー i に とって,自分のある混合戦略 σi∗ が自分の他の任意の混合戦略を弱支配するならば,すなわち, (a) ∀σ−i ∈ ∆ (S−i ) , ∀σi ∈ ∆ (Si ) : Fi (σi∗ , σ−i ) ≥ Fi (σi , σ−i ) (b) ′ ′ ′ ∃σ−i ∈ ∆ (S−i ) , ∀σi ∈ ∆ (Si ) : Fi (σi∗ , σ−i ) > Fi (σi , σ−i ) がともに成り立つ場合には,σi∗ をプレイヤー i の弱支配戦略であると言う. • 特に,プレイヤー i にとって,自分のある混合戦略 σi∗ が自分の他の任意の混合戦略を強支配するならば,すなわち, ∀σ−i ∈ ∆ (S−i ) , ∀σi ∈ ∆ (Si ) : Fi (σi∗ , σ−i ) > Fi (σi , σ−i ) もしくは, ∀σ ∈ ∆ (S) : Fi (σi∗ , σ−i ) > Fi (σ) が成り立つ場合には,σi∗ をプレイヤー i の強支配戦略や混合支配戦略(mixed dominant strategy)などと呼ぶ. • プレイヤー i が戦略型ゲーム G の混合拡張 G∗ において弱支配戦略や強支配戦略 σi∗ を持つ場合には,他のプレイ ヤーたちの混合戦略の組 σ−i がどのようなものであるかに関わらず,プレイヤー i にとって戦略 σi∗ は常に自分の期 待利得を最大化する.したがって,プレイヤー i に支配戦略が存在する場合には,プレイヤー i は他のプレイヤー たちの行動について何も考える必要はない.混合ナッシュ均衡を構成する最適反応は,他のプレイヤーたちの特定 の混合戦略の組を所与とする概念であるのに対し,支配戦略はそうではない点が特徴的である. • プレイヤー i にとって σi∗ が強支配戦略であるならば,σi∗ は明らかに弱支配戦略である.だが,弱支配関係は必ず しも強支配関係を含意しないため,弱支配戦略は必ずしも強支配戦略であるとは限らない. • 純戦略は特別な混合戦略であるから,上の定義は,自分の任意の混合戦略を支配する純戦略や,自分の任意の純戦 略を支配する混合戦略,そして,自分の任意の純戦略を支配する純戦略である純支配戦略などをも包括的に含んで いる.そこで,以降では混合支配戦略をシンプルに支配戦略(dominant strategy)と呼ぶ. 5.1.3 支配戦略の特徴付け 混合支配戦略の特徴付け • あるプレイヤーの混合戦略どうしの支配関係を検討する際には,他のプレイヤーたちがとり得る戦略を純戦略に限 定してもよい(命題 4.1).ゆえに,混合戦略が支配戦略であることを以下のように表現できる. 系 5.1 戦略型ゲーム G の混合拡張 G∗ において,プレイヤー i の混合戦略 σi∗ ∈ ∆ (Si ) について, ∀s−i ∈ S−i , ∀σi ∈ ∆ (Si ) : Fi (σi∗ , s−i ) > Fi (σi , s−i ) が成り立つことは,σi∗ がプレイヤー i の強支配戦略であるための必要十分条件である. 94 • 混合戦略が弱支配戦略であることについても,命題 4.2 より,以下のように表現できる. 系 5.2 戦略型ゲーム G の混合拡張 G∗ において,プレイヤー i の混合戦略 σi∗ ∈ ∆ (Si ) について, (a) ∀s−i ∈ S−i , ∀σi ∈ ∆ (Si ) : Fi (σi∗ , s−i ) ≥ Fi (σi , s−i ) (b) ∃s′−i ∈ S−i , ∀σi ∈ ∆ (Si ) : Fi (σi∗ , s′−i ) > Fi (σi , s′−i ) が成り立つことは,σi∗ がプレイヤー i の弱支配戦略であるための必要十分条件である. • 純戦略は特別な混合戦略であることを踏まえると,上の 2 つの系は以下の事実をも示唆している.すなわち,仮に プレイヤーが純戦略の範囲では強支配戦略や弱支配戦略を持たない場合においても,混合戦略にまで考察の範囲を 拡張すれば,強支配戦略や弱支配戦略が存在する可能性がある. 5.2 5.2.1 支配戦略均衡 純支配戦略均衡 純支配戦略均衡 • 戦略型ゲーム G において,プレイヤー i の純戦略 s∗i ∈ Si が弱支配戦略であることは, (a) ∀s−i ∈ S−i , ∀si ∈ Si : ui (s∗i , s−i ) ≥ ui (si , s−i ) (b) ∃s′−i ∈ S−i , ∀si ∈ Si : ui (s∗i , s′−i ) > ui (si , s′−i ) が成り立つことを意味する.このような意味での最適戦略の組 s∗ = (s∗1 , · · · , s∗n ) ∈ S を G の弱支配戦略均衡(weakly dominant strategy equilibrium)と呼ぶ. • すなわち,G における純戦略の組 s∗ = (s∗1 , · · · , s∗n ) が弱支配戦略均衡であるとは, (a) ∀i ∈ N, ∀s−i ∈ S−i , ∀si ∈ Si : ui (s∗i , s−i ) ≥ ui (si , s−i ) (b) ∀i ∈ N, ∃s′−i ∈ S−i , ∀si ∈ Si : ui (s∗i , s′−i ) > ui (si , s′−i ) が成り立つことを意味する. • 戦略型ゲーム G において,プレイヤー i の純戦略 s∗i ∈ Si が強支配戦略であることは, ∀s−i ∈ S−i , ∀si ∈ Si : ui (s∗i , s−i ) > ui (si , s−i ) もしくは, ∀s ∈ S : ui (s∗i , s−i ) > ui (s) が成り立つことを意味する.このような意味での最適戦略の組 s∗ = (s∗1 , · · · , s∗n ) ∈ S を G の強支配戦略均衡(weakly dominant strategy equilibrium)や純支配戦略均衡(pure dominant strategy equilibrium)などと言う. 95 • すなわち,G における純戦略の組 s∗ = (s∗1 , · · · , s∗n ) が強支配戦略均衡であるとは, ∀i ∈ N, ∀s−i ∈ S−i , ∀si ∈ Si : ui (s∗i , s−i ) > ui (si , s−i ) もしくは, ∀i ∈ N, ∀s ∈ S : ui (s∗i , s−i ) > ui (s) が成り立つことを意味する. • ゲーム G において戦略の組 s∗ が強支配戦略均衡であるならば,s∗ は明らかに弱支配戦略均衡である.だが,ある 戦略が弱支配戦略であることは,それが強支配戦略であることを必ずしも含意しないため,弱支配戦略均衡は必ず しも強支配戦略均衡であるとは限らない. 例 5.2 (支配戦略均衡) • 以下の利得行列で表される戦略型ゲームについて考える. 12 A B A 5, 5 0, 8 B 8, 0 2, 2 • プレイヤー 2 が A, B のどちらの純戦略を選んだ場合においても,プレイヤー 1 は A よりも B を選べば常により 大きな利得を得られる.ゆえに,プレイヤー 1 にとって B は支配戦略である.プレイヤー 2 についても同様であ るから,(B, B) はこのゲームの純支配戦略均衡である. • ちなみに,(B, B) は純最適反応の組であることも容易に確認できるため,先の (B, B) はこのゲームの純ナッシュ均 衡でもある.後に示すように,一般に,戦略型ゲームに純支配戦略均衡が存在する場合には,それは同時に純ナッ シュ均衡でもある. 5.2.2 混合支配戦略均衡 混合支配戦略均衡 • 支配戦略均衡の概念は,混合戦略に関しても容易に拡張される.すなわち,戦略型ゲーム G の混合拡張 G∗ にお いて,プレイヤーの混合戦略の組 σ ∗ = (σ1∗ , · · · , σn∗ ) が弱支配戦略均衡であるとは,任意のプレイヤー i について, 混合戦略 σi∗ が弱支配戦略であること,すなわち, (a) ∀i ∈ N, ∀σ−i ∈ ∆ (S−i ) , ∀σi ∈ ∆ (Si ) : Fi (σi∗ , σ−i ) ≥ Fi (σi , σ−i ) (b) ′ ′ ′ ∀i ∈ N, ∃σ−i ∈ ∆ (S−i ) , ∀σi ∈ ∆ (Si ) : Fi (σi∗ , σ−i ) > Fi (σi , σ−i ) が成り立つことを意味する. 96 • 特に,混合戦略の組 σ ∗ = (σ1∗ , · · · , σn∗ ) において,任意のプレイヤー i について,混合戦略 σi∗ が強支配戦略である ならば,すなわち, ∀i ∈ N, ∀σ−i ∈ ∆ (S−i ) , ∀σi ∈ ∆ (Si ) : Fi (σi∗ , σ−i ) > Fi (σi , σ−i ) または, ∀i ∈ N, ∀σ ∈ ∆ (S) : Fi (σi∗ , σ−i ) > Fi (σ) が成り立つならば,σ ∗ を G∗ の強支配戦略均衡や混合支配戦略均衡(mixed dominant strategy equilibrium)など と呼ぶ. • 混合拡張 G∗ において混合戦略の組 σ ∗ が強支配戦略均衡であるならば,σ ∗ は明らかに弱支配戦略均衡である.だ が,ある混合戦略が弱支配戦略であることは,それが強支配戦略であることを必ずしも含意しないため,弱支配戦 略均衡は必ずしも強支配戦略均衡であるとは限らない. • 純戦略は特別な混合戦略であるから,混合支配戦略均衡を構成するそれぞれのプレイヤーの戦略は,自分の任意の 混合戦略を支配する純戦略や,自分の任意の純戦略を支配する混合戦略,そして,自分の任意の純戦略を支配する 純戦略なども可能性としてあり得る.ゆえに,混合支配戦略均衡は純支配戦略均衡を包括した概念である.そこで, 以降では混合支配戦略均衡をシンプルに支配戦略均衡(dominant strategy equilibrium)と呼ぶ. 5.2.3 支配戦略均衡の特徴付け 混合支配戦略均衡の特徴付け • 混合強支配戦略を特徴づける系 5.1 を踏まえると,混合支配戦略均衡を以下のように表現できる. 系 5.3 戦略型ゲーム G の混合拡張 G∗ において,プレイヤーたちの混合戦略の組 σ ∗ = (σ1∗ , · · · , σn∗ ) ∈ ∆ (S) について, ∀i ∈ N, ∀s−i ∈ S−i , ∀σi ∈ ∆ (Si ) : Fi (σi∗ , s−i ) > Fi (σi , s−i ) が成り立つことは,σ ∗ が G∗ の強支配戦略均衡であるための必要十分条件である. • 同様に,混合弱支配戦略均衡を特徴付ける系 5.2 から,混合弱支配戦略均衡を以下のように表現できる. 系 5.4 戦略型ゲーム G の混合拡張 G∗ において,プレイヤーたちの混合戦略の組 σ ∗ = (σ1∗ , · · · , σn∗ ) ∈ ∆ (S) について, (a) ∀i ∈ N, ∀s−i ∈ S−i , ∀σi ∈ ∆ (Si ) : Fi (σi∗ , s−i ) ≥ Fi (σi , s−i ) (b) ∀i ∈ N, ∃s′−i ∈ S−i , ∀σi ∈ ∆ (Si ) : Fi (σi∗ , s′−i ) > Fi (σi , s′−i ) が成り立つことは,σ ∗ が G∗ の弱支配戦略均衡であるための必要十分条件である. 97 5.3 他の均衡概念との関係 5.3.1 ナッシュ均衡との関係 支配戦略均衡はナッシュ均衡 • 支配戦略均衡はナッシュ均衡でもある.だが,その逆は成り立つとは限らない. 命題 5.1 戦略型ゲーム G の混合拡張 G∗ において,プレイヤーたちの混合戦略の組 σ ∗ ∈ ∆ (S) が G∗ の支配戦略均衡 であるならば,σ ∗ は G∗ のナッシュ均衡でもある. 証明: • 混合戦略の組 σ ∗ = (σ1∗ , · · · , σn∗ ) が混合拡張 G∗ の支配戦略均衡であるとする.すなわち, ∀i ∈ N, ∀σ−i ∈ ∆ (S−i ) , ∀σi ∈ ∆ (Si ) : Fi (σi∗ , σ−i ) > Fi (σi , σ−i ) ∗ としてもよい.すなわち, • 上の命題において σ−i は任意であるから,σ−i = σ−i ∗ ∗ ∀i ∈ N, ∀σi ∈ ∆ (Si ) : Fi (σi∗ , σ−i ) > Fi (σi , σ−i ) が成り立つが,これは σ ∗ がナッシュ均衡であることに他ならない. 5.3.2 逐次消去との関係 逐次支配戦略均衡との関係 • あるゲームに支配戦略均衡が存在するならば,その均衡を構成する支配戦略は逐次消去によって消去されない.し たがって,そのゲームは支配される戦略の逐次消去によって解くことができて,しかも,最終的に得られる戦略の 組は支配戦略均衡と一致する.まとめると,あるゲームに支配戦略均衡が存在する場合には,そのゲームは逐次支 配によって解くことができて,しかも,その解は支配戦略均衡と一致する. • 逆に,あるゲームが逐次支配によって解ける場合でも,そのゲームに支配戦略均衡は存在するとは限らない.例え ば,以下の利得行列で表されるゲームについて考えよう. 12 L R U −2, 2 −1, 1 B 0, 0 −1, 1 • プレイヤー 2 は支配戦略を持たないため,上のゲームは支配戦略均衡を持たない.一方,プレイヤーの合理性を共 有知識と仮定した上で逐次消去を行うと,まず,プレイヤー 1 にとって弱支配される戦略 U が消去され,続いて, プレイヤー 2 にとって強支配される戦略 L が消去され,最終的に (B, R) だけが残るため,このゲームは逐次消去 によって解ける. 98 6 2 人ゲーム 6.1 6.1.1 ゼロ和ゲーム ゼロ和ゲーム ゼロ和ゲーム • 戦略型ゲーム G = (N, {Si }i∈N , {ui }i∈N ) において,ある定数 c ∈ R が存在して, ∀s ∈ S : ∑ ui (s) = 0 i∈N が成り立つとき,G をゼロ和ゲーム(zero-sum game)と呼ぶ. • ゼロ和ゲームにおいては,プレイヤーたちがいかなる純戦略を選んだ場合においても,そこで実現する結果におい てプレイヤーたちが得る利得の総和はゼロになる.ゆえに,ゼロ和ゲームではプレイヤーたちの利害が完全に対立 している. • 特に,プレイヤー集合が |N | = 2 を満たす 2 人ゲーム G = ({1, 2} , {S1 , S2 } , {u1 , u2 }) がゼロ和ゲームである場合 には, ∀ (s1 , s2 ) ∈ S1 × S2 : u1 (s1 , s2 ) + u2 (s1 , s2 ) = 0 すなわち, ∀ (s1 , s2 ) ∈ S1 × S2 : u2 (s1 , s2 ) = −u1 (s1 , s2 ) が成り立つため,プレイヤー 1 の利得 u1 (s1 , s2 ) が明らかであれば,プレイヤー 2 の利得は自動的に −u1 (s1 , s2 ) として定まる. ゼロ和ゲームの混合拡張 • ゼロ和ゲーム G においては,プレイヤーたちの純戦略の任意の組において,プレイヤーたちが得る利得の総和は ゼロと等しくなる.すなわち, ∀s ∈ S : ∑ ui (s) = 0 i∈N が成り立つが,ゼロ和ゲーム G の混合拡張 G∗ においても,混合戦略と期待利得に関して同様の関係が成り立つ. 命題 6.1 ゼロ和ゲーム G の混合拡張 G∗ においては, ∀σ ∈ ∆ (S) : ∑ i∈N が成り立つ. 99 Fi (σ) = 0 証明: • ゼロ和ゲーム G においては, ∀s ∈ S : ∑ (1) ui (s) = 0 i∈N が成り立つ. • G の混合拡張 G∗ において,混合戦略の組 σ ∈ ∆ (S) を任意に選ぶと, ∑ i∈N Fi (σ) = ∑ Fi (σ) i∈N n ∑ ∑ ∏ = σj (sj ) · ui (s) j=1 i∈N s∈S n ∑ ∑ ∏ = σj (sj ) · ui (s) j=1 s∈S i∈N ( ) n ∑ ∏ ∑ = σj (sj ) ui (s) j=1 s∈S =0 ∵ Fi の定義 i∈N ∵ (1) を得る. 6.1.2 鞍点 鞍点 • 2 人ゼロ和ゲーム G において,純戦略の組 (s∗1 , s∗2 ) ∈ S1 × S2 が, ∀s1 ∈ S1 , ∀s2 ∈ S2 : u1 (s1 , s∗2 ) ≤ u1 (s∗1 , s∗2 ) ≤ u1 (s∗1 , s2 ) を満たすならば,(s∗1 , s∗2 ) をゲーム G の鞍点(saddle point)と呼ぶ. • 定義より,鞍点 (s∗1 , s∗2 ) は以下をともに満たす. (a) s∗1 ∈ argmax u1 (s1 , s∗2 ) (b) s∗2 ∈ argmin u1 (s∗1 , s2 ) s1 ∈S1 s2 ∈S2 すなわち,鞍点を構成するプレイヤー 2 の純戦略 s∗2 を所与とするとき,鞍点を構成するプレイヤー 1 の純戦略 s∗1 はプレイヤー 1 の利得 u1 (s1 , s∗2 ) を最大化すると同時に,逆に,プレイヤー 1 の純戦略 s∗1 を所与とするとき,プ レイヤー 2 の純戦略 s∗2 はプレイヤー 1 の利得 u1 (s∗1 , s2 ) を最小化する. • 2 人ゼロ和ゲーム G の混合拡張 G∗ においても,混合戦略の組 (σ1∗ , σ2∗ ) ∈ ∆ (S1 ) × ∆ (S2 ) が鞍点であることを, ∀σ1 ∈ ∆ (S1 ) , ∀σ2 ∈ ∆ (S2 ) : F1 (σ1 , σ2∗ ) ≤ F1 (σ1∗ , σ2∗ ) ≤ F1 (σ1∗ , σ2 ) 100 と定義する. • 定義より,鞍点 (σ1∗ , σ2∗ ) は以下をともに満たす. (a) σ1∗ ∈ argmax F1 (σ1 , σ2∗ ) (b) σ2∗ σ1 ∈∆(S1 ) ∈ argmin F1 (σ1∗ , σ2 ) σ2 ∈∆(S2 ) すなわち,鞍点を構成するプレイヤー 2 の混合戦略 σ2∗ を所与とするとき,鞍点を構成するプレイヤー 1 の混合戦 略 σ1∗ はプレイヤー 1 の期待利得 F1 (σ1 , σ2∗ ) を最大化すると同時に,逆に,プレイヤー 1 の混合戦略 σ1∗ を所与と するとき,プレイヤー 2 の混合戦略 σ2∗ はプレイヤー 1 の期待利得 F1 (σ1∗ , σ2 ) を最小化する. 鞍点と純ナッシュ均衡の関係 • 鞍点と純ナッシュ均衡は概念として一致する. 命題 6.2 2 人ゼロ和ゲーム G において,純戦略の組 (s∗1 , s∗2 ) ∈ S1 × S2 が鞍点であることは,(s∗1 , s∗2 ) が G の純ナッシュ 均衡であるための必要十分条件である. 証明: • 2 人ゼロ和ゲーム G の鞍点 (s∗1 , s∗2 ) は, (a) s∗1 ∈ argmax u1 (s1 , s∗2 ) (b) s∗2 s1 ∈S1 ∈ argmin u1 (s∗1 , s2 ) s2 ∈S2 を満たすものとして定義される. • 2 人ゼロ和ゲーム G においては,2 人のプレイヤーの利得の間には, ∀ (s1 , s2 ) ∈ S1 × S2 : u2 (s1 , s2 ) = −u1 (s1 , s2 ) という関係が成り立つ.ゆえに,プレイヤー 1 の利得を最小化することは,プレイヤー 2 の利得を最大化すること と同義であるから,鞍点 (s∗1 , s∗2 ) を特徴づける条件は, (a) s∗1 ∈ argmax u1 (s1 , s∗2 ) (b) s∗2 s1 ∈S1 ∈ argmax u2 (s∗1 , s2 ) s2 ∈S2 と書き換えられる. • 条件 (a) は,s∗1 が s∗2 に対する純最適反応であることを意味し,条件 (b) は,s∗2 が s∗1 に対する純最適反応であるこ とを意味する.ゆえに,(s∗1 , s∗2 ) は純最適反応の組であるから,これは純ナッシュ均衡である. 101 鞍点と混合ナッシュ均衡の関係 • 2 人ゼロ和ゲーム G の混合拡張 G∗ においても,混合戦略の組 (σ1∗ , σ2∗ ) ∈ ∆ (S1 ) × ∆ (S2 ) が鞍点であることを, ∀σ1 ∈ ∆ (S1 ) , ∀σ2 ∈ ∆ (S2 ) : F1 (σ1 , σ2∗ ) ≤ F1 (σ1∗ , σ2∗ ) ≤ F1 (σ1∗ , σ2 ) と定義する. • 定義より,鞍点 (σ1∗ , σ2∗ ) は以下をともに満たす. (a) σ1∗ ∈ argmax F1 (σ1 , σ2∗ ) (b) σ2∗ σ1 ∈∆(S1 ) ∈ argmin F1 (σ1∗ , σ2 ) σ2 ∈∆(S2 ) すなわち,鞍点を構成するプレイヤー 2 の混合戦略 σ2∗ を所与とするとき,鞍点を構成するプレイヤー 1 の混合戦 略 σ1∗ はプレイヤー 1 の期待利得 F1 (σ1 , σ2∗ ) を最大化すると同時に,逆に,プレイヤー 1 の混合戦略 σ1∗ を所与と するとき,プレイヤー 2 の混合戦略 σ2∗ はプレイヤー 1 の期待利得 F1 (σ1∗ , σ2 ) を最小化する. • 2 人ゼロ和ゲーム G の混合拡張 G∗ においては,命題 6.1 より,2 人のプレイヤーの期待利得の間には, ∀σ ∈ ∆ (S) : ∑ Fi (σ) = 0 i∈N という関係が成り立つ.ゆえに,プレイヤー 1 の期待利得を最小化することは,プレイヤー 2 の期待利得を最大化 することと同義であるから,鞍点 (σ1∗ , σ2∗ ) を特徴づける条件は, (a) σ1∗ ∈ argmax F1 (σ1 , σ2∗ ) (b) σ2∗ σ1 ∈∆(S1 ) ∈ argmax F2 (σ1∗ , σ2 ) σ2 ∈∆(S2 ) と書き換えられる.すなわち,鞍点を構成するプレイヤー 2 の混合戦略 σ2∗ を所与とするとき,鞍点を構成するプ レイヤー 1 の混合戦略 σ1∗ はプレイヤー 1 の期待利得 F1 (σ1 , σ2∗ ) を最大化すると同時に,逆に,プレイヤー 1 の混 合戦略 σ1∗ を所与とするとき,プレイヤー 2 の混合戦略 σ2∗ はプレイヤー 2 の期待利得 F2 (σ1∗ , σ2 ) を最大化する. • 混合ナッシュ均衡もまた,鞍点を用いて特徴づけられる. 命題 6.3 2 人ゼロ和ゲーム G の混合拡張 G∗ において,混合戦略の組 (σ1∗ , σ2∗ ) ∈ ∆ (S1 ) × ∆ (S2 ) が鞍点であることは, (σ1∗ , σ2∗ ) が G∗ の混合ナッシュ均衡であるための必要十分条件である. 証明: • 2 人ゼロ和ゲーム G の混合拡張 G∗ における鞍点 (σ1∗ , σ2∗ ) は, (a) σ1∗ ∈ argmax F1 (σ1 , σ2∗ ) (b) σ2∗ σ1 ∈∆(S1 ) ∈ argmin F1 (σ1∗ , σ2 ) σ2 ∈∆(S2 ) を満たすものとして定義される. 102 • 2 人ゼロ和ゲーム G においては,命題 6.1 より,2 人のプレイヤーの期待利得の間には, ∀ (σ1 , σ2 ) ∈ ∆ (S1 ) × ∆ (S2 ) : F2 (σ1 , σ2 ) = −F1 (σ1 , σ2 ) という関係が成り立つ.ゆえに,プレイヤー 1 の期待利得を最小化することは,プレイヤー 2 の期待利得を最大化 することと同義であるから,鞍点 (σ1∗ , σ2∗ ) を特徴づける条件は, (a) σ1∗ ∈ argmax F1 (σ1 , σ2∗ ) (b) σ2∗ ∈ argmax F2 (σ1∗ , σ2 ) σ1 ∈∆(S1 ) σ2 ∈∆(S2 ) と書き換えられる. • 条件 (a) は,σ1∗ が σ2∗ に対する混合最適反応であることを意味し,条件 (b) は,σ2∗ が σ1∗ に対する混合最適反応で あることを意味する.ゆえに,(σ1∗ , σ2∗ ) は混合最適反応の組であるから,これは混合ナッシュ均衡である. 6.2 6.2.1 ミニマックス定理 マックスミニ戦略 マックスミニ戦略 • 2 人ゼロ和ゲーム G において,プレイヤー 1 が純戦略 s1 ∈ S1 を選んだ場合に自身が得られる利得の最小値は, min u1 (s1 , s2 ) s2 ∈S2 であるが,これを s1 の利益の保証水準(security level)と呼ぶ. • プレイヤー 1 の純戦略 s1 の利益の保証水準とは,プレイヤー 1 が s1 を選んだときに最悪でも自身が確保できる利 得であるが,この値はプレイヤー 1 の純戦略ごとに導出可能であるから,プレイヤー 1 は自身のそれぞれの純戦略 の利益の保証水準を比較できる.そこで,プレイヤー 1 の純戦略 s∗1 ∈ S1 が利益の保証水準を最大化するならば, すなわち, min u1 (s∗1 , s2 ) = max min u1 (s1 , s2 ) s2 ∈S2 s1 ∈S1 s2 ∈S2 が成り立つならば,s∗1 をプレイヤー 1 のマックスミニ戦略(maxmini strategy)と呼ぶ.また,マックスミニ戦略 のもとでの利益の保証水準の最大値 max min u1 (s1 , s2 ) s1 ∈S1 s2 ∈S2 を,プレイヤー 1 のマックスミニ値(maxmini value)と呼ぶ. • 同様に,プレイヤー 2 の純戦略 s∗2 ∈ S2 がマックスミニ戦略であることとは, min u2 (s1 , s2 ) = max min u2 (s1 , s2 ) s2 ∈S2 s2 ∈S2 s1 ∈S1 103 が成り立つことを意味し,プレイヤー 2 のマックスミニ値は, max min u2 (s1 , s2 ) s2 ∈S2 s1 ∈S1 である. 例 6.1 (マックスミニ戦略) • 以下の行列で表される 2 人ゼロ和ゲームについて考える.ただし,S1 = {s11 , s12 } , S2 = {s21 , s22 } である. 12 s21 s22 s11 3 1 s12 4 −2 • プレイヤー 1 の純戦略 s11 の利益の保証水準は, min u1 (s11 , s2 ) = min {u1 (s11 , s21 ) , u1 (s11 , s22 )} = min {3, 1} = 1 s2 ∈S2 である.これは,プレイヤー 1 が s11 を選んだときに,プレイヤー 1 が最低でも確保できる利得である. • プレイヤー 1 の純戦略 s12 の利益の保証水準は, min u1 (s12 , s2 ) = min {u1 (s12 , s21 ) , u1 (s12 , s22 )} = min {4, −2} = −2 s2 ∈S2 である.これは,プレイヤー 1 が s12 を選んだときに,プレイヤー 1 が最低でも確保できる利得である. • プレイヤー 1 は自身が最低でも確保できる利得がより大きい純戦略を選択するならば,プレイヤー 1 のマックスミ ニ値が, { max min u1 (s1 , s2 ) = max s1 ∈S1 s2 ∈S2 } min u1 (s11 , s2 ) , min u1 (s12 , s2 ) = max {1, −2} = 1 s2 ∈S2 s2 ∈S2 であることから,プレイヤー 1 は純戦略 s∗1 = s11 を選ぶ.これはプレイヤー 1 のマックスミニ戦略に他ならない. 混合拡張におけるマックスミニ戦略 • 2 人ゼロ和ゲーム G の混合拡張 G∗ においても,マックスミニ戦略は同様にして定義される.すなわち,プレイヤー 1 が混合戦略 σ1 ∈ ∆ (S1 ) を選んだ場合に自身が得られる期待利得の最小値は, min σ2 ∈∆(S2 ) F1 (σ1 , σ2 ) であるから,これが σ1 の利益の保証水準(security level)である. • プレイヤー 1 の混合戦略 σ1 の利益の保証水準とは,プレイヤー 1 が σ1 を選んだときに最悪でも自身が確保できる 期待利得であるが,この値はプレイヤー 1 の混合戦略ごとに導出可能であるから,プレイヤー 1 は自身のそれぞれ 104 の混合戦略の利益の保証水準を比較できる.そこで,プレイヤー 1 の混合戦略 σ1∗ ∈ ∆ (S1 ) が利益の保証水準を最 大化するならば,すなわち, min σ2 ∈∆(S2 ) F1 (σ1∗ , σ2 ) = max min σ1 ∈∆(S1 ) σ2 ∈∆(S2 ) F1 (σ1 , σ2 ) が成り立つならば,σ1∗ をプレイヤー 1 のマックスミニ戦略(maxmini strategy)と呼ぶ.また,マックスミニ戦 略のもとでの利益の保証水準の最大値 max min σ1 ∈∆(S1 ) σ2 ∈∆(S2 ) F1 (σ1 , σ2 ) を,プレイヤー 1 のマックスミニ値(maxmini value)と呼ぶ. • 同様に,プレイヤー 2 の混合戦略 σ2∗ ∈ ∆ (S2 ) がマックスミニ戦略であることとは, min σ2 ∈∆(S2 ) F2 (σ1 , σ2 ) = max min σ2 ∈∆(S2 ) σ1 ∈∆(S1 ) F2 (σ1 , σ2 ) が成り立つことを意味し,プレイヤー 2 のマックスミニ値は, max min σ2 ∈∆(S2 ) σ1 ∈∆(S1 ) F2 (σ1 , σ2 ) である. 6.2.2 ミニマックス戦略 ミニマックス戦略 • 2 人ゼロ和ゲーム G では,プレイヤー 1 が失う利得はプレイヤー 2 が得る利得と一致する.ゆえに,プレイヤー 1 が純戦略 s1 ∈ S1 を選んだ場合に自身が失う利得の最大値は, max u2 (s1 , s2 ) s2 ∈S2 であるが,これを s1 の損失の保証水準(security level)と呼ぶ. • プレイヤー 1 の純戦略 s1 の損失の保証水準とは,プレイヤー 1 が s1 を選んだときに自身が失う損失の最大値であ るが,この値はプレイヤー 1 の純戦略ごとに導出可能であるから,プレイヤー 1 は自身のそれぞれの純戦略の損 失の保証水準を比較できる.そこで,プレイヤー 1 の純戦略 s∗1 ∈ S1 が損失の保証水準を最小化するならば,すな わち, max u2 (s∗1 , s2 ) = min max u2 (s1 , s2 ) s2 ∈S2 s1 ∈S1 s2 ∈S2 が成り立つならば,s∗1 をプレイヤー 1 のミニマックス戦略(minimax strategy)と呼ぶ.また,ミニマックス戦略 のもとでの損失の保証水準の最小値 min max u2 (s1 , s2 ) s1 ∈S1 s2 ∈S2 を,ミニマックス値(minimax value)と呼ぶ. 105 • 同様に,プレイヤー 2 の純戦略 s∗2 ∈ S2 がミニマックス戦略であることとは, max u1 (s1 , s∗2 ) = min max u1 (s1 , s2 ) s1 ∈S1 s2 ∈S2 s1 ∈S1 が成り立つことを意味し,プレイヤー 2 のミニマックス値は, min max u1 (s1 , s2 ) s2 ∈S2 s1 ∈S1 である. 例 6.2 (ミニマックス戦略) • 以下の行列で表される 2 人ゼロ和ゲームについて考える.ただし,S1 = {s11 , s12 } , S2 = {s21 , s22 } である. 12 s21 s22 s11 3 1 s12 4 −2 • プレイヤー 1 の純戦略 s11 の損失の保証水準は, max u2 (s11 , s2 ) = max {u2 (s11 , s21 ) , u2 (s11 , s22 )} = max {−3, −1} = −1 s2 ∈S2 である.これは,プレイヤー 1 が s11 を選んだときに,プレイヤー 1 が失う利得の最大値である. • プレイヤー 1 の純戦略 s12 の損失の保証水準は, max u2 (s12 , s2 ) = max {u2 (s12 , s21 ) , u2 (s12 , s22 )} = max {−4, 2} = 2 s2 ∈S2 である.これは,プレイヤー 1 が s12 を選んだときに,プレイヤー 1 が失う利得の最大値である. • プレイヤー 1 は自身が最高でも失う利得がより小さい純戦略を選択するならば,ミニマックス値が, { min max u2 (s1 , s2 ) = min s1 ∈S1 s2 ∈S2 } max u2 (s11 , s2 ) , max u2 (s12 , s2 ) = min {−1, 2} = −1 s2 ∈S2 s2 ∈S2 であることから,プレイヤー 1 は純戦略 s∗1 = s11 を選ぶ.これはミニマックス戦略に他ならない. 混合拡張におけるミニマックス戦略 • 2 人ゼロ和ゲーム G の混合拡張 G∗ においても,ミニマックス戦略は同様にして定義される.すなわち,プレイヤー 1 が混合戦略 σ1 ∈ ∆ (S1 ) を選んだ場合にプレイヤー 1 が失う期待利得の最大値は, max σ2 ∈∆(S2 ) F2 (σ1 , σ2 ) であるから,これが σ2 の損失の保証水準(security level)である. 106 • プレイヤー 1 の混合戦略 σ1 の損失の保証水準とは,プレイヤー 1 が σ1 を選んだときにプレイヤー 1 が失う期待利 得の最大値であるが,この値はプレイヤー 1 の混合戦略ごとに導出可能であるから,プレイヤー 1 は自身の混合戦 略の損失の保証水準を比較できる.そこで,プレイヤー 1 の混合戦略 σ1∗ ∈ ∆ (S1 ) が損失の保証水準を最小化する ならば,すなわち, max σ2 ∈∆(S2 ) F2 (σ1∗ , σ2 ) = min max σ1 ∈∆(S1 ) σ2 ∈∆(S2 ) F2 (σ1 , σ2 ) が成り立つならば,σ2∗ をミニマックス戦略(minimax strategy)と呼ぶ.また,ミニマックス戦略のもとでの保証 水準の最小値 min max σ1 ∈∆(S1 ) σ2 ∈∆(S2 ) F2 (σ1 , σ2 ) を,ミニマックス値(minimax value)と呼ぶ. • 同様に,プレイヤー 2 の混合戦略 σ2∗ ∈ ∆ (S2 ) がミニマックス戦略であることとは, max σ1 ∈∆(S1 ) F1 (σ1 , σ2∗ ) = min max σ2 ∈∆(S2 ) σ1 ∈∆(S1 ) F1 (σ1 , σ2 ) が成り立つことを意味し,プレイヤー 2 のミニマックス値は, min max σ2 ∈∆(S2 ) σ1 ∈∆(S1 ) F1 (σ1 , σ2 ) である. 6.2.3 ミニマックス定理 マックスミニ値とミニマックス値の関係 • 2 人ゼロ和ゲームにおいて,プレイヤー 1 のマックスミニ値と,プレイヤー 2 のミニマックス値の間には以下の関 係が成立する. 命題 6.4 2 人ゼロ和ゲーム G において, max min u1 (s1 , s2 ) ≤ min max u1 (s1 , s2 ) s1 ∈S1 s2 ∈S2 s2 ∈S2 s1 ∈S1 という関係が成り立つ. • 命題中の不等式を構成する左辺はプレイヤー 1 のマックスミニ値であり,これは,プレイヤー 1 の利益の保証水準 の最大値である.一方,右辺はプレイヤー 2 のミニマックス値であり,これは,プレイヤー 2 の損失の保証水準の 最小値である.後者が前者以上であるというのが,この命題の主張である. • 例として,以下の行列で表される 2 人ゼロ和ゲームについて考える.ただし,S1 = {s11 , s12 } , S2 = {s21 , s22 } で ある. 12 s21 s22 s11 3 1 s12 4 −2 107 • 上のゲームに関して, { } max min u1 (s1 , s2 ) = max min u1 (s11 , s2 ) , min u1 (s12 , s2 ) = max {1, −2} = 1 s1 ∈S1 s2 ∈S2 s2 ∈S2 s2 ∈S2 { } min max u1 (s1 , s2 ) = min max u1 (s1 , s21 ) , max u1 (s1 , s22 ) = min {4, 1} = 4 s2 ∈S2 s1 ∈S1 s1 ∈S1 s1 ∈S1 であるから,この例においても, max min u1 (s1 , s2 ) = 1 ≤ 4 = min max u1 (s1 , s2 ) s1 ∈S1 s2 ∈S2 s2 ∈S2 s1 ∈S1 という関係が確かに成立している. 証明: • 以下の命題が明らかに成立する. ∀s1 ∈ S1 , ∀s2 ∈ S2 : min u1 (s1 , s2 ) ≤ u1 (s1 , s2 ) ≤ max u1 (s1 , s2 ) s2 ∈S2 s1 ∈S1 (1) • 以下の命題 ∀s2 ∈ S2 : min u1 (s1 , s2 ) ≤ max u1 (s1 , s2 ) s2 ∈S2 s1 ∈S1 について考えると,(1) より,これは任意の s1 ∈ S1 について成り立つことから, ∀s2 ∈ S2 : max min u1 (s1 , s2 ) ≤ max u1 (s1 , s2 ) s1 ∈S1 s2 ∈S2 s1 ∈S1 (2) っを得る. • 以下の命題 max min u1 (s1 , s2 ) ≤ max u1 (s1 , s2 ) s1 ∈S1 s2 ∈S2 s1 ∈S1 について考えると,(2) より,これは任意の s2 ∈ S2 について成り立つことから, max min u1 (s1 , s2 ) ≤ min max u1 (s1 , s2 ) s1 ∈S1 s2 ∈S2 s2 ∈S2 s1 ∈S1 を得るため,目標は達成された. ミニマックス定理 • 2 人ゼロ和ゲームの混合拡張においても,命題 6.4 と同様の命題が成立する.証明は同様であるから省略する. 補題 6.1 2 人ゼロ和ゲーム G の混合拡張 G∗ において, max min σ1 ∈∆(S1 ) σ2 ∈∆(S2 ) F1 (σ1 , σ2 ) ≤ min max σ2 ∈∆(S2 ) σ1 ∈∆(S1 ) という関係が成り立つ. 108 F1 (σ1 , σ2 ) • 実は,後ほど示すように,この命題中の不等式は常に等号で成立する.これをミニマックス定理(minimax theorem) と呼ぶ.ミニマックス定理を示す前段として,上の不等式が等号で成立することの意味を確認しておこう. 補題 6.2 2 人ゼロ和ゲーム G の混合拡張 G∗ において, max min σ1 ∈∆(S1 ) σ2 ∈∆(S2 ) F1 (σ1 , σ2 ) = min max σ2 ∈∆(S2 ) σ1 ∈∆(S1 ) F1 (σ1 , σ2 ) が成り立つことは,G∗ が混合ナッシュ均衡を持つための必要十分条件である. 必要性の証明: • 2 人ゼロ和ゲーム G の混合拡張 G∗ に混合ナッシュ均衡 (σ1∗ , σ2∗ ) ∈ ∆ (S1 ) × ∆ (S2 ) が存在するものと仮定する.命 題 6.3 より,これは (σ1∗ , σ2∗ ) が G∗ の鞍点であることを意味する.ゆえに, ∀σ1 ∈ ∆ (S1 ) , ∀σ2 ∈ ∆ (S2 ) : F1 (σ1 , σ2∗ ) ≤ F1 (σ1∗ , σ2∗ ) ≤ F1 (σ1∗ , σ2 ) (1) が成り立つ.先の補題より, max min σ1 ∈∆(S1 ) σ2 ∈∆(S2 ) F1 (σ1 , σ2 ) ≤ min max σ2 ∈∆(S2 ) σ1 ∈∆(S1 ) F1 (σ1 , σ2 ) は成り立つため,上の不等式とは不等号が逆向きである以下の不等式 min max σ2 ∈∆(S2 ) σ1 ∈∆(S1 ) F1 (σ1 , σ2 ) ≤ max min σ1 ∈∆(S1 ) σ2 ∈∆(S2 ) F1 (σ1 , σ2 ) (2) が成り立つことを示せれば,不等式は等号で成立するため,目標は達成される.ゆえに,(1) から (2) を示す. • まず, F1 (σ1∗ , σ2∗ ) ≥ ≥ max σ1 ∈∆(S1 ) min F1 (σ1 , σ2∗ ) max σ2 ∈∆(S2 ) σ1 ∈∆(S1 ) ∵ (1) F1 (σ1 , σ2 ) ∵ σ2∗ ∈ ∆ (S2 ) ゆえに, F1 (σ1∗ , σ2∗ ) ≥ min max σ2 ∈∆(S2 ) σ1 ∈∆(S1 ) F1 (σ1 , σ2 ) (3) が成り立つ. • また, F1 (σ1∗ , σ2∗ ) ≤ ≤ min σ2 ∈∆(S2 ) max F1 (σ1∗ , σ2 ) min σ1 ∈∆(S1 ) σ2 ∈∆(S2 ) ∵ (1) F1 (σ1∗ , σ2 ) ∵ σ1∗ ∈ ∆ (S1 ) ゆえに, F1 (σ1∗ , σ2∗ ) ≤ max min σ1 ∈∆(S1 ) σ2 ∈∆(S2 ) が成り立つ. 109 F1 (σ1∗ , σ2 ) (4) • (3) , (4) から (2) が得られるため,目標は達成された.ちなみに,たった今示された, max min σ1 ∈∆(S1 ) σ2 ∈∆(S2 ) F1 (σ1 , σ2 ) = min max σ2 ∈∆(S2 ) σ1 ∈∆(S1 ) F1 (σ1 , σ2 ) と,(3) , (4) のもとでは, F1 (σ1∗ , σ2∗ ) = min max σ2 ∈∆(S2 ) σ1 ∈∆(S1 ) F1 (σ1 , σ2 ) = max min σ1 ∈∆(S1 ) σ2 ∈∆(S2 ) F1 (σ1∗ , σ2 ) が成り立つ.すなわち,混合ナッシュ均衡 (σ1∗ , σ2∗ ) においてプレイヤー 1 が得る利得は,プレイヤー 1 のミニマッ クス値と,プレイヤー 2 のマックスミニ値の両方に等しい. 十分性の証明: • 2 人ゼロ和ゲーム G の混合拡張 G∗ において, max min σ1 ∈∆(S1 ) σ2 ∈∆(S2 ) F1 (σ1 , σ2 ) = min max σ2 ∈∆(S2 ) σ1 ∈∆(S1 ) F1 (σ1 , σ2 ) (5) が成り立つものと仮定する.このとき,混合ナッシュ均衡 (σ1∗ , σ2∗ ) の存在を示したいが,σ1∗ の候補としてプレイ ヤー 1 のマックスミニ戦略を採用し,σ2∗ の候補としてプレイヤー 2 のミニマックス戦略を採用する.すなわち,σ1∗ は, min F1 (σ1∗ , σ2 ) = max F1 (σ1 , σ2∗ ) = σ2 ∈∆(S2 ) max min F1 (σ1 , σ2 ) (6) min max F1 (σ1 , σ2 ) (7) σ2 ∈∆(S2 ) σ1 ∈∆(S1 ) を満たし,σ2∗ は, σ1 ∈∆(S1 ) σ1 ∈∆(S1 ) σ2 ∈∆(S2 ) を満たすものとする. • このとき, min σ2 ∈∆(S2 ) F1 (σ1∗ , σ2 ) = = = max min F1 (σ1 , σ2 ) ∵ (6) min max F1 (σ1 , σ2 ) ∵ (5) σ2 ∈∆(S2 ) σ1 ∈∆(S1 ) σ2 ∈∆(S2 ) σ1 ∈∆(S1 ) max σ1 ∈∆(S1 ) F1 (σ1 , σ2∗ ) ∵ (7) すなわち, min σ2 ∈∆(S2 ) F1 (σ1∗ , σ2 ) = max σ1 ∈∆(S1 ) F1 (σ1 , σ2∗ ) (8) が成り立つ. • 他方で,一般に, min σ2 ∈∆(S2 ) F1 (σ1∗ , σ2 ) ≤ F1 (σ1∗ , σ2∗ ) ≤ max σ1 ∈∆(S1 ) ∵ σ2∗ ∈ ∆ (S2 ) F1 (σ1 , σ2∗ ) ∵ σ1∗ ∈ ∆ (S1 ) すなわち, min σ2 ∈∆(S2 ) F1 (σ1∗ , σ2 ) ≤ F1 (σ1∗ , σ2∗ ) ≤ 110 max σ1 ∈∆(S1 ) F1 (σ1 , σ2∗ ) (9) が成り立つ. • (8) , (9) より, F1 (σ1∗ , σ2∗ ) = が成り立つが,F1 (σ1∗ , σ2∗ ) = min σ2 ∈∆(S2 ) min σ2 ∈∆(S2 ) F1 (σ1∗ , σ2 ) = max σ1 ∈∆(S1 ) F1 (σ1 , σ2∗ ) F1 (σ1∗ , σ2 ) は, ∀σ2 ∈ ∆ (S2 ) : F1 (σ1∗ , σ2∗ ) ≤ F1 (σ1∗ , σ2 ) を含意し,F1 (σ1∗ , σ2∗ ) = max σ1 ∈∆(S1 ) F1 (σ1 , σ2∗ ) は, ∀σ1 ∈ ∆ (S1 ) : F1 (σ1 , σ2∗ ) ≤ F1 (σ1∗ , σ2∗ ) を含意するため,これらを合わせると, ∀σ1 ∈ ∆ (S1 ) , ∀σ2 ∈ ∆ (S2 ) : F1 (σ1 , σ2∗ ) ≤ F1 (σ1∗ , σ2∗ ) ≤ F1 (σ1∗ , σ2 ) を得る.ゆえに,(σ1∗ , σ2∗ ) は G∗ の鞍点であるから,命題 6.3 より,これは G∗ の混合ナッシュ均衡である. • ナッシュの定理より,有限ゲーム G の混合拡張 G∗ には混合ナッシュ均衡が常に存在する.ゆえに,2 人ゼロ和ゲー ムが有限であれば,その混合拡張にも混合ナッシュ均衡が存在する.以上の事実と上の補題を踏まえると,ミニマッ クス定理が得られる. 定理 6.1 (ミニマックス定理) 有限な 2 人ゼロ和ゲーム G の混合拡張 G∗ においては, max min σ1 ∈∆(S1 ) σ2 ∈∆(S2 ) F1 (σ1 , σ2 ) = min max σ2 ∈∆(S2 ) σ1 ∈∆(S1 ) F1 (σ1 , σ2 ) が成り立つ. • 議論を整理しよう.有限 2 人ゼロ和ゲーム G の混合拡張 G∗ においては,プレイヤー 1 がマックスミニ戦略を採用 し,プレイヤー 2 がミニマックス戦略を採用するという混合戦略の組み合わせが常に混合ナッシュ均衡となり,な おかつ,その均衡結果において,プレイヤー 1 のマックスミニ値とプレイヤー 2 のミニマックス値が一致する.そ こで,両者が一致するその値を,ゲーム G∗ の値(value)と呼ぶ.さらに,補題 6.2 の必要性の証明における議論 から,その混合ナッシュ均衡においてプレイヤー 1 が得る均衡利得は,ゲーム G∗ の値に等しい. 6.3 6.3.1 ラベル法 ラベル モデル • プレイヤー集合は N = {1, 2},純戦略集合は S1 = {s1 , · · · , sm } , S2 = {sm+1 , · · · , sm+n },利得関数は ui : 111 S1 × S2 → R (i = 1, 2) であるような戦略型ゲーム G = {N, S1 , S2 , u1 , u2 } について考える. • 純戦略集合 S1 に属する純戦略の番号からなる集合を, I = {1, · · · , m} で表し,S2 に属する純戦略の番号からなる集合を, J = {m + 1, · · · , m + n} で表す.その上で,純戦略の組 (si , sj ) ∈ S1 × S2 (i = 1, · · · , m; j = m + 1, · · · , m + n) を,番号の組 (i, j) ∈ I × J と同一視する. • 純戦略の組 (i, j) (= (si , sj )) からプレイヤー 1 が得る利得を, aij = u1 (si , sj ) で表し,aij を i 行 j 列成分とする m × n 行列を, A = (aij ) i∈I j∈J で表す.同様に,純戦略の組 (i, j) (= (si , sj )) からプレイヤー 1 が得る利得を, bij = u2 (si , sj ) で表し,bij を i 行 j 列成分とする m × n 行列を, B = (bij ) i∈I j∈J で表す. • プレイヤー 1 の混合戦略を s = (s1 , · · · , sm ) で表し,混合戦略集合を, { S= s = (s1 , · · · , sm ) ∈ Rm + ¯m } ¯∑ ¯ si = 1 ¯ ¯ i=1 で表す.また,プレイヤー 2 の混合戦略を t = (tm+1 , · · · , tm+n ) で表し,混合戦略集合を, ¯ ¯∑ n ¯ tm+j = 1 T = t = (tm+1 , · · · , tm+n ) ∈ Rn+ ¯¯ ¯ j=1 で表す. 112 最適反応 • 以上のモデルを踏まえた上で,プレイヤー 1 の混合戦略 s = (s1 , · · · , sm ) ∈ S に対して,プレイヤー 2 の純戦略 j ∈ J が最適反応であることを表現する. • プレイヤー 1 が混合戦略 s = (s1 , · · · , sm ) ∈ S を選び,プレイヤー 2 が純戦略 k ∈ J を選んだ場合にプレイヤー 2 が得る期待利得は, m ∑ u2 (si , k) = m ∑ si bik i=1 i=1 と表現される.ゆえに,プレイヤー 2 の純戦略 j ∈ J がプレイヤー 1 の混合戦略 s ∈ S に対する最適反応であるこ とは, m ∑ si bij = max k∈J i=1 m ∑ si bik i=1 が成り立つことを意味する. • 以上を踏まえると,プレイヤー 1 の混合戦略 s ∈ S の中でも,それに対してプレイヤー 2 の純戦略 j ∈ J が最適反 応になるようなものの集合を, ¯m } m ¯∑ ∑ ¯ si bik si bij = max s∈S¯ ¯ k∈J { j S = i=1 i=1 j で表す.ゆえに,混合戦略 s ∈ S について s ∈ S が成り立つことは,純戦略 j が混合戦略 s に対する最適反応で あることと同義である.すなわち,プレイヤー 1 の混合戦略 s ∈ S とプレイヤー 2 の純戦略 j ∈ J の間には, s ∈ S j ⇔ j ∈ b2 (s) という関係が成り立つ.ただし,b2 (s) はプレイヤー 1 の混合戦略 s に対するプレイヤー 2 の最適反応からなる集 合である. • 同様に,プレイヤー 1 の純戦略 i ∈ I がプレイヤー 2 の混合戦略 t ∈ T に対する最適反応であることは, m+n ∑ aij tj = max k∈I j=m+1 m+n ∑ bkj tj j=m+1 が成り立つことを意味するため,プレイヤー 2 の混合戦略 t ∈ T の中でも,それに対してプレイヤー 1 の純戦略 i ∈ I が最適反応になるようなものの集合を, Ti = t ∈ T ¯ ¯ m+n m+n ∑ ¯ ∑ ¯ b t a t = max kj j ij j ¯ k∈I ¯j=m+1 j=m+1 で表すならば,プレイヤー 2 の混合戦略 t ∈ T とプレイヤー 1 の純戦略 i ∈ I の間には, t ∈ T i ⇔ i ∈ b1 (t) という関係が成り立つ.ただし,b1 (t) はプレイヤー 2 の混合戦略 t に対するプレイヤー 1 の最適反応からなる集 合である. サポート 113 • プレイヤー 1 の混合戦略 s = (s1 , · · · , sm ) ∈ S が正の確率を付与する純戦略からなる集合を, I (s) = {i ∈ I|si > 0} で表し,これを s のサポート(support)と呼ぶ. • プレイヤー 1 の純戦略 i ∈ I に対して,以下のような集合 { i S = s = (s1 , · · · , sm ) ∈ Rm + ¯m } ¯∑ ¯ sk ≤ 1, si = 0 ¯ ¯ k=1 を定義する.S i に属する混合戦略 s のもとでは,純戦略 i ∈ I が選ばれる確率は 0 である.ゆえに,混合戦略 s ∈ S について s ∈ S i が成り立つことは,純戦略 i が混合戦略 s のサポートに属さないことと同義である.すなわち,プ レイヤー 1 の混合戦略 s ∈ S と同じくプレイヤー 1 の純戦略 i ∈ I の間には, s ∈ S i ⇔ i ̸∈ I (s) という関係が成り立つ. • 同様に,プレイヤー 2 の混合戦略 t = (tm+1 , · · · , tm+n ) ∈ T のサポートを, J (t) = {j ∈ J|tm+j > 0} で表した上で,プレイヤー 2 の純戦略 j ∈ J に対して,以下のような集合 { j T = t = (tm+1 , · · · , tm+n ) ∈ Rn+ ¯ m+n } ¯ ∑ ¯ tk ≤ 1, tm+j = 0 ¯ ¯ k=m+1 を定義するならば,プレイヤー 2 の混合戦略 t ∈ T と純戦略 j ∈ J の間には, t ∈ T j ⇔ j ̸∈ J (t) という関係が成り立つ. ラベル • 以上の概念を踏まえた上で,プレイヤー 1 の混合戦略 s ∈ S に対して,そのラベル(label)を, ¯ { } L (s) = k ∈ I ∪ J ¯s ∈ S k と定義する. • プレイヤー 1 の混合戦略 s ∈ S とプレイヤー 2 の純戦略 k ∈ J の間には, s ∈ S k ⇔ k ∈ b2 (s) という関係が成り立つため,これとラベル L (s) の定義より, k ∈ L (s) ⇔ k ∈ b2 (s) 114 という関係が成り立つ.すなわち,プレイヤー 1 の混合戦略 s に対して最適反応であるようなプレイヤー 2 の純戦 略 k は s のラベルに属する.また,プレイヤー 1 の混合戦略 s ∈ S とプレイヤー 1 の純戦略 k ∈ I の間には, s ∈ S k ⇔ k ̸∈ I (s) という関係が成り立つため,これとラベル L (s) の定義より, k ∈ L (s) ⇔ k ̸∈ I (s) という関係が成り立つ.すなわち,プレイヤー 1 の混合戦略 s のサポート I (s) に属さないプレイヤー 1 の純戦略 k は s のラベルに属する.ゆえに,プレイヤー 1 の混合戦略 s ∈ S に対するラベル L (s) とは,s に対して最適反応 であるようなプレイヤー 2 の純戦略と,s のサポート I (s) に属さないプレイヤー 1 の純戦略からなる集合である. • 同様に,プレイヤー 2 の混合戦略 t ∈ T のラベルを, ¯ { } L (t) = k ∈ I ∪ J ¯t ∈ T k と定義する.これは,t に対して最適反応であるようなプレイヤー 1 の純戦略と,t のサポート J (t) に属さないプ レイヤー 2 の純戦略からなる集合である. • さらに,2 人の混合戦略の組 (s, t) ∈ S × T のラベルを, L (s, t) = L (s) ∪ L (t) と定義する. 6.3.2 ラベルとナッシュ均衡 ナッシュ均衡の特徴づけ • 2 人ゲームにおけるナッシュ均衡をラベルを用いて表現しよう.まずは,以下の補題を証明する. 補題 6.3 2 人ゲームにおいて,混合戦略の組 (s, t) ∈ S × T に関して, (a) I (s) ⊂ b1 (t) (b) J (t) ⊂ b2 (s) がともに成り立つことは,(s, t) がナッシュ均衡であるための必要十分条件である. • 条件 (a) は,プレイヤー 1 の混合戦略 s ∈ S のサポート I (s) が,プレイヤー 2 の混合戦略 t ∈ T に対するプレイ ヤー 1 の最適反応集合 b1 (t) の部分集合であるということである.つまり,混合戦略 s において正の確率で選ばれ る純戦略はいずれも,混合戦略 t に対する最適反応である. 115 • 条件 (b) は,プレイヤー 2 の混合戦略 t ∈ T のサポート J (t) が,プレイヤー 1 の混合戦略 s ∈ S に対するプレイ ヤー 2 の最適反応集合 b2 (s) の部分集合であるということである.つまり,混合戦略 t において正の確率で選ばれ る純戦略はいずれも,混合戦略 s に対する最適反応である. • ゆえに,2 つの条件 (a) , (b) は,2 人ゲームの混合戦略ナッシュ均衡では,プレイヤーは互いの均衡戦略に対して最 適反応となる純戦略だけを正の確率で用いることを示唆する. 十分性の証明: • 混合戦略の組 (s, t) ∈ S × T に関して, (a) I (s) ⊂ b1 (t) (b) J (t) ⊂ b2 (s) が成り立つものとする.このとき,ナッシュ均衡の定義より, (c) s ∈ b1 (t) (d) t ∈ b2 (s) がともに成り立つことを示したい. • 混合戦略 s ∈ S はそのサポート I (s) に属する純戦略の一次結合として表される.(a) より,サポート I (s) に属す るすべての純戦略は b1 (t) に属するが,命題 3.4 と命題 3.5 より,b1 (t) は非空な凸集合であるから,凸集合の定義 より,I (s) そして b1 (t) に属する純戦略の一次結合である s もまた b1 (t) の要素であるから,(c) が成り立つ. • (d) の証明も同様である.ゆえに,目標は達成された. 必要性の証明: • 混合戦略の組 (s, t) ∈ S × T がナッシュ均衡であるものとする.すなわち,(c) , (d) がともに成り立つものとする. • (c) が成り立つならば,すなわち,s が t に対する最適反応であるならば,命題 3.9 より,s において正の確率で選 ばれる任意の純戦略もまた t に対する最適反応になるため,(a) が成り立つ. • (b) の証明も同様である.ゆえに,目標は達成された. • 上の補題を踏まえると,ナッシュ均衡はラベルを用いて以下のように表せる. 定理 6.2 2 人ゲームにおいて,混合戦略の組 (s, t) ∈ S × T に関して, L (s, t) = I ∪ J が成り立つことは,(s, t) がナッシュ均衡であるための必要十分条件である.また,上の条件が成り立つとき,(s, t) は完 全ラベルを持つと言う. • 上の条件は,混合戦略の組 (s, t) に対するラベル L (s, t) が,プレイヤーたちの純戦略集合の和集合 I ∪ J と一致す るということである. 116 証明: • 補題 6.3 より,混合戦略の組 (s, t) がナッシュ均衡であることは, (a) I (s) ⊂ b1 (t) (b) J (t) ⊂ b2 (s) がともに成り立つことを意味する. • 一方,混合戦略 s ∈ S のラベル L (s) は, ¯ } { L (s) = k ∈ I ∪ J ¯s ∈ S k ¯ ¯ } } { { = k ∈ I ¯s ∈ S k ∪ k ∈ J ¯s ∈ S k = {k ∈ I |k ̸∈ I (s) } ∪ {k ∈ J |k ∈ b2 (s) } ∵ S k の定義 = (I\I (s)) ∪ (J ∩ b2 (s)) となり,混合戦略 t ∈ T のラベル L (t) は, ¯ { } L (t) = k ∈ I ∪ J ¯t ∈ T k ¯ ¯ { } { } = k ∈ I ¯t ∈ T k ∪ k ∈ J ¯t ∈ T k = {k ∈ I |k ∈ b1 (t) } ∪ {k ∈ J |k ̸∈ J (t) } ∵ T k の定義 = (I ∩ b1 (t)) ∪ (J\J (t)) となるため, L (s, t) = L (s) ∪ L (t) ∵ L (s, t) の定義 = (I\I (s)) ∪ (J ∩ b2 (s)) ∪ (I ∩ b1 (t)) ∪ (J\J (t)) となる. • ゆえに,定理中の条件 L (s, t) = I ∪ J は, (I\I (s)) ∪ (J ∩ b2 (s)) ∪ (I ∩ b1 (t)) ∪ (J\J (t)) = I ∪ J と言い換えられるが,これは, (c) (I\I (s)) ∪ (I ∩ b1 (t)) = I (d) (J\J (t)) ∪ (J ∩ b2 (s)) = J が同時に成り立つことを意味する. • さらに,(c) , (d) がともに成り立つことは, (e) I (s) ⊂ I ∩ b1 (t) (f ) J (t) ⊂ J ∩ b2 (s) が同時に成り立つことを意味することを,ベン図を描けば容易に確かめられる. 117 • さらに,(e) は (a) と同値であり,(f ) と (b) は同値であるから,目標は達成された. 6.3.3 ラベル法 例 6.3 (ラベル法) • 以下の利得行列によって表される 2 人ゲームについて考える. 4 5 6 1 3, 3 1, 1 0, 0 2 1, 1 1, 1 2, 0 3 0, 0 0, 2 2, 2 118 7 分析例 7.1 7.1.1 囚人のジレンマ 囚人のジレンマ 囚人のジレンマ • ある犯罪に関して共犯関係にあると思われる 2 人の容疑者が検事の取り調べを受けている. • 容疑者たちはともに,罪を自白(confess)するか黙秘(deny)するかのどちらか一方を選択する. • 検事は容疑者たちを別々の取調室に隔離して取り調べを行っているため,容疑者たちは互いに相談できない. • 両者がともに自白すれば両者の有罪が確定し,両者はともに 8 年の懲役刑を受ける.一方,両者がともに黙秘すれ ば両者は当該罪においては有罪とされないが,検事は余罪で両者を起訴できるため,この場合は両者とも 1 年の懲 役刑を受ける.さらに,2 人のうち一方だけが自白すれば,共犯証言の制度により,自白した者への量刑は 3ヶ月 となり,黙秘した者への量刑は 10 年となる. • 容疑者たちはともにより軽い刑罰を好むものとする.そこで,より軽い刑罰に対してより大きな利得を対応させる ことで,例えば,以下の利得行列が得られる. 12 黙秘 自白 黙秘 5, 5 0, 8 自白 8, 0 2, 2 • ただし,このゲームの本質は,以下の相対的な利得の大小関係にある.ただし,C は協調(cooperate)を表し,D は裏切り(defect)を表す記号である. 12 C D C R, R S, T D T, S P, P ただし,表中の利得の間には, (a) T >R>P >S (b) 2R > T + S > 2P という大小関係が成立するものと定める. • 条件 (a) は,プレイヤー個人にとってどの結果が望ましいかを規定する条件である.つまり,それぞれのプレイヤー は自分だけ抜け駆けして自白することが最良であり,相手に抜け駆けされることが最悪である.また,残り 2 つの 結果については,互いに裏切って自白するよりも,互いに協調して黙秘するほうがマシである. • 条件 (b) は,2 人のプレイヤーから構成される社会にとってどの結果が望ましいかを規定する条件である.つまり, 双方とも協調して黙秘することは社会的に最良であり,双方とも裏切って自白することは社会的に最悪である. • タッカー(A.W.Tucker)によるこのようなゲームを囚人のジレンマ(prisoner’s dilemma)と呼ぶ. 119 囚人のジレンマを表す戦略型ゲーム • 囚人のジレンマにおいては,通常,2 人の容疑者の間には拘束的合意が成立しないため,これは非協力ゲームであ る.仮に,2 人が逮捕される直前に接触をし,取り調べにおいて口裏を合わせる約束をしていた場合においても, その約束には拘束力がないため,やはりこれは非協力ゲームである. • だが,現実の状況においては,容疑者たちが事前の約束通りに行動することがある.例えば,自白した容疑者が出 所後に何らかの報復を受ける可能性がある場合には,容疑者たちは口裏を合わせて黙秘をするであろう.だが,こ のような想定が成立する状況は,拘束的合意が存在しない囚人のジレンマとは異なるゲームとして分析されるべき である. • 囚人のジレンマにおいては,容疑者たちは互いに相談できないまま,相手の意志決定の内容を知らない状態で自身 の意志決定を行うので,これは静学ゲームである.また,多くの場合,ゲームのルールは共有知識とみなされるた め,その場合の囚人のジレンマは完備情報ゲームとなる.つまり,囚人のジレンマは完備情報の静学ゲームである ため,それは戦略型ゲームとして表現される. • 具体的には,囚人のジレンマを表現する戦略型ゲーム G = (N, {A1 , A2 } , {u1 , u2 }) を構成する要素は以下の通り: 1. プレイヤー集合は N = {1, 2} である.ただし,i ∈ N は容疑者 i を表す. 2. プレイヤー i (= 1, 2) の行動集合は Ai = {C, D} である.ただし,C は協調を表し,D は裏切りを表す. 3. プレイヤー 1 の利得関数 u1 : A1 × A2 → R は, (a) u1 (D, C) > u1 (C, C) > u1 (D, D) > u1 (C, D) (b) 2u1 (C, C) > u1 (D, C) + u1 (C, D) > 2u1 (D, D) を満たし,プレイヤー 2 の利得関数 u2 : A1 × A2 → R は, (a) u2 (C, D) > u2 (C, C) > u2 (D, D) > u2 (D, C) (b) 2u2 (C, C) > u2 (C, D) + u2 (D, C) > 2u2 (D, D) を満たす. • 上のゲーム G は有限 2 人ゲームであるから,これは以下の利得行列によって表現される. 12 C D C R, R S, T D T, S P, P ただし,表中の利得の間には, (a) T >R>P >S (b) 2R > T + S > 2P という関係が成り立つ. 120 7.1.2 ナッシュ均衡 ナッシュ均衡 • 囚人のジレンマは以下の純戦略ナッシュ均衡を持つ. 命題 7.1 囚人のジレンマの純戦略ナッシュ均衡は (D, D) である. 証明. • 囚人のジレンマを表す以下の利得行列について考える. 12 C D C R, R S,T D T,S P ,P ただし,表中の利得の間には, (a) T >R>P >S (b) 2R > T + S > 2P という関係が成り立つ. • 利得行列から明らかであるように,(D, D) は純最適反応の組であるから,これは純戦略ナッシュ均衡である. 7.2 7.2.1 クールノー競争 クールノー競争 クールノーの数量競争モデル • ある同質財の複占市場における逆需要関数を p : R+ → R+ で表す.ただし,p は以下の性質を満たすものと仮定 する. (a) ∃q ∈ (0, ∞) , ∀q ∈ R+ : [q ≥ q ⇒ p (q) = 0] . (b) ∃p ∈ (0, ∞) : p (0) = p. (c) p は [0, q] において連続微分可能. (d) ∀q ∈ [0, q] : p′ (q) < 0. • 逆需要関数を p : R+ → R+ として定義することは,任意の数量における市場均衡価格は非負の値であることを意 味する.条件 (a) は,ある数量 q 以上の任意の数量では市場の均衡価格が 0 になることを意味し,条件 (b) は,数 量が 0 のときの市場均衡価格が正の実数値であることを意味する.さらに条件 (c) は,p が [0, q] において連続かつ 微分可能であると同時に,その導関数もまた連続であることを意味し,条件 (d) は,p が [0, q] において狭義減少関 数であることを意味する.すなわち,q 以下の任意の数量から数量がさらに増加すると市場の均衡価格が下落する. 121 • 以上の条件を満たす逆需要関数 p のグラフである逆需要曲線を描いたものが下の図である.関数 p の変数である数 量 q を縦軸にとっている点に注意せよ. q q p =p (q ) ⇔ q =x (p ) x (p')=q' o p'=p (q') p p 【逆需要曲線】 • 本節では,2 つの企業が同質財を供給する上の複占市場において,カルテルを形成せずに競争する 2 つの企業が互 いに生産量を決定する場合にどのような均衡が実現するかを分析する.まずは,この複占市場において同質財を供 給する複占企業 i = 1, 2 の費用関数を ci : R+ → R+ で表す.すなわち,企業 i による生産量が qi ≥ 0 であるとき の企業 i の生産費用は ci (qi ) ≥ 0 である.ただし,ci は以下の条件を満たすものと仮定する: (e) ∃c > 0, ∀i = 1, 2, ∀qi ≥ 0 : ci (qi ) = c · qi . • 企業 i の費用関数を ci : R+ → R+ として定義することは,任意の供給量における複占企業の費用が非負の値であ ることを意味する.条件 (e) は,両企業ともに財の生産に必要な固定費用が 0 であり(c1 (0) = c2 (0) = 0),また 生産量 qi に依存しない共通の限界費用 c > 0 を持つことを意味する.つまり,企業は規模に関して収穫一定の技術 を持つ. • 複占企業が共有する限界費用 c > 0 と市場の逆需要関数 p : R+ → R+ の間には,以下の関係が成り立つものと仮 定する: (f ) ∃q ◦ ∈ (0, ∞) : p (q ◦ ) = c. • 条件 (e) より両企業の限界費用が生産量に関わらず常に c で一定であることを踏まえると,条件 (f ) は,両企業の 限界費用曲線が市場の逆需要曲線と正の生産量において交わることを意味する.つまり,それぞれの企業にとって 競争的な産出量は正の実数である.ちなみに,p (q) = c とおくならば,市場の需要関数 x : R+ → R+ に関して q = x (c) という関係が成立する.また,費用関数 ci の導関数 c′i である限界費用関数を M Ci : R+ → R+ で表すな らば,先の条件 (e) のもとでは, ∃c > 0, ∀i = 1, 2, ∀qi ≥ 0 : M Ci (qi ) = c. となる. 122 • 以上の条件を満たす c′1 , c′2 と p を以下に図示した.先ほどの図とは異なり,経済学の慣例に反して横軸に逆需要関 数の変数である数量 q をとっている点に注意せよ. p c'1(q 1)=c'2(q 2) c=p (q ) p (q ) o q q q 【複占市場】 • 先に提示した性質を満たす費用関数 ci : R+ → R+ (i = 1, 2) を持つ複占企業が,市場の逆需要関数 p : R+ → R+ を所与としたときに,自身の利潤を最大化するような財の供給量を選択するものと仮定しよう.ただし,両企業は 互いにカルテルを結ぶことができず,両者の間に生産量に関する拘束的合意が成立しない状況を想定する.また, 各企業は同時に自身の生産量を決定するものとする.より正確には,各企業は競争相手による意志決定の結果を知 らない状態で自身の生産量を決定するものとする.このとき,複占企業はそれぞれ具体的にどのような意志決定を 行うだろうか. • 完全競争市場における企業は財の市場価格を所与として意志決定を行うのに対し,複占市場には財を供給する企業 が 2 つしか存在しないため,2 つの複占企業 1, 2 が財の供給量 q1 , q2 ≥ 0 をそれぞれ選択すると,市場における財 の総供給量は q1 + q2 ≥ 0 となり,それに対して逆需要関数 p が定める財価格 p (q1 + q2 ) ≥ 0 において財市場が均 衡する.つまり,複占企業が選択する供給量に応じて財価格が変化し得るという意味において,複占企業は価格支 配力を持つ.ただし,企業 i = 1, 2 が操作可能であるのは自身の供給量 qi のみであり,競争相手 j (̸= i) による供 給量 qj を直接操作することができない.ゆえに,複占企業は市場の総供給量を完全に操作できるわけではなく,ゆ えに,財の市場価格を自由に操作できるわけではない. • 繰り返しになるが,複占企業 1, 2 がそれぞれ財の供給量 q1 , q2 ≥ 0 を選択すると市場の総供給量は q1 + q2 となり, それに対して逆需要関数が定める価格 p (q1 + q2 ) > 0 において財市場が均衡し,企業 1 は収入 p (q1 + q2 ) · q1 を得 る.その一方で,供給量 q1 のもとで企業 1 が負担すべき費用は費用関数によって c1 (q1 ) = c · q1 ≥ 0 と定まるた め,生産量の組 (q1 , q2 ) のもとで企業 1 が得る利潤は収入から費用を引いた p (q1 + q2 ) · q1 − c · q1 となる.同様に 考えると,(q1 , q2 ) のもとで企業 2 が得る利潤は p (q1 + q2 ) · q1 − c · q2 となる.これらを一般化して表現すると, p (qi + qj ) · qi − c · qi となる. 123 (i, j = 1, 2; i ̸= j) • 企業 1 は競争相手である企業 2 による生産量 q2 を操作できないため,q2 の値を所与としながら,自身の利潤を最 大化するような生産量 q1 を選択するという最大化問題 max p (q1 + q2 ) · q1 − c · q1 q1 ≥0 に直面する.同様に考えると,企業 2 が直面する最大化問題は, max p (q1 + q2 ) · q2 − c · q2 q2 ≥0 となる.これらを一般的に表現すると, max p (qi + qj ) · qi − c · qi qi ≥0 (i, j = 1, 2; i ̸= j) となる.Cournot (1838) によってモデル化されたこのような数量競争をクールノー競争(Cournot competition) と呼ぶ. クールノー競争を表す戦略型ゲーム • クールノー競争においては,通常,複占企業どうしがカルテルを結ぶことができず,企業間に拘束的合意が成立し ないため,これは非協力ゲームである.現実の複占市場においても,企業どうしがカルテルを結ぶことは独占禁止 法などによって禁止されていることが多い. • クールノー競争における複占企業は事前に相談できず,相手の意志決定の内容を知らない状態で 1 度だけ意志決定 を行うため,これは静学ゲームである. • 多くの場合,クールノー競争のルールは共有知識とみなされるため,その場合のクールノー競争は完備情報ゲーム となる. • 以上を踏まえると,クールノー競争は完備情報の静学ゲームであるため,それは以下のような戦略型ゲーム G = (N, {S1 , S2 } , {u1 , u2 }) として表現される: 1. プレイヤー集合は N = {1, 2} である.ただし,i ∈ N は複占企業 i を表す. 2. プレイヤー i = 1, 2 の純戦略集合は Si = R+ であり,個々の戦略 qi ∈ R+ は,自身が供給する財の生産量を 表す. 3. プレイヤー i の利得関数 ui : S1 × S2 → R は, ui (q1 , q2 ) = p (qi + qj ) · qi − ci (qi ) として定められる.ただし,p : R+ → R+ は市場の逆需要関数であり,ci : R+ → R+ 企業 i の費用関数で ある. 124 7.2.2 クールノー均衡 クールノー均衡 • クールノー競争における市場の逆需要関数 p や複占企業の費用関数 ci などが,前節において特定した性質を満た す場合には,クールノー均衡を表す戦略型ゲームに純戦略ナッシュ均衡が存在することを保証できる.これをクー ルノー均衡(Cournot equilibrium)と呼ぶ. • クールノー均衡 (q1∗ , q2∗ ) が定まれば市場の総供給 q1∗ + q2∗ が定まるため,さらに逆需要関数 p から均衡における市 場価格 p (q1∗ + q2∗ ) が定まる. 命題 7.2 複占市場の逆需要関数 p : R+ → R+ が, (a) ∃q ∈ (0, ∞) , ∀q ∈ R+ : [q ≥ q ⇒ p (q) = 0] . (b) ∃p ∈ (0, ∞) : p (0) = p. (c) p は [0, q] において連続微分可能. (d) ∀q ∈ [0, q] : p′ (q) < 0. を満たし,複占企業 i = 1, 2 の費用関数 ci : R+ → R+ が, (e) ∃c > 0, ∀i = 1, 2, ∀qi ≥ 0 : ci (qi ) = c · qi . (f ) c1 , c2 は R+ において 2 階微分可能. を満たすものとする.さらに,両者の間には, (g) ∃q ◦ ∈ (0, ∞) : p (q ◦ ) = c. という関係が成り立つものとする.このとき,クールノー競争を表す戦略型ゲーム G には純戦略ナッシュ均衡 (q1∗ , q2∗ ) が 存在し,それは以下の条件を満たす: (A) (B) (q1∗ , q2∗ ) ≫ 0. ( ∗ ∗) q +q p′ (q1∗ + q2∗ ) 1 2 2 + p (q1∗ + q2∗ ) = c. 証明. • 企業 2 の生産量 q2 を所与とするとき,それに対する企業 1 の純最適反応は,パラメータ q2 の水準を所与としたと きの,以下の最大化問題 max p (q1 + q2 ) · q1 − c · q1 q1 ∈R+ (1) の解である.同様に,企業 1 の生産量 q1 を所与としたときの企業 2 の純最適反応は,パラメータ q1 の水準を所与 としたときの, max p (q1 + q2 ) · q2 − c · q2 q2 ∈R+ の解である. • 解の存在証明: 125 (2) – 先の最大化問題 (1) , (2) の解の組 (q1∗ , q2∗ ) が q1∗ + q2∗ ∈ [0, q] を満たさないものと仮定して矛盾を導く.すなわ ち,q < q1∗ + q2∗ と仮定する.このとき,逆需要関数 p に関する仮定より p′ (q1∗ + q2∗ ) = p (q1∗ + q2∗ ) = 0 とな るため, p ′ (q1∗ + q2∗ ) ( q1∗ + q2∗ 2 ) + p (q1∗ + q2∗ ) = 0 < c となり,これは (B) と矛盾する.後ほど示すように,解の組 (q1∗ , q2∗ ) は (B) を常に満たす.ゆえに,背理法よ り (q1∗ , q2∗ ) は q1∗ + q2∗ ∈ [0, q] を満たす必要がある. – 上の事実と q1∗ , q2∗ ≥ 0 を踏まえると,それぞれの q2 に対する最大化問題 (1) は, max p (q1 + q2 ) · q1 − c · q1 q1 ∈[0,q] と言い換えられるが,p の連続性より上の目的関数は連続であり,さらに変数の定義域 [0, q] はコンパクト集 合であるから,ワイエルシュトラウスの定理より,この最大化問題は [0, q] の中に最適解を持つことが保証さ れる. – それぞれの q1 に対する最大化問題 (2) についても同様に考えると,やはりこれもまた [0, q] の中に最適解を持 つことが保証される. • (A) , (B) の証明: – それぞれの q2 に対する最大化問題 (1) に関しては,定理中の条件のもとでは最適解 q1∗ ∈ [0, q] が存在すること が既に示されている.また,p は微分可能であるから目的関数もまた微分可能である.ゆえに,クーン・タッ カーの条件より, p′ (q1∗ + q2 ) · q1∗ + p (q1∗ + q2 ) − c ≤ 0 (3) が成り立つ.ただし,q1∗ > 0 の場合には等号が成立する. – 同様に考えると,それぞれの q1 に対する最大化問題 (2) に関しても,最適解 q2∗ ∈ [0, q] は, p′ (q1 + q2∗ ) · q2∗ + p (q1 + q2∗ ) − c ≤ 0 (4) を満たす.ただし,q2∗ > 0 の場合には等号が成立する. – 数量の組 (q1∗ , q2∗ ) が純戦略ナッシュ均衡であるならば q1∗ と q2∗ 互いに最適解となっているため,これは (3) , (4) を同時に満たす.すなわち, p′ (q1∗ + q2∗ ) · q1∗ + p (q1∗ + q2∗ ) − c ≤ 0 (5) p′ (q1∗ + q2∗ ) · q2∗ + p (q1∗ + q2∗ ) − c ≤ 0 (6) が成り立つ.ただし,q1∗ > 0 ならば (5) は等号で成立し,q2∗ > 0 ならば (6) は等号で成立する. – 以下では (A) すなわち (q1∗ , q2∗ ) ≫ 0 を示そう.そこで q1∗ = 0 と仮定すると,(5) , (6) より, p (q2∗ ) ≤ c (7) p′ (q2∗ ) · q2∗ + p (q2∗ ) − c ≤ 0 (8) 126 が得られるが,p は微分可能かつ [0, q] において狭義単調減少ゆえに p′ (q2∗ ) < 0 である.ここで q2∗ > 0 と仮定 しよう.このとき (8) は等号で成立しなければならないはずであるが,このとき p′ (q2∗ ) · q2∗ < 0 となるため, (7) を併せると (8) は等号で成立せず矛盾である.ゆえに背理法より q1∗ > 0 となる.さらに,q2∗ > 0 である ことも同様にして示されるため,目標である (q1∗ , q2∗ ) ≫ 0 が示された. – さて,(q1∗ , q2∗ ) ≫ 0 である場合には (5) と (6) はともに等号で成立する.すなわち, p′ (q1∗ + q2∗ ) · q1∗ + p (q1∗ + q2∗ ) − c = 0 p′ (q1∗ + q2∗ ) · q2∗ + p (q1∗ + q2∗ ) − c = 0 である.これらを辺々足して 2 で割ると, p′ (q1∗ + q2∗ ) ( q1∗ + q2∗ 2 ) + p (q1∗ + q2∗ ) = c が得られるため,もう一つの目標である (B) が示された. クールノー均衡における市場価格 • 命題 7.2 の条件を満たす複占市場では両企業は生産量に依存しない一定の限界費用 c を持つ.ゆえに,この市場に おける完全競争均衡価格は c に等しく,p (q1 + q2 ) = c を満たすような生産量の組 (q1 , q2 ) のもとでその価格 c が 実現し,そのとき社会的余剰は最大化される. • 仮に,同様の市場において限界費用 c を持つ独占企業が財を供給しているものと仮定した上で,独占企業の利潤を 最大化する独占均衡生産量を q m で表そう.独占価格は p (q m ) = pm を満たす pm である.さて,話を複占企業に 戻して,仮に両企業がお互いに協力して q m = q1 + q2 を満たすような生産量の組 (q1 , q2 ) を選択すれば,両企業の 利潤の和は最大化される. • 完全競争的な結果をもたらす生産量の組と,独占的な結果をもたらす生産量の組という両極端な場合について上で 考察したが,クールノー均衡をそれらの場合と比較するとどのような特徴を持っているだろうか.この問いに答え るのが以下の命題である. 系 7.1 命題 7.2 の条件のもとでは,クールノー均衡 (q1∗ , q2∗ ) のもとでの市場均衡価格 p (q1∗ , q2∗ ) は,完全競争価格 c より も高く,独占価格 q m よりも低い.すなわち, c < p (q1∗ + q2∗ ) < p (q m ) という関係が成立する. • クールノー均衡 (q1∗ , q2∗ ) と完全競争価格 c の間に c < p (q1∗ + q2∗ ) が成り立つことは,クールノー均衡のもとでは社 会的余剰が最大化されないことを意味する.つまり,クールノー均衡は社会的には非効率的な資源配分をもたらす. 127 • 一方,クールノー均衡 (q1∗ , q2∗ ) と独占均衡数量 q m の間に p (q1∗ + q2∗ ) < p (q m ) が成り立つことは,クールノー均衡 のもとでは複占企業の利潤の和が最大化されないことを意味する.つまり,クールノー均衡がもたらす資源配分は, 複占企業にとってさえもパレート最適ではない.これは囚人のジレンマと同様の構造である. • では,命題 7.2 から上の系を示そう. 証明. • 命題 7.2 より,クールノー均衡 (q1∗ , q2∗ ) ≥ 0 は,以下の条件をともに満たす. (A) (B) (q1∗ , q2∗ ) ≫ 0. ( ∗ ∗) q +q p′ (q1∗ + q2∗ ) 1 2 2 + p (q1∗ + q2∗ ) = c. • c < p (q1∗ + q2∗ ) の証明: – クールーノー均衡のもとでの均衡価格は p (q1∗ + q2∗ ) であるが,(B) より以下が成り立つ. p (q1∗ + q2∗ ) ′ −c=p (q1∗ + q2∗ ) ( q1∗ + q2∗ 2 ) – 逆需要関数 p は微分可能かつ狭義単調減少ゆえに p′ (q1∗ + q2∗ ) < 0 が成り立つ.また,(A) より ある.したがって, p′ (q1∗ + q2∗ ) ( q1∗ + q2∗ 2 q1∗ +q2∗ 2 >0で ) <0 すなわち, p (q1∗ + q2∗ ) < c が成り立つ. • p (q1∗ + q2∗ ) < p (q m ) の証明: – クールノー均衡 (q1∗ , q2∗ ) と独占均衡数量 q m の間に q1∗ + q2∗ ≥ q m が成り立つことを背理法で示す.すなわち, q1∗ + q2∗ < q m (1) と仮定して矛盾を導く. – 企業 2 の生産量 q2∗ を所与としたときに,企業 1 は q1∗ から逸脱して q1′ = q m − q2∗ > q1∗ へと生産量を増やせば, q1′ + q2∗ = q m となるため,(q1∗ , q2∗ ) のときと比べて両企業の利潤の和が減少することはない. – このとき,企業 2 の利潤は u2 (q1∗ , q2∗ ) = p (q1∗ + q2∗ ) · q2∗ − c · q2∗ から u2 (q1′ , q2∗ ) = p (q1′ + q2∗ ) · q2∗ − c · q2∗ へと 変化するが,両者を比較すると,q1′ > q1∗ と p が狭義の単調減少関数であることから企業 2 の利潤は減少する ことがわかる. – 議論をまとめると,企業 2 の生産量 q2∗ を所与としたとき,企業 1 が q1∗ から逸脱して q1′ へ生産量を増やすと, 両企業の利潤の和は減少しないが,企業 2 の利潤は減少することから,企業 1 の利潤は増加する.つまり,企 業 1 にとって q1∗ は q2∗ に対する最適反応ではないため,これは (q1∗ , q2∗ ) がナッシュ均衡であることと矛盾する. ゆえに,背理法より当初の仮定 (1) が偽であり,q1∗ + q2∗ ≥ q m が成り立つことが示された. 128 – 続いて,q1∗ + q2∗ > q m が成り立つことを背理法で示す.すなわち, q1∗ + q2∗ = q m (2) と仮定して矛盾を導く.この仮定のもとでは,(B) より, p′ (q m ) · qm + p (q m ) = c 2 (3) が成り立つ. – 一方,独占均衡数量 q m は以下の利潤最大化問題 max p (q) · q − c · q q∈R+ の解であるから,最大化のための 1 階の条件より,独占均衡生産量 q m は, p′ (q m ) · q m + p (q m ) − c = 0 を満たすが,これは (3) と矛盾する.ゆえに,背理法より当初の仮定 (3) が偽であり,q1∗ + q2∗ > q m が成り立 つことが示された. – 逆需要関数 p は狭義単調減少関数であるから,q1∗ + q2∗ > q m のもとでは p (q1∗ + q2∗ ) < p (q m ) が成り立つ. クールノー均衡のパレート非効率性 • 上の系によってクールノー均衡がもたらす結果は複占企業にとってさえもパレート効率的ではないことが明らかに なったら,この点について議論をもう少し深めよう. • カルテルは独占禁止法によって禁じられているため,複占企業は両者の利潤の和を最大化する生産量の組,すなわ ち,q m = q1 + q2 を満たす (q1 , q2 ) を約束することはできない.さらに,両企業が秘密裏に談合を行い,両者の利 潤の和を最大化するような生産を互いに遂行するように口裏を合わせた場合においても,それぞれの企業が自己の 利得の最大化を行動指針とする限りにおいて,それぞれの企業はその約束を履行するインセンティブを持たない. • 具体的には,仮に両企業が秘密裏に談合を行い, q m = q1 + q2 を満たす何らかの組 (q1 , q2 ) を生産するよう互いに約束したとする.仮に両企業がこの約束を履行すれば,両企業の 生産量の和は独占均衡生産量と一致するため,両企業が得る利潤の和は最大化される.このときの企業 1 の利潤は, u1 (q1 , q2 ) = [p (q m ) − c] · q1 である.一方,企業 1 が上の q1 から逸脱して上の q2 に対する最適反応 q1 (q2 ) を選んだ場合の企業 1 の利潤は, u1 (q1 (q2 ) , q2 ) = [p (q1 (q2 ) + q2 ) − c] · q1 (q2 ) 129 となる.最適反応の定義より,u1 (q1 (q2 ) , q2 ) ≥ u1 (q1 , q2 ) すなわち, [p (q1 (q2 ) + q2 ) − c] · q1 (q2 ) ≥ [p (q m ) − c] · q1 (1) が成り立つ. • さて,仮に q1 > q1 (q2 ) と仮定すると,(1) が成り立つためには, p (q1 (q2 ) + q2 ) − c > p (q m ) − c すなわち, p (q1 (q2 ) + q2 ) > p (q m ) でなければならないが,p は狭義減少関数であるから,このとき, q1 (q2 ) + q2 < q m となる.つまり,q m = q 1 + q 2 を踏まえると, q1 (q2 ) < q1 となるが,これは q1 > q1 (q2 ) と矛盾である.ゆえに,q1 (q2 ) ≥ q1 が成り立つ. • つまり,企業 2 が当初の約束を守って q2 だけ生産することを前提とするとき,企業 1 は自身も約束を守って q1 を 生産するよりも,それ以上の q1 (q2 ) だけ生産することによって自己の利潤を増やすことができる.企業 2 につい ても同様の議論が成り立つため,結局,両企業の生産量の和を最大化する生産量の組はナッシュ均衡ではない.自 己の利潤の最大化を目指す企業は約束した水準よりも多くを生産するインセンティブを持つため,両企業が実際に 選択するクールノー均衡のもとでの生産量の和は,両企業の利潤の和を最大化する生産量の和を超過してしまうた め,均衡価格は独占価格を下回り,ゆえにパレート効率的な結果が実現しない. 例 7.1 (線型の需要曲線) • クールノー競争における逆需要関数 p : R+ → R+ が, p (q) = a − bq という線型式で与えられる場合について考える.ただし,a, b > 0 であり,企業の限界費用 c > 0 の間に, p (0) = a > c という関係が成り立つものとする.このとき, a−c b > 0 すなわち ( p a−c b ) ( =a−b a−c b a−c b ∈ (0, ∞) が一意的に存在して, ) =c を満たす.ゆえに,この p はクールノー競争モデルが要求する条件をすべて満たす. 130 • 以上の仮定のもとでは,企業 i = 1, 2 の利得関数 ui : S1 × S2 → R は, ui (q1 , q2 ) = [a − b (q1 + q2 )] · qi − c · qi = [a − b (q1 + q2 ) − c] · qi となる. • 企業 2 の生産量 q2 を所与とするとき,それに対する企業 1 の純最適反応は,パラメータ q2 の水準を所与としたと きの,以下の最大化問題 max u1 (q1 , q2 ) q1 ∈R+ すなわち, max [a − b (q1 + q2 ) − c] · q1 q1 ∈R+ の解である. • 目的関数を変数 q1 について整理すると, u1 (q1 , q2 ) = −bq12 + (a − bq2 − c) q1 となる.このとき, ∂u1 (q1 , q2 ) = −2bq1 + a − bq2 − c ∂q1 ∂ 2 u2 (q1 , q2 ) = −2b < 0 ∂q12 であるから,u1 (q1 , q2 ) は q1 に関する狭義凹関数である.ゆえに,大域的最適のための十分条件より, ∂u1 (q1 , q2 ) =0 ∂q1 すなわち, −2bq1 + a − bq2 − c = 0 すなわち, q1 = a − bq2 − c 2b (1) が先の最大化問題の一意的な解であるから,これが q2 に対するプレイヤー 1 の一意的な純最適反応である. • 同様に考えると,プレイヤー 1 の生産量 q1 に対するプレイヤー 2 の一意的な純最適反応は, q2 = a − bq1 − c 2b である. • 数量の組 (q1∗ , q2∗ ) が純戦略ナッシュ均衡であれば,(1) , (2) より,この戦略の組は, (a) q1∗ = (b) q2∗ = 131 a−bq2∗ −c 2b a−bq1∗ −c 2b (2) を満たすものでなければならない.そこで,これらを解くと, q1∗ = q2∗ = a−c 3b が得られる. • 上のクールノー均衡においてそれぞれの企業 i が得る利得は, ui (q1∗ , q2∗ ) = [a − b (q1∗ + q2∗ ) − c] · qi∗ [ ( ) ] a−c a−c a−c = a−b + −c · 3b 3b 3b = 2 (a − c) 9b であるから,均衡において両企業が得る利得の和は, u1 (q1∗ , q2∗ ) + u2 (q1∗ , q2∗ ) = 2 2 (a − c) 9 (3) となる. • 両企業が実現し得る利得の和の最大値は,両企業があたかも 1 つの独占企業として振る舞った場合に実現する独占 利潤である.そこで,以下の最大化問題 max (a − bq − c) · q q∈R+ について考える.目的関数を変数 q について整理すると, −bq 2 + (a − c) q が得られる.このとき, ( ) d −bq 2 + (a − c) q = −2bq + (a − c) dq ( ) d2 −bq 2 + (a − c) q = −2 < 0 dq 2 であるから,これは q に関する狭義凹関数である.ゆえに,大域的最適のための十分条件より, ( ) d −bq 2 + (a − c) q =0 dq すなわち, −2bq + (a − c) = 0 すなわち, qM = a−c 2b が先の最大化問題の解であるから,これが独占企業による最適生産量である.このときの独占価格は, ( ) a−c a+c p q M = a − bq M = a − b · = 2b 2 132 であり,独占利潤は, ( ) p q M · q M − cq M = ( ) 2 a−c (a − c) a+c −c · = 2 2b 4b (4) となる.そこで両企業は, q1 + q2 = a−c 2b (5) を満たすような生産量 q1 , q2 を生産すれば,そこで両企業が得る利得の和は,最大化された利潤の和 (2) と一致する. • ナッシュ均衡における両企業の利得の和 (3) と,両企業があたかも 1 つの独占企業としてふるまった場合の両企業 の利潤の和 (4) を比べると,たしかに後者は前者を上回っている.ゆえに,クールノー競争におけるナッシュ均衡 は効率的であるとは言えない. • カルテルが禁じられている場合には,談合によって (4) を満たす生産量 q1 , q2 を約束することはできない.さらに, 仮に両企業が秘密裏に談合を行うものとした上で,そこで (4) を満たす生産量 q1 , q2 を互いに遂行するよう口裏を 合わせた場合でも,それぞれの企業が自己の利得の最大化を行動指針とする限りにおいて,企業はその約束を履行 するインセンティブを持たない.その理由は以下の通りである. • 仮に,両企業が談合を行い,(5) を満たす q1 , q2 を生産する合意に至ったとする.具体的には,両企業は生産量を 2 等分するならば, ( (q1 , q2 ) = a−c a−c , 4b 4b ) (6) となる.両企業がこの約束を履行すれば,両企業が獲得する利潤の和は (4) で最大化される.だが,約束された企 業 2 の生産量 q2 = a−c 4b を前提とするとき,それに対する企業 1 の純最適反応は,先の議論により, q1 = となり,これは合意内容 q1 = a−c 4b a − bq2 − c a−c b a−c 3 (a − c) = − · = 2b 2b 2b 4b 8b とは一致しない.つまり,企業 1 は合意した生産量よりも多くを生産すること によって自己の利得を増やせる.企業 2 についても同様の議論が成立するため,結局,(6) はナッシュ均衡ではな い.ちなみに,この議論は (5) を満たす任意の (q1 , q2 ) について成立する. • 議論を整理しよう.効率的な結果,すなわち,両企業が獲得する利得の和を最大化するためには,(5) を満たすよ うな生産量 q1 , q2 を履行すれば良い.そこで,企業どうしが事前にそのような生産を約束した場合においても,そ のような生産の組は最適戦略の組すなわちナッシュ均衡にはならず,自己の利得の最大化を目指す企業は,約束し た水準よりも多くを生産するインセンティブを持つ.その結果,両企業の生産量の和は (5) を満たす水準を超過し てしまうため,価格水準は独占価格を下回り,ゆえに効率的な結果が実現しない. • 一方,クールノー均衡 (q1∗ , q2∗ ) における総供給量は, q1∗ + q2∗ = 2 (a − c) 3b であり,これは独占供給量 (5) よりも多い.ゆえに,クールノー均衡価格は独占価格よりも低いため,両企業が生 産量を増やそうとするインセンティブは弱まっている.実際,(q1∗ , q2∗ ) はナッシュ均衡であるから,両企業はそこ から逸脱して生産量を増やすインセンティブを持たない. 133 7.2.3 戦略の逐次消去 クールノー競争における戦略の逐次消去 • クールノー競争における逆需要関数 p : R+ → R+ が, p (q) = a − bq という線型式で与えられる場合について考える.ただし,a, b > 0 であり,企業の限界費用 c > 0 の間に, p (0) = a > c という関係が成り立つものとする.このとき, a−c b > 0 すなわち ( p a−c b ) ( =a−b a−c b a−c b ∈ (0, ∞) が一意的に存在して, ) =c を満たす.ゆえに,この p はクールノー競争モデルが要求する条件をすべて満たす. • 例 7.1 の議論より,プレイヤー i = 1, 2 の純最適反応関数 bi : R+ → R+ は, bi (qj ) = a − bqj − c 2b (i, j = 1, 2; i ̸= j) で与えられる.これを連立して解くと,純戦略ナッシュ均衡 (q1∗ , q2∗ ) が, q1∗ = q2∗ = a−c 3b として与えられる. • 実は,このゲームは逐次強支配によって解ける.そこで,以下では強支配される戦略の逐次消去を適用してみよう. まず,それぞれのプレイヤーの純最適反応関数 b1 (q2 ) , b2 (q1 ) を描くと以下が得られる. q2 a -c b q 1=b 1(q 2) a -c 2b a -c 3b q 2=b 2(q 1) o a -c 3b a -c 2b a -c b q1 • プレイヤー 2 の戦略 q2 に対するプレイヤー 1 の最適な純戦略は b1 (q2 ) である.ゆえに,プレイヤー 2 がどの戦略 を選ぶかに関わらず,プレイヤー 1 にとって a−c 2b はそれより大きい任意の数量を強支配する.ゆえに,プレイヤー 134 1 の純戦略集合から 戦略集合から a−c 2b a−c 2b より大きい数を消去できる.プレイヤー 2 についても同様に考えると,プレイヤー 2 の純 より大きい数を消去できる.消去後に残った 2 人の戦略の組は上図のグレーの領域で表されて いる. [ ] • 新たに得られたゲームにおいて,プレイヤー 2 の戦略 q2 ∈ 0, a−c に対するプレイヤー 1 の最適な純戦略は b1 (q2 ) 2b である.ゆえに,プレイヤー 2 がどの戦略を選ぶかに関わらず,プレイヤー 1 にとって の数量を強支配する.ゆえに,プレイヤー 1 の純戦略集合から ついても同様に考えると,プレイヤー 2 の純戦略集合から a−c 4b a−c 4b a−c 4b はそれより小さい任意 より小さい数を消去できる.プレイヤー 2 に より小さい数を消去できる.消去後に残った 2 人 の戦略の組は下図のグレーの領域で表されている. q2 a -c b q 1=b 1(q 2) a -c 2b a -c 4b q 2=b 2(q 1) o a -c 4b a -c 2b • 同様のプロセスを繰り返すことで,最終的に残る戦略は a -c b a−c 3b て解くことができて,最終的に得られる解は 2 人がともに q1 だけである.ゆえに,このゲームは逐次強支配によっ a−c 3b を選ぶという戦略の組み合わせであり,これは純戦 略ナッシュ均衡と一致する. 7.2.4 7.3 7.3.1 企業数の変化 ベルトラン競争 ベルトラン競争 ベルトランの価格競争モデル • ある同質財の複占市場における需要関数を x : R+ → R+ で表す.ただし,x は以下の性質を満たすものと仮定する. (a) ∃p ∈ (0, ∞) , ∀p ∈ R+ : [p ≥ p ⇒ x (p) = 0] . (b) ∃q ∈ (0, ∞) : x (0) = q. (c) x は [0, p] において連続微分可能. (d) ∀x ∈ [0, p] : x′ (x) < 0. 135 • 需要関数を x : R+ → R+ として定義することは,任意の財価格における市場の需要は非負の値であることを意味 する.条件 (a) は,ある価格 p 以上の任意の価格では市場の需要がゼロになることを意味し,条件 (b) は,価格が 0 のときの需要が有限な正の実数値であることを意味する.さらに条件 (c) は,x が [0, p] において連続かつ微分可 能であると同時に,その導関数もまた連続であることを意味し,条件 (d) は,x が [0, p] において狭義単調減少関 数であることを意味する.すなわち,p 以下の任意の価格から価格がさらに下落すると市場の需要が減少する. • 以上の条件を満たす需要関数 x のグラフである需要曲線を描いたものが下の図である.関数 x の変数である価格 p を縦軸にとっている点に注意せよ. p p q =x (p ) p' o q x (p') q 【需要曲線】 • 本節では,2 つの企業が同質財を供給する上の複占市場において,カルテルを形成せずに競争する 2 つの企業が互 いに価格を決定する場合にどのような均衡が実現するかを分析する.まずは,この複占市場において同質財を供給 する複占企業 i = 1, 2 の費用関数を ci : R+ → R+ で表す.すなわち,企業 i による生産量が qi ≥ 0 であるときの 企業 i の生産費用は ci (qi ) ≥ 0 である.ただし,ci は以下の条件を満たすものと仮定する: (e) ∃c > 0, ∀i = 1, 2, ∀qi ≥ 0 : ci (qi ) = c · qi . • 企業 i の費用関数を ci : R+ → R+ として定義することは,任意の供給量における複占企業の費用が非負の値であ ることを意味する.条件 (a) は,両企業ともに財の生産に必要な固定費用が 0 であり(c1 (0) = c2 (0) = 0),また 生産量 qi に依存しない共通の限界費用 c > 0 を持つことを意味する.つまり,企業は規模に関して収穫一定の技術 を持つ. • 複占企業が共有する限界費用 c > 0 と市場の需要関数 x : R+ → R+ の間には,以下の関係が成り立つものと仮定 する: (f ) x (c) ∈ (0, ∞) . • 条件 (e) より両企業の限界費用が生産量に関わらず常に c で一定であることを踏まえると,条件 (f ) は,両企業の 限界費用曲線が市場の需要曲線と正の生産量において交わることを意味する.つまり,それぞれの企業にとって競 争的な産出量は正の実数である.ちなみに,x (c) = q とおくならば,市場の逆需要関数 p : R+ → R+ に関して 136 c = p (q) という関係が成立する.また,費用関数 ci の導関数 c′i である限界費用関数を M Ci : R+ → R+ で表すな らば,先の条件 (a) のもとでは, ∃c > 0, ∀i = 1, 2, ∀qi ≥ 0 : M Ci (qi ) = c. となる. • 以上の条件を満たす c′1 , c′2 と x を以下に図示した.これは第??のクールノー競争の分析において用いた市場・費用 構造と実質的に等しい. p c'1(q 1)=c'2(q 2) c x (p ) o q x (c) q 【複占市場】 • 先に提示した性質を満たす費用関数 ci : R+ → R+ (i = 1, 2) を持つ複合企業が,市場の需要関数 x : R+ → R+ を 所与としたときに,自身の利潤を最大化するような財の価格を選択するものと仮定しよう.ただし,両企業は互い にカルテルを結ぶことができず,両者の間に価格に関する拘束的合意が成立しない状況を想定する.また,各企業 は同時に自身の価格を決定するものとする.より正確には,各企業は競争相手による意志決定の結果を知らない状 態で自身の価格を決定するものとする.このとき,複占企業はそれぞれ具体的にどのような意志決定を行うだろ うか. • 複占企業 1, 2 がそれぞれ財の価格 p1 , p2 ≥ 0 を選択したときに,これらの価格の組 (p1 , p2 ) ∈ R2+ に対して,そのと きの企業 i = 1, 2 の財への需要 Di (p1 , p2 ) ≥ 0 を定める関数 Di : R2+ → R+ を以下のように特定する.すなわち, Di (p1 , p2 ) = x (pi ) (if pi < pj ) 1 2 x (pi ) (if pi = pj ) 0 (if pi > pj ) とする.ただし,i, j = 1, 2 かつ i ̸= j である.つまり,少しでも安い価格を提示した企業がその価格のもとでの市 場の需要をすべて獲得し,また,両企業の提示価格が等しい場合にはその価格のもとでの市場の需要を両企業で 2 等分する.これは,市場において 2 つの企業が供給する財が消費者にとって完全代替財であることを意味するが, これは当該財が同質財であるという仮定と整合的である. • 複占企業 1, 2 がそれぞれ財の価格 p1 , p2 を選択すると企業 1 の財への需要が D1 (p1 , p2 ) となり,それに対して価格が 137 min {p1 , p2 } と定まり,企業 1 は収入 min {p1 , p2 } · D1 (p1 , p2 ) を得る.ただし,p1 > p2 の場合には D1 (p1 , p2 ) = 0 であることから,企業 1 の収入をシンプルに p1 · D1 (p1 , p2 ) と表せる.その一方で,供給量 D1 (p1 , p2 ) のもとで企 業 1 が負担すべき費用は費用関数によって c1 (D1 (p1 , p2 )) = c · D1 (p1 , p2 ) と定まるため,価格の組 (p1 , p2 ) のもと で企業 1 が得る利潤は収入から費用を引いた p1 · D1 (p1 , p2 ) − c · D1 (p1 , p2 ) = (p1 − c) · D1 (p1 , p2 ) となる.同様 に考えると,(p1 , p2 ) のもとで企業 2 が得る利潤は p2 · D2 (p1 , p2 ) − c · D2 (p1 , p2 ) = (p2 − c) · D2 (p1 , p2 ) となる. これらを一般化して表現すると, pi · Di (pi , pj ) − c · Di (pi , pj ) = (pi − c) · D (p1 , p2 ) (i, j = 1, 2; i ̸= j) となる.Bertrand(1838)によってモデル化されたこのような価格競争をベルトラン競争(Bertrand competition) と呼ぶ. 7.3.2 ベルトラン均衡 ベルトラン均衡 • ベルトラン競争では複占企業どうしがカルテルを結ぶことができず,企業間に拘束的合意が成立しないため,これ は非協力ゲームである.また,企業は事前に相談できず,相手の意志決定の内容を知らない状態で一度だけ意志決 定を行うため,これは静学ゲームである.さらに,多くの場合,ゲームのルールは共有知識とみなされるため,そ の場合のベルトラン競争は完備情報ゲームとなる.つまり,ベルトラン競争は完備情報の静学ゲームであるため, それは戦略型ゲームとして表現される. • 具体的には,ベルトラン競争を表現する戦略型ゲーム G = (N, {S1 , S2 } , {u1 , u2 }) を構成する要素は以下の通り: 1. プレイヤー集合は N = {1, 2} である.ただし,i ∈ N は複占企業 i を表す. 2. プレイヤー i = 1, 2 の純戦略集合は Si = R+ であり,個々の行動 pi ∈ R+ は,自身が供給する財の価格を表す. 3. プレイヤー i の利得関数 ui : S1 × S2 → R は, ui (p1 , p2 ) = (pi − c) · D (p1 , p2 ) として定められる. • 先に特定した複占市場の需要関数と複占企業の費用関数を前提とする場合には,ベルトラン競争を表現する戦略型 ゲームに純戦略ナッシュ均衡が存在することを保証できる.これをベルトラン均衡(Bertrand equilibrium)と呼 ぶ.ベルトラン均衡 (p∗1 , p∗2 ) が定まれば市場価格が p∗ = min {p∗1 , p∗2 } と定まり,さらに市場の需要関数 x から均衡 における市場の需要 x (p∗ ) が定まる. 定理 7.1 複占市場の需要関数 x : R+ → R+ は, (a) ∃p ∈ (0, ∞) , ∀p ∈ R+ : [p ≥ p ⇒ x (p) = 0] . (b) ∃q ∈ (0, ∞) : x (0) = q. (c) x は [0, p] において連続微分可能. (d) ∀x ∈ [0, p] : x′ (x) < 0. 138 を満たし,複占企業 i = 1, 2 の費用関数 ci : R+ → R+ は, (e) ∃c > 0, ∀i = 1, 2, ∀qi ≥ 0 : ci (qi ) = c. (f ) c1 , c2 は R+ において 2 階微分可能 . を満たすものとする.さらに,両者の間には, (g) x (c) ∈ (0, ∞) . という関係が成り立つものとする.このとき,ベルトラン均衡を表す戦略型ゲーム G には純戦略ナッシュ均衡 (p∗1 , p∗2 ) が存在し,それは以下の条件を満たす: p∗1 = p∗2 = c. • つまり,ベルトラン競争においては,両企業が限界費用に等しい価格を提示することが純戦略ナッシュ均衡になる. つまり,たとえ複占市場においてもそこで価格競争が行われる場合には,複占企業は完全競争市場と同様に振る舞 う.ゆえに,ベルトラン競争は完全競争市場と同様の帰結をもたらす. 証明. • p1 = p2 = c を満たす (p1 , p2 ) がナッシュ均衡であることの証明: – p1 = p2 = c の場合の企業 i (= 1, 2) の利得は, 1 ui (p1 , p2 ) = (c − c) · x (pi ) = 0 2 である. – p2 = c を所与とするとき,企業 1 は p1 = p2 = c から逸脱してそれよりも低い価格をつけると市場の需要を すべて奪うことができるが,そのときの利潤は, u1 (p1 , p2 ) = (p1 − c) · D (p1 ) <0 ∵ p1 < c, D (p1 ) > 0 となり,これは逸脱前の利潤 0 を下回るため,企業 1 は低い価格へ逸脱するインセンティブを持たない.一 方,企業 1 が p1 = p2 = c よりも高い価格をつけると市場の需要をすべて失うため,そのときの利潤は, u1 (p1 , p2 ) = (p1 − c) · D (p1 ) =0 ∵ D (p1 ) = 0 となり,これは逸脱前の利潤 0 と同水準であるため,企業 1 は高い価格へ逸脱するインセンティブを持たな い.ゆえに,p2 = c に対する最適戦略は p1 = c である. – 企業 2 についても同様に考えると,p1 = c に対する最適戦略が p2 = c であることが分かる.ゆえに,p1 = p2 = c を満たす (p1 , p2 ) は最適戦略の組であるから,これはナッシュ均衡である. • p1 = p2 ̸= c を満たす (p1 , p2 ) がナッシュ均衡ではないことの証明: 139 – p1 = p2 ̸= c の場合はさらに p1 = p2 > c と p1 = p2 < c の 2 つの場合があり得る.それぞれの場合について 以下で検討しよう. – p1 = p2 > c の場合の企業 1 の利得は, 1 u1 (p1 , p2 ) = (p1 − c) · D (p1 ) 2 である.そこで,上の p2 を所与とするとき,上の p1 に対して p1 − ε > c を満たす限りなく小さい ε > 0 が存 在するため,企業 1 が p1 から p1 − ε へ移行すると,需要をすべて奪うことができて,このときの利潤は, u1 (p1 − ε, p2 ) = (p1 − ε − c) · D (p1 − ε) となる.D は狭義の単調減少関数であるから D (p1 − ε) > D (p1 ) であるため,十分小さい ε に関しては, u1 (p1 − ε, p2 ) > u1 (p1 , p2 ) となる.ゆえに,p1 は p2 に対する最適戦略ではない.つまり,p1 = p2 > c を満たす (p1 , p2 ) は最適戦略の 組でないため,これはナッシュ均衡ではない. – p1 = p2 < c の場合の企業 1 の利得は, 1 u1 (p1 , p2 ) = (p1 − c) · D (p1 ) 2 <0 ∵ p1 < c, D (p1 ) > 0 である.そこで,上の p2 を所与とするとき,企業 1 は p1 から p′1 > p1 を満たす p′1 へ移行すると,需要をす べて失って,そのときの利得は, u1 (p′1 , p2 ) = (p′1 − c) · 0 =0 > u1 (p1 , p2 ) となる.ゆえに,p1 は p2 に対する最適戦略ではない.つまり,p1 = p2 < c を満たす (p1 , p2 ) は最適戦略の 組でないため,これはナッシュ均衡ではない. • p1 ̸= p2 を満たす (p1 , p2 ) がナッシュ均衡ではないことの証明: – p1 < p2 としても一般性は失われない.このとき,p1 , p2 と c の大小関係によって場合分けをする必要がある. それぞれの場合について以下で検討しよう. – c < p1 < p2 の場合の企業 2 の利得は, u2 (p1 , p2 ) = (p2 − c) · 0 =0 である.そこで,上の p1 を所与とするとき,企業 2 は p2 から c < p′2 < p1 を満たす p′2 へ移行すると,需要 140 をすべて得て,そのときの利得は, u2 (p1 , p′2 ) = (p′2 − c) · D (p′2 ) ∵ p′2 > c, D (p′2 ) > 0 >0 = u2 (p1 , p2 ) となる.ゆえに,p2 は p1 に対する最適戦略ではない.つまり,c < p1 < p2 を満たす (p1 , p2 ) は最適戦略の 組でないため,これはナッシュ均衡ではない. – c = p1 < p2 の場合の企業 1 の利得は, u1 (p1 , p2 ) = (p1 − c) · D (p1 ) =0 ∵ p1 = c である.そこで,上の p2 を所与とするとき,上の p1 に対して p1 + ε < p2 を満たす限りなく小さい ε > 0 が 存在するため,企業 1 が p1 から p1 + ε へ移行すると,需要をすべて確保したままで,このときの利得は, u1 (p1 + ε, p2 ) = (p1 + ε − c) · D (p1 + ε) >0 ∵ p1 + ε > c, D (p1 + ε) > 0 = u1 (p1 , p2 ) となる.ゆえに,p1 は p2 に対する最適戦略ではない.つまり,c = p1 < p2 を満たす (p1 , p2 ) は最適戦略の 組でないため,これはナッシュ均衡ではない. – p1 < c < p2 の場合の企業 1 の利得は, u1 (p1 , p2 ) = (p1 − c) · D (p1 ) <0 ∵ p1 < c, D (p1 ) > 0 である.そこで,上の p2 を所与とするとき,c + ε < p2 を満たす限りなく小さい ε > 0 が存在するため,企 業 1 が p1 から c + ε へ移行すると,需要をすべて確保したままで,このときの利潤は, u1 (c + ε, p2 ) = (c + ε − c) · D (c + ε) = ε · D (c + ε) >0 ∵ ε > 0, D (c + ε) > 0 > u1 (p1 , p2 ) となる.ゆえに,p1 は p2 に対する最適戦略ではない.つまり,p1 < c < p2 を満たす (p1 , p2 ) は最適戦略の 組でないため,これはナッシュ均衡ではない. 141 – 最後に,p1 < p2 ≤ c の場合の企業 1 の利得は, u1 (p1 , p2 ) = (p1 − c) · D (p1 ) <0 ∵ p1 < c, D (p1 ) > 0 である.そこで,上の p2 を所与とするとき,企業 1 が p1 から p′1 > p2 を満たす p′1 へ移行すると,需要をす べて失い,このときの利得は, u1 (p′1 , p2 ) = (p′1 − c) · 0 =0 > u1 (p1 , p2 ) となる.ゆえに,p1 は p2 に対する最適戦略ではない.つまり,p1 < p2 ≤ c を満たす (p1 , p2 ) は最適戦略の 組でないため,これはナッシュ均衡ではない. ベルトラン均衡の効率性 • クールノー均衡 (q1∗ , q2∗ ) において企業 i (= 1, 2) が獲得する利潤は, ui (q1∗ , q2∗ ) = 1 2 (a − c) 9 である.ゆえに,均衡において両企業が得る利得の和は, u1 (q1∗ , q2∗ ) + u2 (q1∗ , q2∗ ) = 2 2 (a − c) 9 (1) である.この配分は効率的であると言えるだろうか. • 両企業が実現し得る利得の和の最大値は,両企業があたかも 1 つの独占企業として振る舞った場合に実現する独占 利潤である.そこで,以下の最大化問題 max (a − q) q − cq q∈R+ について考える.目的関数を変数 q について整理すると, −q 2 + (a − c) q が得られる.このとき, ( ) d −q 2 + (a − c) q = −2q + (a − c) dq ( ) d2 −q 2 + (a − c) q = −2 < 0 dq 2 142 であるから,これは q に関する狭義凹関数である.ゆえに,大域的最適のための十分条件より, ( ) d −q 2 + (a − c) q =0 dq すなわち, −2q + (a − c) = 0 すなわち, q∗ = a−c 2 が先の最大化問題の解であるから,これが独占企業による最適生産量である.このとき,独占価格は, P (q ∗ ) = a − q ∗ = a+c 2 であり,独占利潤は, P (q ∗ ) q ∗ − cq ∗ = a+ca−c a−c 1 2 −c = (a − c) 2 2 2 4 (2) となる.両企業は, q1∗ + q2∗ = a−c 2 (3) を満たすような生産量 q1∗ , q2∗ を生産すれば,そこで両企業が得る利得の和は,最大化された利潤の和 (2) と一致 する. • ナッシュ均衡における両企業の利得の和 (1) と,両企業があたかも 1 つの独占企業としてふるまった場合の両企業 の利潤の和 (2) を比べると,たしかに後者は前者を上回っている.ゆえに,クールノー競争におけるナッシュ均衡 は効率的であるとは言えない. • カルテルが禁じられている場合には,談合によって (3) を満たす生産量 q1∗ , q2∗ を約束することはできない.さらに, 仮に両企業が秘密裏に談合を行うものとした上で,そこで (3) を満たす生産量の組 q1∗ , q2∗ を互いに遂行するよう口 裏を合わせた場合でも,それぞれの企業が自己の利得の最大化を行動指針とする限りにおいて,企業はその約束を 履行するインセンティブを持たない.その理由は以下の通りである. • 仮に,両企業が談合を行い, q1 = q2 = 1 (a − c) 4 (4) だけ生産するように約束したとする.この生産量 q1 , q2 は (3) を満たすため,仮に両企業がこの約束を履行すれば, 両企業が獲得する利潤の和は最大化される.だが,約束された企業 2 の生産量 q2 = a−c 4 を前提とするとき,それ に対する企業 1 の純最適反応は,第??節の議論により, q1∗ = a − a−c a − q2 − c 3 4 −c = = (a − c) 2 2 8 となり,これは (4) と一致しない.つまり,企業 1 は約束した生産量よりも多く生産することによって,自己の利 得を増やすことができる.企業 2 についても同様の議論が成り立つため,結局,(4) はナッシュ均衡ではない.ち なみに,この議論は (3) を満たす任意の q1 , q2 について成立する. • 議論を整理しよう.効率的な結果,すなわち,両企業が獲得する利得の和を最大化するためには,(3) を満たすよ うな生産量 q1 , q2 を履行すれば良い.そこで,企業どうしが事前にそのような生産を約束した場合においても,そ 143 のような生産の組は最適戦略の組すなわちナッシュ均衡にはならず,自己の利得の最大化を目指す企業は,約束し た水準よりも多くを生産するインセンティブを持つ.その結果,両企業の生産量の和は (3) を満たす水準を超過し てしまうため,価格水準は独占価格を下回り,ゆえに効率的な結果が実現しない. • 一方,ナッシュ均衡 q1∗ = q2∗ = 1 (a − c) 3 における総供給量は (3) を満たす生産量の水準よりも多く,そのときの均衡価格は独占価格よりも低いため,両企 業が生産量を増やそうとするインセンティブが弱まっている.実際,(q1∗ , q2∗ ) はナッシュ均衡であるから,両企業 はそこから逸脱して生産量を増やすインセンティブを持たない. 7.3.3 企業数の変化 7.3.4 製品差別化 • 企業 2 の価格 p2 を所与とするとき,それに対する企業 1 の純最適反応は,パラメータ p2 の水準を所与としたとき の,以下の最大化問題 max u1 (p1 , p2 ) q1 ∈R+ すなわち, max (a − p1 + bp2 ) (p1 − c) p1 ∈R+ の解である. • 上の最大化問題の目的関数を変数 p1 について整理すると, u1 (p1 , p2 ) = −p21 + (a + bp2 + c) p1 + (−ac − bcp2 ) が得られる.このとき, ∂u1 (p1 , p2 ) = −2p1 + (a + bp2 + c) ∂p1 ∂ 2 u2 (p1 , p2 ) = −2 < 0 ∂p21 であるから,u1 (p1 , p2 ) は p1 に関する狭義凹関数である.ゆえに,大域的最適のための十分条件より, ∂u1 (p1 , p2 ) =0 ∂p1 すなわち, −2p1 + (a + bp2 + c) = 0 すなわち, p1 = a + bp2 + c 2 が先の最大化問題の解であるから,これが p2 に対するプレイヤー 1 の純最適反応である. 144 (1) • 同様に考えると,企業 1 の価格 p1 を所与とするとき,それに対する企業 2 の純最適反応は, p2 = a + bp1 + c 2 (2) となる. • 価格の組 (p∗1 , p∗2 ) が純戦略ナッシュ均衡であれば,(1) , (2) より,この戦略の組は, (a) p∗1 = 1 2 (a + bp∗2 + c) (b) p∗2 = 1 2 (a + bp∗1 + c) を満たすものでなければならない.そこで,これらを解くと, p∗1 = p∗2 = a+c 2−b が得られる.このナッシュ均衡をベルトラン均衡(Bertrand equilibrium)と呼ぶこともある. 均衡数量と均衡利潤 • ベルトラン均衡 (p∗1 , p∗2 ) における企業 i (= 1, 2) の生産量は, Di (p∗1 , p∗2 ) = a − p∗i + bp∗j a+c a+c =a− +b 2−b 2−b a + bc − c = 2−b である. • 均衡において企業 i (= 1, 2) が獲得する利潤は, ui (p∗1 , p∗2 ) = Di (p∗1 , p∗2 ) (p∗i − c) ) ( a + bc − c a + c = −c 2−b 2−b ( )2 a + bc − c = 2−b である. 7.4 7.4.1 ホテリング・モデル ホテリング・モデル ホテリング・モデル • 長さ 1 の数直線 [0, 1] 上に消費者が一様に分布している状況を想定する.例えば,長さ 1 キロの直線的な市場に買 い物客たちが均等に分布している状況を想定せよ. 145 • 企業 i = 1, 2 がそれぞれ自身の立地点 xi ∈ [0, 1] を選択した上で,その場所で同質財を販売する.企業 i が操作で きる変数は自身の立地点 xi だけであり,自身が販売する財の価格 p は常に一定であるものと仮定する. • それぞれの消費者は高々1 単位の財を購入するものと仮定する.ただし,異なる企業によって同じ財が同じ価格で 販売されるため,消費者がどちらの企業からその財を購入するかを決定する上で判断基準となるものは立地点のみ である.そこで,それぞれの消費者は自分により近い地点に立地している企業から財を高々1 単位だけ購入するも のと仮定する.また,2 つの立地点までの距離が等しい場合には,消費者は等しい確率でどちらか一方へ行ってそ こで財を高々1 単位だけ購入するものと仮定する. • 消費者が 1 単位の財を消費することで得る効用を定数 u > 0 とし,消費者が位置する地点と企業 i の立地点 xi と の距離を di ∈ [0, 1] とするとき,消費者が xi において財を 1 単位購入した場合に得る利得を, u − p − t · d2i (c > 0) で表す.つまり,消費者は財を購入すると,財の効用 u から財の価格 p と立地点までへの移動コスト t · d2i を差し 引いた値を利得として得る.ちなみに,t · d2i をフットコスト(foot cost)と呼ぶ.消費者にとって u, p, t は定数で あり,これらの間には, u−p−t>0 という関係が成立するものと仮定する.消費者にとって di のみが変数であるが,上の仮定のもとでは任意の di ∈ [0, 1] に対して, u − p − t · d2i > t − t · d2i ∵ u − p − t > 0 ( ) = t 1 − d2i ≥0 ∵ di ∈ [0, 1] となるため,消費者は常にある立地点を選択し,そこへ移動して 1 単位の財を購入することになる.混雑の問題は 考えない.ゆえに,すべての消費者は自分が選択した立地点において必ず 1 単位を財を購入できるものと仮定する. • 企業 i の費用関数を ci : R+ → R+ で表す.すなわち,企業 i による生産量が qi ≥ 0 であるときの企業 i の生産費 用は ci (qi ) ≥ 0 である.ただし,ci は以下の条件 ∃c > 0, ∀i = 1, 2, ∀qi ≥ 0 : ci (qi ) = c · qi を満たすものと仮定する.すなわち,両企業ともに財の生産に必要な固定費用は 0 であり,また,生産量 qi に依 存しない共通の限界費用 c を持つ. • 企業は売れ残った財は費用なしで廃棄することができ,また,消費者が来すぎて財が足りなくなることもないと仮 定する.すると,企業 i の立地点に yi 人の消費者が来た場合に企業 i が得る利得は, p · yi − c (yi ) = (p − c) · yi となる.企業 i にとって p − c は定数であるから,企業 i が自身の利潤を最大化することと来客数 yi を最大化する ことは実質的に等しい. 146 • 2 つの企業 i = 1, 2 はともに数直線 [0, 1] 上に消費者が一様に分布するという市場構造と先に提示した消費者の利得 関数を所与とした上で,自身の利得すなわち来客数を最大化するような立地点 xi ∈ [0, 1] を選択するものと仮定し よう.ただし,両企業は互いにカルテルを結ぶことができず,両者の間に立地点に関する拘束的合意が成立しない 状況を想定する.また,各企業は同時に自身の立地点を決定するものとする.より正確には,各企業は競争相手に よる意志決定の結果を知らない状態で自身の立地点を決定するものとする.このとき,複占企業はそれぞれ具体的 にどのような意志決定を行うだろうか.Hotelling(1929)によってモデル化されたこのような立地競争をホテリン グ・モデル(Hotelling model)と呼ぶ. 7.4.2 ナッシュ均衡 ホテリング・モデルにおける均衡 • ホテリング・モデルに登場するプレイヤーは 2 つの複占企業と数直線 [0, 1] 上に分布する消費者である.複占企業 どうしはカルテルを結ぶことができず,消費者も各々が独立に意志決定を行うため,これはプレイヤーの間に拘束 的合意が成立しない非協力ゲームである.また,それぞれの企業は最初に自身の立地点を選択し,続いて消費者た ちは一方の立地点を選択してそこから財を購入するため,これは動学ゲームである.特に,動学ゲームの第 2 段階 において意志決定を行う消費者たちは,第 1 段階において複占企業が選択する立地点を観察できるため,これは完 全情報ゲームである. • 具体的には,ホテリング・モデルを表現する完全情報の動学ゲームは以下のように進行する: 1. 企業 i = 1, 2 が同時に立地点 xi ∈ [0, 1] を決定する. 2. それぞれの消費者は x1 , x2 を観察した上で x1 , x2 のどちらか一方を選択してそこで財を 1 単位だけ購入する. • 完全情報の動学ゲームにおける適切な均衡概念はサブゲーム完全均衡である.特に,完全情報の動学ゲームにおけ るサブゲーム完全均衡はバックワード・インダクションによって導くことができる. 定理 7.2 ホテリング・モデルのサブゲーム完全均衡な結果において,企業 1, 2 の立地点は (x1 , x2 ) = (1 1 2, 2 ) となり,両 企業はすべての消費者を 2 等分する. 証明. • 第 2 段階から始まるサブゲーム: – 仮定より,任意の消費者はゲームの第 2 段階において x1 , x2 のどちらか一方を選択して財を 1 単位だけ購入す る.財を購入したときに消費者が得る利得は u − p − t · d2 であるが,u, p, t は定数であるから消費者は x1 , x2 の中から di ∈ [0, 1] を最小化するほうを選択する.つまり,消費者は x1 , x2 の中でも自分の居場所に近いほう を選択する.仮定より,消費者の居場所から x1 , x2 までの距離が等しい場合には等しい確率でどちらか一方 を選ぶ. 147 – では,ゲームの第 2 段階の冒頭において消費者が直面する x1 , x2 の組み合わせに応じて消費者の最適戦略がど のようなものになるかを考察しよう.ただし,2 つの企業のどちらが左側でも分析は同じであるから,x1 ≤ x2 としても一般性は失われない.そこで,以下では x1 = x2 と x1 < x2 のそれぞれの場合について考える. – x1 = x2 の場合には,仮定より 2 つの企業は消費者全体の – x1 < x2 の場合には,x1 と x2 の中点 め,企業 1 への来客数は x1 +x2 2 x1 +x2 2 1 2 ずつを得る. 2 より左側の客は x1 へ行き, x1 +x より右側の客は x2 へ行くた 2 となり,企業 2 への来客数は 1 − x1 +x2 2 となる. • 第 1 段階から始まるサブゲーム: – 以上の分析を踏まえた上で,ゲームの第 1 段階における企業の最適戦略を考察しよう.まずは,x1 = x2 を満 たす (x1 , x2 ) のみが第 1 段階における企業の最適戦略の組となり得ることを示そう.x1 < x2 を満たす (x1 , x2 ) において,x2 を前提にしたときに企業 1 は立地点を x1 から右側へ移動することで来客数を増やせるため,x1 は x2 に対する最適戦略ではない.同様に,x2 は x1 に対する最適戦略でもない.ゆえに,このような (x1 , x2 ) は最適戦略の組ではない. – ゆえに,第 1 段階における最適戦略の組が存在するならばそれは x1 = x2 を満たす (x1 , x2 ) でなければならな いが,実は x1 = x2 = を選択すれば 1 2 1 2 がそのような戦略であることを示そう.x2 = の消費者を得る.一方,企業 1 が x1 = 1 2 1 2 を所与とするとき,企業 1 は x1 = から逸脱して x1 < x2 = 1 2 1 2 を満たす x1 を選んだ場 合には,企業 1 への来客数は, x1 + x2 x2 + x2 < ∵ x1 < x2 2 2 1 1 = ∵ x2 = 2 2 となり,先の来客数 1 2 よりも減少してしまう.逆に,企業 1 が x1 = 1 2 から逸脱して x2 = 1 2 < x1 を満たす x1 を選んだ場合には,企業 1 への来客数は, 1− となり,この場合にも先の来客数 ある.企業 2 にとっても x2 = – (x1 , x2 ) = (1 1 2, 2 ) 1 2 1 2 x1 + x2 x2 + x2 <1− ∵ x1 < x2 2 2 1 1 =1− ∵ x2 = 2 2 1 = 2 よりも減少してしまう.ゆえに,x1 = が x1 = 1 2 1 2 は x2 = 1 2 に対する最適戦略で に対する最適戦略であることは同様にして示される. が第 1 段階における最適戦略の組であることが明らかになったが,x1 = x2 を満たす (x1 , x2 ) の中にこれ以外に最適戦略の組は存在しないことを示そう.例えば,x1 = x2 < 考えよう.このとき企業 1 は 1 2 1 2 を満たす (x1 , x2 ) について の来客数を得るが,仮に企業 1 がここから逸脱して例えば x1 = 1 2 を選んだ場 合には,企業 1 への来客数は, 1− となり,先の来客数 1 2 x1 + x2 =1− 2 1 > 2 よりも増加する.x2 < 1 2 1 2 + 2 1 2 ∵ x1 = 1 1 , x2 < 2 2 を満たす x2 に対して x1 = x2 は最適戦略ではない.企業 2 148 にとっても x1 < x1 = x2 < 1 2 1 2 を満たす x1 に対して x2 = x1 が最適戦略ではないことは同様にして示される.ゆえに, を満たす (x1 , x2 ) は第 1 段階における最適戦略の組ではない.x1 = x2 > 1 2 を満たす (x1 , x2 ) が 第 1 段階における最適戦略の組ではないことも同様にして示される. – 以上の議論により,第 1 段階における最適戦略の組は (x1 , x2 ) = • 以上の議論により,それぞれの企業は (x1 , x2 ) = (1 1 2, 2 ) (1 1 2, 2 ) のみである. へと立地し,それぞれの消費者は自分の居場所に近い立地 点で財を 1 単位だけ購入することがサブゲーム完全均衡な結果である. 7.4.3 製品差別を含む価格競争 製品差別を含んだ価格競争のモデル • ホテリング・モデルではそれぞれの企業が同質財を同じ価格で販売することを仮定したが,価格競争の要素を入れ たらどうなるだろうか. • 長さ 1 の数直線 [0, 1] 上に消費者が一様に分布している状況を想定する.例えば,長さ 1 キロの直線的な市場に買 い物客たちが均等に分布している状況を想定せよ. • 企業 i = 1, 2 がそれぞれ自身の立地点 xi ∈ [0, 1] を選択した上で,その場所で同質財を価格 pi > 0 で販売する.ホ テリング・モデルにおいて企業 i が操作できる変数は自身の立地点 xi だけであったが,ここでは財の価格 pi もま た企業が操作可能な変数となっている. • それぞれの消費者は高々1 単位の財を購入するものと仮定する.ホテリング・モデルにおいて消費者がどちらの企 業から財を購入するかを判断する上での基準は立地点のみであったが,本節のモデルではそれぞれの企業は立地点 とともに価格をも変数として選択するため,消費者もまた財の価格と立地点の両方を踏まえた上でどちらの企業か ら財を購入するかを判断することになる. • 消費者が 1 単位の財を消費することで得る効用を定数 u > 0 とし,消費者が位置する地点と企業 i の立地点 xi と の距離を di ∈ [0, 1] とするとき,消費者が xi において財を 1 単位購入した場合に得る利得を, u − pi − t · d2i (c > 0) で表す.つまり,消費者は財を購入すると,財の効用 u から財の価格 pi と立地点までへのフットコスト t · d2i を差 し引いた値を利得として得る.消費者にとって u, pi , t は定数であり,これらの間には, u − pi − t > 0 (i = 1, 2) という関係が成立するものと仮定する.消費者にとって di のみが変数であるが,上の仮定のもとでは任意の di ∈ [0, 1] 149 に対して, u − pi − t · d2i > t − t · d2i ∵ u − pi − c > 0 ( ) = t 1 − d2i ≥0 ∵ di ∈ [0, 1] となるため,消費者は常にある立地点を選択し,そこへ移動して 1 単位の財を購入することになる.ちなみに,混 雑の問題は考えない.ゆえに,すべての消費者は自分が選択した立地点において必ず 1 単位を財を購入できるもの と仮定する. • 企業 i の費用関数を ci : R+ → R+ で表す.すなわち,企業 i による生産量が qi ≥ 0 であるときの企業 i の生産費 用は ci (qi ) ≥ 0 である.ただし,ci は以下の条件 ∃c > 0, ∀i = 1, 2, ∀qi ≥ 0 : ci (qi ) = c · qi を満たすものと仮定する.すなわち,両企業ともに財の生産に必要な固定費用は 0 であり,また,生産量 qi に依 存しない共通の限界費用 c を持つ. • 企業は売れ残った財は費用なしで廃棄することができ,また,消費者が来すぎて財が足りなくなることもないと仮 定する.すると,企業 i の立地点に yi 人の消費者が来た場合に企業 i が得る利得は, pi · yi − c (yi ) = (pi − c) · yi となる.ホテリング・モデルにおいて企業 i にとって pi − c は定数であったから,企業 i が自身の利潤を最大化す ることと来客数 yi を最大化することは実質的に等しかったが,本節のモデルでは財の価格 pi は企業 i が操作可能 な変数であるから,来客数 yi を最大化することは必ずしも利潤を最大化させることと一致しない. • 2 つの企業 i = 1, 2 はともに数直線 [0, 1] 上に消費者が一様に分布するという市場構造と先に提示した消費者の利得 関数を所与とした上で,自身の利得を最大化するような立地点 xi ∈ [0, 1] と価格 pi ∈ (0, u − t) を選択するものと 仮定しよう.ただし,両企業は互いにカルテルを結ぶことができず,両者の間に立地点や価格に関する拘束的合意 が成立しない状況を想定する.また,各企業は競争相手による意志決定の結果を知らない状態で自身の立地点や価 格を決定するものとする.このとき,複占企業はそれぞれ具体的にどのような意志決定を行うだろうか.こうした 製品差別を含んだ価格競争は d’Aspremont, Gabszewics, and Thisse(1979)によってモデル化されたものである. 製品差別を含んだ価格競争モデルにおける均衡 • 製品差別を含んだ価格競争モデルに登場するプレイヤーは 2 つの複占企業と数直線 [0, 1] 上に分布する消費者であ る.複占企業どうしはカルテルを結ぶことができず,消費者も各々が独立に意志決定を行うため,これはプレイヤー の間に拘束的合意が成立しない非協力ゲームである.また,一般に,企業にとって立地点よりも価格のほうが自由 に動かしやすいことを踏まえると,企業は立地点を決めた後で価格競争を行うようなモデルが適切である.つまり, それぞれの企業は最初に自身の立地点を選択し,続いて企業は自身の財価格を選択し,最後に消費者たちは一方の 立地点を選択してそこから財を購入するため,これは動学ゲームである.特に,動学ゲームの第 2 段階において意 150 志決定を行う企業たちは第 1 段階においてお互いが選択した立地点を観察でき,また,第 3 段階において意志決定 を行う消費者たちはそれ以前に企業たちが選択した立地点と価格を観察できるため,これは完全情報ゲームである. • 具体的には,製品差別を含んだ価格競争モデルを表現する完全情報の動学ゲームは以下のように進行する: 1. 企業 i = 1, 2 が同時に立地点 xi ∈ [0, 1] を選択する. 2. 企業 i は x1 , x2 観察した上で同時に価格 pi ∈ (0, u − t) を選択する. 3. それぞれの観察者は x1 , x2 , p1 , p2 を観察した上で x1 , x2 のどちらか一方を選択してそこで財を 1 単位だけ購 入する. • 完全情報の動学ゲームにおける適切な均衡概念はサブゲーム完全均衡である.特に,完全情報の動学ゲームにおけ るサブゲーム完全均衡はバックワード・インダクションによって導くことができる. 定理 7.3 製品差別を含んだ価格競争モデルのサブゲーム完全均衡な結果において,企業 1, 2 の立地点は (x1 , x2 ) = (0, 1) となり,設定価格は (p1 , p2 ) = (t + c, t + c) となり,両企業はすべての消費者を 2 等分する. 証明. • 第 3 段階から始まるサブゲーム: – 仮定より,任意の消費者はゲームの第 3 段階において x1 , x2 のどちらか一方を選択して財を 1 単位だけ購入 する.xi において財を購入したときに消費者が得る利得は u − pi − t · d2i であるが,u, t は定数であるから消 費者は p1 , p2 , x1 , x2 を踏まえた上で,x1 , x2 の中でも自分の利得を最大化するほうを選択する. – では,ゲームの第 3 段階の冒頭において消費者が直面する p1 , p2 , x1 , x2 の組み合わせに応じて消費者の最適戦 略がどのようなものになるかを考察しよう.ただし,2 つの企業のどちらが左側でも分析は同じであるから, x1 ≤ x2 としても一般性は失われない.そこで,以下では x1 = x2 と x1 < x2 のそれぞれの場合について考 える. – x1 = x2 の場合には d1 = d2 (= d) となる.ゆえに,企業 1 から購入した場合の利得は u − p1 − t · d2 であり 企業 2 から購入した場合の利得は u − p2 − t · d2 であるから,消費者はより低い価格を提示した企業から購入 する.すなわち,p1 < p2 ならば企業 1 から購入し,p1 > p2 ならば企業 2 から購入する.また,p1 = p2 の場 合には 2 つの企業は消費者全体の 1 2 ずつを得る. – x1 < x2 の場合には,すべての消費者が一方の企業のみから財を購入することはないことを示そう.企業 1 が すべての消費者を得るためには地点 1 に位置する消費者を引きつけなければならない.そこで,企業 1 がその 消費者を得るために限界の価格 p1 = c を設定したときに,その消費者が企業 1 から財を購入したときに得る 2 利得は u − c − t (1 − x1 ) となる.一方,企業 2 は対抗措置としてやはり限界価格 p2 = c を設定すれば,そ 2 の消費者が企業 2 から財を購入したときに得る利得は u − c − t (1 − x2 ) となるが,x1 < x2 よりこの消費者 は企業 2 から購入したほうがよい.ゆえに,企業 1 がすべての消費者を得ることはできない.企業 2 がすべ ての消費者を得ることができないことも同様にして示される. – さて,x1 < x2 の場合にはどちらの企業も正の数の消費者を獲得することが明らかになったが,ここでは,企 業 1 と企業 2 のどちらで財を購入しても無差別であるような消費者の居場所 x を特定しよう.このとき,[0, x) 151 に位置する消費者はすべて企業 1 から財を購入し,(x, 1] に位置する消費者はすべて企業 2 から財を購入する. 先の考察より x ∈ (0, 1) である点に留意せよ. – 地点 x の消費者はどちらの企業から財を購入しても無差別である,ゆえに, 2 2 u − p1 − t (x − x1 ) = u − p2 − t (x − x2 ) が成り立つが,x1 < x2 を踏まえた上でこれを x について解くと, x= が得られる.特に,p1 = p2 ならば x = x1 +x2 2 x1 + x2 p2 − p1 + 2 2t (x2 − x1 ) x1 +x2 2 となるため,x1 と x2 の中点 より右側の客は x2 へ行くため,企業 1 への来客数は x1 +x2 2 x1 +x2 2 より左側の客は x1 へ行き, となり,企業 2 への来客数は 1 − x1 +x2 2 と なる. • 第 2 段階から始まるサブゲーム: – 以上の分析を踏まえた上で,ゲームの第 2 段階における企業の最適戦略を考察しよう.企業 i は第 1 段階に 定めた x1 , x2 と第 2 段階において競争相手企業 j (̸= i) が定める価格 pj と第 3 段階における消費者の最適行 動を踏まえた上で,自身の利得を最大化するような財価格 pi を選択する.では,ゲームの第 2 段階の冒頭に おいて企業が直面する x1 , x2 の組み合わせに応じて企業の最適戦略がどのようなものになるかを考察しよう. ただし,x1 ≤ x2 としても一般性は失われない.そこで,以下では x1 = x2 と x1 < x2 のそれぞれの場合につ いて考える. – x1 = x2 の場合には,消費者はより低い価格を提示した企業から購入するため,第 2 段階において 2 つの企業 がプレーするゲームはベルトランの価格競争となる.ゆえに,(p1 , p2 ) = (c, c) が均衡となり,均衡において 両企業は利潤 0 を得る. – x1 < x2 の場合には,企業 1 の利得は, ( (p1 − c) · x = (p1 − c) · p2 − p1 x1 + x2 + 2 2t (x2 − x1 ) ) となり,企業 2 の利得は, ( ) x1 + x2 p2 − p1 (p2 − c) · (1 − x) = (p2 − c) · 1 − − 2 2t (x2 − x1 ) であるから,1 階の条件より,最適戦略の組 (p∗1 , p∗2 ) は, ) ( 2 x2 − x21 p∗ + c + 2 2 2 2 2 (1 − x ) − (1 − x2 ) p∗ + c 1 p∗2 = t + 1 2 2 p∗1 = t を満たす.これらを連立して解くと, ( ) 2t x1 + x2 = (x2 − x1 ) 1 + +c 3 2 ( ) 2t x1 + x2 p∗2 = (x2 − x1 ) 2 − +c 3 2 p∗1 152 となる. – 続いて,x1 < x2 の場合に企業が得る利潤を求めよう.上の最適戦略の組 (p∗1 , p∗2 ) と第 3 段階に関する先の議 論を踏まえると, x1 + x2 p∗2 − p∗1 + 2 2t (x2 − x1 ) 1 x1 + x2 = + 3 6 x∗ = となる.ゆえに,企業 1 の利潤は, ( )( ) x1 + x2 2t 1 x1 + x2 (x2 − x1 ) 1 + + 3 2 3 6 )2 ( 2t x1 + x2 = (x2 − x1 ) 1 + 9 2 (p∗1 − c) · x∗ = となり,企業 2 の利潤は, (p∗2 ( )[ ( )] x1 + x2 2t 1 x1 + x2 − c) · (1 − x ) = (x2 − x1 ) 2 − + 1− 3 2 3 6 ( )2 x1 + x2 2t (x2 − x1 ) 2 − = 9 2 ∗ となる. • 第 1 段階から始まるサブゲーム: – 以上の分析を踏まえた上で,ゲームの第 1 段階における企業の最適戦略を考察しよう.企業 i は第 2 段階にお ける企業の最適行動と,第 3 段階における消費者の最適行動と,第 2 段階において競争相手企業 j (̸= i) が定 める立地点 xj を所与とした上で,自身の利得を最大化するような立地点 xi を選択する.ただし,x1 ≤ x2 と しても一般性は失われない. – まずは,x1 = x2 を満たす (x1 , x2 ) が第 1 段階における企業の最適戦略の組にはならないことを示そう.x1 = x2 の場合には先に考察したように第 2 段階においてベルトラン競争が行われるため,両企業とも利潤 0 を得る. 一方,企業 1 がそこから逸脱して x1 < x2 を満たすような x1 を選ぶ場合には,企業 1 の利潤は, ( )2 2t x1 + x2 (x2 − x1 ) 1 + >0 9 2 となり,先の利潤 0 よりも大きな利潤が得られる.ゆえに,x2 に対して x1 = x2 を満たす x1 は最適戦略では ない.x1 に対して x2 = x1 を満たす x2 もまた最適戦略ではないことは同様にして示せる.ゆえに,x1 = x2 を満たす (x1 , x2 ) は最適戦略の組ではない. – ゆえに,第 1 段階における最適戦略の組が存在するならばそれは x1 < x2 を満たす (x1 , x2 ) でなければなら ないが,以下ではそれを具体的に特定しよう.企業 1 の利得は, ( )2 2t x1 + x2 (x2 − x1 ) 1 + 9 2 153 であり,これを x1 について偏微分すると, 2t − 9 ( ( )2 ) ( )[ ( )] 2t x1 + x2 x1 + x2 2t x1 + x2 x1 + x2 + (x2 − x1 ) 1 + 1+ = 1+ (x2 − x1 ) − 1 + 2 9 2 9 2 2 ) ( )( 1 2t x1 + x2 3 = 1+ − x1 + x2 − 1 9 2 2 2 <0 (x1 , x2 ≤ 1) となる.ゆえに,企業 1 の利得は x1 に関する減少関数であるから,企業 1 にとって x∗1 = 0 が支配戦略となる. – 企業 2 の利得は, ( )2 2t x1 + x2 (x2 − x1 ) 2 − 9 2 であり,これを x2 について偏微分すると, 2t 9 ( ( )2 ) ( ) [( ) ] x1 + x2 x1 + x2 2t 2t x1 + x2 x1 + x2 2− − (x2 − x1 ) 2 − = 2− 2− − (x2 − x1 ) 2 9 2 9 2 2 ( )( ) 2t x1 + x2 1 3 = 2− x1 − x2 + 2 9 2 2 2 >0 (x1 , x2 ≤ 1) となる.ゆえに,企業 2 の利得は x2 に関する増加関数であるから,企業 2 にとって x∗2 = 1 が支配戦略となる. – 以上の議論により,第 1 段階における最適戦略の組は (x∗1 , x∗2 ) = (0, 1) である. • 以上の議論により,第 1 段階において企業は (x∗1 , x∗2 ) = (0, 1) へ立地し,第 2 段階において, ( ) 2t ∗ x∗1 + x∗2 ∗ = (x − x1 ) 1 + +c=t+c 3 2 2 ( ) x∗ + x∗2 2t ∗ (x2 − x∗1 ) 2 − 1 p∗2 = +m=t+c 3 2 p∗1 という価格をつけ,第 3 段階において, x∗ = 1 x∗1 + x∗2 1 + = 3 6 2 より左に位置する消費者は x∗1 = 0 で財を購入し,それより右に位置する消費者は x∗2 = 1 で財を購入することがサ ブゲーム完全均衡な結果である. ホテリング・モデルとの比較 • 立地のみが製品差別の要因となり得るホテリング・モデルにおいては,均衡において両企業は (x1 , x2 ) = (1 1 2, 2 ) へ と立地してすべての消費者を等分した.一方,立地のみでなく価格競争をも要因として加えた本節のモデルにおい ては,均衡において両企業は (x1 , x2 ) = (0, 1) へと立地して (p1 , p2 ) = (t + c, t + c) という価格をつけることです べての消費者を等分した.つまり,ホテリング・モデルに価格競争の要素を加えたことで,立地に関して正反対の 結論が得られたことになるが,この意味について考えてみよう. 154 • まず,両企業が同じ場所に立地する場合(x1 = x2 )にはベルトランの価格競争を行い利潤が 0 になってしまうた め,両企業ともこのような事態を回避しようとする強いインセンティブを持つ.一方,両企業が異なる場所に立地 する場合(x1 < x2 )には,基準となる消費者の位置は, x= x1 + x2 p2 − p1 + 2 2t (x2 − x1 ) によって定まるのであった.これは p1 に関する減少関数であり,p2 に関する増加関数であるから,両企業とも高 い価格をつけるほどより多くの消費者を失うことになる.つまり,価格を上げると消費者 1 人当たりの単位収入は 増加するが,消費者を失うというトレードオフの関係が成立している. • 上の x の第 2 項はまた,両企業による立地点の間の間隔 x2 − x1 が狭いほど,両企業による価格差 p2 − p1 がシェ アに与える影響が大きくなることを示唆している.つまり,2 つの企業が近くに立地すればするほど,同じ価格差 から奪うことのできる顧客の数は増加するため,両企業は価格を下げる要因がますます大きくなる.その極限的な 状況が同じ立地点において行われるベルトランの価格競争である.ゆえに,企業は価格競争を避けるために相手と の距離を広げる誘因を持つかもしれない. • 実際,両企業が異なる地点に立地する場合の最適な価格の組 (p∗1 , p∗2 ) は, ( ) x1 + x2 2t (x2 − x1 ) 1 + +c 3 2 ( ) x1 + x2 2t (x2 − x1 ) 2 − p∗2 = +c 3 2 p∗1 = と定まるのであったが,これは価格に対する製品差別化の効果を現している.例えば,仮に両企業の立地点の中間 点を 1 2 に維持すると x1 +x2 2 = 1 2 となるが,このとき,両企業の立地点の間隔 x2 − x1 を広げるほど両企業の最適 な価格水準は上昇する.つまり,立地による製品差別化が大きくなるほど両企業の価格は上昇するため,製品差別 化は価格競争を和らげる効果がある.その極限的な状況は両端において (p1 , p2 ) = (t + c, t + c) という価格をつけ るというものである.企業は限界費用 c よりも単位フットコスト t 分だけ高い価格をつけることに成功している. • つまり,立地による差別化は顧客の一部を失うデメリットがある一方で,価格競争を緩和するメリットがあるが, 本節のモデルにおいては価格競争を緩和するメリットが相対的に大きいため,両企業は両端に立地するという結論 が得られたのである.ゆえに,例えば,消費者のフットコスト t · d2 が 2 次式であるという仮定を変更すれば,異 なる結論が得られるかもしれない. 7.4.4 均衡の効率性 社会的余剰の最大化 • 前節において議論した製品差別を含んだ価格競争モデルにおいて実現するサブゲーム完全均衡な結果を,社会厚生 の面から評価しよう. 2 • 地点 x ∈ [0, 1] に位置する消費者が企業 1 から財を購入したときに得る利得は u − p1 − t (x1 − x) であり,そこか ら企業 1 が得る利得は p1 − c である.ゆえに,この消費者が企業 1 から商品を購入すると,社会的余剰は, [ ] 2 2 u − p1 − t (x1 − x) + (p1 − c) = u − t (x1 − x) − c 155 (1) だけ増加する.一方,同じ消費者が企業 2 から財を購入した場合の社会的余剰の増分は,先ほどと同様に考えると, [ ] 2 u − p2 − t (x2 − x) + (p2 − c) = u − t (x2 − x)2 − c (2) となる.財への支払いと受け取りは相殺し合うため,上の 2 つの余剰には価格が含まれていない点に留意せよ. • 仮定より任意の消費者 x ∈ [0, 1] はどちらの企業から商品を購入する場合でも非負の利得を得るため,上の 2 つの 余剰はどちらも実現可能である.ゆえに,それぞれの消費者 x について,各々がどちらの企業から財を購入すれば 社会的余剰が最大化されるかという問題について考えることができる.言い換えると,社会的余剰を最大化する立 地 (x1 , x2 ) を以下で考察するのだが,先に指摘したように,余剰について考える際には財価格は相殺されるため, 最適な立地のみが問題となる. • さらに,u, c が定数であることを踏まえると,それぞれの消費者 x について余剰 (1) , (2) のどちらが大きくなるか を考えることは,それらに対応するフットコスト 2 (3) 2 (4) t (x1 − x) t (x2 − x) のどちらが小さくなるかを考えることとと実質的に等しい.つまり,社会的余剰を最大化することはフットコスト の総和を最小化することと等しい. • ベンチマークとして,まずは,x1 = x2 (= x̂) を満たす任意の立地 (x1 , x2 ) (= (x̂, x̂)) について考えよう.(3) , (4) より,この場合は任意の消費者はどちらの企業から購入してもフットコストは等しいため,この場合のフットコス トの総和は, ∫ 1 0 [ ]1 t t t 2 t (x̂ − s) ds = − (x̂ − s)3 = − (x̂ − 1)3 + x̂3 3 3 3 0 となる.特に,この総和を最小化する共通の立地点は x̂ = t 3 − ( 1 2 であり,そのときのフットコストの総和は, )3 ( )3 t 1 1 t −1 + = 2 3 2 12 となる. • 続いて,完全な差別化が行われる (x1 , x2 ) = (0, 1) におけるフットコストの総和を求めよう.この場合には中点 1 2 より左側の消費者は x1 へ行き, 12 より右側の消費者は x2 へ行くのであったから,フットコストの総和は, ∫ 0 1 2 2 t (0 − s) ds + ∫ 1 1 2 [ t 3 t (1 − s) ds = s 3 2 ] 12 0 [ ]1 t t 3 + − (1 − s) = 3 12 1 2 となり,これは先ほどと同様である. • 以下では残りの可能性を考えよう.すなわち,x1 < x2 かつ (x1 , x2 ) ̸= (0, 1) を満たす (x1 , x2 ) の中でフットコス トの総和を最小化するものを探そう.そこでまずは,どちらの企業から購入しても社会的厚生の面では無差別にな るような消費者を特定しよう.そのような消費者を x ∈ [0, 1] で表すならば,先の議論により, 2 2 (x1 − x) = (x2 − x) 156 すなわち, x21 − 2x1 x = x22 − 2x2 x すなわち, x= x21 − x22 2 (x1 − x2 ) を得る.ゆえに,x1 < x2 の場合には, x= x1 + x2 2 となり,x1 と x2 を結ぶ線分の中央に位置する. • ゆえに,(x1 , x2 ) ̸= (0, 1) かつ x1 < x = ∫ x 0 2 t (x1 − s) ds + ∫ 1 x x1 +x2 2 < x2 を満たす (x1 , x2 ) のもとでのフットコストの総和は, [ ]x [ ]1 t t 2 3 3 t (x2 − s) ds = − (x1 − s) + − (x2 − s) 3 3 0 x t t t t 3 3 3 3 = − (x1 − x) + x1 − (x2 − 1) + (x2 − x) 3[ 3 3 3 ( )3 ( )3 ] x1 − x2 t x2 − x1 3 3 − = + x1 − (x2 − 1) + 3 2 2 となる.これを最小化する (x1 , x2 ) を求めるために 1 階の条件を適用すると, )2 x1 − x2 + 3x21 − 2 ( )2 1 x1 − x2 2 − 3 (x2 − 1) + 6 2 1 − 6 ( 3 2 3 2 ( ( x2 − x1 2 x2 − x1 2 )2 =0 (5) )2 =0 ゆえに,最適解 (x1 , x2 ) は, 2 x21 = (x2 − 1) すなわち, x1 = 1 − x2 (6) を満たす.これと (5) を踏まえると,最適解は, ( (x1 , x2 ) = 1 3 , 4 4 ) となる.また,このときのフットコストの総和は, [ ( )3 ( 3 1 )3 ] ( )3 ( 1 3 )3 − t t 1 t 1 3 4 − 4 − −1 + 4 4 = · = + − 3 2 4 4 2 3 16 48 となり,これは t 12 よりも小さい. • 以上の議論を踏まえると,社会的余剰は (x1 , x2 ) = (1 3 4, 4 ) の場合に最大化されることが明らかになったが,これは サブゲーム完全均衡な結果 (x1 , x2 ) = (0, 1) とは異なるものであるから,企業たちが自由に立地できる場合には社 会的に望ましい立地は実現しないことになる. 157 7.4.5 価格規制 固定価格規制 • 製品差別を含んだ価格競争モデルにおけるサブゲーム完全均衡な結果は社会的余剰を最大化するとは限らないこと が明らかになったが,この事実を踏まえた上で,政策当局は何らかの手段を用いて余剰を最大化できないだろうか. ここでは価格規制(price regulation)について考えよう. • 価格規制にも様々な形態が存在するが,まずは,政策当局がある価格水準を提示し,両企業がその価格ちょうどで 財を販売しなければならない場合について考えよう. • 両企業が当局の定める規制価格で財を販売せざるを得ない状況は,企業が操作可能な変数が自身の立地点のみであ るホテリング・モデルの状況に他ならない.ゆえに,このようなタイプの価格規制のもとで実現する結果は,ホテ ( ) リング・モデルにおけるサブゲーム完全均衡な結果 (x1 , x2 ) = 12 , 12 と一致する.ゆえに,社会的余剰は最大化さ れない. 上限価格規制 • 続いて,政策当局がある上限価格(ceiling price)を提示し,両企業がその価格以下で財を販売しなければならな い場合について考えよう. • 製品差別を含んだ価格競争モデルにおいて両企業が (x1 , x2 ) = (1 1 2, 2 ) へと立地する場合にはベルトラン競争が発生 して価格が (p1 , p2 ) = (c, c) となる.ただし,ベルトラン競争が起こる状況はサブゲーム完全均衡な結果ではなく, 実際の均衡結果は (x1 , x2 ) = (0, 1) へと立地して価格を (p1 , p2 ) = (c + m, c + m) に設定するというものであった. 上の 2 つの中間的な状況,例えば 0 < x1 < 1 2 < x2 < 1 を満たす立地 (x1 , x2 ) においては,価格は c と c + m の間 の水準に収まるであろう. • 仮に政策当局が定める上限価格が c + m 以上であれば,両企業はあいかわらず規制前の均衡価格 c + m を選択で きるため,ゲームの結果に影響を与えない.つまり,この場合にも両企業は (x1 , x2 ) = (0, 1) へと立地して価格を (p1 , p2 ) = (c + m, c + m) に設定する. • 一方,政策当局が定める上限価格が c + m より低い水準であれば,両企業はもはや規制前の均衡価格 c + m よりも 低い水準の価格しか選択できない.両企業は価格競争を避けるインセンティブがあるためなるべく離れた地点に立 地しようとするが,その地点は上限価格の水準に依存する.すなわち,両企業とも上限価格ちょうどの価格を設定 した上で,その価格水準のもとで可能な地点まで離れようとする.ゆえに,上限価格の水準が高いほど両企業は離 れた地点へ立地し,上限価格の水準が低いほど両企業は近い地点へ立地する. • さて,製品差別を含んだ価格競争モデルにおいて社会的余剰を定める変数は立地点 (x1 , x2 ) のみであり,(x1 , x2 ) = (1 3) (1 3) 4 , 4 の場合に社会的余剰は最大化されるのであった.ゆえに,両企業が (x1 , x2 ) = 4 , 4 へ立地するのが最適で あるような上限価格水準を政策当局が設定することに成功すれば,上限価格規制を通じて社会的余剰を最大化でき ることになる.具体的な価格水準の導出は演習問題としよう. 158 下限価格規制 • 最後に,規制当局がある下限価格(floor price)を提示し,両企業がその価格以上で財を販売しなければならない 場合について考えよう. • 繰り返しになるが,製品差別を含んだ価格競争モデルにおいて両企業が (x1 , x2 ) = (1 1 2, 2 ) へと立地する場合にはベ ルトラン競争が発生して価格が (p1 , p2 ) = (c, c) となる.ただし,ベルトラン競争が起こる状況はサブゲーム完全均 衡な結果ではなく,実際の均衡結果は (x1 , x2 ) = (0, 1) へと立地して価格を (p1 , p2 ) = (c + m, c + m) に設定する というものであった.上の 2 つの中間的な状況,例えば 0 < x1 < 1 2 < x2 < 1 を満たす立地 (x1 , x2 ) においては, 価格は c と c + m の間の水準に収まるであろう. • 政策当局が企業が赤字になるような下限価格を設定した場合に,企業があえてその規制を破ってそれより低い価格 をつけて赤字を広げる理由はない.ゆえに,当局が定める下限価格は常に企業の限界費用 c を上回る水準であると 仮定しよう.さらに,仮に下限価格が c + m 以下の水準であれば,両企業は相変わらず規制前の均衡価格 c + m を 選択できるため,ゲームの結果に影響を与えない.つまり,この場合にも両企業は (x1 , x2 ) = (0, 1) へと立地して 価格を (p1 , p2 ) = (c + m, c + m) に設定する. • 一方,政策当局が定める下限価格が c + m より高い水準であれば,両企業はもはや規制前の均衡価格 c + m よりも 高い水準の価格しか選択できない.そもそも両企業が立地に関して完全差別化を行ったのは価格差別を回避するた めであるが,このような下限価格規制が行われた場合には価格が c + m 以下になることがないわけだから,これは 制度によって価格競争が禁止されているようなものである.したがって,両企業は互いに近づいても価格競争に巻 き込まれる恐れはなく,その一方で相手に近づくほど多くの顧客を獲得できる.下限価格の水準が高くなるほど両 ( ) 企業は相手に近づく強いインセンティブを持ち,最終的にはホテリング・モデルと同様の結果 (x1 , x2 ) = 12 , 12 が 実現する. 7.4.6 消費者の分布が偏っている場合 159 8 演習問題 ナッシュ均衡の導出 問題 8.1 以下の同時手番ゲームのナッシュ均衡を,混合戦略均衡も含めてすべて求めよ. 12 L R T 2, 3 0, 2 B 1, 0 3, 4 解答: • (T, L) と (B, R) はともに最適反応の組であるから,これらはいずれも純戦略ナッシュ均衡である. 12 L R T 2,3 0, 2 B 1, 0 3,4 • プレイヤー 1 の混合戦略 σ1 : {T, B} → R を, σ1 = (σ1 (T ) , σ1 (B)) = (p, 1 − p) = p で表し,プレイヤー 2 の混合戦略 σ2 : σ1 : {L, R} → R を, σ2 = (σ2 (T ) , σ2 (B)) = (q, 1 − q) = q で表す.p, q ∈ [0, 1] である. • 混合戦略の組 (σ1 , σ2 ) のもとでプレイヤー 1 が得る期待利得 F1 (σ1 , σ2 ) は, F1 (σ1 , σ2 ) = 2pq + (1 − p) q + 3 (1 − p) (1 − q) = (4q − 3) p + (3 − 2q) であるから,プレイヤー 1 の最適反応は, ( if ( rp (q) = [0, 1] if ( 0 if 1 ) <q≤1 ) q = 34 ) 0 ≤ q < 34 3 4 となる. • プレイヤー 2 が得る期待利得 F2 (σ1 , σ2 ) は, F2 (σ1 , σ2 ) = 3pq + 2p (1 − q) + 4 (1 − p) (1 − q) = (5p − 4) q + (4 − 2p) 160 であるから,プレイヤー 2 の最適反応は, rq (p) = 1 [0, 1] 0 ( ) if 45 < p ≤ 1 ( ) if p = 45 ( ) if 0 ≤ p < 45 となる. • 両者を連立して解くと,混合ナッシュ均衡 (p∗ , q ∗ ) は, (p∗ , q ∗ ) = (0, 0) , の 3 つである. 161 ( 4 3 , 5 4 ) , (1, 1) 完全補完財の供給 問題 8.2 同時に利用されることではじめて役に立つ 2 種類の完全補完財 A, B について考える.これらの組み合わせ (A, B) に対する需要が, P = α − βQ (α > 0, β > 0) で与えられている.ただし,P は (A, B) の価格であり,Q は (A, B) の数量である.消費者にとって A や B は単独では 意味をなさない. 1. 財 A, B は独占企業によって所有されており,この企業は組 (A, B) を消費者たちに販売する.企業が (A, B) を供 給する際に必要な価格を 0 と仮定するとき,(A, B) の最適な独占価格を求めよ. 2. 財 A が企業 1 によって所有され,財 B が企業 2 によって所有される状況を想定する.それぞれの企業が財を供給 する際に必要な価格を 0 と仮定とする.両企業が自身の財価格を同時に決定するときのナッシュ均衡 (p∗1 , p∗2 ) を求 めよ. 3. 政府は政策によって 2 つの財 A, B を独占企業に占有させるか,もしくは別々の企業に保有させるかを選択できる 場合には,どちらを選択すべきであるか議論せよ. 1 の解答: α−P β • 独占企業が組 (A, B) を価格 P で販売したときの需要は Q = ( π = PQ = P であるから,そのときの利得は, α−P β ) となる.独占企業は上の π を最大化する P を選択する. • 1 階の条件より, dπ α−P P α − 2P = − = =0 dP β β β すなわち, P = α 2 が最適価格の候補である.実際,2 階の条件より, d2 π 2 =− <0 2 dP β であるから,π は上に狭義凸であるから, P∗ = が最適な独占価格である. 2 の解答: 162 α 2 • 企業 i = 1, 2 が提示する価格を pi で表す.価格の組 (p1 , p2 ) のもとで組 (A, B) に対する需要は Q = あるから,そのときの企業 1 の利得は, [ π1 (p1 , p2 ) = p1 Q = p1 α − (p1 + p2 ) β ] となる.企業 1 は p2 を所与とした上で上の π1 を最大化する p1 を選ぶ. • 1 階の条件より, dπ1 (p1 , p2 ) α − (p1 + p2 ) p1 α − 2p1 − p2 = − = =0 dp1 β β β すなわち, BR1 (p2 ) = α − p2 2 が p2 に対する企業 1 の最適反応である. • 企業 2 についても同様に考えると,p1 に対する企業 2 の最適反応は, BR2 (p1 ) = α − p1 2 となる. • 両者を連立して解くと,ナッシュ均衡 (p∗1 , p∗2 ) = (α α) , 3 3 を得る. 3 の解答: • 生産者余剰: – 問 1 の議論から,独占の場合に独占企業が得る利潤は以下の通り: π∗ = P ∗ ( α − P∗ β ) = α 2 ( α− β α 2 ) = α2 4β – 問 2 の議論から,2 つの企業が財を分有する場合に両企業が得る利潤の和は以下の通り: [ ] [ ] α − (p∗1 + p∗2 ) α − (p∗1 + p∗2 ) + p∗2 β β ] [ ∗ ∗ α − (p1 + p2 ) = (p∗1 + p∗2 ) β ] [ (α α) α − (α + α) 3 3 = + 3 3 β π1∗ + π2∗ = p∗1 = – α2 4β > 2α2 9β 2α2 9β であるから,生産者余剰を最大化するという意味では独占のほうが望ましい. • 消費者余剰: 163 α−(p1 +p2 ) β で – 消費者余剰の大きさは組 (A, B) の市場価格によって決定される.価格が低いほど消費者余剰は大きくなる. – 問 1 の議論より,独占の場合の市場価格は p∗ = α 2 である. – 問 2 の議論より,2 つの企業が財を分有する場合の市場価格は p∗1 + p∗2 = – α 2 < 2α 3 α 3 + α 3 = 23 α である. であるから,消費者余剰を最大化するという意味でも独占のほうが望ましい. • 総余剰: – 総余剰は生産者余剰と消費者余剰の和である.上の議論により,独占のほうがより多くの生産者余剰を消費者 余剰を保証する. – したがって,独占はより大きい総余剰をもたらすため,総余剰を最大化するという意味でも独占のほうが望ま しい. 164 ホテリングモデルの拡張 問題 8.3 数直線 R 上の閉区間 [0, 1] で表される通りに,消費者が一様分布にしたがって分布している状況を想定する. このような市場において 2 企業間で行われる立地競争モデルでは,両企業が 1 2 へ立地することがナッシュ均衡となるが, 企業の数が増加した場合に何が起こるかを考える. 1. 企業数が 3 である場合の純戦略ナッシュ均衡を求めよ.また,純戦略ナッシュ均衡が存在しない場合にはそれを 示せ. 2. 企業数が 4 である場合の純戦略ナッシュ均衡を求めよ.また,純戦略ナッシュ均衡が存在しない場合にはそれを 示せ. 1 の解答: • 企業 i = 1, 2, 3 の立地点を ai ∈ [0, 1] で表す.0 ≤ a1 ≤ a2 ≤ a3 ≤ 1 としても一般性は失われない.以下の 3 つの 場合に分けて考察する. 1. 3 つの企業が同じ場所に立地する場合. 2. 2 つの企業が同じ場所に立地し,残りの 1 企業のみが異なる場所に立地する場合. 3. 3 つの企業がいずれも異なる場所に立地する場合. • 3 つの企業が同じ場所に立地する場合: – 0 ≤ a1 ≤ a2 ≤ a3 ≤ 1 かつ a1 = a2 = a3 を満たす組 (a1 , a2 , a3 ) に注目する.この条件を満たす任意の組にお いてそれぞれの企業は 1 3 の客を得る. – このような組 (a1 , a2 , a3 ) は純戦略ナッシュ均衡ではないことを示す.具体的には,企業 1 のみがそこから逸 脱すると得できることを示しても一般性は失われない. – a1 ≤ 1 2 の場合について考える.企業 1 が a1 から逸脱して十分小さい ε > 0 に関して a1 + ε に立地した場合 に得る客は, [1 − (a1 + ε)] + ε ε = 1 − a1 − 2 2 1 ε 1 ≥1− − ∵ a1 ≤ 2 2 3 1 > ∵ εは十分小さい 3 となる.ゆえに,企業 1 は a1 から逸脱するインセンティブがある. – a1 > 1 2 の場合について考える.続く. 165 参考文献 [1] Bertrand, J. (1883), “Book review of theorie mathematique de la richesse sociale and of recherches sur les principles mathematiques de la theorie des richesses”, Journal de Savants, 67, 499–508. [2] Cournot, A. A., Fisher, I. (1897), “Researches into the Mathematical Principles of the Theory of Wealth”, Macmillan Co.. [3] Fudenberg, D., and Tirole, J. (1991). “Game theory”, Cambridge, Massachusetts. [4] Mas-Colell, A., Whinston, M. D., and Green, J. R. (1995), “Microeconomic theory”, New York: Oxford university press. [5] 岡田章. (2011), “ ゲーム理論”, 有斐閣. [6] グレーヴァ香子. (2011), “非協力ゲーム理論”, 知泉書館. 166
© Copyright 2025 ExpyDoc