新ゲーム理論第Ⅰ部非協力ゲームの理論第1章非協力ゲームの戦略形 M1 藤井敬士今回の内容 • 社会的ジレンマ – 囚人のジレンマ – 均衡利得，パレート最適 • 状況表現としてのゲーム – 協力ゲームと非協力ゲーム • 支配可能 • 共有地の悲劇 – 非協力的状況から協力関係の構築 • ゲームの理論の性格囚人のジレンマ 2人で・・・．やりました半年 2年 5年 10年 2年 5年 B A B 黙秘共犯宣言 A,Bともに2年 Aに10年 Bに半年共犯宣言 Aに半年 Bに10年 A,Bともに5年黙秘 A 2人で・・・．やりました B A 黙秘共犯宣言黙秘 5，5 0，8 共犯宣言 8，0 2，2 (※利得がA,Bにとって共通であると仮定) 自分が最悪になるのを避けるために，結局2人とも証言する．標準的囚人のジレンマ・ゲーム C D C D S1 , S 2 W1 , B2 B1 ,W2 Bi (best )  Si (second)  Ti (third)  Wi (worst), i  1,2 のとき，囚人のジレンマ型ゲームという T1 ,T2 2S1  B1  W1 , 2S1  B1  W1 のとき，特に標準的囚人のジレンマ型ゲームという →最高と最低よりも2番目×2回の方がいい最終的に両者の思考がたどり着く ( D, D)を均衡点と呼び，そのときの利得ベクトル(T1 , T2 )を均衡利得と呼ぶ支配戦略均衡 S1 , S 2 W1 , B2 B1 ,W2 T1 ,T2 ＜ D D ＜ C C プレイヤー1についてS1  B1 , W1  T1 であるから，プレイヤー2がどんな戦略をとろうとも戦略Dをとるのが良い． →戦略Dが戦略Cを支配している，もしくは戦略Cは戦略Dに支配されるという． →プレイヤー２についても同様 →支配戦略があるときは支配戦略を用いる（支配戦略の原理）（D，D）を支配戦略均衡点という．均衡利得とパレート最適性 ( S1 , S 2 )  (5,5)のように，誰かの利得を増加させるためには他の人の利得を減少させなければならないとき，その利得ベクトルをパレート最適という．厳密には，利得ベクトル x  ( x1 ,..., xn ), y  ( y1 ,..., yn ) において，xi  yi i  1,2,...,n のとき， xはyをパレート支配するといい，すべてのyに対してこれが成り立つxをパレート最適という．囚人のジレンマの閉塞的状況から脱出するためには，非協力的状況から協力的状況への変革が必要状況表現としてのゲーム • ゲームとは →ゲームには相手がいる • 有限か無限か • 誰がプレイヤーであるか • ある主体は，ゲームの中にいるのか外にいるのか（ex.「住民参加」という言葉を使うとき – プレイヤーの集合が変動することもあるゲームとは，プレイヤーを明らかにしたうえで，それらのプレイヤーの間に成立している社会的状況のこと非協力ゲームと協力ゲーム戦略＝各プレイヤーの持つ行動計画 1. 非協力ゲーム理論プレイヤーの間には，各プレイヤーがとるべき戦略について，強制力のある取り決めは存在しない．(より基本的といえる．) 2. 協力ゲーム理論すべてのプレイヤーの間に，そのとるべき戦略についての合意が成り立ち，それに基づいて戦略を選択し行動する． ※現実に拘束的合意が存在するかどうかは観察不可能なので，どちらの前提に立つのか，という問題．非協力ゲームの戦略形利得関数 xi  f i (s1 , s2 ,...,sn ), i  1,2,...,n ここで， si  Si i  1,2,...,n (Si : プレイヤーiの戦略の集合 ) ※各プレイヤーの利得は，自分だけでなくほかのプレイヤーのとる戦略の関数でもある．非協力ゲームの戦略形社会的状況を，非協力という前提で，プレイヤー．戦略，利得関数の 3つの組で表したもの．他に展開形という形式がある．（cf.3章）非協力ゲームの戦略形非協力有限2人ゲームプレイヤー１と２がいるとき，それぞれの戦略をi, jとし(1  i  m,1  j  n)，     それぞれの利得を aij  f1 (i, j ), bij  f 2 (i, j )とするとき， A  aij , B  bij をプレイヤー１，２の利得行列という．このような非協力ゲームを戦略形非協力有限 2人ゲームという．プレイヤー2 1 プレイヤー 1  j 1  a11 , b11  a1 j , b1 j     i  ai1 , bi1  aij , bij     m am1 , bm1  amj , bmj  n  a1n , b1n     ain , bin      amn , bmn  という双行列で表せるので双行列ゲームともいう．非協力ゲームの戦略形行動原理プレイヤーは期待効用を最大にするように行動するルールとゲームルール・・・ここまでに挙げた要素や前提のことゲーム・・・1組のルールによって表現されたものゲームとは，複数のプレイヤー間の状況をルールとして表現したもの．このように状況を表現することがゲーム理論の第一の目的以下での表記についてプレイヤーの集合: N  {1,2,  , n} プレイヤーiの戦略とその集合 : Si  {si } 戦略の組とその集合： S  {s  ( s1 , s2 ,  , sn )}  S1  S 2    S n プレイヤーi以外のすべてのプレイヤーのとる戦略の組とその集合 : si  ( s1 , s2 ,  , si 1 , si 1 ,  , sn ) S i  S1  S 2    Si 1  Si 1    S n si  S i とかく戦略の同等と支配プレイヤーiの戦略 hと戦略kについて，任意の si  S iに対して f i ( s1 , s2 , , h, , sn )  f i ( s1 , s2 , , k , , sn ) が成り立つとき，プレイヤーiの戦略 hと戦略kは同等であるという．  が  に変わると，戦略hは戦略 kを支配するという．被支配戦略の除去と支配可能「支配される戦略は用いない」という戦略の選択原理を被支配戦略除去の原理という．下のようなゲームの例で説明する．プレイヤー2 1 2 3 1 2,4 4,6 6,3 2 3,2 3,4 3,5 3 4,5 2,6 4,4 プレイヤー1 被支配戦略の除去と支配可能 1. 5. プレイヤー2にとって，戦略1は戦略2に支配されている． 3. 2. 4. プレイヤー2は戦略2を選択する．縮小したゲームを考えると，プレイヤー1の戦略2と3は戦略1 プレイヤー2の戦略1を除くプレイヤー1の戦略2と3を除去する．に支配されている．プレイヤー2 1 2 3 1 2,4 4,6 6,3 2 3,2 ＜3,4 3,5 3 4,5 4,4 プレイヤー1 2,6 被支配戦略の除去と支配可能このように(被支配戦略除去の原理に従って) 到達した戦略の組(1,2)を，一般にゲームの均衡点という．被支配戦略除去の原理による均衡点が存在するとき，ゲームは支配可能であるという．支配戦略均衡点支配戦略・・・他のすべての戦略を支配する戦略支配戦略均衡点・・・ｎ人のすべてのプレイヤーが支配戦略を持つとき，支配戦略が存在するときは支配戦略を用いる（支配戦略の原理）ため，ｎ個の支配戦略の組 s*  (s1* , s2* ,, sn* ) が残る．これを支配戦略均衡点という．（※支配戦略の原理は，被支配戦略除去の原理の特別な場合といえる）弱支配戦略・・・ fi (s1, s2 ,, h,, sn )  fi (s1, s2 ,, k ,, sn ) のとき，戦略ｋは戦略ｈに弱支配されるという．共有地の悲劇共有地の悲劇モデル化して考える（非協力ゲーム） q1頭農家1 q1頭農家2 q2 頭農家3 q3頭農家4 q4 頭牛1頭の価格＝2，1軒につき3頭まで買える資金がある農家iの収益 xiは，xi  qi [16  (q1  q2  q3  q4 )]  2qi 全体の放牧数が増えると生育が悪くなり利益効率が下がる牛購入のコスト共有地の悲劇 1. 2. 農家iにとって，戦略1は戦略2と3に支配されているので 3. 戦略3は戦略2を弱支配する．（他の農家が3頭ずつ出しつまり，他の農家が2頭以下にやめる保証のない限りは排除する．たとき以外は戦略3の方が有利） 3頭放牧したほうが有利 i以外の農家の放牧牛の数の和 i の牛数 0 1 13 2 24 3 33 1 12 22 30 2 11 20 27 3 10 18 24 4 9 16 21 5 8 14 18 6 7 12 15 7 6 10 12 8 5 8 9 9 4 6 6 共有地の悲劇このゲームの弱支配均衡点は，s=(3,3,3,3)であり，この場合，均衡利得はｘ=(6,6,6,6)である．仮にr=(2,2,2,2)という戦略をとれば，y=(12,12,12,12)という利得ベクトルが期待できる．つまり，弱支配均衡点における均衡利得は共同合理的でない場合もある． i以外の農家の放牧牛の数の和 i の牛数 0 1 13 2 24 3 33 1 12 22 30 2 11 20 27 3 10 18 24 4 9 16 21 5 8 14 18 6 7 12 15 7 6 10 12 8 5 8 9 9 4 6 6 共有地の悲劇（問題改善）非協力的状況では限界がある． →各農家で相談して2頭ずつ放牧することに取り決める →共同事業を行い，4軒をひとつの農家とみなす収益x  q(16  q)  2qだから，q  7のとき利得は最大値49 →4軒では割り切れないので貨幣のようなものを導入する非協力的状況からいかに協力関係を構築するかということが問題解決の重要な点になっているゲーム理論の性格 • 形式合理性（思考と行動の論理的整合性）を前提としている – 完全でない場合もあり，限定合理性を前提とすることもある – 合理性と言うとき，効用を最大化するという目的合理性という意味も持つ場合が多い – すべてのプレイヤーに共通な合理性の基準というものがあるのか？ゲーム理論の役割（目的）は，分析することである．その上で問題解決のための思考の枠組みを提供する．（必ずしもすべての人を満足させる案を出すことだけではない）