新ゲーム理論 第Ⅰ部 非協力ゲームの理論 第1章 非協力ゲームの戦略形 M1 藤井敬士 今回の内容 • 社会的ジレンマ – 囚人のジレンマ – 均衡利得,パレート最適 • 状況表現としてのゲーム – 協力ゲームと非協力ゲーム • 支配可能 • 共有地の悲劇 – 非協力的状況から協力関係の構築 • ゲームの理論の性格 囚人のジレンマ 2人で ・・・. やりました 半年 2年 5年 10年 2年 5年 B A B 黙秘 共犯宣言 A,Bとも に2年 Aに10年 Bに半年 共犯宣言 Aに半年 Bに10年 A,Bとも に5年 黙秘 A 2人で ・・・. やりました B A 黙秘 共犯宣言 黙秘 5,5 0,8 共犯宣言 8,0 2,2 (※利得がA,Bにとって共通であると仮定) 自分が最悪になるのを避けるために,結局2人とも証言する. 標準的囚人のジレンマ・ゲーム C D C D S1 , S 2 W1 , B2 B1 ,W2 Bi (best ) Si (second) Ti (third) Wi (worst), i 1,2 のとき,囚人のジレンマ型ゲームという T1 ,T2 2S1 B1 W1 , 2S1 B1 W1 のとき,特に標準的囚人のジレンマ型ゲームという →最高と最低よりも2番目×2回の方がいい 最終的に両者の思考が たどり着く ( D, D)を均衡点と呼び, そのときの利得ベクト ル(T1 , T2 )を均衡利得と呼ぶ 支配戦略均衡 S1 , S 2 W1 , B2 B1 ,W2 T1 ,T2 < D D < C C プレイヤー1についてS1 B1 , W1 T1 であるから, プレイヤー2がどんな戦略をとろう とも戦略Dをとるのが良い. →戦略Dが戦略Cを支配している,もしくは戦略Cは戦略Dに支配されるという. →プレイヤー2についても同様 →支配戦略があるときは支配戦略を用いる(支配戦略の原理) (D,D)を支配戦略均衡点という. 均衡利得とパレート最適性 ( S1 , S 2 ) (5,5)のように,誰かの利得を増加させるためには 他の人の利得を減少さ せなければならないとき, その利得ベクトルをパレート最適という. 厳密には,利得ベクトル x ( x1 ,..., xn ), y ( y1 ,..., yn ) において,xi yi i 1,2,...,n のとき, xはyをパレート支配すると いい,すべてのyに対して これが成り立つxをパレート最適という . 囚人のジレンマの閉塞的状況から脱出するためには, 非協力的状況から協力的状況への変革が必要 状況表現としてのゲーム • ゲームとは →ゲームには相手がいる • 有限か無限か • 誰がプレイヤーであるか • ある主体は,ゲームの中にいるのか外にいるのか (ex.「住民参加」という言葉を使うとき – プレイヤーの集合が変動することもある ゲームとは,プレイヤーを明らかにしたうえで,それら のプレイヤーの間に成立している社会的状況のこと 非協力ゲームと協力ゲーム 戦略=各プレイヤーの持つ行動計画 1. 非協力ゲーム理論 プレイヤーの間には,各プレイヤーがとるべき戦略について,強制力 のある取り決めは存在しない.(より基本的といえる.) 2. 協力ゲーム理論 すべてのプレイヤーの間に,そのとるべき戦略についての合意が成り 立ち,それに基づいて戦略を選択し行動する. ※現実に拘束的合意が存在するかどうかは観察不可能なので,どちらの 前提に立つのか,という問題. 非協力ゲームの戦略形 利得関数 xi f i (s1 , s2 ,...,sn ), i 1,2,...,n ここで, si Si i 1,2,...,n (Si : プレイヤーiの戦略の集合 ) ※各プレイヤーの利得は,自分だけでなくほかのプレイヤーの とる戦略の関数でもある. 非協力ゲームの戦略形 社会的状況を,非協力という前提で,プレイヤー.戦略,利得関数の 3つの組で表したもの.他に展開形という形式がある.(cf.3章) 非協力ゲームの戦略形 非協力有限2人ゲーム プレイヤー1と2がい るとき,それぞれの戦略をi, jとし(1 i m,1 j n), それぞれの利得を aij f1 (i, j ), bij f 2 (i, j )とするとき, A aij , B bij を プレイヤー1,2の利 得行列という.このよ うな非協力ゲームを 戦略形非協力有限 2人ゲームという. プレイヤー2 1 プ レ イ ヤ ー 1 j 1 a11 , b11 a1 j , b1 j i ai1 , bi1 aij , bij m am1 , bm1 amj , bmj n a1n , b1n ain , bin amn , bmn という双行列で表せるので双行列ゲームともいう. 非協力ゲームの戦略形 行動原理 プレイヤーは期待効用を最大にするように行動する ルールとゲーム ルール・・・ここまでに挙げた要素や前提のこと ゲーム・・・1組のルールによって表現されたもの ゲームとは,複数のプレイヤー間の状況をルールと して表現したもの.このように状況を表現すること がゲーム理論の第一の目的 以下での表記について プレイヤーの集合: N {1,2, , n} プレイヤーiの戦略とその集合 : Si {si } 戦略の組とその集合: S {s ( s1 , s2 , , sn )} S1 S 2 S n プレイヤーi以外のすべてのプレイヤーの とる戦略の組とその集合 : si ( s1 , s2 , , si 1 , si 1 , , sn ) S i S1 S 2 Si 1 Si 1 S n si S i とかく 戦略の同等と支配 プレイヤーiの戦略 hと戦略kについて, 任意の si S iに対して f i ( s1 , s2 , , h, , sn ) f i ( s1 , s2 , , k , , sn ) が成り立つとき,プレ イヤーiの 戦略 hと戦略kは同等であるという. が に変わると,戦略hは戦略 kを支配するという. 被支配戦略の除去と支配可能 「支配される戦略は用いない」という戦略の選択原理を被支配戦 略除去の原理という.下のようなゲームの例で説明する. プレイヤー2 1 2 3 1 2,4 4,6 6,3 2 3,2 3,4 3,5 3 4,5 2,6 4,4 プレイヤー1 被支配戦略の除去と支配可能 1. 5. プレイヤー2にとって,戦略1は戦略2に支配されている. 3. 2. 4. プレイヤー2は戦略2を選択する. 縮小したゲームを考えると,プレイヤー1の戦略2と3は戦略1 プレイヤー2の戦略1を除く プレイヤー1の戦略2と3を除去する. に支配されている. プレイヤー2 1 2 3 1 2,4 4,6 6,3 2 3,2 <3,4 3,5 3 4,5 4,4 プレイヤー1 2,6 被支配戦略の除去と支配可能 このように(被支配戦略除去の原理に従って) 到達した戦略の組(1,2)を,一般にゲームの 均衡点という. 被支配戦略除去の原理による均衡点が存在 するとき,ゲームは支配可能であるという. 支配戦略均衡点 支配戦略・・・他のすべての戦略を支配する戦略 支配戦略均衡点・・・n人のすべてのプレイヤーが支配戦略を持 つとき,支配戦略が存在するときは支配戦略を用いる(支配 戦略の原理)ため,n個の支配戦略の組 s* (s1* , s2* ,, sn* ) が残る.これを支配戦略均衡点という. (※支配戦略の原理は,被支配戦略除去の原理の特別な場合 といえる) 弱支配戦略・・・ fi (s1, s2 ,, h,, sn ) fi (s1, s2 ,, k ,, sn ) のとき,戦略kは 戦略hに弱支配されるという. 共有地の悲劇 共有地の悲劇 モデル化して考える(非協力ゲーム) q1頭 農家1 q1頭 農家2 q2 頭 農家3 q3頭 農家4 q4 頭 牛1頭の価格=2,1軒につき3頭まで買える資金がある 農家iの収益 xiは,xi qi [16 (q1 q2 q3 q4 )] 2qi 全体の放牧数が増えると 生育が悪くなり利益効率が下がる 牛購入のコスト 共有地の悲劇 1. 2. 農家iにとって,戦略1は戦略2と3に支配されているので 3. 戦略3は戦略2を弱支配する.(他の農家が3頭ずつ出し つまり,他の農家が2頭以下にやめる保証のない限りは 排除する. たとき以外は戦略3の方が有利) 3頭放牧したほうが有利 i以外の農家の放牧牛の数の和 i の 牛 数 0 1 13 2 24 3 33 1 12 22 30 2 11 20 27 3 10 18 24 4 9 16 21 5 8 14 18 6 7 12 15 7 6 10 12 8 5 8 9 9 4 6 6 共有地の悲劇 このゲームの弱支配均衡点は,s=(3,3,3,3)であり,この場合,均衡利得は x=(6,6,6,6)である. 仮にr=(2,2,2,2)という戦略をとれば,y=(12,12,12,12)という利得ベクトル が期待できる. つまり,弱支配均衡点における均衡利得は共同合理的でない場合もある. i以外の農家の放牧牛の数の和 i の 牛 数 0 1 13 2 24 3 33 1 12 22 30 2 11 20 27 3 10 18 24 4 9 16 21 5 8 14 18 6 7 12 15 7 6 10 12 8 5 8 9 9 4 6 6 共有地の悲劇(問題改善) 非協力的状況では限界がある. →各農家で相談して2頭ずつ放牧することに取り決め る →共同事業を行い,4軒をひとつの農家とみなす 収益x q(16 q) 2qだから,q 7のとき利得は最大値49 →4軒では割り切れないので貨幣のようなものを導入 する 非協力的状況からいかに協力関係を構築する かということが問題解決の重要な点になっている ゲーム理論の性格 • 形式合理性(思考と行動の論理的整合性)を前提と している – 完全でない場合もあり,限定合理性を前提とすることもあ る – 合理性と言うとき,効用を最大化するという目的合理性と いう意味も持つ場合が多い – すべてのプレイヤーに共通な合理性の基準というものが あるのか? ゲーム理論の役割(目的)は,分析することである.その上 で問題解決のための思考の枠組みを提供する.(必ずしも すべての人を満足させる案を出すことだけではない)
© Copyright 2025 ExpyDoc