科学・技術と人間セミナー(ゲーム理論入門) 第 4 回演習 (訂正版) 第 4 回演習問題:次の追加問題を行え.(ヒント:例題を参考にせよ) 追加問題 (p.261 問題 11-1 改題). ファッションの流行色について考える. 原色を好むタイプと中間色を好むタイプ の個人からなるグループがある. このグループ内の 2 人 A,B が出会う際に服装の色から得られる利得は次の表で与 えられる: HH B H 原色 (P) HH A H H 原色 (P) 中間色 (N) 中間色 (N) (0, 0) (1, 3) (3, 1) (0, 0) 原色:primary color 中間色:neutral color (1) この戦略形ゲームのナッシュ均衡点を混合戦略の範囲まで求めよ. (2) このグループは無数と考えて良い程大人数である場合を考える. このグループ内で各個人が他の個人とランダ ムに出会う状況において, 「原色タイプ」と「中間色タイプ」の行動進化のダイナミックス図を描いて,進化的に安 定なナッシュ均衡点を求めよ. (3) このグループが 8 人だけからなる場合を考える. n 人が原色タイプであり, (8 − n) 人が中間色タイプであるグ ループの状態を (nP,(8 − n)N) と表す. 但し, 0 5 n 5 8. 毎期毎期このグループ内の 1 人が服装の色を変える状況と し, 変える 1 人はランダムに決まるとする. この時, グループの状態間の推移図を推移確率と共に求めよ. 例題. 2 つのオペレーティングシステム (OS) の W-OS を採用するタイプと M-OS を採用するタイプの個人からなる 職場を考える. この職場内の 2 人 A,B が共同作業を行う際の生産性は次の表で与えられる: HH HH B W-OS HH A H W-OS M-OS (2, 2) (0, 0) M-OS (0, 0) (4, 4) (1) この戦略形ゲームのナッシュ均衡点を混合戦略の範囲まで求めよ. (2) この職場は無数と考えて良い程大人数である場合を考える. この職場内で各個人が他の個人とランダムに出 会って 2 人で共同作業する状況において, 「W-OS を採用するタイプ」と「M-OS を採用するタイプ」の行動進化の ダイナミックス図を描いて,進化的に安定なナッシュ均衡点を求めよ. (3) この職場が 6 人だけからなる場合を考える. n 人が W-OS を採用するタイプであり, (6 − n) 人が M-OS を採用 するタイプである職場の状態を (nW,(6 − n)M) と表す. 但し, 0 5 n 5 6. 毎期毎期この職場内の 1 人が OS を買い換 える状況とし, 買い換える 1 人はランダムに決まるとする. この時, 職場の状態間の推移図を推移確率と共に求めよ. (解) (1) まず, 純戦略による均衡点があるか調べる. 各プレイヤーの最適応純戦略の利得にアンダーラインを引くと HH HH B W-OS HH A H W-OS M-OS (2, 2) (0, 0) M-OS (0, 0) (4, 4) となり,(W-OS, W-OS), (M-OS, M-OS) が純戦略による均衡点である. 次に混合戦略によるナッシュ均衡点を求め る. A がを W-OS を選択する確率を p とし, 混合戦略を (p, 1 − p) とする. B が W-OS を選択する確率を q とし, 混合 戦略を (q, 1 − q) とする. 但し, 0 5 p 5 1, 0 5 q 5 1. B の混合戦略 (q, 1 − q) に対して, A が W-OS を選択する時の期待利得は EA ((1, 0), (q, 1 − q)) = 2q + 0(1 − q) = 2q, A がを M-OS を選択する時の期待利得は EA ((0, 1), (1 − q)) = 0q + 4(1 − q) = 4(1 − q). A が W-OS と M-OS を正の確率で選択する混合戦略を取るには, EA ((1, 0), (q, 1 − q)) = EA ((0, 1), (q, 1 − q)) が必 要なので, 2q = 4(1 − q). ∴ q = 23 . このゲームは対称ゲームなので,A の混合戦略 (p, 1 − p) に対して, B が W-OS と M-OS を正の確率で選択する混合戦略を取るには, p = 32 が必要である. 混合戦略の組 (( 32 , 31 ), ( 23 , 31 )) は互いに最 適応戦略なので均衡点である. 1 (2) 簡単の為, W-OS を採用するタイプの個人を W タイプ, M-OS を採用するタイプの個人を M タイプと言う. こ の職場内で W タイプの比率を x, M タイプの比率を (1 − x) とする. 但し, 0 5 x 5 1. 対称ゲームなのでこの職場内 での個人をプレイヤー A としても B としてもどちらでも良い事に注意する. W タイプが W タイプと出会う確率は x であり, M タイプと出会う確率は (1 − x) であるから, W タイプの期待利得 EW は, EW = 2x + 0(1 − x) = 2x. 同 様に, M タイプが W タイプと出会う確率は x であり, M タイプと出会う確率は (1 − x) であるから, M タイプの期待 利得 EM は, EM = 20 + 4(1 − x) = 4(1 − x). 横軸を x 軸として, EW と EM のグラフを描くと 4 EW 2 O x < 23 の時, EW < EM より W タイプの比率 x は減少する. 2 3 < x の時, EM < EW より W タイプの比率 x は増加する. よって, 行動進化のダイナミックス図は左図の x 軸に描いた様になる. これより, x = 23 の状態から少し変化すれば長期的に職場は x = 0 か x = 1 の状態に収束し, x = 0 の状態と x = 1 の状態は少し変化しても元に戻るので, (M-OS, M-OS), (W-OS, W-OS) が進化的に安定なナッシュ均衡点である. EM 1 x 2 3 (3) 職場の状態が (nW,(6 − n)M) であるとする. 但し, 0 5 n 5 6. 今期に W タイプが OS を買い換える個人に選ばれた場合, この W タイプの他の状態は ((n − 1)W,(6 − n)M) であ 2(n−1) 6−n る. この W タイプが新しい W-OS に買い換える時の期待利得は, n−1 であり, M-OS に買い換 5 ·2+ 5 ·0= 5 4(6−n) 6−n n−1 える時の期待利得は, 5 · 0 + 5 · 4 = 5 である. よって, 「W タイプが新 W-OS に買い換える」⇐⇒ 2(n − 1) 4(6 − n) 13 > ⇐⇒ n > ⇐⇒ n = 5 5 5 3 今期に M タイプが OS を買い換える個人に選ばれた場合, この M タイプの他の状態は (nW,(5 − n)M) である. こ 2n の M タイプが W-OS に買い換える時の期待利得は, n5 · 2 + 5−n 5 · 0 = 5 であり, 新しい M-OS に買い換える時の期 4(5−n) 待利得は, n5 · 0 + 5−n である. よって, 5 ·4= 5 「M タイプが W-OS に買い換える」⇐⇒ 2n 4(5 − n) 10 > ⇐⇒ n > ⇐⇒ n = 4 5 5 3 従って, ・W タイプが増加する ⇔「M タイプが W-OS に買い換える」⇔ n = 4. ・W タイプが減少する ⇔「W タイプが M-OS に買い換える」⇔ 1 5 n 5 4. ・状態が不変 ⇔「W タイプが新 W-OS に買い換える」または「M タイプが新 M-OS に買い換える」⇔ n = 5 また は n 5 3. 以上により, 状態間の推移図は以下の様になる: 1 y (0W,6M) 5 6 1 6 y (1W,5M) 2 3 1 3 y (2W,4M) 1 2 1 2 y (3W,3M) 5 6 2 3 (4W,2M) 1 3 y (5W,M) 1 6 1 y (6W,0M) 状態間の推移確率は次の例の様に求められる. 例えば,「(4W,2M)→(5W,M)」の推移確率は状態 (4W,2M) の時に M タイプが OS を買い換える個人に選ばれる確率なので 26 = 13 . また例えば,「(2W,4M)y(2W,4M)」の推移確率は 状態 (2W,4M) の時に M タイプが OS を買い換える個人に選ばれる確率なので 46 = 23 . 2
© Copyright 2024 ExpyDoc