A B (0,0) (3,1) (1,3) (0,0) 原色:primary color 中間色:neutral color A B

科学・技術と人間セミナー(ゲーム理論入門) 第 4 回演習 (訂正版)
第 4 回演習問題:次の追加問題を行え.(ヒント:例題を参考にせよ)
追加問題 (p.261 問題 11-1 改題). ファッションの流行色について考える. 原色を好むタイプと中間色を好むタイプ
の個人からなるグループがある. このグループ内の 2 人 A,B が出会う際に服装の色から得られる利得は次の表で与
えられる:
HH
B
H
原色 (P)
HH
A
H
H
原色 (P)
中間色 (N)
中間色 (N)
(0, 0)
(1, 3)
(3, 1)
(0, 0)
原色:primary color
中間色:neutral color
(1) この戦略形ゲームのナッシュ均衡点を混合戦略の範囲まで求めよ.
(2) このグループは無数と考えて良い程大人数である場合を考える. このグループ内で各個人が他の個人とランダ
ムに出会う状況において,
「原色タイプ」と「中間色タイプ」の行動進化のダイナミックス図を描いて,進化的に安
定なナッシュ均衡点を求めよ.
(3) このグループが 8 人だけからなる場合を考える. n 人が原色タイプであり, (8 − n) 人が中間色タイプであるグ
ループの状態を (nP,(8 − n)N) と表す. 但し, 0 5 n 5 8. 毎期毎期このグループ内の 1 人が服装の色を変える状況と
し, 変える 1 人はランダムに決まるとする. この時, グループの状態間の推移図を推移確率と共に求めよ.
例題. 2 つのオペレーティングシステム (OS) の W-OS を採用するタイプと M-OS を採用するタイプの個人からなる
職場を考える. この職場内の 2 人 A,B が共同作業を行う際の生産性は次の表で与えられる:
HH
HH B W-OS
HH
A
H
W-OS
M-OS
(2, 2)
(0, 0)
M-OS
(0, 0)
(4, 4)
(1) この戦略形ゲームのナッシュ均衡点を混合戦略の範囲まで求めよ.
(2) この職場は無数と考えて良い程大人数である場合を考える. この職場内で各個人が他の個人とランダムに出
会って 2 人で共同作業する状況において,
「W-OS を採用するタイプ」と「M-OS を採用するタイプ」の行動進化の
ダイナミックス図を描いて,進化的に安定なナッシュ均衡点を求めよ.
(3) この職場が 6 人だけからなる場合を考える. n 人が W-OS を採用するタイプであり, (6 − n) 人が M-OS を採用
するタイプである職場の状態を (nW,(6 − n)M) と表す. 但し, 0 5 n 5 6. 毎期毎期この職場内の 1 人が OS を買い換
える状況とし, 買い換える 1 人はランダムに決まるとする. この時, 職場の状態間の推移図を推移確率と共に求めよ.
(解) (1) まず, 純戦略による均衡点があるか調べる. 各プレイヤーの最適応純戦略の利得にアンダーラインを引くと
HH
HH B W-OS
HH
A
H
W-OS
M-OS
(2, 2)
(0, 0)
M-OS
(0, 0)
(4, 4)
となり,(W-OS, W-OS), (M-OS, M-OS) が純戦略による均衡点である. 次に混合戦略によるナッシュ均衡点を求め
る. A がを W-OS を選択する確率を p とし, 混合戦略を (p, 1 − p) とする. B が W-OS を選択する確率を q とし, 混合
戦略を (q, 1 − q) とする. 但し, 0 5 p 5 1, 0 5 q 5 1.
B の混合戦略 (q, 1 − q) に対して,
A が W-OS を選択する時の期待利得は EA ((1, 0), (q, 1 − q)) = 2q + 0(1 − q) = 2q,
A がを M-OS を選択する時の期待利得は EA ((0, 1), (1 − q)) = 0q + 4(1 − q) = 4(1 − q).
A が W-OS と M-OS を正の確率で選択する混合戦略を取るには, EA ((1, 0), (q, 1 − q)) = EA ((0, 1), (q, 1 − q)) が必
要なので, 2q = 4(1 − q). ∴ q = 23 . このゲームは対称ゲームなので,A の混合戦略 (p, 1 − p) に対して, B が W-OS
と M-OS を正の確率で選択する混合戦略を取るには, p = 32 が必要である. 混合戦略の組 (( 32 , 31 ), ( 23 , 31 )) は互いに最
適応戦略なので均衡点である.
1
(2) 簡単の為, W-OS を採用するタイプの個人を W タイプ, M-OS を採用するタイプの個人を M タイプと言う. こ
の職場内で W タイプの比率を x, M タイプの比率を (1 − x) とする. 但し, 0 5 x 5 1. 対称ゲームなのでこの職場内
での個人をプレイヤー A としても B としてもどちらでも良い事に注意する. W タイプが W タイプと出会う確率は
x であり, M タイプと出会う確率は (1 − x) であるから, W タイプの期待利得 EW は, EW = 2x + 0(1 − x) = 2x. 同
様に, M タイプが W タイプと出会う確率は x であり, M タイプと出会う確率は (1 − x) であるから, M タイプの期待
利得 EM は, EM = 20 + 4(1 − x) = 4(1 − x). 横軸を x 軸として, EW と EM のグラフを描くと
4
EW
2
O
x < 23 の時, EW < EM より W タイプの比率 x は減少する.
2
3 < x の時, EM < EW より W タイプの比率 x は増加する.
よって, 行動進化のダイナミックス図は左図の x 軸に描いた様になる.
これより, x = 23 の状態から少し変化すれば長期的に職場は x = 0 か x = 1
の状態に収束し, x = 0 の状態と x = 1 の状態は少し変化しても元に戻るので,
(M-OS, M-OS), (W-OS, W-OS) が進化的に安定なナッシュ均衡点である.
EM
1 x
2
3
(3) 職場の状態が (nW,(6 − n)M) であるとする. 但し, 0 5 n 5 6.
今期に W タイプが OS を買い換える個人に選ばれた場合, この W タイプの他の状態は ((n − 1)W,(6 − n)M) であ
2(n−1)
6−n
る. この W タイプが新しい W-OS に買い換える時の期待利得は, n−1
であり, M-OS に買い換
5 ·2+ 5 ·0=
5
4(6−n)
6−n
n−1
える時の期待利得は, 5 · 0 + 5 · 4 = 5 である. よって,
「W タイプが新 W-OS に買い換える」⇐⇒
2(n − 1)
4(6 − n)
13
>
⇐⇒ n >
⇐⇒ n = 5
5
5
3
今期に M タイプが OS を買い換える個人に選ばれた場合, この M タイプの他の状態は (nW,(5 − n)M) である. こ
2n
の M タイプが W-OS に買い換える時の期待利得は, n5 · 2 + 5−n
5 · 0 = 5 であり, 新しい M-OS に買い換える時の期
4(5−n)
待利得は, n5 · 0 + 5−n
である. よって,
5 ·4=
5
「M タイプが W-OS に買い換える」⇐⇒
2n
4(5 − n)
10
>
⇐⇒ n >
⇐⇒ n = 4
5
5
3
従って,
・W タイプが増加する ⇔「M タイプが W-OS に買い換える」⇔ n = 4.
・W タイプが減少する ⇔「W タイプが M-OS に買い換える」⇔ 1 5 n 5 4.
・状態が不変 ⇔「W タイプが新 W-OS に買い換える」または「M タイプが新 M-OS に買い換える」⇔ n = 5 また
は n 5 3.
以上により, 状態間の推移図は以下の様になる:
1
y
(0W,6M)
5
6
1
6
y
(1W,5M)
2
3
1
3
y
(2W,4M)
1
2
1
2
y
(3W,3M)
5
6
2
3
(4W,2M)
1
3
y
(5W,M)
1
6
1
y
(6W,0M)
状態間の推移確率は次の例の様に求められる. 例えば,「(4W,2M)→(5W,M)」の推移確率は状態 (4W,2M) の時に
M タイプが OS を買い換える個人に選ばれる確率なので 26 = 13 . また例えば,「(2W,4M)y(2W,4M)」の推移確率は
状態 (2W,4M) の時に M タイプが OS を買い換える個人に選ばれる確率なので 46 = 23 .
2