支配戦略と囚人のジレンマ

ゲーム理論(2015 年度後期)
教授 清水大昌
第 3 回 2015 年 10 月 07 日
[email protected]
http://www-cc.gakushuin.ac.jp/˜20060015/lecture/game2015.html
今回は 2 × 2 ゲームでもっとも有名な「囚人のジレンマ」を紹介し、関連する「支配戦略」とい
う概念を扱う。
前回の復習
以下のゲームの最適反応とナッシュ均衡を求めてください。
A
B
Up
Down
Left
9 , 5
11 , 4
B の戦略「Left」に対しての A の最適反応:
B の戦略「Right」に対しての A の最適反応:
A の戦略「Up」に対しての B の最適反応:
A の戦略「Down」に対しての B の最適反応:
ナッシュ均衡は (
,
)
Right
8 , 7
5 , 8
A
B
Up
Middle
Down
Left
5 , 3
8 , 1
3 , 6
Center
7 , 6
1 , 4
6 , 7
Right
3 , 5
7 , 3
1 , 1
囚人のジレンマ
• 経済学でよく見られるゲームの形。
• 良い結果と悪い結果があるときに、悪い結果のみがナッシュ均衡で得られる。プレーヤー
がそれぞれ自分の利得を最大にしようとしても、均衡では最大にならない。
金田一 江戸川
黙秘
自白
黙秘
−3 , −3
0 , −15
自白
−15 , 0
−8 , −8
利得表: 囚人のジレンマ
• 金田一と江戸川はある事件の共犯者。警察に捕まり別々に取調べを受けている。お互いは
連絡できない。
– 2人とも「黙秘」すれば証拠不十分のため 3 年の刑 (−3 の利得)
– 2人とも「自白」すれば、証拠はあるが情状酌量をされて 8 年の刑 (−8)
1
– 1人が「自白」して1人が「黙認」すれば、「自白」した方は証拠を提出し、司法取
引が成立して無罪か執行猶予で放免 (0)、「黙認」した方は全ての罪をかぶらされて、
情状酌量もされずに懲役 15 年 (−15) となる。
• このとき、ナッシュ均衡は何か?
=⇒
金田一も江戸川も相手の行動に関わらず自白
したほうが良い。よって、均衡は (自白、自白)。
しかし、二人とも「黙秘」すれば懲役3年で済んだはずだが · · ·。これがジレンマ。
• 江戸川はこれを考えて「黙秘」した方が良いと考えたとする。でも、金田一はやはり「自
白」するほうが得になっている。
• ナッシュ均衡のときの利得は (黙秘, 黙秘) の利得にパレート支配されている。ナッシュ均
衡利得以外はすべてパレート効率的。
• 囚人のジレンマが起こる理由としては、「自白」のような戦略が外部不経済をもたらして
いることが挙げられる。
金田一 江戸川
黙秘
自白
黙秘
−3 , −3
0 , −15
自白
−15 , 0
−8 , −8
囚人のジレンマの例: 数量競争
• 企業は、相手の生産量が与えられた下では、自分の生産量を多めにしたい。
しかし、両方の企業がそうしたら、お互いの利潤は下がってしまう。
• 例えば、逆需要関数を p = 120 − q 、q1 + q2 = q として、限界費用と固定費用が 0 である 2
企業の競争を考えよう。
• ここでの独占生産量は 60 なので、例えば両社とも 30 の生産をすると共同利潤は最大とな
る。一方、数量競争で扱われるクールノー均衡時の生産量は 40 となる。これをまとめる
と次の表となる。
企業1 企業2
生産規模縮小 (30)
生産規模拡大 (40)
縮小
1800 , 1800
2000 , 1500
拡大
1500 , 2000
1600 , 1600
• 囚人のジレンマから回避するため、企業は談合をして、お互いが生産規模を縮小しようと
取り決めたい。しかし、この行動は社会厚生には悪い影響を与える。
• このため、公正取引委員会による独占禁止法を使った介入が必要となるのである。
• 価格競争でも同様の議論ができるので、考えてみてほしい。
2
支配戦略
• ここで新たな概念を紹介しよう。
• 戦略 1 と戦略 2 を比べて、
「相手がどのような戦略を採ってきても」戦略 1 の方が戦略 2 よ
り高い利得を得られる場合、戦略 1 は戦略 2 を支配するという。逆に戦略 2 は戦略 1 に支
配されるという。
• ある戦略がほかの戦略を全て支配している場合、その戦略を支配戦略という。
• 言い換えれば、相手のどの戦略に対しても、自分のある戦略が最適反応になっていれば、
その戦略は支配戦略となっている。
• 支配戦略があれば、その戦略を採用するのは自分の合理性だけに依存しているので、ゲー
ム理論的相互作用について考える必要がなくなる。
• また、支配される戦略も採用されないだろう。この辺りを次に突き詰めて考えていこう。
強支配戦略
• 戦略 1 と戦略 2 を比べて、
「相手がどのような戦略を採ってきても」戦略 1 の方が戦略 2 よ
り 必ず 高い利得を得られる場合、戦略 1 は戦略 2 を強支配するという。逆に戦略 2 は戦略
1 に強支配されるという。
• ある戦略がほかの戦略を全て強支配している場合、その戦略を強支配戦略という。
• 囚人のジレンマでは「自白」戦略が「黙秘」戦略を強支配しているので、強支配戦略になっ
ている。
• 全てのプレーヤーが強支配戦略を持つとき、それらの戦略の組を強支配戦略均衡と呼ぶ。
強支配戦略均衡はナッシュ均衡であるが、逆は成り立たない。
弱支配戦略
• 戦略 1 と戦略 2 を比べて、「相手がどのような戦略を採ってきても」戦略 1 の方が戦略 2
より 必ず高いか等しい 利得を得られ、
「相手の戦略によっては利得が高い場合もある」場
合、戦略 1 は戦略 2 を弱支配するという。逆に戦略 2 は戦略 1 に弱支配されるという。
• ある戦略がほかの戦略を全て強支配または弱支配している場合、その戦略を弱支配戦略と
いう。
• 全てのプレーヤーが弱支配戦略を持つとき、それらの戦略の組を弱支配戦略均衡と呼ぶ。
弱支配戦略均衡はナッシュ均衡であるが、逆は成り立たない。
• 強支配戦略も弱支配戦略も存在しない場合が多く、よってナッシュ均衡より一般的に使い
勝手は良くないが、もし存在する場合にはそこに注目するとよい。
3
ペプシコーラ
コカ・コーラ
最小限の広告
大々的な広告
最小
50 , 50
80 , 10
A さん B さん
我慢する
付ける
大々的
10 , 80
40 , 40
軍備縮小
10 , 10
15 , 0
日本 ASEAN
自由貿易
保護貿易
軍備拡大
0 , 15
2 , 2
利得表: 冷戦
付ける
0 , 5
1 , 1
利得表: 暑い夏・クーラー
利得表: 広告。広告費が 10 掛かる状況。
アメリカ ソ連
軍備縮小
軍備拡大
我慢する
3 , 3
5 , 0
自由貿易
100 , 80
150 , 20
保護貿易
50 , 120
70 , 40
利得表: 貿易自由化交渉
囚人のジレンマの例
• 上に囚人のジレンマが経済学(など)で出現する例を 4 つ紹介した。
1
2
制限
乱獲
制限
100 , 100
150 , 20
1
乱獲
20 , 150
40 , 40
2
制限
乱獲
制限
100 , 100
50 , 20
乱獲
20 , 50
−60 , −60
• 続いて「共有地の悲劇」という例を紹介する。
• 漁業を考えよう。魚を獲るときには、将来のことも考えなければならない。よって、漁の
組合同士で自己制限を課そうと考える。
• しかし、相手がどちらの戦略を採っても、自分は乱獲をしたほうが儲かる。よって、囚人
のジレンマとなり、お互い乱獲してしまう。
• このような乱獲を防止するためには、罰則規定を設ければよい。つまり、乱獲したら罰金
−100 を支払うとする。すると、利得は右の図のように変わり、ナッシュ均衡では制限し
た漁が行われるようになる。
• このように、どのような場合に協調を支援し(漁業、貿易、冷戦)、いつ阻害する(数量
競争)ことが、政府や公共機関にとって望ましいかを考える必要がある。
まとめと次回
• 囚人のジレンマはパレート支配されている利得の組がナッシュ均衡(支配戦略均衡)と
なる。
• 強支配と弱支配について。「∼する」「∼される」も。
• 政策として、どのような場合に協調を支援し(漁業、貿易、冷戦、環境税)、いつ阻害す
る(数量競争)ことが、政府や社会全体にとって望ましいかを考える必要がある。
4