ゲーム理論(第2回)

ゲーム理論・ゲーム理論Ⅰ
(第2回)
第2章 戦略形ゲームの基礎
2014年4月18日
担当 古川徹也
2014/04/18
1
今日の講義
• 教科書第2章「戦略形ゲームの基礎」より,
2.1
戦略形ゲームと利得行列
2.2
戦略形ゲームを解く
の2つの節の大事な点を説明する。
2014/04/18
2
2.1.1 プレイヤー・戦略・利得
• 戦略形ゲームは,プレイヤー,戦略,利
得の3つを明らかにすることによって表
現できる。
• これらをゲームの基本3要素と呼ぶこと
がある。
• 与えられた状況をゲームとして表現する
場合,最低この3つは定義されていなけ
ればならない。
2014/04/18
3
プレイヤー・戦略・利得(続き)
• プレイヤー
意思決定を行う主体(個人,企業等)
• 戦略
プレイヤーが選択可能な行動。複雑な
ゲームでは,行動スケジュールを指す
• 利得
戦略の組として表現される結果に対して,
プレイヤーの好みを表す数値
2014/04/18
4
モデル1
プレイヤー
戦略
利得
A駅 1200
B駅 300
2014/04/18
I市コンビニ戦争PART 1
セレブとファミモ
セレブ
A駅に出店する,B駅に出店する
ファミモ
A駅に出店する,B駅に出店する
セレブの戦略
ファミモの戦略
セレブの利得
ファミモの利得
A駅
A駅
400
800
A駅
B駅
1200
300
B駅
A駅
300
1200
B駅
B駅
100
200
5
モデル2
プレイヤー
戦略
利得
A駅 600
B駅 300
2014/04/18
I市コンビニ戦争PART 2
セレブとファミモ
セレブ
A駅に出店する,B駅に出店する
ファミモ
A駅に出店する,B駅に出店する
セレブの戦略
ファミモの戦略
セレブの利得
ファミモの利得
A駅
A駅
200
400
A駅
B駅
600
300
B駅
A駅
300
600
B駅
B駅
100
200
6
2.1.2 利得行列を作って考えよう
モデル1の利得行列
ファミモ
A駅
B駅
A駅
(400,800)
(1200,300)
B駅
(300,1200)
(100,200)
セレブ
左がセレブ,右がファミモの利得
2014/04/18
7
モデル2の利得行列
ファミモ
A駅
B駅
A駅
(200,400)
(600,300)
B駅
(300,600)
(100,200)
セレブ
左がセレブ,右がファミモの利得
2014/04/18
8
2.2 戦略形ゲームを解く
2.2.1 ゲームを解く
• ゲームを用いて分析することの最終目的
は,モデル化されたゲームでどのプレイ
ヤーがどのような行動をとるかを予想す
ること。
• 予想される結果をゲームの解と呼ぶ。
• ゲームの解を求めることをゲームを解く
と言う。
2014/04/18
9
ゲームを解く思考方法
 第1ステップ まずゲームの中のプレイヤー
ごとの視点に立ち,そのプレイヤーの立場に
なって考える。
 第2ステップ 自分が考えているプレイヤー
以外が選択したすべての戦略に対して,どの
戦略が一番高い利得を与えるか考える。
 第3ステップ すべての戦略に対して検討し
たら,次に別のプレイヤーの視点に立ち,第
2ステップを続ける。すべてのプレイヤーに
対してこれを検討する。
2014/04/18
10
2.2.2 支配戦略を探せ
• 定義(支配戦略) あるプレイヤーのある戦
略が,他のプレイヤーのすべての戦略に対し
て,他のどんな戦略よりも高い利得を与える
とき,その戦略はそのプレイヤーの支配戦略
と呼ばれる。
• 自分に支配戦略があるときは,それを選択す
る。相手に支配戦略があるときは,相手は間
違いなくその戦略を選ぶはずである。
• 支配戦略均衡:支配戦略の組み合わせ。
→もっとも簡単で明快なゲームの解である。
2014/04/18
11
モデル1とモデル2
• モデル1には,両プレイヤーに支配戦略
が存在するので,支配戦略均衡も存在す
る。
• モデル2には,両プレイヤーに支配戦略
が存在するわけではないので,支配戦略
均衡も存在しない。
→確認せよ!
2014/04/18
12
図2.7 成果主義のジレンマ
B君
A君
協力する
協力する
協力しない
(4,4)
(-6,10)
協力しない (10,-6)
(0,0)
左がA君,右がB君の利得
2014/04/18
13
図2.9 囚人のジレンマ
囚人2
囚人1
黙秘
自白
黙秘
(-1, -1) (-10, 0)
自白
(0,-10) (-5, -5)
左が囚人1,右が囚人2の利得
2014/04/18
14
2.2.4 最適反応戦略を考える
• 定義(最適反応戦略) 他のプレイヤー
の戦略に対して,自分の利得を最大にす
る戦略を,(その戦略に対する)最適反
応戦略と呼ぶ。
2014/04/18
15
モデル2の利得行列
ファミモ
A駅
B駅
A駅
(200,400)
(600,300)
B駅
(300,600)
(100,200)
セレブ
左がセレブ,右がファミモの利得
2014/04/18
16
モデル2について
• セレブについては
(1) ファミモの「A駅」に対する最適反応戦略は「B駅」
(2) ファミモの「B駅」に対する最適反応戦略は「A駅」
→ 支配戦略はない
• ファミモについては
(1) セレブの「A駅」に対する最適反応戦略は「A駅」
(2) セレブの「B駅」に対する最適反応戦略は「A駅」
→ 「A駅」が支配戦略
• このとき,ファミモが「A駅」,セレブが「B
駅」という組み合わせがゲームの解
2014/04/18
17
2.2.5 小国の交渉力
大国の利得
小国の利得
交渉決裂
(強硬,強硬)
1
2
大国がすべて負担
(妥協,強硬)
2
4
大国と小国が負担等分
(強硬,妥協)
4
1
大国が負担80%
(妥協,妥協)
3
3
カッコ内は,左が大国,右が小国の選択
2014/04/18
18
図2.12 「小国」の利得行列
小国
強硬
妥協
強硬
(1, 2)
(4, 1)
妥協
(2, 4)
(3, 3)
大国
左が大国,右が小国の利得
2014/04/18
19
図2.12 「小国モデル」の利得行列
小国
強硬
妥協
強硬
(1, 2)
(4, 1)
妥協
(2, 4)
(3, 3)
大国
小国にとっては「強硬」が支配戦略
2014/04/18
20
図2.12 「小国」の利得行列
小国
強硬
妥協
強硬
(1, 2)
(4, 1)
妥協
(2, 4)
(3, 3)
大国
大国は「妥協」を選び,小国は最良
の結果を得る→瀬戸際戦略
2014/04/18
21
弱い方が最良の結果?
• 小国は自らの弱い立場を利用して,相手
に「妥協しない」というコミットメント
を大国に与えることができる。
• 大国は,小国が「妥協しない」ことを前
提として自らの利得を最大にするから,
「妥協」を選ばざるをえなくなる。
2014/04/18
22