行列ゲーム

.
.
行列ゲーム
ぜん だおず
曽 道 智
Zeng, Dao-Zhi
東北大学
2015 年 4 月 28 日
1 / 15
行列ゲーム I
戦略形ゲーム (game in strategic form)
標準形ゲーム (game in normal form)
例
B社
A社
新製品を販売
現状維持
新製品を販売
現状維持
50%, 50%
30%, 70%
70%, 30%
50%, 50%
定義 G = (N, {Si }i∈N , { fi }i∈N )
N: プレイヤーの集合
Si : プレイヤー i の戦略の集合.
∏
fi : i∈N Si → R, プレイヤー i の利得関数.
fi (s1 , · · · , si )
以上の情報は共有知識 (common knowledge)
2 / 15
行列ゲーム II
ゼロ和ゲーム, 定和ゲーム
n
∑
fi (s1 , · · · , s n) = K
i=1
(双) 行列ゲーム: 有限個の戦略、2 人の場合

···
(a1n, b1n)
 (a11 , b11 )

.
..
..

(ai j , bi j )
.

(a n1 , b n1 )
···
(a nn, b nn)
囚人のジレンマ, prisoner’s dilemma
囚人 2
黙秘
囚人 1
黙秘
5, 5
自白
6, −4





自白
−4, 6
−3, −3
3 / 15
行列ゲーム III
男女の争い battle of the sexes
女
ボクシング
男
ボクシング
2, 1
バレエ
−1, −1
バレエ
−1, −1
1, 2
4 / 15
Nash 均衡 I
プレイヤー i の戦略 si ∈ Si が他の n − 1 人のプレイヤー
の戦略の組 s−i = (s1 , · · · , si−1 , si+1 , · · · , s n) に対する最
適応答 (best response):
fi (si , s−i ) = max fi (t i , s−i )
t i ∈Si
最適応答の全体 Bi (s−i )
Nash 均衡点 s∗ = (s∗1 , · · · , s∗n) ⇔ s∗i ∈ Bi (s∗−i ), ∀i
予想と最適戦略が整合的
(i) すべてのプレイヤーが他のプレイヤーの戦略に対する
最適応答となる戦略を選択する
(ii) すべてのプレイヤーが他のプレイヤーが選択する戦略
を正しく推測する
の条件が必要.特に (ii) は厳しい.
5 / 15
Nash 均衡 II
2 人ゼロ和ゲームの場合, 均衡点 = 鞍点
f (s1 , s∗2 ) ≤ f (s∗1 , s∗2 ) ≤ f (s∗1 , s2 )
存在するも保障されない
硬貨合わせゲーム (matching pennies)
兄
表
裏
弟
表
−1, 1 1, −1
裏
1, −1 −1, 1
ジャンケン
唯一性も保障されない. どちらの均衡を予測する?
C
D
C
D
A 100, 100 0, 0
A 9, 9 0, 8
B
0, 0
1, 1
B 8, 0 7, 7
6 / 15
Nash 均衡 III
E
A
B
C
D
100, 100
0, 0
0, 0
0, 0
F
G
0, 0
0, 0
0, 0 100, 100
99, 99
0, 0
0, 0
0, 0
H
0, 0
0, 0
0, 0
100, 100
7 / 15
支配戦略 I
プレイヤー i の戦略 si が戦略 t i を支配する (dominate)
とは、 fi (si , s−i ) > fi (t i , s−i ) が任意の s−i ∈ S−i に対して
成り立つことである
弱 (い) 支配: > ⇒ ≥
囚人のジレンマの「自白」が「黙秘」を支配する
すべてのプレイヤーに強支配戦略が存在すれば,その
組は純粋戦略の範囲においてこのゲームのナッシュ均
衡であり,それ以外にはナッシュ均衡は存在しない
プレイヤーの戦略が他のすべての戦略を強(弱)支配す
る場合,強(弱)支配戦略 (dominant strategy) という.
強支配される戦略の逐次消去
強支配される戦略を除去し、残った戦略だけを用いる
戦略形ゲームを考える
L
M
R
U 1, 0 1, 2 0, 1
D 0, 3 0, 1 2, 0
8 / 15
支配戦略 II
強支配される戦略を逐次消去する場合,最終的に残る
戦略は除去する順番に依存しない.
強支配される戦略の逐次消去により,唯1つの戦略の
組が残ったとすれば,この戦略の組は純粋戦略の範囲
においてこのゲームのナッシュ均衡であり,これ以外に
はナッシュ均衡は存在しない.
戦略の組が純粋戦略の範囲においてナッシュ均衡であ
れば,各戦略が強支配される戦略の逐次消去により消
去されることはない.
弱支配される戦略の逐次消去により,唯1つの戦略の
組が残ったとすれば,この戦略の組は純粋戦略の範囲
においてこのゲームのナッシュ均衡である.
戦略の組 s = (s1 , · · · , s n) がパレート最適 (Pareto
optimal) であるとは、 fi (t) > fi (s) となる戦略の組 t ∈ S
が存在しないことである。
均衡点は必ずしも Pareto optimal ではない
9 / 15
混合戦略 I
純戦略 (pure strategy)
混合戦略 (mixed strategy). 確率的に純戦略を利用
G = (N, {Si }i∈N , { fi }i∈N ) の混合拡大 (mixed extension)
G∗ = (N, {Qi }i∈N , {Fi }i∈N )
Qi は Si 上の確率分布の全体である。その要素 qi がプレ
イヤー i の混合戦略
∏
Fi : i∈N Qi → R, 期待利得関数
Fi (q1 , · · · , q n) =
∑
s1 ∈S1
···
n
∑{∏
s n∈S n
}
q j (s j ) fi (s1 , · · · , s n)
j=1
最適応答
Bi (q−i ) = {qi ∈ Qi |Fi (qi , q−i ) = max ri ∈Qi Fi (ri , q−i )}
B(q) = B1 (q−1 ) × · · · × B n(q−n)
10 / 15
混合戦略 II
均衡点 q∗ ⇔ q∗ ∈ B(q∗ )
不動点
支配戦略, Pareto 最適も同様
混合戦略による実現可能集合 (feasible set)
U = {(F1 (q), · · · , F n(q))|q ∈ Q} が有界な閉集合
(compact)
図 2.2, 2.3: 囚人のジレンマ, 男女の争いゲームの実現可
能集合
11 / 15
均衡点の存在
Nash 定理 n 人有限ゲーム G において、混合戦略の範囲
で少なくとも 1 つの均衡点が存在する
ミニマックス定理 ゼロ和 2 人ゲームにおいて
max min F(q1 , q2 ) = min max F(q1 , q2 )
q1 ∈Q1 q2 ∈Q2
q2 ∈Q2 q1 ∈Q1
複数の均衡があるかも。リスク支配による選択
12 / 15
無限ゲーム I
人数が無限, 独占競争への発展
戦略数が無限, 連続ゲーム
利得関数の連続条件
Melvin Dresher 著 The Mathematics of Games of
Stragegy: Theory and Application P.115
両プレーヤーの戦略空間 X = Y = [0, 1]
Player 1 の利得関数 f (·, ·) と Player 2 の利得関数 g(·, ·)


0
for x = y



−1
for x = 1, y < 1; and x < y < 1
f (x, y) = − g(x, y) = 


 +1 for y = 1, x < 1; and y < x < 1.
プレーヤー 1 の混合戦略 F(x) とプレーヤー 2 の純戦略
y の対戦によるプレーヤー 1 の利得は、
13 / 15
無限ゲーム II
(i) y ∈ (0, 1) の場合に、
∫
π(F, y) =
1
f (x, y)dF(x)
x=0
∫
y−0
= −1
∫
1−0
dF(x) + 1
0
∫
dF(x) − 1
y+0
1
dF(x)
1−0
= −1 + 2F(1 − 0) − [F(y − 0) + F(y)]
≤ −1 + 2[F(1 − 0) − F(y − 0)];
(ii) y = 0 の場合に、
∫
π(F, y) = +1
1−0
0+0
∫
dF(x) − 1
1
dF(x)
1−0
= 2F(1 − 0) − 1 ≥ −1 + 2[F(1 − 0) − F(y − 0)]
14 / 15
無限ゲーム III
(iii) y = 1 の場合に、
∫
1−0
π(F, y) = +1
∫
1
dF(x) − 1
dF
0
1−0
= 2F(1 − 0) − 1 ≥ −1 + 2[F(1 − 0) − F(y − 0)]
よって、どんな F(x) とどんな ϵ ∈ (0, 1/2) に対して、
π(F, y0 ) ≤ −1 + ϵ を満たす y0 が存在する。
inf π(F, G) ≤ −1 + ϵ ⇒ sup inf π(F, G) ≤ −1 + ϵ.
G
G
F
同様に、inf G sup F π(F, G) ≥ 1 − ϵ もあるので、
inf sup π(F, G) > sup inf π(F, G)
G
F
F
G
が成立し
混合戦略による均衡は存在しない
15 / 15