ゲームの理論 - Simulating Theoretical Models of

ゲーム理論:パソコンによるシ
ミュレーションを用いた入門
Dec 2003.
revised: 31 Dec 2003.
ゲームの分類
• ある哲学者は、「ゲーム」という言葉に共通する意味はないと
指摘した。家族のように、互いに似てはいるが、家族である
という以外に共通点はない。これを家族的類似という。
• しかし数学者は次のような特徴を、ありふれたゲームの種類
からとりだした。それはむしろボードゲームやコンピュータ
ゲームではなく、企業の市場戦略や社会のしくみにあてはま
る。
• ゲームフォーム:戦略形、展開形、反復、提携形など
• 以下では戦略形ゲーム(あるいは標準形ゲーム)にしぼって
説明する。ゲームの参加者(プレイヤー)、各参加者のとりう
る行動、およびゲームの結果、すなわちすべての参加者がと
る行動の組に対してどのような利得(ないし費用)がそれぞ
れの参加者において発生するか。
さらに進んだゲーム分析では、手番の順序、それによって発生する情報、
他のプレイヤーのふるまいや情報にかんする信念などが導入される。
例。じゃんけん
• プレイヤー:任意のN人。ただし、同時にプレイすることがで
きるのは、事実上2人から5、6人くらいまでであろう。
• プレイヤーの(純粋)戦略:石とハサミと紙。
• ゲームの結果と利得:どのプレイヤーも勝ち負け引き分けの
いずれかの状態をとる。ただし、勝ち負けのルールにしたが
う。また、たとえば勝ちが1点、負けが-1点、引き分け0点と
して利得を定義する。
• 手番についてのルール:同時手番。つまり戦略形ゲーム。
• 勝ち負けのルール:石はハサミより強く、紙は石より強く、ハ
サミは紙より強い。全員が同じ戦略か、あるいは最も強い戦
略を使ったプレイヤーがいなければ引き分け。
• ナッシュ均衡:明らかに、つねに一番強い純粋戦略もまた純
粋戦略ナッシュ均衡もない。ただし、ランダム戦略では各人
すべての戦略を等確率1/3で出すのが、混合均衡になる。
ゲームの戦略と均衡点
• もちろんゲーム理論はゲームそのものを定式化す
るだけではない。ゲームを定式化したら、その結果
を予測することになる。これをゲームの解とか、ゲー
ムの均衡という。
• ゲームの解はゲームの種類によっていろいろ使い
分けされている。大きく分けると、非協力ゲーム理論
におけるナッシュ均衡と、協力ゲームにおけるコア、
仁、シャプレー値などである。
• ナッシュ均衡は、 (テキストに出ている)0和ゲーム
におけるミニマックス解の一般化である。またランダ
ム化された戦略を使える場合に、混合戦略均衡な
いし混合均衡と呼ばれる。
フォン・ノイマンらによるミニマックス均衡の存在証明やJ. ナッシュによる有限ゲー
ムでのナッシュ均衡(混合均衡)の存在証明は、この分野の初期の成果である。
ナッシュ均衡
• 最適反応戦略の組によって定義される。
• ナッシュ均衡はN人非ゼロ和利得の場合、つ
まり各プレイヤーにそれぞれ別の利得表があ
る場合にも使える。
• ゼロ和ゲームのミニマックス均衡は、(純粋戦
略の)ナッシュ均衡と一致する。
• 練習問題:適当な2人ゼロ和ゲームを選び、
これを確認しなさい。
2人2戦略の非協力ゲームの例
•
•
•
•
•
「男女のいさかい」は2つのナッシュ均衡がある
が、お互いうまく協調できるかどうかは分からな
い。右図のケースでは混合均衡は50%-50%で
はなく、1/3-2/3となる。つまり両者とも3回中2回
は自分の好む均衡が実現する可能性に賭け、
残りは相手の側に譲る。このとき両者とも期待
利得は2/3である。
利得がともに1,0,0,1 の場合を、協調ゲーム
という。混合均衡は50%-50%となる。(a,0,0,b
に一般化したときの均衡はどうなるか?)
「チキン」(弱虫)はやはり2つのナッシュ均衡が
ある男女のいさかいタイプのゲームだが、一方
が譲らなかった場合の損失は甚大な場合の変
種と考えてよい。またこうしたゲームでは信号
(相関戦略)をうまく使うと混合均衡よりもよい結
果が得られることがある。
「囚人ジレンマ」はフラッド&ドレッシャーの実験
をランド研究所のタッカーが紹介して以来、この
分野の文献をにぎわせてきた。このゲームには
両者の裏切りという均衡しかない。
なおアクセルロッドらは、コンピュータプログラム
を使って、前回の相手の行動を真似る「お返し」
プログラム(Tit For Tat)がトーナメント実験でよ
い成績を収めたと報告してまた話題になった。
payoff for 1
s21
s11
s12
payoff for 2
s21
s11
s12
s22
1
0
0
2
s22
2
0
0
1
男女のいさかい
payoff for 1
s21
s11
s12
payoff for 2
s21
s11
s12
囚人ジレンマ
s22
3
4
-10
-5
s22
3
-10
4
-5
定和ゲームの例題
テキストの例題2のゼロ和ゲームで共通利益10とした場合。
A の利得行列 f(A ,B ;10)
B1
B2
A1
7
A2
3
A3
2
B の利得行列
B1
A1
A2
A3
B3
6
3
7
B2
3
7
8
B4
4
2
3
B3
4
7
3
5
6
1
←各列で
最大値を
選ぶ
B4
6
8
7
5
4
9
←各行で
最大値を
選ぶ
土田(2001)の0和ゲームの例題。A1-B3がミニマックス均衡、かつ純粋戦略ナッシュ均衡である。相手の
最適反応を仮定することにより、保証水準を考えた慎重な行動を導く。
例.クールノーの複占モデル
クールノーは市場価格 の下で複占企業が競争的に生産量を決める状 況を分析した。
それは今日のゲーム理 論で言うナッシュ均衡 の考え方を先取りした ものであった。
企業Aと企業 Bが同一の製品を同一の 市場で製造販売する。
Aがx単位、 Bがy単位をそれぞれ販 売する。
また需給が均衡する価 格pは以下のようであ
るとする。
p  maxa  x  y , 0
a   x  y  if a  x  y

0 otherwise

まず A社の最適反応戦略は、
arg max A  if y  a
x
SA  
0 if y  a

すなわち
S B  max0.5a  c  y , 0 .
同様にB社の最適反応戦略は、
製造費用はそれぞれの社で、 cxと cyである。
したがってその利潤は 、次のようである。
 A  px  cx  maxa  x  y , 0  c   x
 B  py  cy  maxa  x  y , 0  c   y
arg max B  if x  a
x
SB  
0 if x  a

すなわち
S B  max0.5a  c  x , 0 .
ナッシュ均衡は両社の 最適反応曲線の交点である
(次のスライド参照)
両社の戦略はそれぞれ自社の生産量(=販売 量)を決めることであ
る。
ナッシュ均衡は、両者 の戦略がともに最適反 応の場合として定義さ れる。
。
クルーノーの複占モデルにおけるナッ
シュ均衡
内点( x  0, y  0)でのナッシュ均衡は連 立方程式
 x  0.5a  c  y 

 y  0.5a  c  x 
の解である。
最適応答曲線とナッシュ均衡
120
すなわち、
100
x  0.5a  c  0.5a  c  x 
 x  0.25a  c   0.25x
y
80
 x  y  a  c  3.
Aの最適反応
B の最適反応
60
図は最大需要a=100,
変動費用c=10としたとき、A社とB社
の最適反応戦略を表す。
40
20
0
0
50
100
150
これはエクセルによってクルーノーモ
デルを簡易シミュレーションした結果
をグラフ化したものである。
x
ただし戦略x,yはそれぞれ0から100
まで10単位ずつに区切った。ぎざぎ
ざはそのため。
混合戦略のナッシュ均衡
• 各プレイヤーが各自の純粋戦略をミックス(ランダム
化)して使える場合、各プレイヤーの使う混合戦略
はその純粋戦略の確率分布となる。
• 混合戦略のナッシュ均衡は、定義どおり、誰も自分
だけ確率を変えても、自分自身の利得が増えない
状態である。
• 純粋戦略での均衡がないゲームを含めて、有限で
あれば、混合戦略の均衡は必ず存在する(ナッシュ
の定理)。
サドルポイント(鞍点)の例題
• 例題(土田, 2000)の0和
ゲームにおける期待利得を
計算し、グラフ化しよう。
• そのサドルポイント(鞍点)
が混合戦略におけるゲー
ムの均衡点である。
テキストp.87のゲームの混合戦略と期待利得(表9.6)
7
6
5
4
The SaddlePo int
max min pAqT  min maxpAqT
3
where
2
pS1
 5 2  q 


pAqT   p 1  p 
3
7
1

q



90
80
70
60
100
P1(
A 1) %
S4
50
5 2

A  
3
7


0
S10
S7
40
q  q 1  q 
1
30
p   p 1 p
20
qS 2
0
10
pS1 qS 2
S1
P2(B 2)
表による均衡の確認
• おおよその位置は前頁のグラフの元になっている表によって
も確認できる。
• また均衡点(サドルポイント)の付近では、両者の期待利得は
ほとんど動かなくなることに注意せよ。
このあたりに鞍点(ナッシュ均衡)がある。
混合戦略の下での利得表
(%)
P (y=B )
P (x=A )
0
10
20
0
7
6.5
6
10
6.5 6.08 5.66
20
6 5.66 5.32
30
5.5 5.24 4.98
40
5 4.82 4.64
50
4.5
4.4
4.3
60
4 3.98 3.96
70
3.5 3.56 3.62
80
3 3.14 3.28
90
2.5 2.72 2.94
100
2
2.3
2.6
M AX
7
6.5
6
B R _x
0
0
0
30
5.5
5.24
4.98
4.72
4.46
4.2
3.94
3.68
3.42
3.16
2.9
5.5
0
40
5
4.82
4.64
4.46
4.28
4.1
3.92
3.74
3.56
3.38
3.2
5
0
50
4.5
4.4
4.3
4.2
4.1
4
3.9
3.8
3.7
3.6
3.5
4.5
0
60
4
3.98
3.96
3.94
3.92
3.9
3.88
3.86
3.84
3.82
3.8
4
0
70
3.5
3.56
3.62
3.68
3.74
3.8
3.86
3.92
3.98
4.04
4.1
4.1
100
80
3
3.14
3.28
3.42
3.56
3.7
3.84
3.98
4.12
4.26
4.4
4.4
100
90
2.5
2.72
2.94
3.16
3.38
3.6
3.82
4.04
4.26
4.48
4.7
4.7
100
100 M IN B R _y
2
2
2.3
2.3
2.6
2.6
2.9
2.9
3.2
3.2
3.5
3.5
3.8
3.8
4.1
3.5
4.4
3
4.7
2.5
5
2
5
100
100
100
100
100
100
100
100
0
0
0
0
•なお、ワークシートで数式とその値の表示を切り替えるには、Ctrl キーと ` キー(シフトを押して@のキー)を押します。
数式による混合均衡の導出
それらの交点がサドル ポイント
• 例題のような簡単な場合は、テ
キストにも紹介されているよう
に、初等的な方法で混合均衡
を求めることができる。
• 以下では2次形式での期待利
得からの別の解き方を示すが、
直接期待利得を求めてもよい。
サドルポイントを求める段は、
因数分解による初等的なもの。
サドルポイントの定義
式中の2次形式を計算すると
 5 2  q 
 5q  21  q 

   p 1  p 

pAqT   p 1  p 


3
7
1

q
3
q

7
1

q





 p5q  21  q   1  p 3q  71  q 
となる。
Aはこの値を最大化しよ うとしてpを0と1の
また Bはこれを最小化しよう
pないしqのいずれか
間で選ぶ。
として同様にqを動か
す。
を固定すると、高々、
1次式であることに注意 する(テキストの図9
.1参照)。
(そして混合戦略ナッ
シュ均衡)である。
それぞれpとqで偏微
分して 1階条件を連立させて解 く。
あるいは以下のように
変形することによって
も
ゲームの値と均衡戦略 が分かる。
pAqT  p3q  2   1  p 7  4q 
 p3q  2   7  4q  7  4q 
 p7 q  5  7  4q 
5 
7

 7 p q    4 q  
7 
4

5 
5 5 7

 7 p q    4 q    
7 
7 7 4

5 
5 5 7

 7 p q    4 q    4  
7 
7 7 4

5   45  7 7 

 7 p  4  q    4

7 
4 7 

4 
5   29 

 7 p   q    4 
7 
7   28 

4 
5  29

 7 p   q   
7 
7 7

4
5

すなわち均衡における 混合戦略は p  , q  、
7
7

29
Aに対する保証利得は となる。
7
練習問題
• 男女のいさかいゲームの混合均衡を求めな
さい。
男女のいさかいの混合均衡の導出
• 例題にならって男女のいさかいゲームの混合均衡を求める。
まず両プレイヤーの期 待効用を2次形式により計算する 。
 2 0  q 
 2q 





v A  pAq   p 1  p 
  p 1  p 



 0 1 1  q 
1  q 
1
 1
 2
 2 pq  1  p 1  q   3 pq  p  q  1  3  p   q   .
3
 3
 3
T
 1 0  q 
 q 

   p 1  p 

vB  pBq   p 1  p 
 0 2 1  q 
 21  q 
2
 2
 2
 pq  21  p 1  q   3 pq  2 p  2q  2  3  p   q   .
3
 3
 3
T
1 2
よって  p, q   0,1、1,0 、および  , がナッシュ均衡である 。
3 3
ナッシュの写像の不動点
• ナッシュ論文で均衡の存在証明のために用いられた写像を
使って、エクセル(fixpo03.xls)でサドルポイントの例題をシ
ミュレーションしてみよう。
• この写像の不動点(そこにいったんたどりつくとその写像に
よって動かなくなる位置座標)が混合均衡である。
• 図によると、混合均衡は(4/7, 5/7)は中心よりやや右上の点
であり、しばらくはまったく動かないので不動点のように思わ
れる。ところが、やがてそこから渦状に遠ざかっていく。
• このように混合均衡は理論上はナッシュ写像の不動点のは
ずだが、シミュレーションではわずかの誤差によって不安定
になり、軌道を外れてやがて外周のアトラクタに落ちていくこ
とが観察される。
連続写像の不動点(ナッシュ均衡)を近似するアルゴリズムは1960年代にLemkeとHowsonによってはじめられ
た。後にScarfやMerrillによって、経済学の一般均衡の計算に応用された。
ナッシュ写像のシミュレーション
t
=100
tim e
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
0.195963
混合戦略
P1
0.571429
0.571429
0.571429
0.571429
0.571429
0.571429
0.571429
0.571429
0.571429
0.571429
0.571429
0.571429
0.571429
0.571429
0.571429
0.571429
0.571429
0.571429
0.571429
0.571429
0.571429
0.571429
0.571429
0.571429
0.571429
0.602905
R SE
0.15338
P2
0.714286
0.714286
0.714286
0.714286
0.714286
0.714286
0.714286
0.714286
0.714286
0.714286
0.714286
0.714286
0.714286
0.714286
0.714286
0.714286
0.714286
0.714286
0.714286
0.714286
0.714286
0.714286
0.714286
0.714286
0.714286
1-P 1
0.428571
0.428571
0.428571
0.428571
0.428571
0.428571
0.428571
0.428571
0.428571
0.428571
0.428571
0.428571
0.428571
0.428571
0.428571
0.428571
0.428571
0.428571
0.428571
0.428571
0.428571
0.428571
0.428571
0.428571
0.428571
1-P 2
0.285714
0.285714
0.285714
0.285714
0.285714
0.285714
0.285714
0.285714
0.285714
0.285714
0.285714
0.285714
0.285714
0.285714
0.285714
0.285714
0.285714
0.285714
0.285714
0.285714
0.285714
0.285714
0.285714
0.285714
0.285714
期待利得
写像Tで使う係数
E1
E2
C1
C2
4.142857 0.857143 8.88E-16
0
4.142857 0.857143 8.88E-16
0
4.142857 0.857143
0 4.44E-15
4.142857 0.857143
0 1.42E-14
4.142857 0.857143
0 9.77E-15
4.142857
857143
9.77E-15
0
P ath of a N0.
ash
's m ap for
a tw o-person
4.142857 non-cooperati
0.857143 ve3.82E-14
0
gam e
4.142857 0.857143 5.68E-14
0
4.1142857 0.857143 3.55E-15
0
4.
0 4.13E-13
0.9142857 0.857143
4.
0 8.55E-13
0.8142857 0.857143
4.
142857
0.
857143
0 3.86E-13
0.7
4.142857 0.857143
9E-13
0
0.6
4.142857 0.857143 2.47E-12
0
0.5
4.
142857 0.857143 3.38E-12
0
0.4142857 0.857143
4.
0 3.05E-12
0.3142857 0.857143
4.
0 3.13E-11
0.2142857 0.857143
4.
0 3.46E-11
4.
4.3E-12
0
0.1142857 0.857143
4.0142857 0.857143 6.84E-11
0
4.142857
1.
0
0
0.20.857143
0.4
0.29E-10
6
0.8
1
4.142857 0.857143 1.4E-10
0
4.142857 0.857143
0 5.16E-10
4.142857 0.857143
0 2.08E-09
4.142857 0.857143
0 1.65E-09
D1
2.22E-16
0
0
3.89E-15
2.01E-14
3.12E-14
2.26E-14
0
0
0
4.1E-13
1.39E-12
1.83E-12
1.06E-12
0
0
0
3.53E-11
7.48E-11
7.11E-11
1.25E-11
0
0
3.72E-10
2.74E-09
D2
0
1.67E-15
3.22E-15
0
0
0
0
2.46E-14
1.46E-13
1.54E-13
0
0
0
0
2.64E-12
9.88E-12
1.16E-12
0
0
0
0
2.46E-10
5.46E-10
0
0
写像T
T1
T2
0.571429 0.714286
0.571429 0.714286
0.571429 0.714286
0.571429 0.714286
0.571429 0.714286
0.571429 0.714286
0.571429 0.714286
0.571429 0.714286
0.571429 0.714286
0.571429 0.714286
0.571429 0.714286
0.571429 0.714286
0.571429 0.714286
0.571429
0.714286
Path of
a N ash 's m ap for a tw o-person
0.571429 0.714286
non-cooperative gam e
0.571429 0.714286
0.571429 0.714286
1
0.571429
0.714286
0.
571429
0.714286
0.9
0.571429 0.714286
0.
8
0.
571429
0.714286
0.
571429
0.714286
0.7
0.571429 0.714286
0.
6
0.
571429
0.714286
0.
571429
0.714286
0.
5
0.4
サドルポイントの例題(定和ゲーム)の不動点から出
発した連続写像のようすを図示する。最初の200期く
らいまでは上の図のように6点のリミットサイクルのよ
うに見えるが、次第に軌道がずれて、3000期くらい
までには右図のような不変集合を描く。
0.3
0.2
0.1
0
0
0.2
0.4
0.6
0.8
1
ナッシュ写像の数式
• 例題のような2人各2純粋戦略のゲームにおいて、現在の混合
戦略の組(p,q)とし、各プレイヤーについて次の計算をする。
• 現在の相手の確率を固定し、自分が純粋戦略を使ったと仮定し
たときの、それぞれの期待利得を求める。
• 現在の各人の期待利得と比べて、各純粋戦略への変更がどれ
だけ期待利得の増加をもたらすか調べ、マイナスなら0とする。
→各人について、(c1,c2),(d1,d2)とする。
• 混合確率を次のように、写像Tによって更新する。
1の更新 p=(p, 1-p) ==> T(p)=((p+c1)/(1+c1+c2), (1-p+c2)/(1+c1+c2))
2の更新 q=(q, 1-q) ==> T(q)=((q+d1)/(1+d1+d2), (1-q+d2)/(1+d1+d2))
• 練習問題:
– 上の写像Tは、鞍点においては移動を起こさないことを証明せよ。
2人有限戦略の場合のナッシュ写像
v A p, q   pAqT 、 vB p, q   pBqTとする。
また、

 q ,  , q

p k  p1 ,  , pk 1 , pk , pk 1 ,  , p N A  0,  , 0, 1, 0,  , 0 、
ql
1
l 1
とする。つまり

, ql , ql 1 ,  , q N B  0,  , 0, 1, 0,  , 0
p k やq lはそれぞれの k番目と l番目の純粋戦略を
用いる場合に相当する 。
ここで
v A,k q   v A p k , q   p k AqT 、 vB ,l p   v A p, q l   pBql
T
とする。さらに、
ci  maxv A,k q   v A p, q , 0 ,
d j  maxvB ,l p   vB p, q , 0 
とする。
直観的には、 ci やd jはその混合戦略組において、各プレイヤーが
各純粋戦略に切替える 誘因の強さを表す。
このとき連続写像 T : p, q   p, qを以下のように定義す る。
 p    p  c  1 NA c ,
 i
k 1 k
i
i
 
NB
q j  q j  d j  1  l 1 d l .




練習問題
• 例題の共通利益を変えても均衡は変わらな
いことを確かめなさい。
• 2人各2純粋戦略のゲームで、利得をいろい
ろ変えて実験し、写像の様子を観察して分
かったことをまとめなさい。
– 男女のいさかいゲームの場合
– チキンゲームの場合
– 囚人ジレンマゲームの場合
協調ゲームの場合
• 協調ゲーム(コイン合わせ)の場合
• 50%--50%の混合均衡は不動点だ。
• 1/3—2/3から出発したナッシュ写像の軌跡は、
混合均衡にかぎりなく近づき、しばし動かなく
なるように見えるが、ひとたび軌道から外れ
ると純粋戦略均衡1--1に向かって走り出す。
• 図ではレ点のような図柄になっている。ただし
1—1の均衡点に近づくと、ブレーキがかかっ
たようになる。
協調ゲームのナッシュ写像
• 左図は混合均衡点(1/2,1/2)から出発。不動点。
長さは100.
• 中央図は(1/3,2/3)から出発の長さ100の系列。
不動点に至るが、わずかの誤差で軌道をはず
れ、純粋戦略均衡(1,1)へ向かう。
• 右図。格子点(0.25刻み)からの出発(長さ10)。
Path of a N ash 's m ap for a tw o-person
non-cooperative gam e
1
0.9
0.9
0.8
0.8
0.7
0.7
0.6
0.6
0.5
0.5
0.4
0.4
0.3
0.3
0.2
0.2
0.1
0.1
0
0
0.2
0.4
0.6
0.8
1
s22
1
0
payoff for 2
s21
s11
s12
Path of a N ash 's m ap for a tw o-person
non-cooperative gam e
1
0
payoff for 1
s21
s11
s12
0
1
s22
1
0
0
1
P ath of a N ash 's m ap for a tw o-person noncooperative gam e
1
0.75
0.5
0.25
0
0
0
0.2
0.4
0.6
0.8
0.25
0.5
0.75
1
1
0.25 0.25
0.75 0.5
0.25 0.5
0.75 0.75
0.5 0.5
0.6 0.6
0.5 0.75
0.75 0.25
コイン合わせのナッシュ写像
• 左図は混合均衡点(1/2,1/2)から出発。不動点。
長さは100.
• 中央図は(1/3,2/3)から出発の長さ100の系列。
螺旋的に移動し、リミットサイクルに落ちる。
• 右図。格子点(0.25刻み)からの出発(長さ10)。
Path of a N ash 's m ap for a tw o-person
non-cooperative gam e
payoff for 1
s21
s11
s12
payoff for 2
s21
s11
s12
Path of a N ash 's m ap for a tw o-person
non-cooperative gam e
s22
1
0
0
1
s22
0
1
1
0
P ath of a N ash 's m ap for a tw o-person
non-cooperative gam e
1
1
1
0.9
0.9
0.8
0.8
0.7
0.7
0.6
0.6
0.5
0.5
0.4
0.4
0.3
0.3
0.2
0.2
0.1
0.1
0
0
0
0.2
0.4
0.6
0.8
1
0.75
0.5
0.25
0
0
0.2
0.4
0.6
0.8
1
0
0.25
0.5
0.75
1
可解ゲーム:強い解
•
•
非協力ゲームの解(solution)は戦略が交換可能な均衡点の集合としてナッシュによって提唱さ
れた。すなわちどの均衡ペアのどのプレイヤーの戦略を交換してできる戦略組もまた均衡点で
ある場合である。
図はナッシュが強い解としてあげた例(Ex. 4)。均衡集合は全点。効用の勾配がなく、どの点も写
像に対して不動。
P ath of a N ash 's m ap for a tw o-person
non-cooperative gam e
payoff for 1
s21
s11
s12
1
s22
1
1
0
0
0.75
0.5
payoff for 2
s21
s11
s12
s22
1
0
1
0
0.25
0
0
0.25 0.25
0.75 0.5
0.25 0.75
0 0.5
1 0.25
0.25 0
0.5 1
0.25
0.5
0.25 0.5
0.75 0.75
0.5 0.25
0 0.75
1 0.5
0.5 0
0.75 1
0.75
0.5 0.5
0.6 0.6
00
01
1 0.75
0.75 0
格子点からの数値実験
1
0.5 0.75
0.75 0.25
0 0.25
10
11
0.25 1
ナッシュ写像とゲームの可解性
•
まず両プレイヤーの期 待効用を2次形式により計算する 。
•
 5  4  q 
 5q  41  q  

   p 1  p 

v A  pAqT   p 1  p 
  5 3 1  q 
  5q  31  q 
 5 pq  4 p1  q   51  p q  31  p 1  q 
 5  4  5  3 pq  4  3 p  5  3q  5  3
•
56
8
 7

 17  p   q   2  2 .
17
 17
 17

 5q  41  q  
v A
  5q  41  q   5q  31  q   17q  7
 0  1  1
p
  5q  31  q 
7
7

 17  q .  q  .
17
 17

  3 4  q    3 p  51  p  q 

  


vB  pBqT   p 1  p 
 5  4 1  q   4 p  41  p  1  q 
 3 pq  51  p q  4 p1  q   41  p 1  q 
  3  5  4  4  pq  5  4 q  4  4  p  5  4
72
9
 8

 16  p   q   2  2 .
16
 16
 16

  3 p  51  p  1 
vB
   3 p  51  p   4 p  41  p   16 p  9
 0  
q
 4 p  41  p    1
9
9

 16  p .  p  .
16
 16

9 7
よって混合戦略組  p, q    , が均衡点である。
 16 17 
ナッシュが可解(solvable)ゲームとしてあげた例
(Ex. 1)の一つ。均衡集合は内点の混合均衡(9/16,
7/17)のみ。しかしナッシュの写像の下で、やはり安
定な不動点ではない。
アトラクタは4点からなる不変集合(リミットサイクル)
をなす。また軌道の図柄からもわかるように、これは
コイン合わせゲームの変種である。
このようにアトラクタは、ナッシュの写像のような近
視眼的改善の反復(リプリケータダイナミクス)にお
ける頑健な解集合といえる。しかし利得の変更や使
用する写像によって影響されやすい。
Path of a N ash 's m ap for a tw o-person
non-cooperative gam e
payoff for 1
s21
s11
s12
5
-5
payoff for 2
s21
s11
s12
-3
5
s22
-4
3
1
0.9
0.8
0.7
0.6
s22
4
-4
0.5
0.4
0.3
tim e
0.2
0.1
0
0
0.2
0.4
0.6
0.8
1
混合均衡を始点とする数値実験
リミットサイクル
0
1
2
3
4
5
P1
0.187483
0.091289
0.885087
0.942988
0.187483
0.091289
P2
0.081152
0.858928
0.931638
0.160391
0.081152
0.858928
ナッシュ写像とEWA学習
•
EWA学習モデルを用いて、以下のゲームをシミュレーションしてみよう。EWAではパラメータの
選択によって、いくつかのタイプの強化学習やフィクシシャスプレイ他の信念調整学習を使い
分けできる。ここでは各純粋戦略の魅力度とそれに対応するロジット型の選択確率をEWA学習
させ、モンテカルロ法で学習の様子をシミュレーションした。
P ath of a N ash 's m ap for a tw o-person
non-cooperative gam e
EWA(experience weighted attraction) Learning
(Cam erer& Ho,1999, Econom etrica 67(4) : 827  74.)
payoff for 1
s21
s11
s12
The updatingrules :
N t     N t  1  1, t  1
Ai j t   N t     N t  1  Ai j t  1



1

  i sij , si t    1     I sij , si t 
s22
0.3
0
0.75
0
0.3
0.5
0.25
where
0
1 if sij  si t 
I sij , si t   
 0 otherwise

0

payoff for 2
s21
s11
s12
The probabilistic choice:
k
   Aij t 1
k e Ai t 1  exponentiallogit
e
Pi t   
mi
 Ai j t  1  Aik t  1  power log it

k
mi
j
0.25 0.25
0.75 0.5
0.25 0.75
0 0.5
1 0.25
0.25 0
0.5 1
s22
0
0.3
0.25
0.5
0.25 0.5
0.75 0.75
0.5 0.25
0 0.75
1 0.5
0.5 0
0.75 1
0.75
1
0.5 0.5
0.6 0.6
00
01
1 0.75
0.75 0
0.5 0.75
0.75 0.25
0 0.25
10
11
0.25 1
ナッシュ写像:格子点からの数値実験
0.3
0
Path of a N ash 's m ap for a tw o-person
non-cooperative gam e
1
0.9
0.8
0.7
0.6
0.5
EW A P [1,1]-P [2,1]
EW A P [1,1]-P [2,1]
EW A P [1,1]-P [2,1]
0.4
0.3
1
1
1
0.9
0.9
0.9
0.8
0.8
0.7
0.7
0.7
0.6
0.6
0.6
0.5
0.5
0.5
0.8
0.4
0.4
0.3
0.3
0.2
0.2
0.4
0.6
0.8
1
0
0.2
0.4
0.6
0.8
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.3
0.2
0.1
0.2
0
0.1
0
0.2
0.4
0.6
0.8
0
0
0
Path of a N ash 's m ap for a tw o-person
non-cooperative gam e
0
0.4
0.1
0
0.1
1
0.2
0.1
0.2
0
0.2
0.4
0.6
0.8
1
0
0.2
0.4
0.6
EWA学習: (1/2,1/2)からの数値実験 累積強化学習(左)、平均強化学習(中)、信念調整学習(右)
0.8
1
ナッシュ写像:点(1/3,2/3)および
点(1/2,1/2)からの数値実験
1
クールノーモデルの動学化
• これまで見たようにナッシュ均衡は適切な連続写像
の不動点として特徴けられる。
• 先に紹介したクールノーの寡占競争モデルは、ナッ
シュ均衡の先駆だったが、各企業の動学的な産出
量調整が均衡に至るか否かという視点が含まれて
いる。
• 近年、動学的システムにおける不安定軌道(カオ
ス)の研究がさかんになり、クールノーゲームのN人
の場合への一般化とその動学も注目されている。
Puu-Agizaのカオス
• PuuやAgizaによって
行われたクールノーモ
デルの動学化を表計
算で再現してみよう。
• 図は、その不変集合
やカオスの例を示した
もの。
展開形ゲームと情報
• 展開形ゲームではこれまで見たような行列で利得が表される
ゲーム(標準形あるいは戦略形ゲーム)とちがって、各プレイ
ヤーがゲームの進行上、どのタイミングで、あるいはどういう
順番で行動をするのかを、木の形で表します。
• また、同じゲームの木を使って、プレイヤーが各時点で持つ
情報を表すことができます。不完全情報というのは、各プレイ
ヤーが行動を起こすとき、自分がどこにいるかを識別できな
いことを指していいます。
• プレイヤーの戦略は、情報集合ごとに定義されるため、それ
ゆえゲームは標準形のときよりも複雑なものになります。情報
集合というのは、ゲームの木の中で自分が手番であるいくつ
かの節点(ノード)をまとめて、そう呼びます。プレイヤー自身
は、その中のどこかにいるということだけが分かります。
不完備情報ゲーム
• 参入・阻止ゲームは、独占企業が新規参入企業に対抗する
不完全競争市場のゲーム理論モデルである。
• 独占企業(monopolist)が新規参入企業(entrant)の参入を黙
認すると、シェアの一定割合を奪われる。一方これに対抗し
て価格値下げを行うと、両者の利潤が減る。
• ここでは基本なモデル例を示す。「強」と「弱」いずれかのタイ
プの参入企業が、一回かぎり参入可能である。次ページの
ようなゲームの木と利得で表す。このように「タイプ」というも
のを通じて、プレイヤーの間に不均等・非対称に情報が散ら
ばっているゲームモデルは、Harsanyiによって詳しく研究さ
れた。
• もし独占企業が価格引下げを実施すると、両者の利得が参
入企業の強さにしたがって相対的に変化する。しかし、実際
にそうするまでは参入企業が果たして強いのか、弱いのか
は見分けがつかないものとする。
参入・阻止ゲームの木
•
•
武藤(p.127)図4-3参照。葉は(独占企業の利得、参入企業の利得)を表す。利得
から分かるように、ここでいう弱い参入企業は、価格切り下げで阻止したときによ
り大きな損失を受け、また共存してもシェアを食われる割合が小さい。
いずれかのプレイヤーのタイプによって、ゲームの結果についての評価つまり利
得が左右されるゲームでは、自分自身のタイプについては知っているものと仮定
し、他のプレイヤーはゲームのプレイを通じてその情報を推理できるのみである。
またどのタイプが実現されるかは、第3のプレイヤーとして自然を導入し、元の
ゲームに先立つ手番において、確率的に選ばれると仮定する。
阻止
新企業
参入
(1, 1)
共存
自
然
強
撤退
(5, 0)
0.5
弱
0.5
新企業
独占企業
(0, 3)
阻止
参入
(1, -2)
共存
撤退
(3, 2)
(5, 0)
独占企業の情報集合。上下の2つのノードのうち、いずれかにい
ることは分かる。そこで確率的推定値(信念)を持つと仮定する。
完全情報だったとした場合の
バックワードインダクション解
• もし参入社のタイプが後手の独占企業にも分かっている完全
情報ゲームだったとするなら、そのバックワードインダクション
は以下のような解を導くだろう。
阻止
新企業
参入
(1, 1)
共存
自
然
強
撤退
(5, 0)
0.5
弱
0.5
新企業
独占企業
(0, 3)
阻止
参入
(1, -2)
共存
撤退
(3, 2)
(5, 0)
手番の順序を無視した場合の不動点
• 各タイプの部分ゲームにおいて手番順序を無視した、2種類の標準形
ゲームを考える。2つの2人2×2戦略のゲームのナッシュ写像による位
相図は以下のようになる。
P ath of a N ash 's m ap for a tw o-person noncooperative gam e
P ath of a N ash 's m ap for a tw o-person noncooperative gam e
1
1
不動点は
(1, 1)つま
り参入&阻
止のみ
0.75
0.5
(x, y) = (0, 1)
および(x, 0),
x≧0.5上の全
点が不動点。
つまり撤退&
半分以上の確
率での阻止が
脅しとして効く。
0.75
0.5
0.25
0.25
0
0
0
0
0.25 0.25
0.75 0.5
0.25 0.75
0 0.5
1 0.25
0.25 0
0.5 1
0.25
0.5
0.25 0.5
0.75 0.75
0.5 0.25
0 0.75
1 0.5
0.5 0
0.75 1
独占企業の利得
参入
阻止
共存
0.75
0.5 0.5
0.6 0.6
00
01
1 0.75
0.75 0
0.5 0.75
0.75 0.25
0 0.25
10
11
0.25 1
撤退
1
0
1
5
5
弱い参入企業
の場合
強い参入企業
参入企業の利得
参入
阻止
共存
撤退
1
3
0
0
の場合
0.25 0.25
0.75 0.5
0.25 0.75
0 0.5
1 0.25
0.25 0
0.5 1
0.25
0.5
0.25 0.5
0.75 0.75
0.5 0.25
0 0.75
1 0.5
0.5 0
0.75 1
0.75
1
0.5 0.5
0.6 0.6
00
01
1 0.75
0.75 0
独占企業の利得
参入
阻止
共存
0.5 0.75
0.75 0.25
0 0.25
10
11
0.25 1
撤退
1
3
参入企業の利得
参入
撤退
阻止
-2
共存
2
5
5
0
0
ベイズ完全均衡の導出手順
参入企業(Entrant)
タイプごとの戦
略を決める
最適戦略を選び、
整合性をチェッ
クする
Pr(enter| weak)
Pr(enter| tough)
Pr(exit| T )  1 - Pr(enter| T )
各戦略の期待利
得を計算する
v Eweak (enter)
 q enter  v Eweak (enter,deter)
 (1  q enter )  v Eweak (enter,coop),
and so on.
独占企業(Monopolist)
観察された情報
に基づき信念を
アップデートする
その情報集合に
おける各戦略の
期待利得を計算
Pr(weak| X)  Pr(X| weak)/Pr(X)
where X is eitherenteror exit and
Pr(X) Pr(X| weak)Pr(X) Pr(X| tough)Pr(X).
v M (deter | X)
weak
 vM
(deter,X)  P r(weak| X)
tough
 vM
(deter,X)  P r(tough| X)
where X is eitherenteror exit.
Similarly for vM (coop| X).
最適戦略を選ぶ
v M (q | X)  q  v M (deter | X)  (1  q)  v M (coop| X).
q enter  arg max v M (q | enter),
q[ 0 ,1]
q exit  arg max v M (q | enter).
q[ 0 ,1]
Prologによる参入阻止ゲームのモデ
リング例:純粋戦略の場合
%=====================================
% Two stage enter-deterance game
%=====================================
% descriptive modeling.
%=====================================
% payoffs for pure strategy profile
%=====================================
payoff([_, _, _], nature, 0).
player(entrant).
player(monopolist).
possible_type_of_entrant(weak).
possible_type_of_entrant(tough).
payoff([tough, exit, coop], entrant, 0).
payoff([tough, exit, deter], entrant, 0).
payoff([tough, enter, coop], entrant, 3).
payoff([tough, enter, deter], entrant, 1).
payoff([tough, exit, coop], monopolist, 5).
% decision rule of entrant which hypothesized by monopolist.
payoff([tough, exit, deter], monopolist, 5).
payoff([tough, enter, coop], monopolist, 0).
strategy_of_entrant(T,exit,Q):strategy_of_entrant(T,enter,P),
Q is 1 - P.
payoff([tough, enter, deter], monopolist, 1).
strategy_of_entrant(weak,enter,0).
strategy_of_entrant(tough,enter,1).
payoff([weak, enter, coop], entrant, 2).
possible_strategy_of_entrant(weak,enter,P):-member(P,[0,1]).
possible_strategy_of_entrant(tough,enter,P):-member(P,[0,1]).
possible_strategy_of_monopolist(deter,P):-member(P,[0,1]).
payoff([weak, exit, coop], entrant, 0).
payoff([weak, exit, deter], entrant, 0).
payoff([weak, enter, deter], entrant, -2).
payoff([weak, exit, coop], monopolist, 5).
payoff([weak, exit, deter], monopolist, 5).
payoff([weak, enter, coop], monopolist, 3).
payoff([weak, enter, deter], monopolist, 1).
信念の更新:ベイズルール
%=====================================
% beliefs and the updating rule
%=====================================
prior_belief_of_monopolist(weak,0.5).
prior_belief_of_monopolist(tough,Q):prior_belief_of_monopolist(weak,P),
Q is 1 - P.
knowledge(upper_node->monopolist is weak).
knowledge(lower_node->monopolist is tough).
updating_belief_of_monopolist(
P->(Q=B/B0),
at(Node:T),
observing(Enter),
reason(prob(B,for(T)),prob(BN,if_not))
):strategy_of_entrant(T,Enter,S),
knowledge(Node->monopolist is T),
collect_probs_of_consistent_states(Enter,_,B0),
prior_belief_of_monopolist(T,P),
bayes_rule(B0,P,S,B,Q),
BN is B0 - B.
bayes_rule(B0,P,S,B,Q):B0 > 0,
B is P * S,
Q is B / B0.
bayes_rule(0,_,_,0.5,0.5). % posterior of measure-0 event.
collect_probs_of_consistent_states(Enter,BL,B0):findall(B1,
(
strategy_of_entrant(T1,Enter,P1),
prior_belief_of_monopolist(T1,S1),
B1 is P1 * S1
),
BL),
sum(BL,B0).
?- updating_belief_of_monopolist(Update,Where,Data,Why).
Update = 0.5->0=0/0.5
Where = at(upper_node:weak)
Data = observing(enter)
Why = reason(prob(0, for(weak)), prob(0.5, if_not)) ;
Update = 0.5->1=0.5/0.5
実行例
Where = at(lower_node:tough)
Data = observing(enter)
Why = reason(prob(0.5, for(tough)), prob(0, if_not)) ;
Update = 0.5->1=0.5/0.5
Where = at(upper_node:weak)
Data = observing(exit)
Why = reason(prob(0.5, for(weak)), prob(0, if_not)) ;
Update = 0.5->0=0/0.5
Where = at(lower_node:tough)
Data = observing(exit)
Why = reason(prob(0, for(tough)), prob(0.5, if_not)) ;
No
?-
独占企業の合理的プレイ
%================================
% rational choice for monopolist
%================================
expected_utility_of_monopolist(if(T,Enter),deter(Q),utility(U=Ueq)):payoff([T, Enter, deter], monopolist, Ud),
payoff([T, Enter, coop], monopolist, Uc),
possible_strategy_of_monopolist(deter,Q),
W1 is integer(Q * 100),
W2 is integer((1-Q) * 100),
% to avoide nemerical error.
Ueq = (W1 * Ud + W2 * Uc) /100,
U is Ueq.
?- rational_choice_of_monopolist(E,B,D,U).
E = if(exit)
B = belief(weak, 1)
D = deter(0)
U = utility(5) ;
実行例
E = if(exit)
expected_utility_of_monopolist(if(Enter),belief(weak:P),deter(Q),utility(U=Ueq)):updating_belief_of_monopolist(_->(P=_),at(_:weak),observing(Enter),_),
expected_utility_of_monopolist(if(weak,Enter),deter(Q),utility(_=Uw/100)),
expected_utility_of_monopolist(if(tough,Enter),deter(Q),utility(_=Ut/100)),
K1 is P * 100,
K2 is 100 - K1,
Ueq = (K1 * Uw + K2 * Ut)/10000,
U is Ueq.
B = belief(weak, 1)
rational_choice_of_monopolist(if(Enter),belief(weak:P),deter(Q),utility(U)):member(Enter,[exit, enter]),
D = deter(1)
EU=expected_utility_of_monopolist(if(Enter),belief(weak:P),deter(Q),utility(
U=_)),
max(U,EU).
D = deter(1)
U = utility(5) ;
E = if(enter)
B = belief(weak, 0)
U = utility(1) ;
No
?-
参入企業の合理的プレイ
?- rational_choice_of_entrant(A,B,C).
%================================
% rational choice for entrant
%================================
A = weak, enter(0)
expected_utility_of_entrant((T,Enter),if(belief(weak:P),deter(Q)),utility(U=Ueq)):rational_choice_of_monopolist(if(Enter),belief(weak:P),deter(Q),utility(_)),
payoff([T, Enter, deter], entrant, Ud),
payoff([T, Enter, coop], entrant, Uc),
W1 is integer(Q * 100), % to avoide nemerical error.
W2 is integer((1-Q) * 100),
Ueq = (W1 * Ud + W2 * Uc) /100,
U is Ueq.
C = utility(0= (0* (100* -2+0*2)+100*
(0*0+100*0))/10000) ;
expected_utility_of_entrant((T,enter(P)),assess(ASSESS),utility(U=Ueq)):expected_utility_of_entrant((T,enter),if(Be,De),utility(_=Ue/100)),
expected_utility_of_entrant((T,exit),if(Bx,Dx),utility(_=Ux/100)),
ASSESS=[if(enter,Be,De),if(exit,Bx,Dx)],
possible_strategy_of_entrant(T,enter,P),
W1 is integer(P * 100), % to avoide nemerical error.
W2 is integer((1-P) * 100),
Ueq = (W1 * Ue + W2 * Ux) /10000,
U is Ueq.
rational_choice_of_entrant((T,enter(P)),assess(ASSESS),utility(U=Ueq)):possible_type_of_entrant(T),
EU=expected_utility_of_entrant((T,enter(P)),assess(ASSESS),utility(U=Ueq)),
max(U,EU).
B = assess([if(enter, belief(weak:0), deter(1)),
if(exit, belief(weak:1), deter(0))])
A = weak, enter(0)
B = assess([if(enter, belief(weak:0), deter(1)),
if(exit, belief(weak:1), deter(1))])
実行例
C = utility(0= (0* (100* -2+0*2)+100*
(100*0+0*0))/10000) ;
A = tough, enter(1)
B = assess([if(enter, belief(weak:0), deter(1)),
if(exit, belief(weak:1), deter(0))])
C = utility(1= (100* (100*1+0*3)+0*
(0*0+100*0))/10000) ;
A = tough, enter(1)
B = assess([if(enter, belief(weak:0), deter(1)),
if(exit, belief(weak:1), deter(1))])
C = utility(1= (100* (100*1+0*3)+0*
(100*0+0*0))/10000) ;
No
?-
完全ベイズ均衡の自動検証
?- consistency_test.
(…)
Yes
?- display_consistency_results(all).
strategy_of_entrant(weak, enter, 0)
strategy_of_entrant(tough, enter, 0)
consistency(no), (weak, enter(hypo:0, best:1)), if(enter, belief(weak:0.5), deter(0))
consistency(no), (tough, enter(hypo:0, best:1)), if(enter, belief(weak:0.5), deter(0))
strategy_of_entrant(weak, enter, 0)
strategy_of_entrant(tough, enter, 1)
consistency(yes), (weak, enter(hypo:0, best:0)), if(exit, belief(weak:1), deter(0))
consistency(yes), (weak, enter(hypo:0, best:0)), if(exit, belief(weak:1), deter(1))
consistency(yes), (tough, enter(hypo:1, best:1)), if(enter, belief(weak:0), deter(1))
strategy_of_entrant(weak, enter, 1)
strategy_of_entrant(tough, enter, 0)
consistency(yes), (weak, enter(hypo:1, best:1)), if(enter, belief(weak:1), deter(0))
consistency(no), (tough, enter(hypo:0, best:1)), if(enter, belief(weak:1), deter(0))
strategy_of_entrant(weak, enter, 1)
strategy_of_entrant(tough, enter, 1)
consistency(yes), (weak, enter(hypo:1, best:1)), if(enter, belief(weak:0.5), deter(0))
consistency(yes), (tough, enter(hypo:1, best:1)), if(enter, belief(weak:0.5), deter(0))
Yes
?-
• 以上の合理的ゲームプレ
イモデルの結果の整合性を
テストするルーチン
consistency_test/0を作成し
た。図はこれを実行した後、
記録された検査データ
consistency/4に基づき再表
示したもの。
• 仮説としての参入者の戦
略(hypo)と、合理的な参入
確率(best)がつねに一致し
ているのが、完全ベイズ均
衡(PBE)である。ここではい
ずれのタイプも参入し、阻止
されない場合(一括均衡)と、
強い方だけ参入するのでそ
れと推論され、阻止される場
合(分離均衡)の2つがあ
る。
• なおプログラム全体は
gbayes01.plとしてホーム
ページに公開している。
(http://www.us.kantogakuen.ac.jp/indo/kenkyu.
html)
偽の評判:数値実験から分かること
• この参入阻止ゲームでは、独占企業の初期信念(prior)において弱タ
イプの参入企業の確率は0.5に設定されていた。これは述語
prior_belief_of_monopolist(weak,0.5).
によってモデル化されている。
• 純粋戦略のみの場合、第2引数を適当に変えて実験結果を見ると、次
のことが確かめられる。
• 弱タイプの初期信念が1/3以下のときに一括均衡が消え、分離均衡だ
けになる(ただし後で述べるように混合均衡はある)。
• また1のときに一括均衡のみになり、分離均衡が消える(もっとも、もし
それが正しければ強い企業が参入することはないが)。
• したがって、このモデルでは、たとえわずかな確率でも強い参入企業
の可能性がある場合には、分離均衡の完全ベイズ均衡が存在し、そ
こでは参入すれば強タイプとみなされ阻止される。この分離均衡では
明らかに弱い参入企業の側から見てはったりは得にならない。あえて
強いふりをしても弱い参入企業にとってけしてうれしくはない。
• これらの間の開区間(1/3,1)では、両均衡がともに存在する。偽の評判
が生じるのはこのうち一括均衡のケースであり、強い企業が、弱い企
業に混じって阻止されず、独占企業からシェアを奪うことができる。
0.1×nの混合戦略、初期信念0.75
以下では混合戦略の場合を0.1きざみで近似したシミュレーション結果を示す。これは各プレイヤー戦略発生プログラムのわずか
な変更で済む。ユーティリティprobability/2述語を用いたが、もちろん、member(P,[0,0.1,0.2,…,0.9,1])としてもよい。
?- consistency_test.
strategy_of_entrant(weak, enter, 0)
strategy_of_entrant(tough, enter, 1)
consistency(yes), (weak, enter(hypo:0, best:0)), if(exit, belief(weak:1), deter(0))
consistency(yes), (weak, enter(hypo:0, best:0)), if(exit, belief(weak:1), deter(0.1))
consistency(yes), (weak, enter(hypo:0, best:0)), if(exit, belief(weak:1), deter(0.2))
consistency(yes), (weak, enter(hypo:0, best:0)), if(exit, belief(weak:1), deter(0.3))
consistency(yes), (weak, enter(hypo:0, best:0)), if(exit, belief(weak:1), deter(0.4))
consistency(yes), (weak, enter(hypo:0, best:0)), if(exit, belief(weak:1), deter(0.5))
consistency(yes), (weak, enter(hypo:0, best:0)), if(exit, belief(weak:1), deter(0.6))
consistency(yes), (weak, enter(hypo:0, best:0)), if(exit, belief(weak:1), deter(0.7))
consistency(yes), (weak, enter(hypo:0, best:0)), if(exit, belief(weak:1), deter(0.8))
consistency(yes), (weak, enter(hypo:0, best:0)), if(exit, belief(weak:1), deter(0.9))
consistency(yes), (weak, enter(hypo:0, best:0)), if(exit, belief(weak:1), deter(1))
consistency(yes), (tough, enter(hypo:1, best:1)), if(enter, belief(weak:0), deter(1))
strategy_of_entrant(weak, enter, 1)
strategy_of_entrant(tough, enter, 1)
consistency(yes), (weak, enter(hypo:1, best:1)), if(enter, belief(weak:0.75), deter(0))
consistency(yes), (tough, enter(hypo:1, best:1)), if(enter, belief(weak:0.75), deter(0))
Yes
?-
0.1×nの混合戦略、初期信念1/3
?- consistency_test.
strategy_of_entrant(weak, enter, 0)
strategy_of_entrant(tough, enter, 1)
consistency(yes), (weak, enter(hypo:0, best:0)), if(exit, belief(weak:1), deter(0))
consistency(yes), (weak, enter(hypo:0, best:0)), if(exit, belief(weak:1), deter(0.1))
consistency(yes), (weak, enter(hypo:0, best:0)), if(exit, belief(weak:1), deter(0.2))
consistency(yes), (weak, enter(hypo:0, best:0)), if(exit, belief(weak:1), deter(0.3))
consistency(yes), (weak, enter(hypo:0, best:0)), if(exit, belief(weak:1), deter(0.4))
consistency(yes), (weak, enter(hypo:0, best:0)), if(exit, belief(weak:1), deter(0.5))
consistency(yes), (weak, enter(hypo:0, best:0)), if(exit, belief(weak:1), deter(0.6))
consistency(yes), (weak, enter(hypo:0, best:0)), if(exit, belief(weak:1), deter(0.7))
consistency(yes), (weak, enter(hypo:0, best:0)), if(exit, belief(weak:1), deter(0.8))
consistency(yes), (weak, enter(hypo:0, best:0)), if(exit, belief(weak:1), deter(0.9))
consistency(yes), (weak, enter(hypo:0, best:0)), if(exit, belief(weak:1), deter(1))
consistency(yes), (tough, enter(hypo:1, best:1)), if(enter, belief(weak:0), deter(1))
strategy_of_entrant(weak, enter, 1)
strategy_of_entrant(tough, enter, 1)
consistency(yes), (weak, enter(hypo:1, best:1)), if(enter, belief(weak:0.333333), deter(0.2))
consistency(yes), (tough, enter(hypo:1, best:1)), if(enter, belief(weak:0.333333), deter(0.2))
Yes
?-
参考文献
•
クールノーモデルと参入阻止ゲーム(完全ベイジアン均衡)の例題:
武藤滋夫(2001). ゲーム理論入門. 日経文庫.
•
0和ゲームの鞍点、線形計画法との関係:
小山昭雄 (1980). ゲームの理論入門. 日経文庫.
•
混合均衡の導出:
R.J. オーマン (1991).丸山徹・立石寛訳.ゲーム論の基礎.勁草書房.
•
ナッシュ写像、均衡と解:
西田俊夫(1973). ゲームの理論. 日科技連.
Nash, J. F. (1951), Non-Cooperative Games, Annals of Mathematics 54, pp.286-295.
•
EWA学習
Camerer, C. and T.H. Ho (1999). Experience-weighted Attraction Learning in Normal Form Games.
Econometrica 67(4):827 – 874.
•
3人クールノーゲームの動学とカオス
H. N. Agiza (1998). Explicit Stability Zones for Cournot Game with 3 and 4 Competitors. Chaos,
Solitons & Fractals 9(12): 1955-66.
•
定和ゲームの例題と解法
土田美廣(2001). Cプログラミングによる経済・経営問題の解決法. 税務経理協会.
(モデル分析の授業教材として使いました。他の章にはいくつか誤植が見られます。)