PowerPoint プレゼンテーション

ゲーム理論とは
2人以上のプレイヤーの意思決定
の分析をする理論
ゲーム理論の構成要素
(同時ゲームの場合)
プレイヤー、戦略、利得
プレイヤー:ゲームをする意思決定者(太郎 vs 二郎、とか、A社 vs B社、
とか、国家 vs 国民)
戦略:プレイヤーが選択できる行動(グー or チョキ or パー、とか、
賛成 or 反対、とか、増税 or そのままor 減税 )
利得:選択した行動が与える利益(勝ち+1 or 負け -1 or あいこ 0, とか、
利潤が +80億 or - 20 億、とか 懲役 5 年 or 懲役 1年)
じゃんけんの例
太郎
二郎
グー
チョキ
パー
グー
0
-1
+1
チョキ
+1
0
-1
パー
-1
+1
0
表内の数値は、太郎の立場での利得
二郎の利得は上の表の値に-1 をかけたもの: ゼロ和ゲーム
じゃんけん min max
Min
グー
チョキ
パー
グー
0
-1
+1
チョキ
+1
0
-1
パー
-1
+1
0
あきらかに
+1
+1
Min of Max
-1
-1 Max of Min = -1
+1

Max
-1

太郎
二郎
Max
Min of Max = + 1
Max of Min
混合戦略とMN均衡点
太郎
二郎
グー

チョキ



パー
グー
p1
p1q2
0 
q 3  p1q3
p2 q3
q2

定理(ミニマックスの定理):

max
 min E(p,q)
p
p2
- p2 q1
0
q1
チョキ
q
太郎と二郎の
それぞれの手に
パー p
3
確率 (p1 , p2 , p3 )、
確率 ( q1 ,q2 ,q3 )
という確率を
p3q1
あたえ、太郎が
 p3q2 得る特典の期待
 値
を E(p,q) とする。
0
 は当然ですが、実は
= min max E(p,q) 今この値は 0。
q
p
この値を与える (p,q) をゲームの均衡点という。
Nashの考え方?(じゃんけん)
太郎
二郎
グー
チョキ
パー
グー
(0,0)
(-1,+1)
( +1,-1)
チョキ
(+1,-1)
(0,0)
( -1,+1)
パー
(-1,+1)
(+1,-1)
( 0,0)
(a,b): a は太郎の利得、b は二郎の利得
(0,0) となっている3点をナッシュの均衡点という。
しかし、これではナッシュの考え方の真価が分かりにくいとおもいます。実際、じゃんけんに必勝
法は無いので、どの手を出せばよいかという情報は得られない。
(どちらが多いか?)Nashの考え
入試を2月前
半にする
いつもと一緒
(2月後半)
入試を3月に
する
入試を2月前
半にする
(150,100)
(150,250)
( 100,250)
いつもと一緒(2
月後半)
(250,150)
(90,60)
( 100,150)
(250,100)
(150,100)
( 60,40)
N大学
P大学
入試を3月に
する
一大学のみを受験する人が500人、2月前半に試験があれば受験したい人が250人、
2月後半に試験があれば受験したい人が 150人、3月に試験があれば受験したい人
が100人,同じ時期に行うと、N大学のほうがちょっと人気があるとする。自分の希望に
あてはまる時期に受験者ないと、別の大学を受験してしまう。
(a,b): a は N大学はの利得(受験者数)、b はP大学の利得(受験者数)
(どちらが多いか?)Nashの考え
入試を2月前
半にする
いつもと一緒
(2月後半)
入試を3月に
する
入試を2月前
半にする
(150,100)
(150,250)
( 100,250)
いつもと一緒(2
月後半)
(250,150)
(90,60)
( 100,150)
(250,100)
(150,100)
( 60,40)
N大学
P大学
入試を3月に
する
N大学の立場では、2月前半にするのが有利です(支配戦略)。
この時は、N大学は必ず最良の手をとると考える。その中で、
P大学にとっての最良の手は、いつもと同様の2月後半が最良。
(a,b): a は N大学はの利得(受験者数)、b はP大学の利得(受験者数)
(どちらが多いか?)Nashの考え
入試を2月前
半にする
いつもと一緒
(2月後半)
入試を3月に
する
入試を2月前
半にする
(150,100)
(150,250)
( 100,250)
いつもと一緒(2
月後半)
(250,150)
(90,60)
( 100,150)
(250,100)
(150,100)
( 60,40)
N大学
P大学
入試を3月に
する
(250,150) がナッシュ均衡点と呼ばれる解です。
(a,b): a は N大学はの利得(受験者数)、b はP大学の利得(受験者数)
囚人のジレンマ
 太郎
黙秘
自白
黙秘
-3、-3
0、-4
自白
-4、0
-1、-1
二郎



囚人のジレンマ
 太郎
黙秘
自白
黙秘
-3、-3
0、-4
自白
-4、0
-1、-1
二郎


