プレーヤー1

上級価格理論II
第6回
2011年後期
中村さやか
今日やること
2. 完備情報の動学ゲーム
• 2.4 完備不完全情報の動学ゲーム
– 2.4.A ゲームの展開型による表現
– 2.4.B サブゲーム完全なナッシュ均衡
ゲームの標準形による表現(復習)
ゲームの標準型による表現(normal-form representation)
の定義とは、以下を指定すること:
(1) ゲームのプレーヤー
(2) 各プレーヤーの選択できる戦略の集合(戦略空間)
(3) プレーヤーの選択する戦略の組み合わせごとに各プレー
ヤーが受け取る利得
ゲームの展開型による表現の定義
ゲームの展開型による表現(extensive-form
representation)の定義とは、以下を指定すること:
(1)
(2a)
(2b)
(2c)
(3)
ゲームのプレーヤー
各プレーヤーにいつ手番が回ってくるか
自分の手番で各プレーヤーは何ができるか
自分の手番が来たときプレーヤーは何を知っているか
プレーヤーの選択する戦略の組み合わせごとに
各プレーヤーが受け取る利得
展開型ゲームの例
1
2
L
R 2
L’
R’
L’
R’
3
1
1
2
2
1
0
0
プレーヤー1の利得
プレーヤー2の利得
1. プレーヤー1がその行動 a1 を実行可能集合 A1={L,R} から
選ぶ
2. プレーヤー2は a1 を見て、そのあと行動 a2 を実行可能集合
A2={L’,R’}から選ぶ
3. 利得 u1(a1, a2), u2(a1, a2) が決まる
ゲームの木の構造
1
2
L
R
2
L’
R’
L’
R’
3
1
1
2
2
1
0
0
プレーヤー1の利得
プレーヤー2の利得
点 (node)と2点を結ぶ(向きのついた)枝から構成
• 決定節 (decision node):
• 終節 (terminal node): 利得の書いてあるところ
枝の入ってこない始点 (initial node)が1つある
標準型と展開型
•
•
静学ゲームは標準形、動学ゲームでは展開型で表現すると
分析上便利
どんなゲームでも、標準型・展開型両方で表現可能
標準型と展開型の違い
• 標準型: 戦略空間を指定
• 展開型: 以下を指定
(2a) 各プレーヤーにいつ手番が回ってくるか
(2b) 自分の手番で各プレーヤーは何ができるか
(2c) 自分の手番が来たときプレーヤーは何を知っているか
戦略の定義(復習)
定義
• プレーヤーの戦略とは完全な行動計画のことで、そのプ
レーヤーが行動を起こすことになるかもしれないそれぞれ
の事態でどの実行可能な行動を取るかをすべて漏れなく指
定したものである
⇒ ありとあらゆる事態について行動を指定しないとナッシュ均
衡の考え方を適用できない
⇒ 行動空間と戦略空間は必ずしも一致しない
戦略空間の例
1
2
L
R 2
L’
R’
L’
R’
3
1
1
2
2
1
0
0
プレーヤー1の利得
プレーヤー2の利得
プレーヤー2の戦略:(a1がLの時の行動、 a1がRの時の行動)
行動空間: A2={L, R}
戦略空間: A2={(L’,L’), (L’, R’), (R’, L’), (R’, R’)}
展開型で表現されたゲームの標準形の表現
• 上でゲームの木で表現されたゲームを標準形で表現
プレーヤー2
(L’,L’)
プレーヤー1
(L’, R’) (R’, L’) (R’, R’)
L
3,
1
3,
1
1,
2
1,
2
R
2,
1
0,
0
2,
1
0,
0
同時手番ゲームの展開型による表現
1. プレーヤー1がその行動 a1 を実行可能集合 A1から選ぶ
2. プレーヤー2はプレーヤー1の行動 a1 を見ずに、行動 a2 を
実行可能集合 A2から選ぶ
3. 利得が u1(a1, a2), u2(a1, a2) として決定される
⇒ 1. と 2. を入れ替えても同じ
⇒ 互いに相手が何をしたかについての情報がない
情報集合の定義
•
プレーヤーの情報集合(information set)とは、次の2条件を
満たす決定節の集まりである
i. プレーヤーは情報集合に含まれるどの節でも自分の手番
になっている
ii. 情報集合に含まれる1つの節にゲームのプレーが到達した
とき、プレーヤーはその情報集合に含まれる節のうちどこ
に自分がいるのか区別できない
※ 同一の情報集合に属する各節では、プレーヤーの取りうる
行動の集合(行動空間)が同じでなければならない
(そうでなければ行動空間を見れば自分がどの節にいるか
推測できる)
※ どの節もどれか1つの情報集合に入っている
(含まれる節が1つだけの情報集合もある)
情報集合の例
囚人1
黙秘
自白
囚人2
黙秘
自白
3
1
1
2
黙秘
2
1
自白
0
0
プレーヤー1の利得
プレーヤー2の利得
• 情報集合に含まれている節を○で囲んでその横にプレー
ヤーの名前を書く
• 囚人2は2つの節のうちどちらに自分がいるのかわからない
• 各決定節では1人しか動かない: 同時に動く場合も、1人が
先に動き、残りがその動きを知らずに動く、と表現
完全情報と不完全情報
完全情報の定義:
• ゲームのどの手番においても、そこで動くプレーヤーがそれ
までのゲームの完全な歴史を知っていること
⇔ どの情報集合もただ一つの節のみを含む
不完全情報の定義:
• ゲームの少なくとも1つの手番で、そこで動くプレーヤーがそ
れまでのゲームの完全な歴史を知らないこと
⇔ 少なくとも1つの情報集合が複数の節を含む
サブゲームの厳密な定義
定義:
展開型ゲームのサブゲームとは、
a. それ自体が1節のみを含む情報集合になっている決定節n
(ただしゲームの最初の決定節は除く)から始まり
b. ゲームの木のnより後に続くすべての決定節および終節を
含み(かつnの後に来ない節は1つも含まず)、
c. どの情報集合をも切断しないもの
である
注:ここでは全体のゲームをサブゲームとはみなさないが、みな
す人もいる (議論の本質には全く関係なし)
サブゲームの例
1
L
R
2
2
L’
R’
L’
R’
3
1
1
2
2
1
0
0
サブゲームは2つ
プレーヤー1の利得
プレーヤー2の利得
サブゲームが存在しない例
囚人1
黙秘
自白
囚人2
黙秘
自白
3
1
1
2
黙秘
2
1
自白
0
0
プレーヤー1の利得
プレーヤー2の利得
• サブゲームは情報集合を切断できないので、ここではサブ
ゲームは存在しない
サブゲームと歴史
•
サブゲームでは、そこまでの完全な歴史がその後に動くプ
レーヤー間の共有知識になっている
サブゲームの定義: どの情報集合をも切断しない
⇒ n以降の任意の節n’が複数の節を含む情報集合に入ってい
る場合、その情報集合に含まれる全ての節がサブゲームに
入っている
⇒ その情報集合に含まれる全ての節がn以降にきている
⇒ n’で手番を持つプレーヤーは、(少なくとも)nまでの完全な
歴史を知っている
サブゲーム完全の定義(復習)
サブゲーム完全 (Selten 1965):
• ナッシュ均衡はそこでのプレーヤーの戦略がどのサブゲー
ムにおいてもナッシュ均衡となるとき、サブゲーム完全
(subgame-pefect)であるという
⇒ 逆向き推論法による「結果」とサブゲーム完全なナッシュ均
衡はどう違うか?
均衡: 戦略(=完全な行動計画)の集まり
結果: 結果として何が選ばれたか
「結果」と「均衡」 ①
2段階の完備完全情報ゲーム(2.1.Aの復習):
1. プレーヤー1が実行可能な行動の集合A1から行動a1を選ぶ
2. プレーヤー2はa1を見たうえで実行可能な行動の集合A2か
ら行動a2を選ぶ
3. それぞれの利得 u1 (a1, a2), u2 (a1, a2) が決まる
逆向き推論法による結果: (a*1, R2(a*1))
サブゲーム完全なナッシュ均衡: (a*1, R2(a1))
R2(a1): 起こりうるすべてのa1に対して選ぶべき行動を指定
「結果」と均衡 ①’
1
L
R
2
2
L’
R’
L’
R’
3
1
1
2
2
1
0
0
プレーヤー1の利得
プレーヤー2の利得
逆向き推論法による結果: (R, L’)
サブゲーム完全なナッシュ均衡: (R, (R’, L’))
ナッシュ均衡: (R, (R’, L’)) 及び (L, (R’, R’))
⇒信憑性のない脅しを含んでいる
「結果」と「均衡」 ②
2段階の完備不完全情報ゲーム(2.2.Aの復習):
1. プレーヤー1とプレーヤー2が同時に行動a1とa2をそれぞれ
の実行可能集合A1とA2から選ぶ
2. プレーヤー3とプレーヤー4が第1段階の結果(a1, a2)を観
察し、そのあと同時に行動a3とa4をそれぞれの実行可能集
合A3とA4から選ぶ
3. 利得が ui (a1, a2, a3, a4), i=1, 2, 3, 4 で与えられる
サブゲーム完全な結果: (a*1, a*2, a*3 (a*1, a*2), a*4(a*1, a*2))
サブゲーム完全なナッシュ均衡:
(a*1, a*2, a*3 (a1, a2), a*4(a1, a2))
逆向き推論法と情報集合
囚人1
黙秘
自白
囚人2
黙秘
自白
3
1
1
2
黙秘
2
1
自白
0
0
プレーヤー1の利得
プレーヤー2の利得
囚人2は自分がどちらの節にいるか知らずに行動を決定
⇒ 3章でこういう場合での逆向き推論法について扱う
サブゲーム完全なナッシュ均衡の存在
•
完備情報の有限動学ゲームにおいて、混合戦略を許容す
ればサブゲーム完全なナッシュ均衡は必ず存在
完備情報の有限動学ゲーム:
プレーヤー数が有限で、 各プレーヤーの実行可能な戦略も
有限個のゲーム
証明: 省略 (岡田 p130-132参照)