プレーヤー1

上級価格理論II
第9回
2011年後期
中村さやか
今日やること
3. 不完備情報の静学ゲーム
• 3.3 顕示原理 (revelation principle)
4. 不完備情報の動学ゲーム
• 4.1 完全ベイジアン均衡への入門
オークションの売り手の収入最大化
•
売り手の利益が最大化するにはどういう方法でオークション
を行えばよいか?
オークションにはありとあらゆる方法がある
•
例)
– 入札者が入札への参加料を払う?
– 落札できなかった場合も自分や他の人たちの入札額に
応じて何らかの支払いをする?
– 最低入札価格を決めておく?
• これら全てについて一つ一つ検討しないといけない?
⇒ 顕示原理によってこの問題をはるかに単純化できる
オークションの場合の自己申告メカニズム
(direct mechanism)
実は売り手は以下のクラスのゲームにだけ着目すればよい
1. 入札者は同時に自分のタイプ(留保価格)を申告する。ウソ
をついてもかまわない。つまり、入札者 i は自分の真のタイ
プ ti に関係なく、i のタイプの集合 Ti に属する要素からどの
タイプ τi でも選び、それが自分のタイプだと申告できる。
2. 入札者たちが申告したタイプに応じて入札者 i は xi(τ1 ,…,
τn) を払い、財を確率 qi(τ1 ,…, τn) で受け取る。
どのような自己申告のタイプの組み合わせ (τ1 ,…, τn) に対
しても確率の和 Σi qi(τ1 ,…, τn) は1以下。
• 真実の表明(=正しいタイプを申告すること)がベイジアン・
ナッシュ均衡になるような直接メカニズムを誘因両立的
(incentive compatible)という
顕示原理 (revelation principle)
•
いかなるベイジアン・ゲームのいかなるベイジアン・ナッシュ
均衡も、誘因両立的な自己申告メカニズムによって表現で
きる(=プレーヤーのタイプがどんな組み合わせであっても
均衡における行動と利得が等しくなる)
⇔ ベイジアン・ゲームのベイジアン・ナッシュ均衡として達成で
きる配分は、すべて自己申告メカニズムの正直なベイジア
ン・ナッシュ均衡(全員が正しいタイプを申告)として実現で
きる
⇒ オークションの場合には、各入札者の均衡戦略が Ti に属
するそれぞれの ti に対して τi(ti)=ti となるような支払いの
ルール xi(τ1 ,…, τn) と 分配確率のルール qi(τ1 ,…, τn) だけ
に着目すればよい
顕示原理の応用:オークション
•
入札者の評価が互いに独立で、他の入札者の評価を知っ
ても自分の評価が変わらないオークション(3.2.B)で、売り手
の期待利得を最大化するオークション方法とベイジアン・
ナッシュ均衡をもとめる
• 正直な均衡をもつ自己申告メカニズムの中で売り手の期待
利得を最大化するものを見つければ、売り手は最大でどれ
だけの期待利得が得られるかがわかる
⇒ この売り手の期待利得の最大値をもたらすモデルと均衡を
探せばよい
• 3.2.Bのオークション・モデルの対称的なベイジアン・ナッ
シュ均衡は売り手に最大の期待利得をもたらす
• 売り手に最大の期待利得をもたらすモデルと均衡は他にも
いろいろある
顕示原理の応用:ダブル・オークション①
•
3.2.Cのダブル・オークションのルール:
– 売り手は販売希望価格 ps を、買い手は購入希望価格
pb を同時に提示
– もし pb ≧ ps なら (pb + ps)/2 の価格で取引成立
– もし pb < ps なら取引不成立
• このルールの下では、取引した方が効率的なのに取引が行
われないことがある
• ルールを変更したらもっとうまくいく?
例
– 取引が成立しなくても買い手から売り手へ、または売り
手から買い手へ支払いが行われるようにする?
– 取引成立の条件を変える?
顕示原理の応用:ダブル・オークション②
•
ダブル・オークションの自己申告メカニズム:
– 買い手と売り手が同時にそれぞれのタイプ τb, τs を表明
– 買い手が売り手に正または負の値を取る x(τb, τs) を支
払い、買い手は財を確率 p(τb, τs) で受け取る
• 自己申告メカニズムの中で正直な均衡を持つものを探し、
その中で参加条件(売り手と買い手それぞれの均衡での期
待利得がゲームに参加しないときの利得以上)が満たされ
るものを特定
• ↑の中で取引が効率的であるとき、かつそのときに限って取
引が行われるようなベイジアン・ナッシュ均衡は存在しない
⇒ 売り手と買い手が自発的に参加する交渉ゲームで、取引が
効率的であるとき、かつそのときに限って取引が行われるよ
うなベイジアン・ナッシュ均衡は存在しない
ベイジアン・ナッシュ均衡の定義 (復習)
定義
静学ベイジアン・ゲーム G=(A1, …, An; T1, …, Tn; p1, …,
pn; u1, …, un) において戦略 s*=(s*1, …, s*n) が(純粋戦略)
ベイジアン・ナッシュ均衡であるとは、各プレーヤー i と Ti に
属する i の各 ti に対して s*i(ti) が
max
ai Ai
*
*
*
*
u
(
s
(
t
),...,
s
(
t
),
a
,
s
(
t
),...,
s
i 1 i 1
i 1 i 1
n (t n ); ti ) pi (t i | ti )
i 1 1
i
t i Ti
の解になっていることである
⇒ 他のプレーヤーの戦略を所与とすると、どのプレーヤーも戦
略を変更する誘因をもたない
顕示原理の証明 ①
顕示原理:
いかなるベイジアン・ゲームのいかなるベイジアン・ナッシュ
均衡も、誘因両立的な自己申告メカニズムによって表現で
きる(=タイプのどんな組み合わせに対しても均衡における
行動と利得が等しくなる)
証明のアウトライン
• 静学ベイジアン・ゲーム G=(A1, …, An; T1, …, Tn; p1, …,
pn; u1, …, un) において戦略 s*=(s*1, …, s*n) がベイジア
ン・ナッシュ均衡であるとする
⇒ 正直なベイジアン・ナッシュ均衡において s*=(s*1, …, s*n)
が行われるような自己申告メカニズムを構成する
顕示原理の証明 ②
元のゲーム: G=(A1, …, An; T1, …, Tn; p1, …, pn; u1, …, un)
• 戦略 s*=(s*1, …, s*n) がベイジアン・ナッシュ均衡
自己申告メカニズム:
• タイプ空間 (T1, …, Tn) と信念 (p1, …, pn) はGと同じ
• 行動空間はタイプ空間 (T1, …, Tn) と同じ
(各プレーヤー i が各自の可能なタイプ Ti の中から1つ選
んで自分のタイプを申告)
• 各プレーヤーにとって正しいタイプを申告することが最適反
応になるように利得関数を構成する
顕示原理の証明 ③
元のゲーム:
• プレーヤー i は、他のプレーヤーの戦略
(s*1 (t1), …, s*i-1(ti-1), s*i+1(ti+1), …, s*n(tn)) を所与として、
可能な行動 Ai の中から最適反応となる s*i(ti) を選択
自己申告メカニズム:
• 申告したタイプ τi によって、そのタイプのもとでの最適戦略
s*i(τi) が自動的にプレーされる
⇒ 他の全員が正直に申告するならば (s*1 (t1), …, s*i-1(ti-1),
s*i+1(ti+1), …, s*n(tn)) がプレーされるので、自分も s*i(ti) が
プレーされるように正直に申告するのが最適反応
他のタイプのふりをしても得をしない
顕示原理の証明 ④
元のゲーム:
G = (A1, …, An; T1, …, Tn; p1, …, pn; u1, …, un)
• 戦略 s* = (s*1, …, s*n) がベイジアン・ナッシュ均衡
自己申告メカニズム:
G = (T1, …, Tn; T1, …, Tn; p1, …, pn; v1, …, vn)
vi(τ, t) = ui[s*(τ), t]
t = (t1, …, tn),
τ = (τ1, …, τn)
• 戦略 τ*= t がベイジアン・ナッシュ均衡
証明終わり
4章 不完備情報の動学ゲーム
1章: 完備情報の静学ゲーム:
• ナッシュ均衡の均衡概念で十分
2章: 完備情報の動学ゲーム:
• ナッシュ均衡の均衡概念では変な均衡が排除できないので
より強い概念のサブゲーム完全なナッシュ均衡を適用
3章: 不完備情報の静学ゲーム:
• ナッシュ均衡の均衡概念では十分な分析ができないので、
より強い概念であるベイジアン・ナッシュ均衡を適用
4章: 不完備情報の動学ゲーム:
• ベイジアン・ナッシュ均衡の均衡概念やサブゲーム完全な
ナッシュ均衡の均衡概念では十分な分析ができず、変な均
衡が排除できないので、これらより強い概念である完全ベイ
ジアン均衡を適用
均衡概念の間の関係
完全ベイジアン均衡は
• 不完備情報の静学ゲームではベイジアン・ナッシュ均衡と
等しく
• 完備情報の動学ゲームではサブゲーム完全なナッシュ均衡
と等しく
• 完備情報の静学ゲームではナッシュ均衡と等しい
⇒ 完全ベイジアン均衡はこれら3つの均衡の部分集合
完全ベイジアン均衡と
サブゲーム完全なナッシュ均衡
サブゲーム完全:
• ナッシュ均衡のうち、どのサブゲームにおいてもナッシュ均
衡となっているもの
完全ベイジアン均衡:
• ベイジアン・ナッシュ均衡のうち、どの完全な情報集合から
始まる継続ゲーム(continuous game)においてもベイジア
ン・ナッシュ均衡になっているもの
(正式な定義は後で示す)
情報集合の定義 (復習)
•
プレーヤーの情報集合(information set)とは、次の2条件を
満たす決定節の集まりである
i. プレーヤーは情報集合に含まれるどの節でも自分の手番
になっている
ii. 情報集合に含まれる1つの節にゲームのプレーが到達した
とき、プレーヤーはその情報集合に含まれる節のうちどこ
に自分がいるのか区別できない
※ 同一の情報集合に属する各節では、プレーヤーの取りうる
行動の集合(行動空間)が同じでなければならない
(そうでなければ行動空間を見れば自分がどの節にいるか
推測できる)
※ どの節もどれか1つの情報集合に入っている
(含まれる節が1つだけの情報集合もある)
情報集合の例 (復習)
囚人1
黙秘
自白
囚人2
黙秘
自白
3
1
1
2
黙秘
2
1
自白
0
0
プレーヤー1の利得
プレーヤー2の利得
• 情報集合に含まれている節を○で囲んでその横にプレー
ヤーの名前を書く
• 囚人2は2つの節のうちどちらに自分がいるのかわからない
サブゲームの厳密な定義(復習)
定義:
展開型ゲームのサブゲームとは、
a. それ自体が1節のみを含む情報集合になっている決定節n
(ただしゲームの最初の決定節は除く)から始まり
b. ゲームの木のnより後に続くすべての決定節および終節を
含み(かつnの後に来ない節は1つも含まず)、
c. どの情報集合をも切断しないもの
である
注:ここでは全体のゲームをサブゲームとはみなさないが、みな
す人もいる (議論の本質には全く関係なし)
サブゲームの例 (復習)
1
2
L
R 2
L’
R’
L’
R’
3
1
1
2
2
1
0
0
サブゲームは2つ
プレーヤー1の利得
プレーヤー2の利得
サブゲームが存在しない例 (復習)
囚人1
黙秘
自白
囚人2
黙秘
自白
3
1
1
2
黙秘
2
1
自白
0
0
プレーヤー1の利得
プレーヤー2の利得
• サブゲームは情報集合を切断できないので、ここではサブ
ゲームは存在しない
完備不完全情報の動学ゲームの例
R
1
L
M
1
3
2
L’
2
1
R’
L’
0
0
0
2
R’
0
1
プレーヤー1の利得
プレーヤー2の利得
プレーヤー1が L, M, R の中から1つを選ぶ
もしRが選ばれればそこでゲームは終了
もしLかMが選ばれれば、プレーヤー2はRが選ばれなかっ
たことを知り(LとMのどちらが選ばれたかは知らずに)、L’ と
R’ からどちらかを選ぶ
ゲームの標準形の表現
プレーヤー2
L’
プレーヤー1
R’
L
2, 1 0, 0
M
0, 2 0, 1
R
1, 3 1, 3
• 純粋戦略のナッシュ均衡: (L, L’) (R, R’)
• これらはサブゲーム完全?
サブゲーム完全なナッシュ均衡
R
1
L
M
1
3
2
L’
2
1
R’
L’
0
0
0
2
R’
0
1
純粋戦略のナッシュ均衡: (L, L’) (R, R’)
このゲームにはサブゲームがないので、ナッシュ均衡であれば
サブゲーム完全なナッシュ均衡になる
⇒ サブゲーム完全なナッシュ均衡: (L, L’) (R, R’)
しかし (R, R’) は信憑性のない脅しに依存