投資家1

上級価格理論II
第4回
2011年後期
中村さやか
今日やること
2. 完備情報の動学ゲーム
• 2.2 完備不完全情報の2段階ゲーム
– 2.2.A 理論:サブゲーム完全性
– 2.2.B 銀行の取付け
• 2.3 繰り返しゲーム
– 2.3.A 理論:2段階繰り返しゲーム
– 2.3.B 無限繰り返しゲーム
完備不完全情報の2段階ゲーム
1. プレーヤー1とプレーヤー2が同時に行動a1とa2をそれぞれ
の実行可能集合A1とA2から選ぶ
2. プレーヤー3とプレーヤー4が第1段階の結果(a1, a2)を観
察し、そのあと同時に行動a3とa4をそれぞれの実行可能集
合A3とA4から選ぶ
3. 利得が ui (a1, a2, a3, a4), i=1, 2, 3, 4 で与えられる
単純化のための仮定:
• 第1段階ゲームのどんな結果(a1, a2)に対しても第2段階
ゲームが一意的なナッシュ均衡を持つ
第2段階のナッシュ均衡を(a*3 (a1, a2), a*4(a1, a2))で表す
完備不完全情報の2段階ゲーム
1. プレーヤー1とプレーヤー2が同時に行動a1とa2をそれぞれ
の実行可能集合A1とA2から選ぶ
2. プレーヤー3とプレーヤー4が第1段階の結果(a1, a2)を観
察し、そのあと同時に行動a3とa4をそれぞれの実行可能集
合A3とA4から選ぶ
3. 利得が ui (a1, a2, a3, a4), i=1, 2, 3, 4 で与えられる
仮定: 第2段階ゲームの結果が(a*3 (a1, a2), a*4(a1, a2))
⇒上のゲームは(1段階の)同時手番ゲームになる:
1. プレーヤー1とプレーヤー2が同時に行動a1とa2をそれぞれ
の実行可能集合A1とA2から選ぶ
2. 利得は ui (a1, a2, a*3 (a1, a2), a*4(a1, a2)), i=1, 2
このゲームが一意的なナッシュ均衡(a*1, a*2)を持つとする
完備不完全情報の2段階ゲーム
1. プレーヤー1とプレーヤー2が同時に行動a1とa2をそれぞれ
の実行可能集合A1とA2から選ぶ
2. プレーヤー3とプレーヤー4が第1段階の結果(a1, a2)を観
察し、そのあと同時に行動a3とa4をそれぞれの実行可能集
合A3とA4から選ぶ
3. 利得が ui (a1, a2, a3, a4), i=1, 2, 3, 4 で与えられる
仮定:
• 第2段階の一意的ナッシュ均衡が(a*3 (a1, a2), a*4(a1, a2))
• 第2段階の結果が(a*3 (a1, a2), a*4(a1, a2))であると仮定し
た場合の1段階のゲームの一意的ナッシュ均衡が(a*1, a*2)
⇒ (a*1, a*2, a*3(a*1, a*2), a*4(a*1, a*2))をこの2段階ゲームの
サブゲーム完全な結果とよぶ(詳しくは2.4で)
銀行の取付け① 銀行の投資
投資家2人が銀行にそれぞれDだけ投資
銀行はその預金をある長期プロジェクトに投資
投資家1
D
銀行
投資家2
D
2D
長期プロジェクト
途中清算なら2r
投資完了なら2R
銀行が途中で投資を清算 ⇒2r (D>r>D/2) 回収
銀行が最後まで投資継続 ⇒2R (R>D) 回収
銀行の取付け② 投資家の取り分
•
•
•
•
•
•
投資家1
D
投資家2
銀行
D 途中清算なら2r
2D
長期プロジェクト
投資完了なら2R
投資家が預金を引き出せるのは銀行投資が満期になる前
の期日1か満期になった後の期日2のどちらか&割引率0
2人とも期日1で引き出し⇒2人ともrを受け取る
1人だけ期日1で引き出し⇒引き出した方はD, 引き出さな
かった方は2r-Dを受け取る
2人とも期日2で引き出し⇒2人ともRを受け取る
1人だけ期日2で引き出し⇒引き出した方は2R-D, 引き出
さなかった方はDを受け取る
2人とも引き出さない⇒2人ともRを受け取る
銀行の取付け③ 期日2のゲーム
投資家2
引き出す
投資家1
•
•
引き出さない
引き出す
R,
R
2R-D,
D
引き出さない
D, 2R-D
R,
R
相手が引き出すなら、R>D なので引き出した方がよい
相手が引き出さないなら、2R-D>R なので引き出した方が
よい
⇒「引き出す」が「引き出さない」を強く支配
⇒2人とも預金を引き出し(R,R)を得るのが一意的ナッシュ均衡
銀行の取付け④ 期日1のゲーム
投資家2
引き出す
引き出す
投資家1
引き出さない
引き出さない
r,
r
D,
2r-D
2r-D,
D
R,
R
• 相手が引き出すなら、r>2r-D なので引き出した方がよい
• 相手が引き出さないなら、D<R なので引き出さない方がよい
ナッシュ均衡は2つ:
1. 2人とも預金を引き出し(r,r)を得る ⇒取りつけ騒ぎ
2. 2人とも預金を引き出さずに(R,R)を得る ⇒効率的
2段階繰り返しゲーム① ルール
プレーヤー2
L2
プレーヤー1
R2
L1
1, 1
5, 0
R1
0, 5
4, 4
• 2人のプレーヤーはこの同時手番ゲームを2回繰り返す
⇒2度目のゲームは1度目のゲームの結果を見てから行われる
• ゲームの利得は1回目と2回目の利得の和 (割引率ゼロ)
⇒2.2.Aで分析したクラスのゲーム
2段階繰り返しゲーム② 第2段階
プレーヤー2
L2
プレーヤー1
R2
L1
1, 1
5, 0
R1
0, 5
4, 4
• どちらのプレーヤーにとってもLがRを強く支配
⇒ 第2段階の一意的ナッシュ均衡は第1段階の結果にかかわ
らず(L1, L2)
2段階繰り返しゲーム③ 第1段階
プレーヤー2
L2
プレーヤー1
•
R2
L1 1+1, 1+1 5+1, 0+1
R1 0+1, 5+1 4+1, 4+1
第2段階の一意的ナッシュ均衡の利得(1, 1)を第1段階の利
得に加えると上の利得票が得られる
• どちらのプレーヤーにとってもLがRを強く支配
⇒ 第1段階の一意的ナッシュ均衡は (L1, L2)
⇒サブゲーム完全な結果
段階ゲームと有限繰り返しゲーム
•
•
•
•
•
G={A1 ,…, An ; u1 ,…, un} をプレーヤー1,…, nが同時に行
動空間A1 ,…, Anから行動a1 ,…, anを選択し、利得が
u1 (a1 ,…, an)…, un (a1 ,…, an)によって与えられる完備情
報の静学ゲームとする
段階ゲームGをT回繰り返して行う有限繰り返しゲーム
(finitely repeated game)をG(T)で表す
このとき、Gを繰り返しゲームの段階ゲーム(stage game)と
よぶ
このゲームでは毎回の繰り返しの前にそれ以前の全てのプ
レーが観察されることになっている
G(T)の利得はT個の段階ゲームの利得を足し合わせたも
のである
命題
•
•
もし段階ゲームGが一意的なナッシュ均衡を持つならば、繰
り返しゲームG(T)はどんな有限のTについても一意的でサ
ブゲーム完全な結果を持つ
その結果とは、Gのナッシュ均衡がどの段階ゲームにおい
てもプレーされることである
注意:
• ナッシュ均衡が一意的でないならば、この命題は成り立た
ない (詳しくは教科書で)
無限繰り返しゲームと割引因子
段階ゲームを無限回繰り返す
• 例えばそれぞれの段階ゲームでどの行動を選んでも必ず
正の利得を得られるとする
⇒ それらを単純に足し合わせたものが繰り返しゲームの利得
だとすると、それぞれの段階ゲームでどんな選択をしても繰
り返しゲームの利得は無限大になってしまう
⇒ 将来の利得を現在価値に換算する際に割引くことで解決
定義
• 割引因子をδ(0<δ<1)とするとき、利得の無限列π1, π2, π3,
…の現在価値(present value)は以下の式で与えられる

 1   2   2 3      t 1 t
t 1
いつ終わるかわからない繰り返しゲーム
•
•
各段階ゲームが終わるたびごとに確率pでゲームがそこで
終わり、確率1-pでゲームを少なくともつぎの段階まで継続
する無限回繰り返しゲーム
時間選好による割引率は1/(1+r) (r>0) であるとする
利得の現在価値の期待値
= π1 + π2(1-p)/(1+r) + π3[(1-p)/(1+r)]2 +・・・
t 1
1 p 
 
 t
t 1  1  r 

⇒ 割引率δは時間選好だけでなくゲームが終わる確率も反映
していると解釈できる (pが大きいほど大きく割り引く)
無限回繰り返しゲームの例
プレーヤー2
L2
プレーヤー1
R2
L1
1, 1
5, 0
R1
0, 5
4, 4
• 2人のプレーヤーはこの同時手番ゲームを無限回繰り返す
⇒ 各段階ゲームはそれまでのゲームの結果を見てから行わ
れる
• ゲームの利得は各段階ゲームの利得の現在価値の和
無限回繰り返しゲームの結果
プレーヤー2
L2
プレーヤー1
R2
L1
1, 1
5, 0
R1
0, 5
4, 4
有限回繰り返しゲーム:
サブゲーム完全な結果では必ず毎回 (L1, L2)が選ばれる
無限回繰り返しゲーム:
毎回 (R1, R2)が選ばれるサブゲーム完全な結果がある
トリガー戦略 (trigger strategy)
•
•
•
まず第1段階ではRiをプレーする
第t段階では、もしそれまでのt-1段階での結果がすべて(R1,
R2)であったならRiをプレーする
そうでないときはLiをプレーする
trigger: しっぺがえし
• プレーヤーiは他のプレーヤーが協力を続ける限り自分も協
力を続ける
• しかしその前提が崩れた時には非協力に切り替え、その後
ずっと非協力的な行動を続ける
• もし両方のプレーヤーがこの戦略を取っていれば、すべて
の段階で(R1, R2)がプレーされる
トリガー戦略とナッシュ均衡①
WTS: 両方がトリガー戦略を取っているのはナッシュ均衡
⇔ 相手がトリガー戦略をとるなら自分もトリガー戦略をとること
が最適反応
証明:
• まず、相手がトリガー戦略をとっているときに自分が一度Ri
以外を選んだ後のゲームを考える
• その後は相手はLjを選び続ける
⇒ 最適反応は自分も毎回Liを選び続けること
• 裏切った段階で得られる最大利得は5 (自分がLi、相手がRj
をプレー)、その後は毎回1を得るので、利得の列の現在価
値は
5+δ・1+δ2・1+δ3・1・・・ = 5+δ/(1-δ)
トリガー戦略とナッシュ均衡②
• 自分が最適反応を行った場合の利得の無限列の現在価値
をVとする
• もしある段階ゲームでRiをプレーするのが最適ならば、
V=4+δV ⇒ V=4/(1-δ)
• もしある段階ゲームでLiをプレーするのが最適ならば、
V= 5+δ/(1-δ)
4/(1-δ) – [5+δ/(1-δ)] = [1/(1-δ)][4-5(1-δ)-δ]=(4δ-1)/(1-δ)
0<δ<1より分母は正
δが十分大きければ(δ>0.25 ならば)分子も正
⇒各段階ゲームでRiをプレーするのが最適
⇒相手がトリガー戦略をとるなら自分もトリガー戦略をとるのが
最適反応
無限繰り返しゲームの定義
•
•
•
Gを段階ゲームとするとき、そのGを無限に繰り返し ,かつそ
のさいプレーヤーの共通の割引因子がδであるような無限
繰り返しゲーム(infinitely repeated game)をG(∞, δ)で表す
このゲームでは、どのtについても、t段階の初めにそれ以前
のt-1回の段階ゲームの結果が観察されている
それぞれのプレーヤーのG(∞, δ)における利得は、これらの
段階ゲームからの利得の無限列の現在価値である
⇒ とるべき行動(戦略)はそれ以前のゲームの結果にも依存
⇒ 各プレーヤーの戦略空間と行動空間が一致していた完備
情報の静学ゲームとは異なる
「歴史」と戦略
第t段階までのプレーの歴史(history):
• 第1段階から第t段階までの各プレーヤーの選択の記録
定義
• 有限繰り返しゲームG(T)または無限繰り返しゲームG(∞,
δ)において、プレーヤーの戦略とは、各段階で、それまでに
起こり得た全ての歴史のそれぞれに応じプレーヤーがどの
行動を取るかを指定したものである
戦略=完全な行動計画
(戦略さえあれば代理人がプレーヤーに代わってプレー可能)
サブゲームの定義
サブゲーム(subgame):
• 元のゲームの一部分で、ある1つの歴史があり、それがプ
レーヤー間の共有知識となっている任意の点を起点とし、
そのあとがプレーされるゲームのこと
• 有限繰り返しゲームG(T)で第t+1段階から始まるサブゲー
ムとは、GがT-t回プレーされる繰り返しゲームのことで、
G(T-t)と書かれる
⇒ 第t+1段階から始まるサブゲームは第t段階までの可能なプ
レーの歴史それぞれに対応して1個ずつ存在する
• 無限繰り返しゲームG(∞, δ)において第t+1段階から始まる
サブゲームは、第t段階までに起こり得たプレーの歴史の数
と同数存在し、それぞれがもとのゲームと同じになる
サブゲームの例
•
無限繰り返しの囚人のジレンマゲームで、第1段階の起こり
うる歴史は4つある; (L1, L2), (L1, R2), (R1, L2), (R1, R2)
⇒ 第2段階から始まるサブゲームは
歴史が(L1, L2)のサブゲーム
歴史が(L1, R2)のサブゲーム
歴史が(R1, L2)のサブゲーム
歴史が(R1, R2)のサブゲーム
の4つ
• 第2段階から始まるサブゲームは第2段階のステージゲー
ムだけでなくその後全ての段階のステージゲームを含んで
いる
サブゲーム完全の定義
サブゲーム完全 (Selten 1965):
• ナッシュ均衡はそこでのプレーヤーの戦略がどのサブゲー
ムにおいてもナッシュ均衡となるとき、サブゲーム完全
(subgame-pefect)であるという
⇒ ナッシュ均衡を精緻化した概念
•
①
⇒
②
⇒
無限繰り返しの囚人のジレンマゲームにおけるトリガー戦
略は、サブゲーム完全
それ以前の結果が全て(R1, R2)のサブゲーム
トリガー戦略がナッシュ均衡
それ以前の結果が一度は(R1, R2)以外を含むサブゲーム
トリガー戦略がナッシュ均衡 ((L1, L2)を繰り返すだけ)