Chapter 6 Applications

Repeated Games and Reputations
Long-Run Relationships
Chapter 6
Applications
Taiki Todo
March 29, 2012
Introduction
• 本章では完全観測繰り返しゲームの適
用例を3つ紹介
• 現実問題の解析・説明に繰り返しゲー
ムを用いる際の定式化の例
Outline
• 6.1 Price Wars
– n 企業間の価格競争
– プレイヤ間の協調 (collusion) の達成可能性
• 6.2 Time Consistency
– 企業-政府間の資本課税競争
– 無限回繰り返しゲームによる効率的結果の実現
• 6.3 Risk Sharing
– 消費と保険加入
– 現実問題の,均衡結果による説明
6. Applications
6.1 Price Wars
Price Wars
• 同一の商品を生産する n 個の企業
• 最安値を設定した企業のみが勝者(消費者
に販売可能)
• 勝者の利益は,消費者の需要量×価格
– 複数の企業が最安値を設定した場合,その企業
間で需要を等分割
• この競争が繰り返し行われる場合に,企業間
の協調(全員が同一価格を設定)は達成でき
るだろうか
Repeated Game Representation
(1/3)
• n: 企業(プレイヤ)数
• s: 状態.全プレイヤが正確に状態を把握 (perfect
monitoring)
• S: 状態の集合
• q: S 上の分布関数.q(s) は状態 s が生起する確率
• p1,…, pn: 分布 q から選ばれる現在の状態を観測
後,プレイヤが設定する価格.プレイヤの戦略.
• s-min{p1,…,pn}: 最安値に対応する需要.この形式
で与えられると仮定.
• min{p} * (s – min{p}): 勝者が等分割する利益
Repeated Game Representation
(2/3)
• 各期のゲームにおけるナッシュ均衡では,最安値は
$0 となり,全員利得 0
– 他の誰か一人でも $0 を付けた場合,自分はどのような価
格を付けても利得は 0
– 一方,自分以外の最安値が $100 のとき,$99 を付ければ
全ての需要を独占
– この繰り返しにより最安値は $0 まで低下
• 一方,最も利得を増加させる価格は,需要 s に対し
て s/2. そのときの利得 (s/2)^2
• 自分以外の全員が s/2 を付けているとき,少し下げ
れば需要を独占
Repeated Game Representation
(3/3)
• The most collusive equilibrium (MCE)
– Strongly symmetric
– Maximizes the firms’ expected payoff
• 以降,この MCE p(s) を考慮
– p(s) <= s/2: min{p}(s-min{p}) の式より一般性を失わない
– 均衡からの逸脱は,以降永久に処罰
• 分布 q の構造と均衡戦略との関係を議論
– 6.1.1 independent and identically distributed
– 6.1.2 with persistence
6.1.1 Independent Price Shocks
• 各期独立に,同一の分布 q に従って状態 s
が生起
• MCE p(s) は,全ての s において以下の式の
解:
1
(1- d )p(s)(s - p(s)) + d v* ³ (1- d )p(s)(s - p(s))
n
1
*
v = å p(sˆ)(sˆ - p(sˆ))q(sˆ)
n sˆÎS
協調した場合の今期の利得と
今後の期待利得
均衡戦略 p から逸脱した場合の
今期の利得
For Large δ
• δ が十分大きいとき,v* の式のみが有効
• すなわち,p(s) = s/2 が均衡戦略
– 現在の状態 s に対する価格設定による利得が小
さくなる
1
v = å p(sˆ)(sˆ - p(sˆ))q(sˆ)
n sˆÎS
*
For Small δ (1/3)
• 一方,δ が十分小さいとき,
p(s) は次の式を解く:
nd v
³ p(s)(s - p(s))
(n -1)(1- d )
u
p(s)(s-p(s))
*
• 右図より,s = max{S} の場合
*
nd v
< (s / 2)2
(n -1)(1- d )
であるから,必ず bar(s) が
存在
bar(s)
p(s)
For Small δ (2/3)
• この bar(s) を用いて,
MCE p(s) は次のように書け
る:
u
– s > bar(s) のとき
nd v*
p(s)(s - p(s)) =
(n -1)(1- d )
– s <= bar(s) のとき
p(s) = s / 2
p(s)
For Small δ (3/3):
discussions
• Bar(s) が与えられたとき,MCE p(s) は,
– s > bar(s)に対して単調減少 (counter-cyclical)
• 状態 s の値が大きいほど,逸脱した場合の利益は大
きい
– s < bar(s) に対して単調増加 (pro-cyclical)
• 問題(特に需要 s )が与えられたとき,需要が
小さいうちは協調戦略の価格は増加傾向
• しかし,需要が大きくなると,協調戦略の価格
が減少
6.1.2 Correlated Price Shocks
• 6.1.1 では,各期の状態は独立に同一の分布
から選ばれると仮定
• 現実の問題,次の状態は現在の状態と何ら
かの関係を持つことが多い
• 特に,次の状態が現在の状態から変わりにく
い(粘度,persistence)というのはよく見られる
傾向
– 景気の変動:好景気と不景気が急激に入れ替わ
ることは稀,多くの場合緩やかに変動
Simple Example
• n=2
• S = {1 (low demand) , 2 (high demand)}
• q: 次状態の分布.以下のマルコフ過程で定義:
–
–
–
–
初期状態はランダム(互いに確率 1/2)で生起
確率 1-φ で,現在の状態と同一の状態が生起
確率 φ で,現在の状態と異なる状態が生起
φ を小さく選べば,persistent な状況を表現可能
• δ = 11/20 (1/2 より微妙に大きい点がポイント)
Cf. MCE
• 先に,6.6.1 のケースと同様の i.i.d. の分布を
仮定し,MCE を考えてみる
– 需要が小さいとき (s=1), 1/2 を設定
– 需要が大きいとき (s=2), 次の式で与えられる p を
設定:
1
11 11
sup [(1- d )p(2 - p)] £ (1- d ) p(2 - p) + d ( +
p(2 - p))
p<p
2
28 22
– この式を解くと,p~ = 0.22 が得られる
– 即ち,countercyclical
• High-demand の場合の方が均衡価格が低くなる
Persistent States (1/2)
• 次に,定義したマルコフ過程を考える
• 各期 s/2 を定める戦略 p を考える
– s に関して単調増加
– この戦略が MCE であれば,このモデルは pro-cyclical
• φ がほぼ 0 のとき(= persistence が強いとき),
– 初期状態 s=1 -> v* = 1/8
– 初期状態 s=2 -> v* = ½
• よって,上記の戦略が MCE となるための必要十分
条件は
sup [(1- d )p(2 - p)] £
p<1/2
1
8
sup [(1- d )p(2 - p)] £
p<1
1
2
Persistent States (2/2)
• これらを解くと,δ >= ½
• よって,現在の discount factor 11/20 であれ
ば,各期 s/2 を定める戦略が MCE
– この MCE p(s) は明らかに単調増加
– すなわち,このモデルは pro-cyclical: 需要 s が増
加すれば,協調 (MCE) による利益も増加
6. Applications
6.2 Time Consistency
Time Consistency
• 企業と政府の資本課税競争
• 企業は各期,1単位の分割財を,消費と資本に分割
– 消費はそのまま自分の利益
– 資本は,ある一定の割合の収益を生み出すが,その収益
は政府によって課税される
– 徴収された税によって,公共財が生産され,企業はその
公共財からも(微量の)利益を得る
• 企業が毎期同一の分割を行うような税率は?
– 政府は benevolent/慈善的
6.2.1 Stage Game
• Player 1: 政府
• Player 2: 企業.毎期同一性能の異なる企業
が参加
– c: 消費 (consumption)
– 1-c: 資本 (capital)
– R: 資本からの収益 (return). R>1
– t: 政府による課税率 (tax rate)
– γ(>1): 税収からの公共財の生産率.R-1<γ<R
Consumer’s Utility
c + (1- t)R(1- c)+ 2 G
• 但し,G は公共財の量
• 企業の立場では,G は微少量と考えられる?
ため,固定して計算
ì
R -1
ïï 0 if t <
R
argmax [ c + (1- t)R(1- c)] = í
0£c£1
ï 1 if t > R -1
ïî
R
Government’s Response
• 企業が分割 c を選択したときの政府の最適な
課税率 t
– ただし,政府は慈善的であり,目的関数は企業の
利益の最大化
ì g
ü
é
ù
argmax ëc + (1- t)R(1- c) + 2 g tR(1- c) û = min í
,1ý
0£t£1
î R(1- c) þ
Best Response
• 互いの最適反応を図示す
ると右図のようになる
• ところで,政府は慈善的で
あるから,政府-企業の利
害は一致
• R は資本からの収益である
から明らかに R>1
• よって,企業は全て資本と
する (c=0) のが効率的
• そのときの最適な課税は
t = γ/R (点 B)
6.2.2 Equilibrium, Commitment,
and Time Consistency
• しかし,点 B は効率的
ではあるが,均衡でない
– 課税率 t=γ/R に対する
最適な分割は c=1
– 実際,均衡は点 A
• 企業が最適反応を取ると
仮定すると,企業の利得
を最大化する課税率は
t=(R-1)/R となり,結果は
点C
– 企業が全て資本とする
ような最大の課税率
Commitment Problem
• 先に政府が t=(R-1)/R を選び,それを企業が観測で
きるのであれば,点 C の結果を保証可能
• しかし,現実には不可能
• このとき,政府の立場から見るとコミットメント問題が
生じる
– 相手の戦略決定前に自分の戦略を相手に伝えることが
できれば,自分の効用(この場合は政府の効用であり,
問題の定義より企業の効用と等価)を増加可能
– Time consistency problem とも呼ばれる.このとき,政府
は optimal だが time inconsistent な課税率を持つ,という
6.2.3 The Infinitely Repeated Game
• 無限回の繰り返しゲームを考えることで,政府が企
業に情報を伝えられるのではないか
• 仮定として,政府は割引率 δ を持つものとする
• ここでは, grim-trigger 戦略を考え,毎期点 C を達
成可能なサブゲーム完全均衡となることを示す
Grim Trigger Strategy
• 状態: wL and wH
– wL: 低税率(t=t*=(R-1)/R)かつ c=0
– wH: 高税率(t=1)かつ c=1
• 初期状態 wL
• 行動
– 政府: wL のとき t*, otherwise t=1
– 企業: wL のとき c=0, otherwise c=1
• 遷移
– wL かつ t=t* のとき wL, otherwise wH
6. Application
6.3 Risk Sharing
Risk Sharing
• 消費者の消費と保険契約
• 高所得者は低所得者よりも消費が多い?
• 現実のデータを見ると,必ずしもそのようにはなって
おらず,現在や過去の収入状況に依存している,ら
しい.
• ここでは,プレイヤ2人のシンプルなモデルを用い
て,そのデータに一つの説明をつける
– モラル・ハザードとの関係?
6.3.1 The Economy (1/2)
• n=2: プレイヤは二人
• State: e(1) = (y-, y_) & e(2) = (y_, y-)
– 初期保有量を規定
– y- + y_ = 1, y- \in (1/2, 1)
– 等確率 (random state RG)
• Stage game strategy:
相手に譲渡する量(=保険料?)
– 譲渡後の保有量を c1, c2 で表記
• Utility u(c): 保有量に関する関数
– 単調増加かつ凹 → リスク回避
– Ex. 限界効用逓減
u(c)
c
6.3.1 The Economy (2/2)
• Strategy: 前期までの履歴と今期の初期保有
量から,今期相手へ譲渡する額を出力
– Ex. No-transfer: 効用関数が単調増加なので,各
期相手に譲渡しないことが均衡.但し,concave
であるから結果は非効率的(risk-neutral であれ
ば効率的)
• 各期で効率的な結果を導くサブゲーム完全
均衡は存在する?それはどのような場合?
6.3.2 Full Insurance Allocations
• Full-insurance strategy profile: ある定数 c が
存在し,任意の履歴に対してプレイヤ 1 が c
を保有し,プレイヤ 2 が 1-c を保有するような
戦略の組
– 即ち,任意の履歴に対して,両エージェントが毎
期同じ額を消費する戦略の組
– No-transfer は full insurance? → NO
– Player1-all-transfer は full insurance? → YES
– Equal-payoff-transfer は full insurance? → YES
– Full insurance 自体は均衡とは別の概念
SPE and Full Insurance
• Full Insurance (FI) strategy profile がサブゲーム完全均衡とな
るのはいつ?
– Minmax payoff 及び feasibility より,
扇型の領域が IR かつ feasible な
payoff の集合
– サブゲーム完全均衡戦略
は,次の式を解く:
u(c1 ) ³ (1- d )u(y) + d v
u(c2 ) ³ (1- d )u(y) + d v
• 例えば,多くの δ について,
equal-payoff transfer は
この式を解く,即ち
FI かつ SPE
Equal-Payoff Strategy
• 相手が逸脱しない限り,互いの保有量が 1/2
となるように譲渡
• 相手が逸脱したあとは,一切の譲渡を
行わない
• 性質:
– Full insurance: 常に同じ消費を行う
– Sub-game perfect: 逸脱の誘因が生じない
6.3.3 Partial Insurance
• δ* を,equal-payoff equilibrium のみが full
insurance SPE となる最小の割引率とする
• δ* より小さい割引率の場合,full insurance
equilibrium は存在しない
• このとき,代わりの概念として,stationaryoutcome equilibrium (SOE) を導入
– e(1) においてはプレイヤ 1 がεだけ保険料を支払
い,e(2) においてはプレイヤ 2 がεだけ支払う
– FI profile → SO profile. Equal-payoff も stationaryoutcome.
Discussions on Risk Sharing
• ここまで,δが十分大きい場合 (full insurance),
及びδがδ* よりも少しだけ小さい場合 (partial
insurance) を議論してきた
– 即ち,割引率が大きい範囲においては,収入
(endowment) のレベルが異なっていても,消費
(consumption) が一定となる均衡が存在
Remainings
• 以降の内容は十分理解できていない
• 6.3.4 Consumption Dynamics
– 6.3.3 の一般化
– 履歴に e(1) のみが現れる場合 (y-, y_), それ以外
では stationary-outcome をとるような戦略
• 6.3.5 Intertemporal Consumption Sensitivity
– 状態数が 3 (middle state を追加)の場合の議論
Summary
Summary
• 完全観測繰り返しゲームによる定式化と解析