Advanced Topics in Economics I

上級価格理論II
第5回
2011年後期
中村さやか
今日やること
2. 完備情報の動学ゲーム
• 2.3 繰り返しゲーム
– 2.3.B 無限繰り返しゲーム (続き)
– 2.3.C クールノー型複占企業間の共謀
定義: 実現可能な利得
•
•
•
•
段階ゲームGの利得
(x1 ,…, xn) がGの純粋戦
略による利得の突結合とし
て書けるとき、その利得を
実現可能(feasible)と呼ぶ
突結合:非負で和が1にな
るウェイトを用いた加重平
均
二つの点を結んだ線上の
点は突結合として書ける
図形の内部の点も突結合
として書ける
x2
囚人のジレンマゲーム
の純粋戦略の利得
(0,5)
(4,4)
(1,1)
(5,0)
x1
青緑の部分が実現可能な
利得
実現可能な利得と混合戦略
例1
• 混合戦略によって(0,5)と
(4,4)がそれぞれ正の確率
で実現し、平均的にはAが
実現
例2
• 混合戦略によって(0,5)、
(4,4)、(1,1)がそれぞれ正
の確率で実現し、平均的に
はBが実現
x2
4つの点:囚人のジレン
マゲームの純粋戦略の
利得
(0,5)
(4,4)
B
(1,1)
A
(5,0)
x1
青緑の部分が実現可能な
利得
定義: 平均利得
•
•
割引因子がδの時に、各期に利得をπ1, π2, π3,・・・だけ得る
のと同じ現在価値を、毎期同じ値の利得を得て達成するに
は、毎期どれだけの利得を得る必要があるか?
毎期同じ利得πを得た場合の利得の無限列の現在価値は
π/(1-δ)
これが利得の無限列π1, π2, π3,・・・の現在価値と一致する
なら、πは利得の無限列の平均利得(average payoff)


1 

   t 1 t
t 1

   (1   )  t 1 t
t 1
フリードマンの定理 (Friedman 1971)
Gを完全情報の有限静学ゲームとする。
(e1,・・・en)をGのナッシュ均衡での利得とし、(x1,・・・ xn) をG
のそれ以外の実現可能な利得とする。
このときもし xi > ei がどのプレーヤーについても成り立ち、か
つδが十分1に近いならば、無限回繰り返しゲームG(∞, δ)の、
(x1,・・・ xn)を平均利得とするサブゲーム完全なナッシュ均衡
が存在する。
フリードマンの定理の例
•
4つの点:囚人のジレン
マゲームの純粋戦略の
利得
有限ゲームでのナッシュ均
x2
衡の利得は(1,1)
⇒ π1>1 かつ π2>1 ならば
(4,4)
(0,5)
各プレーヤーがこれを超え
る利得を得られる
⇒ (もしδが十分1に近けれ
ば)青色の部分に含まれる
どの点も、無限回繰り返し
(1,1)
(5,0)
ゲームのサブゲーム完全
x1
なナッシュ均衡の平均利得
として達成可能
青緑の部分が実現可能な
利得
フリードマンの定理の証明
(ae1,・・・, aen): 均衡利得が(e1,・・・, en)となるGのナッシュ均衡
(ax1,・・・, axn): 実現可能な利得(x1,・・・, xn)をもたらす行動の組
プレーヤーiのトリガー戦略:
• 第1段階では axi をプレーする
• 第t段階では、もし前の期のt-1段階の結果が (ax1,・・・, axn)
ならば axi をプレーし、そうでなければ aei をプレーする
WTS (証明したいこと):
1. もしδが十分1に近いならば、各プレーヤーがこの戦略を取る
ことが無限回繰り返しゲームのナッシュ均衡になる
2. そのようなナッシュ均衡はサブゲーム完全
WTS1: トリガー戦略がナッシュ均衡
WTS1:
もしδが十分1に近いならば、各プレーヤーがこのトリガー戦
略を取ることが無限回繰り返しゲームのナッシュ均衡になる
証明:
① 他の全員がトリガー戦略を取っていて、それまで毎回(ax1,・・・,
axn)がプレーされていたとする
• プレーヤーiがトリガー戦略から逸脱した期に得られる最大の
利益をdiとすると、この期以降の利得の現在価値は
di+δei/(1-δ)
• 逸脱しなければ、この期以降の利得の現在価値は xi/(1-δ)
• 逸脱しないほうがよい ⇔ xi/(1-δ) ≧ di+δei/(1-δ)
⇔ δ≧(di-xi)/(di-ei)
WTS1: トリガー戦略がナッシュ均衡 続き
•
「各プレーヤーがこのトリガー戦略を取ることが無限回繰り返
しゲームのナッシュ均衡になる」
⇔ δ≧Max(di-xi)/(di-ei) (★)
i
• どのプレーヤーiについても、di≧xi>ei より、 (di-xi)/(di-ei)<1
–
–
–
di: 逸脱した期の最大利益
ei: 有限回繰り返しゲームのナッシュ均衡での利得
xi: 実現可能な利得 定理の仮定によりxi>ei
⇒ もしδが十分1に近ければ(★)が成立
② 他の全員がトリガー戦略を取っていて、それ以前に一度でも
(ax1,・・・, axn)以外がプレーされていたとする
⇒ 他の全員が(ae1,・・・, aei-1, aei+1,・・・, aen)をプレーするので、
自分もeiをプレーするのが最適
WTS2: トリガー戦略のナッシュ均衡は
サブゲーム完全
WTS2:
G(∞,δ)のどのサブゲームにおいても、各プレーヤーがこのト
リガー戦略を取ることがナッシュ均衡になる
証明:
• G(∞,δ)のどのサブゲームも、 G(∞,δ)と同じ形をしている
• サブゲームは二種類ある:
① それまでの結果すべてが (ax1,・・・, axn)のサブゲーム
⇒ 上で示した通り、全員がトリガー戦略をとるのがナッシュ均衡
② それ以前に少なくとも1回 (ax1,・・・, axn)以外の結果が生じて
いるサブゲーム
⇒ 上で示した通り、全員がトリガー戦略をとるのがナッシュ均衡
クールノー型複占企業間の共謀
静学的クールノーモデル:
• 両企業が同時に生産量を決定
• ナッシュ均衡における両企業の利潤の和は、独占利潤より
も少ない
(両企業の生産量の和が独占生産量よりも多いため)
• 両企業が結託して各企業が独占生産量の半分を作るのは
静学的モデルではナッシュ均衡ではない
無限回繰り返しゲーム:
• トリガー戦略によって結託が可能になる
クールノー・モデル: 仮定
•
•
•
•
•
•
•
複占(duopoly): 企業1,2
同質的な生産物
qi =企業iの生産量, i =1,2
Q = q1 + q2 = 市場での総供給量
P(Q) = a – Q, (a > 0)
= 市場での総供給量がQのとき需給が一致する価格
(逆需要曲線)
企業iの総費用= Ci(qi) = cqi, (0 < c < a)
⇒ 固定費用ゼロ、限界費用はcで一定
企業は生産量を同時に(=相手の生産量を知る前に)決定
クールノー・モデル: ナッシュ均衡
(q*i, q*j)がナッシュ均衡
⇔ i=1,2について、 q*iが Max πi (qi, q*j) の解になっている
qi≧0
Max πi (qi, q*j) = qi [a - (qi+q*j) - c] を解くと、一階の条件より
qi≧0
qi =(a - q*j - c)/2
注意:相手の生産量は自分にとって所与(定数)
連立方程式として
q*1 =(a - q*2 - c)/2,
q*2 =(a - q*1 - c)/2
を解くと、 q*1 = q*2 =(a-c)/3
クールノー・モデル: 独占/談合との比較
• 2社の利潤の和が最大になるように各社の生産量を選択:
Max π1(q1,q2)+π2(q1,q2)=(q1+q2)[a-(q1+q2)-c]
q1,q2≧0
⇔ Max Q[a-Q-c] ⇒ 一階の条件より Q**=q**1+q**2=(a-c)/2
Q≧0
• 一方、ナッシュ均衡の総供給量は 2(a-c)/3 > (a-c)/2
⇒ ナッシュ均衡での総供給量は独占の下での総供給量より多
く、総利潤はより少ない
• もし片方の企業が独占供給量の半分の(a-c)/4だけ生産した
場合、もう一方の企業の最適反応は
qi = [a-c-(a-c)/4]/2 = 3(a-c)/8 > (a-c)/4
⇒ 各企業が独占供給量の半分ずつ生産する場合、どちらの企
業にもそこから逸脱するインセンティブが働く
トリガー戦略がサブゲーム完全なナッシュ均衡
トリガー戦略:
• 第1期には独占生産量の半分qm/2を生産する
• 第t期には、もしt-1期において2企業が毎期それぞれqm/2を
生産していたなら、その期でもqm/2を生産する
• そうでなければクールノー生産量qcを生産する
•
もしδの値が十分1に近ければ、両企業が上のトリガー戦略
をプレーすることがサブゲーム完全なナッシュ均衡になる
生産量と利潤
1. 両企業とも独占生産量の半分qm/2を生産
⇒ 両企業の利潤: πm/2 = (a - c)2/8
2. 両企業ともクールノー生産量qcを生産
⇒ 両企業の利潤: πc = (a - c)2/9
3. 相手がqm/2を生産しているときに自分が今期の利潤を最大
化する生産量を選択
⇒ Max qi [a - (qi + qm/2) - c]
qi≧0
⇒ 1階の条件より qi = (a - qm/2 - c)/2
⇒ qm = (a - c)/2 を代入すると qi = 3(a - c)/8
⇒ 逸脱(deviate)した期の利潤: πd = 9(a - c)2/64
逸脱しない方がよいのはどんなとき?
逸脱しない方がよい ⇔ (πm/2)/(1-δ) ≧ πd + πc[δ/(1-δ)]
πm/2 = (a-c)2/8
πc = (a-c)2/9
πd = 9(a-c)2/64
を上式に代入 ⇒ δ≧9/17
つまり、 δ≧9/17ならばトリガー戦略がナッシュ均衡
これはどのようなサブゲームについても成立する
⇒ このナッシュ均衡はサブゲーム完全
割引率δが小さい場合のトリガー戦略
δ<9/17 のときは何が達成できるか?
⇒ 両企業が独占生産量の半分qm/2を選ぶという結果はトリ
ガー戦略によっては達成できないが、両企業がクールノー
生産量qcよりは少ない生産量を選ぶという結果ならサブ
ゲーム完全なナッシュ均衡として達成できる
トリガー戦略:
• 第1期にはある生産量q*を生産する
• 第t期には、もしt-1期において2企業が毎期それぞれq*を生
産していたなら、その期でもq*を生産する
• そうでなければクールノー生産量qcを生産する
生産量と利潤 (2)
1. 両企業ともq*を生産
⇒ 両企業の利潤: π* = q*(a - c - 2q*)
2. 両企業ともクールノー生産量qcを生産
⇒ 両企業の利潤: πc = (a - c)2/9
3. 相手がq*を生産しているときに自分が今期の利潤を最大化
する生産量を選択
⇒ Max qi [a - (qi+ q*) - c]
qi≧0
⇒ 1階の条件より qi = (a - q* - c)/2
⇒ 逸脱(deviate)した期の利潤: πd = (a - c- q*)2/4
逸脱しない方がよいのはどんなとき? (2)
逸脱しない方がよい ⇔ π*/(1-δ) ≧ πd + πc[δ/(1-δ)]
π* = q*(a - c - 2q*)
πc = (a-c)2/9
πd = (a - c- q*)2/4
を上式に代入 ⇒ q* ≧ (9-5δ)(a-c)/3(9-δ) = (★)
•
(★)はδに関する単調減少関数で、δが9/17に近づけばqm/2
に近づき、δが0に近づけばqcに近づく
アブル―(Abreu 1986)の戦略
•
最も厳しいペナルティーで脅すことで、割引率δが小さい場
合でも独占生産量を達成できる
飴と鞭(carrot and stick)戦略:
• 第1期には独占生産量の半分qm/2を生産する
• 第t期には、もしt-1期において2企業が毎期それぞれqm/2を
生産していたなら、その期でもqm/2を生産する
• もしt-1期において2企業が毎期それぞれxを生産していた場
合にも、第t期でqm/2を生産する
• それ以外の場合にはxを生産する
共謀・懲罰・逸脱
共謀から
逸脱
(一期の)
懲罰期
懲罰から
逸脱しない
共謀
懲罰から
逸脱
(一期の)
懲罰期
懲罰から逸脱しない: 両企業ともその期にxを生産
懲罰から逸脱: (片方もしくは両方が)その期にx以外を生産
生産量と利潤 (3)
1. 両企業ともqm/2を生産 ⇒ πm/2 = (a - c)2/8
2. 相手がqm/2を生産しているときに自分が今期の利潤を最大
化する生産量を選択⇒ πd = 9(a - c)2/64
3. 両企業ともxを生産 ⇒ π(x) = x(a - c - 2x)
• V(x):今期π(x)を受け取りその後は永久に独占利潤の半分
πm/2を受け取る無限列の現在価値
V(x) = π(x) + δ(πm/2)/(1-δ)
4. 相手がxを生産しているときに自分が今期の利潤を最大化
する生産量を選択
⇒ Max qi [a - (qi+ x) - c] ⇒ 1階の条件: qi = (a - x - c)/2
qi≧0
⇒ 両企業ともxを生産するというpunishmentから逸脱
(deviate)した期の利潤: πdp = (a - c- x)2/4
逸脱しない方がよいのはどんなとき? (3)
2種類のサブゲーム
(i) 直前期の結果が(qm/2, qm/2)または(x, x)となる共謀サブ
ゲーム
(ii) 直前期の結果がそれ以外のサブゲーム
(i)で逸脱しない方がよい⇔ (πm/2)/(1-δ)≧ πd +δV(x)
(1)
(ii)で逸脱しない方がよい⇔ V(x)≧ πdp(x) +δV(x)
(2)
(1)(2)に V(x) = π(x) + δ(πm/2)/(1-δ) を代入
δ(πm/2 - π(x)) ≧ πd - πm/2
(1’)
δ(πm/2 - π(x)) ≧ πdp - π(x)
(2’)
逸脱からの今期の利益≦処罰による来季の損失の現在価値
δ=0.5の場合
δ(πm/2 - π(x)) ≧ πd - πm/2
δ(πm/2 - π(x)) ≧ πdp - π(x)
(1’)
(2’)
πm, π(x), πd, πdp の値とδ=0.5を代入すると、
1/8≧x/(a-c) もしくは x/(a-c)≧3/8 ならば(1’)が成立
3/10≦ x/(a-c)≦1/2 ならば(2’)が成立
⇒ 3/8≦x/(a-c)≦1/2 ならば(1’)と(2’)が成立
⇒ この戦略がサブゲーム完全なナッシュ均衡
⇒ δが9/17より小さくても独占生産量が達成できる