タイミングゲーム、コミットメント

ゲーム理論 (上級 I)/ゲーム理論特論 I(2015 年度)
教授 清水大昌
第 4 回 2015 年 10 月 19 日
[email protected]
http://www-cc.gakushuin.ac.jp/˜20060015/lecture/gradgame2015.html
Timing game
• クールノーやシュタッケルベルグは、企業同士の行動パターンは外生として与えられている。これ
を内生化したらどうなるだろうか?つまり、企業がタイミングを選べたら?
• Hamilton and Slutsky (1990)
• Observable delay game
– 2 企業モデル。各企業 i はタイミング ei ∈ {1, 2} をまず同時に独立に選ぶ。
– その後、各企業は相手の ei を観察した後、行動を決める。
– e1 = e2 = 1 ⇒ 同時手番ゲームでクールノー競争。e1 = e2 = 2 でも同様。
– e1 = 1, e2 = 2 なら企業 1 がリーダー、企業 2 がフォロアーのシュタッケルベルグ均衡。逆も
同様。
– では、均衡ではどのような ei が選ばれるだろうか?まず戦略的代替の場合から。
– 企業 1 が e1 = 1 を選んだときの最適反応 ⇒ e2 = 1 [Cournot > Stackelberg follower]
– e1 = 2 に対しては e2 = 1 が最適。
– よって、e1 = e2 = 1 が均衡となり、クールノーになるはず。
– 戦略的補完の場合: e1 = 1 には e2 = 2 で、e1 = 2 には e2 = 1 となるので、それらの組が均
衡となるはず。[Stackelberg leader > Cournot]
• Action Commitment
– 各企業は相手の e を観察することなく行動を決める。e にコミットできないと考えることが
できる。
– 企業 i の行動を ai と置く。
– 企業 1 が e1 = 1, a1 = aC
1 (Cournot output) を所与とすれば、企業 2 の最適反応は以下の二
C
つ。(1) e2 = 2, a2 = a2 , (2) e2 = 1, a2 = aC
2。
– 企業 1 が e1 = 1, a1 = aL
1 (Stackelberg leader output) を所与とすれば、企業 2 の最適反応
F
は以下の二つ。(1) e2 = 2, a2 = aF
2 , (2) e2 = 1, a2 = a2 。このうち (1) は Observable delay
game で戦略的代替の場合には均衡ではなかった。
– また、第二期に出す ei = 2 という選択肢での行動 ai は最適反応になってなければならない。
– よって 3 つの均衡が出てくる。(戦略的補完でも代替でも。)
(1) e1 = e2 = 1 : Cournot
(1)
(2) e1 = 1, e2 = 2 : Stackelberg
(2)
(3) e1 = 2, e2 = 1 : Stackelberg
(3)
– Hamilton and Slutsky は (2) と (3) を推薦。(1) は弱支配されている戦略を使っているため。
(e2 = 1 が e2 = 2 に弱支配されている。)
1
– 金利費用や在庫費用を使って e2 = 2 ≻ e2 = 1 にすれば、Stackelberg のみ生き残る。(あ
まり費用が大きすぎると普通にクールノーになってしまう。)
コミットメント
• 以下、企業はどうにかして何かにコミットして有利に戦況を進めたいと思っている。その方法を紹
介していく。
費用削減投資
• 限界費用を削減することにより、反応曲線を右上にシフトできる。結果、生産量を credible に増や
すことができ、利潤が増える。よって、限界費用削減はある意味コミット効果がある。
• 2 企業が同時にすれば?Brander and Spencer (1983)
• 第 1 期に 2 企業が同時に独立に限界費用削減投資を行う。第 2 期にお互いの投資量を観察した後、
同時に独立に生産量を決める。
• 結果、それぞれの企業の反応曲線は右上にシフトし、利潤は減る。
Π1 = P (x1 + x2 )x1 − c1 (I1 )x1 − I1
∂Π1
∂x1 ∂x2
∂x1 ∂c1
∂x1
= P ′(
+
)x1 + P
−
x1 − c1
−1=0
∂I1
∂I1
∂I1
∂I1
∂I1
∂I1
ここで −1 以外は投資の限界純利益、−1 は限界費用
∂x1
∂x2 ∂c1
変形すると (P ′ x1 + P − c1 )
+ P′
−
x1 − 1 = 0
∂I1
∂I1
∂I1
最初のカッコ内は、クールノーの一階条件より0となる。第 2 項は戦略効果と呼ばれる。
• 社会余剰は P や c の形状による。特に c′′ = 0 (限界費用一定) で企業が投資前は対称のとき、
– P ′′ = 0 (線形): 投資競争によって投資量は最適な水準となる。
– P ′′ < 0: 過少投資となる。
– P ′′ > 0: 過剰投資となる。
学習効果
• 企業が生産することにより生産過程について学習できる、つまり効率化を図れる場合、企業は先に
多く生産することにより、自分のコストを下げ、次期以降の競争を有利に運ぶことができる。これ
もある意味コミットメントである。
2
• これは問題を解いて考えてみよう。(2010 年度大学院入試 (2 回目))
ある産業を考える。逆需要関数は p = 32 − q で与えられる。ここで p は市場価格、q は市場全体
の生産量である。固定費用は無いとする。また qi を企業 i の生産量を表す記号として使ってよい。
(1) 企業 J が独占しているとする。限界費用が 10 であるとき、企業 J の最適生産量と利潤を求め
よ。
(2) 企業 J が独占しているが、生産期間は 2 期間あるとする。学習効果 (learning by doing) があ
り、第2期の限界費用は c2 = 10 − qJ1 /2 となる。ただし qJ1 は企業 J の第1期における生産量
である。企業 J が2期間の利潤を最大にしようとするとき、それぞれの期における最適生産量と、
最終的に得られる利潤を求めよ。
(3) 第1期は企業 J が独占し、第2期に企業 K が参入し数量競争 (クールノー競争) を行うとす
る。企業 K の限界費用も 10 であるとする。企業 J は (2) と同じく第2期に学習効果があり、企
業 K には学習効果は無い。このとき、企業 J の第1期での均衡生産量、企業 J と K の第2期で
の均衡生産量、ならびにそれぞれの企業の均衡総利潤を求めよ。
収入最大化
• 3 番目のコミットメントの話は、目的関数を収入最大化にすること。(Fershtman and Judd, 1987)
• Principal-Agent モデルでは、一般的に情報の非対称性がある場合に Principal (株主など) が Agent
(経営者など) にしっかり働いてもらうようにインセンティブ付けする。
• ここでは株主と経営者の関係を考えるが、情報は対称とする。
• 株主は当然利潤最大化を図りたい。そのため、経営者に次のような報酬体系を提示する。
– 評価基準は次の式。これが高い方が報酬が高くなる。
– Rev を収入とし、α ∈ [0, 1] を適当なパラメータとすると評価基準式は αRev + (1 − α)Π. α
が 0 の場合は普通の利潤最大化。α が 1 の場合には純粋収入最大化。
• 利潤 = 収入 − 費用なので、収入を目的関数にするということは費用を無視すると言うことと同じ。
よって、反応関数が右にシフトする。費用削減効果の議論と同じく、利潤を上げることが出来る。
• ただし、相手の企業も同じことをすると、囚人のジレンマとなり利潤が下がってしまうと言うこと
も同じ。
不完備情報ゲーム
• 最後は不完備情報ゲームにおける limit pricing (制限価格付け)。
• 不完備情報ゲームとは、ゲームで使う情報がプレーヤー間で共有されていないゲームのこと。例え
ば、プレーヤーのタイプが分からない、需要のレベルが分からないなど。情報の非対称性を描写す
るのに使える。
• このようなとき、分からない情報がどのようになっているかを確率付けして均衡を求める。個人の
主観確率を信念 (belief ) と呼ぶ。詳しくはここでは扱わないが、事前の信念が情報が明らかにな
るうえで事後的にアップデートされることがある。Bayesian updating などが良く使われる。
3
• また、自然 (nature) という考え方もある。プレーヤーのタイプや需要レベルは自然が最初に確率
的に決め、それを各プレーヤー(か一部のプレーヤー)は分かっていない。分からないプレーヤー
はこれらも確率的に想定する。
• 期待値をベースにしたナッシュ均衡概念の一つにベイズ均衡がある。
Limit Pricing
• Limit pricing では、既存企業があえて独占価格を付けず自社価格を下げることで自社のコストの
低さについてシグナルを送ることが均衡になる。
• モデルで考えよう。(Shy p.202 より) 2 期間モデルで需要は p = 10 − Q、一期目は企業 1(既存企
業) のみが市場に存在し、二期目に企業 2(参入企業) が参入するか選択する。参入する場合には参
入費用 9 が掛かるとする。
• 情報の非対称性が無ければ、第一期には企業 1 が独占し、第 2 期にはクールノーとなる。(価格を
下げて参入を阻止することにコミットメントできないため。)
• では、企業 2 は企業 1 の限界費用が分からないとしよう。(企業 2 の限界費用はお互い分かってい
て c2 = 1 であるとする。) 企業 2 は企業 1 の限界費用 c1 は半々の確率で 0 であるか 4 であると知っ
ているとする。もちろん企業 1 は自社の費用構造は分かっている。
• よって、企業 2 はこの情報をベースに最大化問題を解く。
企業 1 の第 1 期の生産量 q11 が費用構造のシグナルとなる。直観を言うと
(1) 既存企業の MC が高いとき、既存企業は自分の MC が低いと相手に思わせたい。
(2) 参入企業は MC が高い既存企業が真似てきているなら自分も強気に出たい (生産量を増やした
い)。
(3) MC が低い既存企業は参入企業が強気に出ると損なので、自分の第一期の生産量を増やすこと
により自分の MC が低いことを示す。
(4) MC が高い既存企業にとっては、第一期の生産量を増やして第二期に MC が低いと思わせて競
争するより、第一期は普通に独占したほうが利潤が高くなるため、真似るのをやめる。
(5) すると生産量によって分離されるため、参入企業もタイプが見分けられる。すると相手が弱い
ときは参入して、強いときは参入しない。
• 参入企業は参入しないと利潤 0。その際独占企業の利潤は c1 = 0 なら 25、c1 = 4 なら 9 となる。
• 参入がある場合、c1 = 0 なら Π1 = 13, Π2 = −1.9、c1 = 4 なら Π1 = 1, Π2 = 7 となる。
• 既存企業の MC が高い場合、既存企業が素直に行動すると 9 + 1 = 10 得られる。
• 既存企業の MC が低い場合、MC が高い既存企業に真似られないように q11 を独占の 5 ではなく
5.83 まで増やすことになる。もし 5.83 まで作れば、MC が高い既存企業が真似をすれば
(10 − 5.83) · 5.83 − 4 · 5.83 + 第二期の独占利潤 9 = 9.99
となり、素直に行動したほうが良くなる。ここで MC が低い既存企業がこのような高生産量、つま
り低価格を付けるインセンティブがあるか調べる必要がある。
Limit Pricing:
独占+寡占:
(10 − 5.83) · 5.83 + 25 = 49.31
25 + 13 = 38
よって、Limit pricing が均衡で起こることがわかる。
4