にとって所与ではない

上級価格理論II
第3回
2011年後期
中村さやか
今日やること
2. 完備情報の動学ゲーム
• 2.1 完備完全情報の動学ゲーム
– 2.1.A 理論:逆向き推論法
– 2.2.B シュタッケルベルクの複占モデル
– 2.2.D 逐次的交渉
完全情報の動学ゲームの例
2手番ゲーム (two-stage game) i=1,2
① プレーヤー1がプレーヤー2に1000ドル渡すか渡さないか決
める
② プレーヤー2はプレーヤー1の選択を見たうえで、手りゅう弾
を爆発させるか決める
手りゅう弾を爆発させるとプレーヤー1,2とも死亡
完全情報 (perfect information)
• 各プレーヤーが自分の手番になったとき、それまでのゲー
ムの歴史を完全に知っている
• 歴史 (history): 各プレーヤーの選択の記録
信頼性のない脅し
① プレーヤー1がプレーヤー2に1000ドル渡すか渡さないか決
める
② プレーヤー2はプレーヤー1の選択を見たうえで、手りゅう弾
を爆発させるか決める
手りゅう弾を爆発させるとプレーヤー1,2とも死亡
ナッシュ均衡は2つ
• プレーヤー1は「渡さない」、プレーヤー2は「プレーヤー1が
渡しても渡さなくても爆発させない」をそれぞれ選択
• プレーヤー1は「渡す」、プレーヤー2は「プレーヤー1が渡す
なら爆発させない、プレーヤー2が渡さないなら爆発させる」
をそれぞれ選択
⇒信憑性のない脅し (ハッタリが効いている)
こういうもっともらしくない均衡を除外する均衡概念は?
完備完全情報の動学ゲーム
次に扱う完備完全情報の動学ゲーム:
1. プレーヤー1が実行可能な行動の集合A1から行動a1を選ぶ
2. プレーヤー2はa1を見たうえで実行可能な行動の集合A2か
ら行動a2を選ぶ
3. それぞれの利得 u1 (a1, a2), u2 (a1, a2) が決まる
特徴:
• 手番が逐次的に回ってくる
• 次の手番の前にそれまでの手番でどういう行動が選ばれた
か全員にわかっている
• 実行可能な行動の組み合わせで決まる各プレーヤーの利
得が共有知識
逆向き推論法 (backward induction)
ゲームを後ろから解いていく
• 第二段階でプレーヤー2はプレーヤー1が取った行動a1を
所与として自分の行動を選ぶので、プレーヤー2の問題は:
Max u2 (a1, a2)
a2∊A2
•
A1に属する度の行動a1についても上の最大化問題が1つだ
けの解を持つとすると仮定し、その解を反応(最適反応)と
呼び、 R2 (a1)と書く
• プレーヤー1はプレーヤー2の反応を正しく予測して行動す
るので、第一段階におけるプレーヤー1の問題は
Max u1 (a1, R2 (a1))
a1∊A1
•
上の問題の解をa*1で表し、(a*1, R2 (a*1))を逆向き推論法
による結果(backward induction outcome)と定義する
3手番ゲーム
1. プレーヤー1はLまたはRを選ぶ
Lならゲームは終わり、利得は(2,0)
2. プレーヤー2はプレーヤー1の選択を見て、RならばL’かR’
のどちらかを選ぶ
L’ならゲームは終わり、利得は(1,1)
3. プレーヤー1はプレーヤー2の選択を見て(かつ自分の第1
段階での選択も念頭に置いて)、もしそれらがR, R’ならば
L’’かR’’のどちらかを選ぶ
どちらの場合もゲームは終わり
L’’なら利得は(3,0)、R’’なら利得は(0,2)
Game Tree
1
L
R
2
(2,0)
L’
R’
1
(1,1)
L’’
(3,0)
R’’
(0,2)
逆向き推論法の前提:
プレーヤーの合理性が共有知識
• プレーヤーが二人とも合理的であるにもかかわらず、プレー
ヤー1がLではなくRを選ぶことはありうるか?
ケース1:
• プレーヤー1が合理的であることは共有知識であるが、プ
レーヤー2が合理的であることは共有知識でない
⇒プレーヤー2がL’でなくR’を選ぶかもしれないとプレーヤー1
が予測
ケース2:
• プレーヤー2が合理的であることは共有知識であるが、プ
レーヤー1が合理的であることは共有知識でない
⇒プレーヤー1がL’’でなくR’’を選ぶかもしれないとプレーヤー2
が予測するとプレーヤー1が予測
シュタッケルベルク・モデル
• Stackelberg, 1934
• 寡占市場: 1つの巨大企業とその他の企業
• 支配的(先導的)企業が先に生産量/価格を決め、それを見
て次に従属的(追従的)企業が生産量/価格を決める
(ここでは複占市場で生産量を決めるモデルを紹介)
例:
• GMとフォード・クライスラー
• コカコーラとサントリー・キリン
シュタッケルベルク・モデル: 仮定
企業が逐次的に行動する以外はクールノー・モデルと同じ
•
•
•
•
•
複占(duopoly): 企業1,2
qi =企業iの生産量, i =1,2
⇒ 総生産量: Q= q1 + q2
P(Q) = a - Q
(a > 0)
= 総生産量Qのもとで需給が一致する価格
企業iの総費用 = Ci(qi) = cqi, (0 < c < a)
⇒ 固定費用ゼロ、限界費用はcで一定
企業1が最初に生産量を決定し、企業2がそれを見てから
次に生産量を決定
企業2の反応関数
企業2の最適化問題:
Max π2(q1, q2) = Max q2 (a - q1 - q2 - c)
q2≧0
q2≧0
注意: 企業1の生産量は企業2にとって所与(定数)
1階の条件(π2(q1, q2)をq2について偏微分して0とおく):
a - q1 - 2q2 - c=0
これをq2について解くと q2 = (a - c - q1 )/2
⇒ 企業2の反応関数は R2 (q1) = (a - c - q1 )/2
企業1の生産量によって企業2の生産量が決定
⇒企業1はこれを正しく予想して行動する
企業1の行動
企業1の最適化問題:
Max π1(q1, R2 (q1))
q1≧0
π1(q1, R2 (q1)) = q1 (a - q1 - R2 (q1) - c)
= q1 (a – c - q1 - (a - c - q1 )/2 ) = q1 (a - c - q1 )/2
注意: 企業2の生産量は企業1にとって所与ではない
1階の条件(π1(q1)をq1について微分して0とおく):
a - c - 2q*1 =0
これをq1について解くと q*1 = (a - c)/2
⇒ 企業2の供給量は
q*2 = R2 (q*1) = (a - c - q*1 )/2 = (a - c - (a - c)/2 )/2
=(a-c)/4
クールノー・モデルとの比較
クールノー (C)
シュタッケル
ベルク (S)
企業1の生産量
企業2の生産量
(a-c)/3
(a-c)/3
(a-c)/2
(a-c)/4
総生産量
2(a-c)/3
3(a-c)/4
• (S)のほうが(C)より総生産量が多い⇒価格が低い
• 企業1は(S)で(C)と同じ生産量を選んで(C)と同じ利潤を得
ることもできたがそうしなかった
⇒企業1は(S)では(C)より多くの利潤を得ている
• (S)では(C)より価格が低い & 企業2の生産量が少ない
⇒企業2は(S)では(C)より少ない利潤を得ている
クールノー・モデルとの比較
続き
• もし企業2が企業1の生産量を知らずに生産量を選ぶ(そし
てそれを企業1も分かっている)ならば、シュタッケルベル
ク・モデルではなくクールノー・モデルになる
• 企業2が企業1の生産量を知っており、さらにそのことを企
業1に知られていることが企業2を不利にしている
• 1人の意思決定問題では情報を持つことでより不利になる
ことはありえないが、ゲーム理論では「より多くの情報を
持っていると相手に知られること」で不利になることがある
3期間の逐次的交渉ゲーム
• 2人のプレーヤー i=1,2: 2人とも危険中立的
• プレーヤーiの割引率はδi (0<δi<1)
• 1(万円)の分け方(1の取り分、2の取り分)を決める
ルール:
t=1: 1が(1の取り分、2の取り分)=(s1, 1- s1)を提案する
2が提案を受け入れるか拒否するか決める
受け入れ ⇒ (s1, 1- s1)で分ける
拒否 ⇒ 2が分け方(s2, 1-s2)を提案する
t=2: 1が提案を受け入れるか拒否するか決める
受け入れ ⇒ (s2, 1-s2)で分ける
拒否 ⇒ t=3に続く
t=3: (s, 1-s)で分ける (sの値は外生的に決まっている)
ナッシュ均衡はたくさんある
例)
• 2は自分の取り分が1/2以上なら受け入れ、1/2未満なら拒
否
• 1は(1/2, 1/2)を提案
実は、どんな分け方もナッシュ均衡になる
逆向き推論法: 最終段階の意思決定
t=2:
t=3:
1が提案を受け入れるか拒否するか決める
受け入れ ⇒ (s2, 1-s2)で分ける
拒否 ⇒ t=3に続く
(s, 1-s)で分ける (sの値は外生的に決まっている)
仮定: 無差別ならば受諾する
受諾した場合の1の取り分の割引価値: s2
拒否した場合の1の取り分の割引価値: δ1s
1は s2≧δ1s ならば受諾し、 s2<δ1s ならば拒否する
逆向き推論法: プレーヤー2の提案
2が分け方(s2, 1-s2)を提案する
s2≧δ1s ならば1が受諾し、(s2, 1-s2)で分ける
⇒ 2の取り分の割引価値は1-s2
s2<δ1s ならば1が拒否し、(s, 1-s)で分ける
⇒ 2の取り分の割引価値はδ2(1-s)
s2>δ1s を提案するよりは s2=δ1s を提案した方がよい
s2=δ1s を提案した場合の2の取り分は 1-δ1s
⇒ δ1とδ2が十分近いならば、これは s2<δ1s を提案した場合
の2の取り分の割引価値δ2 (1-s) より大きい
⇒ 2は (δ1s, 1- δ1s) を提案し、1はそれを受諾する
「交渉力の原理」
• 提案する側は、相手が受け入れても拒否してもちょうど無
差別になる水準まで相手の取り分を下げることができる
逆向き推論法: プレーヤー2の受諾/拒否
仮定: 無差別ならば受諾する
1が提案した(s1, 1- s1)を受け入れるか拒否するか
受け入れ ⇒ 取り分の割引価値は 1- s1
拒否 ⇒ 2が分け方(δ1s, 1-δ1s)を提案し、1はそれを受諾
⇒ 取り分の割引価値は δ2 (1-δ1s)
1- s1 ≧ δ2 (1-δ1s) ならば受け入れ
1- s1 < δ2 (1-δ1s) ならば拒否
s1 ≦ 1 - δ2 (1-δ1s) ならば受け入れ
s1 > 1 - δ2 (1-δ1s) ならば拒否
逆向き推論法: 最初の意思決定
仮定: 無差別ならば受諾する
1が(s1, 1- s1)をどのように提案するか?
s1 ≦ 1 - δ2 (1-δ1s) ならば2が受け入れ⇒ (s1, 1- s1)で分ける
⇒ 1の取り分の割引価値はs1
s1 > 1 - δ2 (1-δ1s) ならば2が拒否 ⇒ (δ1s, 1- δ1s)で分ける
⇒ 1の取り分の割引価値はδ12s
s1 =1 - δ2 (1-δ1s) にするか、2に拒否される提案をするか
δ1とδ2が十分近いならば、2に拒否される提案をした場合の
取り分の割引価値 δ12s より s1=1-δ2(1-δ1s) を提案した場の
取り分の割引価値 1-δ2(1-δ1s) の方が大きい
⇒ 1は(1-δ2(1-δ1s), δ2(1-δ1s))を提案、2は受け入れ
無限期の逐次的交渉ゲーム
• 2人のプレーヤー i=1,2: 2人とも危険中立的
• プレーヤーiの割引率はδi (0<δi<1)
• 1(万円)の分け方(1の取り分、2の取り分)を決める
ルール:
t=1: 1が(1の取り分、2の取り分)=(s1, 1- s1)を提案する
2が提案を受け入れるか拒否するか決める
受け入れ ⇒ (s1, 1- s1)で分ける
拒否 ⇒ 2が分け方(s2, 1-s2)を提案する
t=2: 1が提案を受け入れるか拒否するか決める
受け入れ ⇒ (s2, 1-s2)で分ける
拒否 ⇒ 1が分け方(s’1, 1- s’1)を提案する
t=3: ・・・これを無限に繰り返す
ナッシュ均衡はたくさんある
例)
• 1は(1, 0)を必ず提案し、それ以外の分け方は拒否
• 2は1の提案は何でも受け入れる
自分も(1, 0)を提案
⇒ 0時点では互いに最適反応
逆向き推論法
•
•
•
⇒
⇒
•
⇒
⇒
•
逆向き推論法によって最後から解いていくには最後の手
番が必要だが、無限期だと最後は存在しない
第3期から始まるゲームはゲーム全体(第1期から始まる
ゲーム)と全く同じ
第3期から始まるゲームでの分け方が(s,1-s)であると仮定
このゲームは3期間のゲームとして解くことができる
1は最初に(1-δ2(1-δ1s), δ2(1-δ1s))を提案、2は受け入れ
定常性を持つ均衡を仮定すると、第1期から始まるゲーム
の分け方は第3期から始まるゲームの分け方 と同じはず
s=1-δ2(1-δ1s), 1-s=δ2(1-δ1s)
s=(1-δ2)/(1-δ1δ2), 1-s=δ2(1-δ1)/(1-δ1δ2)
1は最初に((1-δ2)/(1-δ1δ2), δ2(1-δ1)/(1-δ1δ2))を提案、2は
受け入れ
割引率と交渉力
(s, 1-s)=((1-δ2)/(1-δ1δ2), δ2(1-δ1)/(1-δ1δ2))で分配
• δ1=δ2=δの場合、 (s, 1-s)=(1/(1+δ), δ/(1+δ))
⇒ 先に提案するほうが有利
⇒ δ→1のとき(我慢強くなる、もしくは提案と再提案の間の時
間が短くなる)、 (s, 1-s)→(1/2, 1/2)
•
δ2が一定で δ1→1のとき、 (s, 1-s) →(1, 0)
δ1が一定で δ2→1のとき、 (s, 1-s) →(0, 1)
⇒ 我慢強いほうが多くの分け前を得る