プレーヤー1

上級価格理論II
第2回
2011年後期
中村さやか
今日やること
• 1.2 応用
– 1.2.A クールノーの複占モデル
– 1.2.B ベルトランの複占モデル
• 1.3 混合戦略と均衡の存在
– 1.3.A 混合戦略
– 1.3.B ナッシュ均衡の存在
クールノー・モデル: 仮定
•
•
•
•
•
•
•
複占(duopoly): 企業1,2
同質的な生産物
qi =企業iの生産量, i =1,2
Q = q1 + q2 = 市場での総供給量
P(Q) = a – Q, (a > 0)
= 市場での総供給量がQのとき需給が一致する価格
(逆需要曲線)
企業iの総費用= Ci(qi) = cqi, (0 < c < a)
⇒ 固定費用ゼロ、限界費用はcで一定
企業は生産量を同時に(=相手の生産量を知る前に)決定
クールノー・モデル: 標準型による表現
(1) ゲームのプレーヤー
企業i, i=1,2
(2) 各プレーヤーの選択できる戦略
生産量の選択 qi ≧ 0
各企業の戦略空間: Si = [0, ∞) (非負の実数)
(3) プレーヤーの選択する戦略の組み合わせごとに各プレー
ヤーが受け取る利得
ui(si, sj) = πi(qi, qj)
= qi [P(Q) - c] = qi [a - (qi + qj) - c]
クールノー・モデル: ナッシュ均衡
(s*i, s*j)がナッシュ均衡
⇔ i=1,2について、 siが Max ui (si, sj) の解になっている
si ∊ Si
(q*i, q*j)がナッシュ均衡
⇔ i=1,2について、 q*iが Max πi (qi, q*j) の解になっている
qi≧0
Max πi (qi, q*j) = qi [a - (qi+q*j) - c] を解くと、一階の条件より
qi≧0
qi =(a - q*j - c)/2
注意:相手の生産量は自分にとって所与(定数)
連立方程式として
2q*1 = a - q*2 – c,
2q*2 = a - q*1 – c
を解くと、 q*1 = q*2 =(a-c)/3
クールノー・モデル: 反応曲線
この場合の最適反応:
相手の生産量に対して q2
最適な自分の生産量
企業1の最適反応:
R1 (q2) = (a-c)/2 - q2/2
企業2の最適反応:
R2 (q1) = (a-c)/2 - q1/2
最適反応曲線は
q1 = q2 = (a-c)/3
の一点のみで交わる
⇒これがナッシュ均衡
q1
クールノー・モデル: 独占/談合との比較
• 2社の利潤の和が最大になるように各社の生産量を選択:
Max π1(q1,q2)+π2(q1,q2)=(q1+q2)[a-(q1+q2)-c]
q1,q2≧0
⇔ Max Q[a-Q-c] ⇒ 一階の条件より Q**=q**1+q**2=(a-c)/2
Q≧0
• 一方、ナッシュ均衡の総供給量は 2(a-c)/3 > (a-c)/2
⇒ ナッシュ均衡での総供給量は独占の下での総供給量より多
く、総利潤はより少ない
• もし片方の企業が独占供給量の半分の(a-c)/4だけ生産した
場合、もう一方の企業の最適反応は
qi = [a-c-(a-c)/4]/2 = 3(a-c)/8 > (a-c)/4
⇒ 各企業が独占供給量の半分ずつ生産する場合、どちらの企
業にもそこから逸脱するインセンティブが働く
クールノー・モデル: 強く支配される戦略の逐次消去
1. それぞれの企業に
とって、(a-c)/2 より大
きい生産量は強く支
配される
2. 相手が(a-c)/2 より大
きい生産量を選ばな
いことを前提とすると、
各企業にとって(a- a  c
c)/4 より小さい生産 2
量は強く支配される
ac
3. ・・・
4
消去を続けていくと、
最終的にはナッシュ
均衡の(a-c)/3に到達
q2
R1 (q2)
ac ac
,


3 
 3
R2 (q1)
(a  c) / 4
(a  c) / 2
q1
ベルトランの複占モデル: 仮定
注意: クールノーとは異なるモデル
クールノー・モデルもベルトラン・モデルもナッシュ均衡
• 複占(duopoly): 企業1,2
• 差別化された製品
(同質的製品のベルトラン・モデルもある)
• pi =企業iの価格, i =1,2
• qi (pi, pj) = a - pi + bpj
(0 < b < 2)
=企業iの製品への需要量
• 企業iの総費用 = Ci(qi) = cqi, (0 < c < a)
⇒ 固定費用ゼロ、限界費用はcで一定
• 企業は価格を同時に決定
ベルトラン・モデル: 標準型による表現
(1) ゲームのプレーヤー
企業i, i=1,2
(2) 各プレーヤーの選択できる戦略
価格の選択 pi ≧ 0
各企業の戦略空間: Si = [0, ∞) (非負の実数)
(3) プレーヤーの選択する戦略の組み合わせごとに各プレー
ヤーが受け取る利得
ui(si, sj) = πi(pi, pj) = (pi – c) (a - pi + bpj)
ベルトラン・モデル: ナッシュ均衡
(p*i, p*j)がナッシュ均衡
⇔ i=1,2について、 p*iが Max πi (pi, p*j) の解になっている
pi≧0
Max πi(pi, p*j) = (pi – c) (a - pi + bpj) を解くと、
pi≧0
一階の条件より pi =(a + bp*j + c)/2
注意: 相手の価格は自分にとって所与(定数)
連立方程式として
2p*1 = a + bp*2 + c,
2p*2 = a + bp*1 + c
を解くと、 p*1 = p*2 =(a+c)/(2-b)
ナッシュ均衡が存在しない?
• ペニー合わせ (matching pennies)
• プレーヤー1とプレーヤー2がそれぞれ1ペニー硬貨の表を
出すか裏を出すか同時に決める
• 二人とも表、または二人とも裏
⇒プレーヤー1はプレーヤー2に1ペニー渡す
• 表裏が合わない
⇒プレーヤー2はプレーヤー1に1ペニー渡す
プレーヤー2
表
プレーヤー1
表
裏
-1,
裏
1
1, -1
1, -1
-1,
1
互いに相手を出し抜こうとするゲームの例
バッター
直球
ピッチャー
直球
カーブ
カーブ
-1,
1
1,
-1
1,
-1
-1,
1
防御する国
陸
侵攻する国
海
陸
-1,
1
1,
-1
海
1,
-1
-1,
1
他の例:じゃんけん、ババ抜き、ポーカー、などなど
混合戦略と純粋戦略
混合戦略 (mixed strategy)
純粋戦略 (pure strategy)
• それぞれの戦略をどの確
率で実行するか選択
• 1つだけの戦略を選択
• 戦略集合Siに含まれるそ
れぞれの戦略について選
択された確率分布
• 戦略集合Siに含まれるそ
れぞれの戦略si
例: コインの表を確率0.8、
裏を確率0.2で選ぶ
例: コインの表を選ぶ
混合戦略の定義
G={S1 ,…, Sn; u1 ,…, un}を考え、 Si={si1, …, siK}とする
• pik をプレーヤーiがk = 1,…,Kのそれぞれについてsik を選ぶ
確率とする
• このときプレーヤーiの混合戦略とは確率分布pi=(pi1,…, piK)
のことで、0 ≦ piK ≦ 1 (k = 1,…,K), pi1 + … + piK = 1 で
ある
注意:
• どんな純粋戦略も混合戦略として表現できる
(ある戦略に確率1、その他の戦略に確率0を選択)
期待利得
• 単純化のためにプレーヤーが2人と仮定
• J: S1に属する純粋戦略の数 ⇒ S1={s11,…, s1J}, s1j∊ S1
• K: S2に属する純粋戦略の数 ⇒ S2={s21,…, s2K}, s2k∊ S2
• プレーヤー1が、「プレーヤー2は戦略(s21,…, s2K)を確率
(p21,…, p2K)で選択する」と予想すると仮定
⇒プレーヤー1の純粋戦略s1jを選んだ場合の期待利得は
K
p
k 1
u ( s1 j , s2 k )
2k 1
⇒プレーヤー1が混合戦略(p11,…, p1J)を選んだ場合のプレー
ヤー1の期待利得は
J
K
 J K
v1 ( p1 , p2 )   p1 j  p2 k u1 ( s1 j , s2 k )   p1 j p2 k u1 ( s1 j , s2 k )
j 1
 k 1
 j 1 k 1
期待利得 続き
• プレーヤー2が、「プレーヤー1は戦略(s11,…, s1J)を確率
(p11,…, p1J)で選択する」と予想し、混合戦略(p21,…, p2K)を
選んだ場合のプレーヤー2の期待利得は
J
 J K
v2 ( p1 , p2 )   p2 k  p1 j u2 ( s1 j , s2 k )   p1 j p2 k u2 ( s1 j , s2 k )
k 1
 j 1
 j 1 k 1
K
混合戦略の下での最適反応
• p1=(p11,…, p1J)がp2に対して最適反応
⇔ S1上の任意の確率分布p’1についてv1(p1, p2)≧ v1(p’1, p2)
(弱い不等号であることに注意)
• このときもしp1j>0ならば、S1に属するどのs1j’についても
K
p
k 1
K
u ( s1 j , s2 k )   p2 k u1 ( s1 j ' , s2 k )
2k 1
k 1
例: もしコインの裏と表をそれぞれ0.5の確率で選ぶのが最適
反応ならば、コインの表を選ぶ純粋戦略もコインの裏を選ぶ
純粋戦略も両方とも最適反応
混合戦略の下での最適反応 続き
• プレーヤー1がプレーヤー2の混合戦略p2に対して最適反応
となる複数の純粋戦略を持っている
⇒「最適反応となる複数の純粋戦略」上の任意の確率分布
(それ以外には確率0を割り当てる)もまた最適反応になる
例: もしコインの表を選ぶ純粋戦略もコインの裏を選ぶ純粋戦
略も両方とも最適反応ならば、任意の混合戦略が最適反応
混合戦略の下でのナッシュ均衡の定義
• 2人プレーヤーの標準型ゲームG={S1, S2; u1, u2}において、
混合戦略(p*1, p*2)がナッシュ均衡であるとは、 各プレー
ヤーの混合戦略が他の混合戦略に対する最適反応となって
いることである
⇔ p*1がS1上の任意の確率分布p1に対して
v1(p*1, p*2)≧ v1(p1, p*2)
を満たし、またp*2がS2上の任意の確率分布p2に対して
v2(p*1, p*2)≧ v2(p*1, p2)
を満たす
ペニー合わせの最適混合戦略 ①
プレーヤー1(表裏が違えば勝ち)の最適混合戦略:
• プレーヤー2が表を選ぶ確率が0.5以上なら裏を、0.5以下
なら表を選ぶ
• 確率がちょうど0.5ならば表でも裏でもよい
プレーヤー1の期待利得:
• プレーヤー1が表を選ぶ確率をr、プレーヤー2が表を選ぶ
確率をqとする
プレーヤー1の期待利得
=rq・(-1)+r(1-q)・(+1)+(1-r)q・(+1)+(1-r)(1-q)・(-1)
=(2q-1)+r(2-4q)
⇒ r*(q)=0 if q>0.5, r*(q)=1 if q<0.5, r*(0.5)=[0,1]
ペニー合わせの最適混合戦略 ②
プレーヤー2(表裏が合えば勝ち)の最適混合戦略:
• プレーヤー1が表を選ぶ確率が0.5以上なら表を、0.5以下
なら裏を選ぶ
• 確率がちょうど0.5ならば表でも裏でもよい
プレーヤー2の期待利得:
• プレーヤー1が表を選ぶ確率をr、プレーヤー2が表を選ぶ
確率をqとする
プレーヤー2の期待利得
=rq・(1)+r(1-q)・(-1)+(1-r)q・(-1)+(1-r)(1-q)・(+1)
=(1-2r)+q(4r-2)
⇒ q*(r)=1 if r>0.5, q*(r)=0 if r<0.5, q*(0.5)=[0,1]
ペニー合わせの混合ナッシュ均衡
• プレーヤー1が表を選ぶ
確率をr、プレーヤー2が r
表を選ぶ確率をqとする
1
プレーヤー1の最適戦略:
r*(q)=1 if q<0.5
r*(q)=0 if q>0.5
r*(0.5)=[0,1]
0.5
プレーヤー2の最適戦略:
q*(r)=0 if r<0.5
q*(r)=1 if r>0.5
q*(0.5)=[0,1]
ナッシュ均衡=(0.5, 0.5)
0
0.5
1 q
両性の争いゲームの最適混合戦略
女性
オペラ
ボクシング
男性
オペラ
ボクシング
2,
1
0,
0
0,
0
1,
2
• 男性がオペラを選ぶ確率をq、女性がオペラを選ぶ確率をrと
する
女性の期待利得=2qr+(1-q)(1-r)=r(3q-1)+(1-q)
⇒ r*(q)=1 if q>1/3, r*(q)=0 if q<1/3, r*(1/3)=[0,1]
男性の期待利得=qr+2(1-q)(1-r)=q(3r-2)+(2-2r)
⇒ q*(r)=1 if r>2/3, q*(r)=0 if r<2/3, q*(2/3)=[0,1]
両性の争いの混合ナッシュ均衡
q: 男性がオペラを選ぶ確率
r: 女性がオペラを選ぶ確率 r
女性の最適戦略:
1
r*(q)=0 if q<1/3
r*(q)=1 if q>1/3
2/3
r*(1/3)=[0,1]
男性の最適戦略:
q*(r)=0 if r<2/3
q*(r)=1 if r>2/3
q*(2/3)=[0,1]
ナッシュ均衡:
(q,r)=(0, 0), (1/3, 2/3), (1,1) 0
1/3
1 q
ナッシュ均衡の存在
• n人の標準型ゲーム G={S1,…, Sn; u1,…, un} において、 n
が有限で、どのiについてもSnが有限集合であるならば、混
合戦略を含めればナッシュ均衡が少なくとも1つは必ず存在
する
証明: 岡田『ゲーム理論』 pp. 33-36 参照