上級価格理論II 第2回 2011年後期 中村さやか 今日やること • 1.2 応用 – 1.2.A クールノーの複占モデル – 1.2.B ベルトランの複占モデル • 1.3 混合戦略と均衡の存在 – 1.3.A 混合戦略 – 1.3.B ナッシュ均衡の存在 クールノー・モデル: 仮定 • • • • • • • 複占(duopoly): 企業1,2 同質的な生産物 qi =企業iの生産量, i =1,2 Q = q1 + q2 = 市場での総供給量 P(Q) = a – Q, (a > 0) = 市場での総供給量がQのとき需給が一致する価格 (逆需要曲線) 企業iの総費用= Ci(qi) = cqi, (0 < c < a) ⇒ 固定費用ゼロ、限界費用はcで一定 企業は生産量を同時に(=相手の生産量を知る前に)決定 クールノー・モデル: 標準型による表現 (1) ゲームのプレーヤー 企業i, i=1,2 (2) 各プレーヤーの選択できる戦略 生産量の選択 qi ≧ 0 各企業の戦略空間: Si = [0, ∞) (非負の実数) (3) プレーヤーの選択する戦略の組み合わせごとに各プレー ヤーが受け取る利得 ui(si, sj) = πi(qi, qj) = qi [P(Q) - c] = qi [a - (qi + qj) - c] クールノー・モデル: ナッシュ均衡 (s*i, s*j)がナッシュ均衡 ⇔ i=1,2について、 siが Max ui (si, sj) の解になっている si ∊ Si (q*i, q*j)がナッシュ均衡 ⇔ i=1,2について、 q*iが Max πi (qi, q*j) の解になっている qi≧0 Max πi (qi, q*j) = qi [a - (qi+q*j) - c] を解くと、一階の条件より qi≧0 qi =(a - q*j - c)/2 注意:相手の生産量は自分にとって所与(定数) 連立方程式として 2q*1 = a - q*2 – c, 2q*2 = a - q*1 – c を解くと、 q*1 = q*2 =(a-c)/3 クールノー・モデル: 反応曲線 この場合の最適反応: 相手の生産量に対して q2 最適な自分の生産量 企業1の最適反応: R1 (q2) = (a-c)/2 - q2/2 企業2の最適反応: R2 (q1) = (a-c)/2 - q1/2 最適反応曲線は q1 = q2 = (a-c)/3 の一点のみで交わる ⇒これがナッシュ均衡 q1 クールノー・モデル: 独占/談合との比較 • 2社の利潤の和が最大になるように各社の生産量を選択: Max π1(q1,q2)+π2(q1,q2)=(q1+q2)[a-(q1+q2)-c] q1,q2≧0 ⇔ Max Q[a-Q-c] ⇒ 一階の条件より Q**=q**1+q**2=(a-c)/2 Q≧0 • 一方、ナッシュ均衡の総供給量は 2(a-c)/3 > (a-c)/2 ⇒ ナッシュ均衡での総供給量は独占の下での総供給量より多 く、総利潤はより少ない • もし片方の企業が独占供給量の半分の(a-c)/4だけ生産した 場合、もう一方の企業の最適反応は qi = [a-c-(a-c)/4]/2 = 3(a-c)/8 > (a-c)/4 ⇒ 各企業が独占供給量の半分ずつ生産する場合、どちらの企 業にもそこから逸脱するインセンティブが働く クールノー・モデル: 強く支配される戦略の逐次消去 1. それぞれの企業に とって、(a-c)/2 より大 きい生産量は強く支 配される 2. 相手が(a-c)/2 より大 きい生産量を選ばな いことを前提とすると、 各企業にとって(a- a c c)/4 より小さい生産 2 量は強く支配される ac 3. ・・・ 4 消去を続けていくと、 最終的にはナッシュ 均衡の(a-c)/3に到達 q2 R1 (q2) ac ac , 3 3 R2 (q1) (a c) / 4 (a c) / 2 q1 ベルトランの複占モデル: 仮定 注意: クールノーとは異なるモデル クールノー・モデルもベルトラン・モデルもナッシュ均衡 • 複占(duopoly): 企業1,2 • 差別化された製品 (同質的製品のベルトラン・モデルもある) • pi =企業iの価格, i =1,2 • qi (pi, pj) = a - pi + bpj (0 < b < 2) =企業iの製品への需要量 • 企業iの総費用 = Ci(qi) = cqi, (0 < c < a) ⇒ 固定費用ゼロ、限界費用はcで一定 • 企業は価格を同時に決定 ベルトラン・モデル: 標準型による表現 (1) ゲームのプレーヤー 企業i, i=1,2 (2) 各プレーヤーの選択できる戦略 価格の選択 pi ≧ 0 各企業の戦略空間: Si = [0, ∞) (非負の実数) (3) プレーヤーの選択する戦略の組み合わせごとに各プレー ヤーが受け取る利得 ui(si, sj) = πi(pi, pj) = (pi – c) (a - pi + bpj) ベルトラン・モデル: ナッシュ均衡 (p*i, p*j)がナッシュ均衡 ⇔ i=1,2について、 p*iが Max πi (pi, p*j) の解になっている pi≧0 Max πi(pi, p*j) = (pi – c) (a - pi + bpj) を解くと、 pi≧0 一階の条件より pi =(a + bp*j + c)/2 注意: 相手の価格は自分にとって所与(定数) 連立方程式として 2p*1 = a + bp*2 + c, 2p*2 = a + bp*1 + c を解くと、 p*1 = p*2 =(a+c)/(2-b) ナッシュ均衡が存在しない? • ペニー合わせ (matching pennies) • プレーヤー1とプレーヤー2がそれぞれ1ペニー硬貨の表を 出すか裏を出すか同時に決める • 二人とも表、または二人とも裏 ⇒プレーヤー1はプレーヤー2に1ペニー渡す • 表裏が合わない ⇒プレーヤー2はプレーヤー1に1ペニー渡す プレーヤー2 表 プレーヤー1 表 裏 -1, 裏 1 1, -1 1, -1 -1, 1 互いに相手を出し抜こうとするゲームの例 バッター 直球 ピッチャー 直球 カーブ カーブ -1, 1 1, -1 1, -1 -1, 1 防御する国 陸 侵攻する国 海 陸 -1, 1 1, -1 海 1, -1 -1, 1 他の例:じゃんけん、ババ抜き、ポーカー、などなど 混合戦略と純粋戦略 混合戦略 (mixed strategy) 純粋戦略 (pure strategy) • それぞれの戦略をどの確 率で実行するか選択 • 1つだけの戦略を選択 • 戦略集合Siに含まれるそ れぞれの戦略について選 択された確率分布 • 戦略集合Siに含まれるそ れぞれの戦略si 例: コインの表を確率0.8、 裏を確率0.2で選ぶ 例: コインの表を選ぶ 混合戦略の定義 G={S1 ,…, Sn; u1 ,…, un}を考え、 Si={si1, …, siK}とする • pik をプレーヤーiがk = 1,…,Kのそれぞれについてsik を選ぶ 確率とする • このときプレーヤーiの混合戦略とは確率分布pi=(pi1,…, piK) のことで、0 ≦ piK ≦ 1 (k = 1,…,K), pi1 + … + piK = 1 で ある 注意: • どんな純粋戦略も混合戦略として表現できる (ある戦略に確率1、その他の戦略に確率0を選択) 期待利得 • 単純化のためにプレーヤーが2人と仮定 • J: S1に属する純粋戦略の数 ⇒ S1={s11,…, s1J}, s1j∊ S1 • K: S2に属する純粋戦略の数 ⇒ S2={s21,…, s2K}, s2k∊ S2 • プレーヤー1が、「プレーヤー2は戦略(s21,…, s2K)を確率 (p21,…, p2K)で選択する」と予想すると仮定 ⇒プレーヤー1の純粋戦略s1jを選んだ場合の期待利得は K p k 1 u ( s1 j , s2 k ) 2k 1 ⇒プレーヤー1が混合戦略(p11,…, p1J)を選んだ場合のプレー ヤー1の期待利得は J K J K v1 ( p1 , p2 ) p1 j p2 k u1 ( s1 j , s2 k ) p1 j p2 k u1 ( s1 j , s2 k ) j 1 k 1 j 1 k 1 期待利得 続き • プレーヤー2が、「プレーヤー1は戦略(s11,…, s1J)を確率 (p11,…, p1J)で選択する」と予想し、混合戦略(p21,…, p2K)を 選んだ場合のプレーヤー2の期待利得は J J K v2 ( p1 , p2 ) p2 k p1 j u2 ( s1 j , s2 k ) p1 j p2 k u2 ( s1 j , s2 k ) k 1 j 1 j 1 k 1 K 混合戦略の下での最適反応 • p1=(p11,…, p1J)がp2に対して最適反応 ⇔ S1上の任意の確率分布p’1についてv1(p1, p2)≧ v1(p’1, p2) (弱い不等号であることに注意) • このときもしp1j>0ならば、S1に属するどのs1j’についても K p k 1 K u ( s1 j , s2 k ) p2 k u1 ( s1 j ' , s2 k ) 2k 1 k 1 例: もしコインの裏と表をそれぞれ0.5の確率で選ぶのが最適 反応ならば、コインの表を選ぶ純粋戦略もコインの裏を選ぶ 純粋戦略も両方とも最適反応 混合戦略の下での最適反応 続き • プレーヤー1がプレーヤー2の混合戦略p2に対して最適反応 となる複数の純粋戦略を持っている ⇒「最適反応となる複数の純粋戦略」上の任意の確率分布 (それ以外には確率0を割り当てる)もまた最適反応になる 例: もしコインの表を選ぶ純粋戦略もコインの裏を選ぶ純粋戦 略も両方とも最適反応ならば、任意の混合戦略が最適反応 混合戦略の下でのナッシュ均衡の定義 • 2人プレーヤーの標準型ゲームG={S1, S2; u1, u2}において、 混合戦略(p*1, p*2)がナッシュ均衡であるとは、 各プレー ヤーの混合戦略が他の混合戦略に対する最適反応となって いることである ⇔ p*1がS1上の任意の確率分布p1に対して v1(p*1, p*2)≧ v1(p1, p*2) を満たし、またp*2がS2上の任意の確率分布p2に対して v2(p*1, p*2)≧ v2(p*1, p2) を満たす ペニー合わせの最適混合戦略 ① プレーヤー1(表裏が違えば勝ち)の最適混合戦略: • プレーヤー2が表を選ぶ確率が0.5以上なら裏を、0.5以下 なら表を選ぶ • 確率がちょうど0.5ならば表でも裏でもよい プレーヤー1の期待利得: • プレーヤー1が表を選ぶ確率をr、プレーヤー2が表を選ぶ 確率をqとする プレーヤー1の期待利得 =rq・(-1)+r(1-q)・(+1)+(1-r)q・(+1)+(1-r)(1-q)・(-1) =(2q-1)+r(2-4q) ⇒ r*(q)=0 if q>0.5, r*(q)=1 if q<0.5, r*(0.5)=[0,1] ペニー合わせの最適混合戦略 ② プレーヤー2(表裏が合えば勝ち)の最適混合戦略: • プレーヤー1が表を選ぶ確率が0.5以上なら表を、0.5以下 なら裏を選ぶ • 確率がちょうど0.5ならば表でも裏でもよい プレーヤー2の期待利得: • プレーヤー1が表を選ぶ確率をr、プレーヤー2が表を選ぶ 確率をqとする プレーヤー2の期待利得 =rq・(1)+r(1-q)・(-1)+(1-r)q・(-1)+(1-r)(1-q)・(+1) =(1-2r)+q(4r-2) ⇒ q*(r)=1 if r>0.5, q*(r)=0 if r<0.5, q*(0.5)=[0,1] ペニー合わせの混合ナッシュ均衡 • プレーヤー1が表を選ぶ 確率をr、プレーヤー2が r 表を選ぶ確率をqとする 1 プレーヤー1の最適戦略: r*(q)=1 if q<0.5 r*(q)=0 if q>0.5 r*(0.5)=[0,1] 0.5 プレーヤー2の最適戦略: q*(r)=0 if r<0.5 q*(r)=1 if r>0.5 q*(0.5)=[0,1] ナッシュ均衡=(0.5, 0.5) 0 0.5 1 q 両性の争いゲームの最適混合戦略 女性 オペラ ボクシング 男性 オペラ ボクシング 2, 1 0, 0 0, 0 1, 2 • 男性がオペラを選ぶ確率をq、女性がオペラを選ぶ確率をrと する 女性の期待利得=2qr+(1-q)(1-r)=r(3q-1)+(1-q) ⇒ r*(q)=1 if q>1/3, r*(q)=0 if q<1/3, r*(1/3)=[0,1] 男性の期待利得=qr+2(1-q)(1-r)=q(3r-2)+(2-2r) ⇒ q*(r)=1 if r>2/3, q*(r)=0 if r<2/3, q*(2/3)=[0,1] 両性の争いの混合ナッシュ均衡 q: 男性がオペラを選ぶ確率 r: 女性がオペラを選ぶ確率 r 女性の最適戦略: 1 r*(q)=0 if q<1/3 r*(q)=1 if q>1/3 2/3 r*(1/3)=[0,1] 男性の最適戦略: q*(r)=0 if r<2/3 q*(r)=1 if r>2/3 q*(2/3)=[0,1] ナッシュ均衡: (q,r)=(0, 0), (1/3, 2/3), (1,1) 0 1/3 1 q ナッシュ均衡の存在 • n人の標準型ゲーム G={S1,…, Sn; u1,…, un} において、 n が有限で、どのiについてもSnが有限集合であるならば、混 合戦略を含めればナッシュ均衡が少なくとも1つは必ず存在 する 証明: 岡田『ゲーム理論』 pp. 33-36 参照
© Copyright 2024 ExpyDoc