σ1(h) = ⎛ ⎢⎨ ⎢⎝ T if h ∈ H B if h ∈ H σ2(h) = ⎛ ⎢⎨ ⎢⎝ L if h ∈ H R

ゲーム理論入門 第 5 回宿題 解答と解説
問題 1 (1) まず (B, R) は段階ゲームのナッシュ均衡である.そこで,今, ゲームの歴史の集合
H を,設問で指定された戦略を各プレイヤーがとっているときに「実現するゲームの歴史」の集合
H1 と,
「実現しないゲームの歴史」H2 の 2 種類にわけて考えよう.ゲームの出発点は H1 に含まれ
ている.これを除けば,H1 に含まれる歴史とは,(B, R) という結果が毎回継続している歴史であ
り,H2 はそれ以外の歴史がすべて含まれる.
プレイヤー 2 がどのような歴史から始まる段階ゲームで必ず R を取ってくるとする.このとき,
まず「実現するゲームの歴史」の集合 H1 に含まれる歴史から始まる段階ゲームにおいてプレイヤー
1 が B ではなく T をとったとしよう.このとき,その段階ゲームではプレイヤー 1 の利得は 4 から
3 に減少する.プレイヤー 1 の行動の変更によって次以降の段階ゲームは H1 に含まれる歴史から
始まるものになるが,プレイヤー 2 はそこでも相変わらず R しかとってこない.したがって,プレ
イヤー 1 が再び B の代わりに T をとったところで,損の上に損を重ねるだけである.よって,H1
に含まれる歴史から始まる段階ゲームでは,プレイヤー 1 にとって B が最適反応になっている.
一方,H2 に含まれる歴史から始まる段階ゲームを考えると,ここでプレイヤー 1 が行動を T を
とったとしても,実現しない歴史から始まる段階ゲームだから,プレイヤー 1 の利得は変わらない.
よって,ここでも B をとるのが最適反応である.
総じて,プレイヤー 2 が任意の歴史のもとで R をとるなら,プレイヤー 1 も任意の歴史のもと
で B をとるのが最適反応である.同じことがプレイヤー 2 についても言えるから,これらの戦略の
組は無限回繰り返しゲームのナッシュ均衡になっている.
(2) 自分あるいは相手が裏切らない限り (T, L) がプレイされ,どちらかが 1 度でも裏切ったら段階
ゲームのナッシュ均衡の行動をプレイするように戦略を組めばよいから,次のようになる.


 T if h ∈ H C
σ1 (h) =

 B if h ∈ H D
σ2 (h) =


 L if h ∈ H C

 R if h ∈ H D
(3) プレイヤー 1 の場合,(T, L) が継続してきた歴史のもとで T の代わりに B を選択すれば,その
ときプレイヤー 2 は L を選択するから,短期的な利得の増分は 4-3=1 である.一方,その次の段
階ゲームからはプレイヤー 2 が R をとり続けるから,プレイヤー 1 は B をとり続けるのが最適で
ある.このとき (T, L) がずっと続いていく状態と比較すれば,毎回の段階ゲームで 3-2=1 だけの損
失が発生する.これが将来永遠に続くから,長期的な損失は割引因子 δ を用いて現在価値を計算す
ると,
δ + δ2 + δ3 + · · · =
δ
1−δ
と求まる.よって,プレイヤー 1 がトリガー戦略から逸脱しないための条件は
1≤
δ
1−δ
1
より,δ ≥ 1/2 であることがわかる.一方,プレイヤー 2 についても短期的利益と長期的損失を考
えると,まず (T, L) が継続してきた歴史から始まる段階ゲームで行動を L から R に変更すること
で得られる短期的利益は 5-4 = 1 である.一方,その次の回からはプレイヤー 1 が行動を B に変
更するから,プレイヤー 2 もそれに応じて行動を R にするのが最適になる.このとき,毎回の段階
ゲームでは 4-1=3 だけの損失が発生する.よって,長期的損失は
3δ + 3δ 2 + 3δ 3 + · · · =
3δ
1−δ
と求まる.よって,プレイヤー 1 がトリガー戦略から逸脱しないための条件は
1≤
3δ
1−δ
より,δ ≥ 1/4 であることがわかる.以上より,まとめると,これらのトリガー戦略がナッシュ均
衡になるための必要十分条件は δ ≥ 1/4 である.
問題 2 (1) これはすでに学んでいるベルトラン競争だから,1 回限りのゲームではナッシュ均衡は
pA = pB = 20 という価格の組合せになる.つまり,完全競争ではないにもかかわらず,均衡では
価格と限界費用が一致して,社会的余剰が最大になる資源配分が実現する(ただし,限界費用が生
産量にかかわらず一定で,かつ両社とも同じである場合に限る).
(2) 企業 A の利潤を πA ,企業 B の利潤を πB とすると,両社が同じ価格をつけて pA = pB = p の
とき,それぞれの利潤は
πA = πB = (p − 20)(80 − p)/2
と表される(それぞれの企業の生産量は市場需要量の半分になることに注意せよ).このとき各社
の利潤を最大にする価格 p は,上の関数が放物線になることに着目すれば,p = (80 + 20)/2 = 50
であることがわかる.
(3) まず,トリガー戦略は,ゲームの出発点および互いに価格を 50 ドルに設定し続けてきた歴史か
ら始まる段階ゲームにおいては価格を 50 ドルに設定し,それ以外の歴史(つまり,少なくともど
ちらか一方が一度でも 50 ドル以外の価格をつけたことのある歴史)から始まる段階ゲームでは価
格を 20 ドルに設定する戦略である.
さて,両社がこのトリガー戦略をとる場合に実現する歴史(経路)上では,互いに最適反応にな
る行動が指定されているためには,逸脱からの短期的利益が長期的損失以下になっているのが必要
かつ十分な条件である.たとえば,A 社について考えてみよう.50 ドルの価格を設定せずに逸脱す
る場合,もっとも有利な逸脱の仕方は,50 ドルよりもほんの少しだけ安い価格をつけて市場の需要
をすべて独占してしまうことである.このとき獲得できる需要量はおよそ 80-50=30 単位,1 単位あ
たりの利潤はおよそ 50-20=30 ドルだから,得られる利潤は最大でも 30×30=900 ドルを超えるこ
とはない.一方,50 ドルの価格を設定していれば需要が半分の 15 単位になるため,利潤は 30×15
= 450 ドルである.よって,逸脱による短期的利益は 900-450 =450 ドルを超えることがない.次
に,長期的損失を考えよう.逸脱が発覚して,次回の段階ゲームからは B 社が価格を 20 ドルに引
き下げてくる.これにはどう対抗したところでプラスの利潤を得ることはできない.獲得できる利
潤は最大でゼロである.よって長期的損失を求めるには,次回からの段階ゲームで利潤が 450 から
ゼロに減ってしまうことを現在価値で評価すればよい.すなわち,各企業の持つ割引因子を δ とす
れば,長期的損失は
450δ + 450δ 2 + 450δ 3 + · · · =
450δ
1−δ
2
である.したがって,両社がトリガー戦略をとるときに実現する歴史(経路)上で逸脱が生じない
ための必要十分条件は,
450 ≤
450δ
1−δ
であることがわかる.これを解けば,δ ≥ 1/2 が求まる.
割引因子に関する条件としてはこれで正解だが,以上の議論は「実現する歴史(経路)」上で逸
脱が生じない条件を見ただけであり,実現しない歴史(経路)上でも最適反応になる行動がとられ
ているかどうかまでは検討されていない.厳密には,実現しない歴史から始まる部分ゲームでも,
トリガー戦略の組が,割引因子の値にかかわらず,ナッシュ均衡になる戦略を指定しているかどう
か確かめておく必要がある.ただし,これはすでに講義でも話したように,(i) 段階ゲームのナッ
シュ均衡になる行動を任意の歴史のもとで繰り返す戦略は必ず,無限回繰り返しゲームのナッシュ
均衡であり,(ii) 無限回繰り返しゲームの部分ゲームは,全体のゲームと同じである(つまり,
「金
太郎飴」の構造になっている)ことに注意すれば,トリガー戦略の組が,どの実現しない歴史(経
路)から始まる部分ゲームでもナッシュ均衡の戦略を指定していることは明らかである.
問題 3(自分でゲーム・ツリーを描いて考えて見よ)
与えられた σ2 と組み合わせたとき部分ゲーム完全なナッシュ均衡になるのが,σ1 = (D, D, D, D, D)
であることは講義でも説明した. 次に,ナッシュ均衡では,均衡経路上では必ず互いに D しかと
らないことに注意しよう.つまり,均衡で実現するのは,1 回目の段階ゲームでは (D, D),2 回め
も (D, D) でなければなならないということである.いいかえれば,ナッシュ均衡を構成するプレ
イヤー 1 の戦略は必ず,
σ1 = (D, Y, Z, U, D)
という形になっているということである(Y, Z, U のところには C が入る可能性がある).
そうするとどちらか一方だけが逸脱しても 1 回目の段階ゲームで (C, C) が実現することはない
から,(C, C) の歴史に対して 2 回目の段階ゲームでどのような行動を指定していても均衡経路を変
更することはない(つまり,1 回目のゲームで各プレイヤーが D から逸脱するインセンティブは生
じない).よって,σ1 = (D, C, D, D, D) は σ2 と組み合わせたときナッシュ均衡になる.
同様にして,プレイヤー 1 が 1 回目に D をとる限り,1 回目のゲームの結果が (C, D) になるこ
とはない.よって σ1 = (D, D, C, D, D) も σ2 と組み合わせたときナッシュ均衡になる.1 回目が
(C, C) にならないという上の議論とも併せれば,σ1 = (D, C, C, D, D) も同様である.
では,1 回目のゲームの結果が (D, C) のとき D ではなく C を指定する戦略はどうか.この場
合,プレイヤー 2 が 1 回目に C をとれば,ゲームの結果は (D, C) になる.プレイヤー 2 はそうす
ることで 1 回目のゲームでは利得 1 を失う.しかし 2 回目のゲームではプレイヤー 1 が C をとるか
ら,このときプレイヤー 2 は D をとることにすれば,利得を 4 増やせる.したがって,プレイヤー
2 に逸脱のインセンティブがうまれるから,σ1 = (D, Y, Z, C, D) は σ2 と組み合わせたとき,ナッ
シュ均衡にならない(Y および Z は D でも C でも結論は変わらない).
よって答えは,(D, D, D, D, D),(D, C, D, D, D), (D, D, C, D, D), (D, C, C, D, D) の 4 つ.
(以上)
3