上級価格理論II 第4回 2011年後期 中村さやか 今日やること 2. 完備情報の動学ゲーム • 2.2 完備不完全情報の2段階ゲーム – 2.2.A 理論:サブゲーム完全性 – 2.2.B 銀行の取付け • 2.3 繰り返しゲーム – 2.3.A 理論:2段階繰り返しゲーム – 2.3.B 無限繰り返しゲーム 完備不完全情報の2段階ゲーム 1. プレーヤー1とプレーヤー2が同時に行動a1とa2をそれぞれ の実行可能集合A1とA2から選ぶ 2. プレーヤー3とプレーヤー4が第1段階の結果(a1, a2)を観 察し、そのあと同時に行動a3とa4をそれぞれの実行可能集 合A3とA4から選ぶ 3. 利得が ui (a1, a2, a3, a4), i=1, 2, 3, 4 で与えられる 単純化のための仮定: • 第1段階ゲームのどんな結果(a1, a2)に対しても第2段階 ゲームが一意的なナッシュ均衡を持つ 第2段階のナッシュ均衡を(a*3 (a1, a2), a*4(a1, a2))で表す 完備不完全情報の2段階ゲーム 1. プレーヤー1とプレーヤー2が同時に行動a1とa2をそれぞれ の実行可能集合A1とA2から選ぶ 2. プレーヤー3とプレーヤー4が第1段階の結果(a1, a2)を観 察し、そのあと同時に行動a3とa4をそれぞれの実行可能集 合A3とA4から選ぶ 3. 利得が ui (a1, a2, a3, a4), i=1, 2, 3, 4 で与えられる 仮定: 第2段階ゲームの結果が(a*3 (a1, a2), a*4(a1, a2)) ⇒上のゲームは(1段階の)同時手番ゲームになる: 1. プレーヤー1とプレーヤー2が同時に行動a1とa2をそれぞれ の実行可能集合A1とA2から選ぶ 2. 利得は ui (a1, a2, a*3 (a1, a2), a*4(a1, a2)), i=1, 2 このゲームが一意的なナッシュ均衡(a*1, a*2)を持つとする 完備不完全情報の2段階ゲーム 1. プレーヤー1とプレーヤー2が同時に行動a1とa2をそれぞれ の実行可能集合A1とA2から選ぶ 2. プレーヤー3とプレーヤー4が第1段階の結果(a1, a2)を観 察し、そのあと同時に行動a3とa4をそれぞれの実行可能集 合A3とA4から選ぶ 3. 利得が ui (a1, a2, a3, a4), i=1, 2, 3, 4 で与えられる 仮定: • 第2段階の一意的ナッシュ均衡が(a*3 (a1, a2), a*4(a1, a2)) • 第2段階の結果が(a*3 (a1, a2), a*4(a1, a2))であると仮定し た場合の1段階のゲームの一意的ナッシュ均衡が(a*1, a*2) ⇒ (a*1, a*2, a*3(a*1, a*2), a*4(a*1, a*2))をこの2段階ゲームの サブゲーム完全な結果とよぶ(詳しくは2.4で) 銀行の取付け① 銀行の投資 投資家2人が銀行にそれぞれDだけ投資 銀行はその預金をある長期プロジェクトに投資 投資家1 D 銀行 投資家2 D 2D 長期プロジェクト 途中清算なら2r 投資完了なら2R 銀行が途中で投資を清算 ⇒2r (D>r>D/2) 回収 銀行が最後まで投資継続 ⇒2R (R>D) 回収 銀行の取付け② 投資家の取り分 • • • • • • 投資家1 D 投資家2 銀行 D 途中清算なら2r 2D 長期プロジェクト 投資完了なら2R 投資家が預金を引き出せるのは銀行投資が満期になる前 の期日1か満期になった後の期日2のどちらか&割引率0 2人とも期日1で引き出し⇒2人ともrを受け取る 1人だけ期日1で引き出し⇒引き出した方はD, 引き出さな かった方は2r-Dを受け取る 2人とも期日2で引き出し⇒2人ともRを受け取る 1人だけ期日2で引き出し⇒引き出した方は2R-D, 引き出 さなかった方はDを受け取る 2人とも引き出さない⇒2人ともRを受け取る 銀行の取付け③ 期日2のゲーム 投資家2 引き出す 投資家1 • • 引き出さない 引き出す R, R 2R-D, D 引き出さない D, 2R-D R, R 相手が引き出すなら、R>D なので引き出した方がよい 相手が引き出さないなら、2R-D>R なので引き出した方が よい ⇒「引き出す」が「引き出さない」を強く支配 ⇒2人とも預金を引き出し(R,R)を得るのが一意的ナッシュ均衡 銀行の取付け④ 期日1のゲーム 投資家2 引き出す 引き出す 投資家1 引き出さない 引き出さない r, r D, 2r-D 2r-D, D R, R • 相手が引き出すなら、r>2r-D なので引き出した方がよい • 相手が引き出さないなら、D<R なので引き出さない方がよい ナッシュ均衡は2つ: 1. 2人とも預金を引き出し(r,r)を得る ⇒取りつけ騒ぎ 2. 2人とも預金を引き出さずに(R,R)を得る ⇒効率的 2段階繰り返しゲーム① ルール プレーヤー2 L2 プレーヤー1 R2 L1 1, 1 5, 0 R1 0, 5 4, 4 • 2人のプレーヤーはこの同時手番ゲームを2回繰り返す ⇒2度目のゲームは1度目のゲームの結果を見てから行われる • ゲームの利得は1回目と2回目の利得の和 (割引率ゼロ) ⇒2.2.Aで分析したクラスのゲーム 2段階繰り返しゲーム② 第2段階 プレーヤー2 L2 プレーヤー1 R2 L1 1, 1 5, 0 R1 0, 5 4, 4 • どちらのプレーヤーにとってもLがRを強く支配 ⇒ 第2段階の一意的ナッシュ均衡は第1段階の結果にかかわ らず(L1, L2) 2段階繰り返しゲーム③ 第1段階 プレーヤー2 L2 プレーヤー1 • R2 L1 1+1, 1+1 5+1, 0+1 R1 0+1, 5+1 4+1, 4+1 第2段階の一意的ナッシュ均衡の利得(1, 1)を第1段階の利 得に加えると上の利得票が得られる • どちらのプレーヤーにとってもLがRを強く支配 ⇒ 第1段階の一意的ナッシュ均衡は (L1, L2) ⇒サブゲーム完全な結果 段階ゲームと有限繰り返しゲーム • • • • • G={A1 ,…, An ; u1 ,…, un} をプレーヤー1,…, nが同時に行 動空間A1 ,…, Anから行動a1 ,…, anを選択し、利得が u1 (a1 ,…, an)…, un (a1 ,…, an)によって与えられる完備情 報の静学ゲームとする 段階ゲームGをT回繰り返して行う有限繰り返しゲーム (finitely repeated game)をG(T)で表す このとき、Gを繰り返しゲームの段階ゲーム(stage game)と よぶ このゲームでは毎回の繰り返しの前にそれ以前の全てのプ レーが観察されることになっている G(T)の利得はT個の段階ゲームの利得を足し合わせたも のである 命題 • • もし段階ゲームGが一意的なナッシュ均衡を持つならば、繰 り返しゲームG(T)はどんな有限のTについても一意的でサ ブゲーム完全な結果を持つ その結果とは、Gのナッシュ均衡がどの段階ゲームにおい てもプレーされることである 注意: • ナッシュ均衡が一意的でないならば、この命題は成り立た ない (詳しくは教科書で) 無限繰り返しゲームと割引因子 段階ゲームを無限回繰り返す • 例えばそれぞれの段階ゲームでどの行動を選んでも必ず 正の利得を得られるとする ⇒ それらを単純に足し合わせたものが繰り返しゲームの利得 だとすると、それぞれの段階ゲームでどんな選択をしても繰 り返しゲームの利得は無限大になってしまう ⇒ 将来の利得を現在価値に換算する際に割引くことで解決 定義 • 割引因子をδ(0<δ<1)とするとき、利得の無限列π1, π2, π3, …の現在価値(present value)は以下の式で与えられる 1 2 2 3 t 1 t t 1 いつ終わるかわからない繰り返しゲーム • • 各段階ゲームが終わるたびごとに確率pでゲームがそこで 終わり、確率1-pでゲームを少なくともつぎの段階まで継続 する無限回繰り返しゲーム 時間選好による割引率は1/(1+r) (r>0) であるとする 利得の現在価値の期待値 = π1 + π2(1-p)/(1+r) + π3[(1-p)/(1+r)]2 +・・・ t 1 1 p t t 1 1 r ⇒ 割引率δは時間選好だけでなくゲームが終わる確率も反映 していると解釈できる (pが大きいほど大きく割り引く) 無限回繰り返しゲームの例 プレーヤー2 L2 プレーヤー1 R2 L1 1, 1 5, 0 R1 0, 5 4, 4 • 2人のプレーヤーはこの同時手番ゲームを無限回繰り返す ⇒ 各段階ゲームはそれまでのゲームの結果を見てから行わ れる • ゲームの利得は各段階ゲームの利得の現在価値の和 無限回繰り返しゲームの結果 プレーヤー2 L2 プレーヤー1 R2 L1 1, 1 5, 0 R1 0, 5 4, 4 有限回繰り返しゲーム: サブゲーム完全な結果では必ず毎回 (L1, L2)が選ばれる 無限回繰り返しゲーム: 毎回 (R1, R2)が選ばれるサブゲーム完全な結果がある トリガー戦略 (trigger strategy) • • • まず第1段階ではRiをプレーする 第t段階では、もしそれまでのt-1段階での結果がすべて(R1, R2)であったならRiをプレーする そうでないときはLiをプレーする trigger: しっぺがえし • プレーヤーiは他のプレーヤーが協力を続ける限り自分も協 力を続ける • しかしその前提が崩れた時には非協力に切り替え、その後 ずっと非協力的な行動を続ける • もし両方のプレーヤーがこの戦略を取っていれば、すべて の段階で(R1, R2)がプレーされる トリガー戦略とナッシュ均衡① WTS: 両方がトリガー戦略を取っているのはナッシュ均衡 ⇔ 相手がトリガー戦略をとるなら自分もトリガー戦略をとること が最適反応 証明: • まず、相手がトリガー戦略をとっているときに自分が一度Ri 以外を選んだ後のゲームを考える • その後は相手はLjを選び続ける ⇒ 最適反応は自分も毎回Liを選び続けること • 裏切った段階で得られる最大利得は5 (自分がLi、相手がRj をプレー)、その後は毎回1を得るので、利得の列の現在価 値は 5+δ・1+δ2・1+δ3・1・・・ = 5+δ/(1-δ) トリガー戦略とナッシュ均衡② • 自分が最適反応を行った場合の利得の無限列の現在価値 をVとする • もしある段階ゲームでRiをプレーするのが最適ならば、 V=4+δV ⇒ V=4/(1-δ) • もしある段階ゲームでLiをプレーするのが最適ならば、 V= 5+δ/(1-δ) 4/(1-δ) – [5+δ/(1-δ)] = [1/(1-δ)][4-5(1-δ)-δ]=(4δ-1)/(1-δ) 0<δ<1より分母は正 δが十分大きければ(δ>0.25 ならば)分子も正 ⇒各段階ゲームでRiをプレーするのが最適 ⇒相手がトリガー戦略をとるなら自分もトリガー戦略をとるのが 最適反応 無限繰り返しゲームの定義 • • • Gを段階ゲームとするとき、そのGを無限に繰り返し ,かつそ のさいプレーヤーの共通の割引因子がδであるような無限 繰り返しゲーム(infinitely repeated game)をG(∞, δ)で表す このゲームでは、どのtについても、t段階の初めにそれ以前 のt-1回の段階ゲームの結果が観察されている それぞれのプレーヤーのG(∞, δ)における利得は、これらの 段階ゲームからの利得の無限列の現在価値である ⇒ とるべき行動(戦略)はそれ以前のゲームの結果にも依存 ⇒ 各プレーヤーの戦略空間と行動空間が一致していた完備 情報の静学ゲームとは異なる 「歴史」と戦略 第t段階までのプレーの歴史(history): • 第1段階から第t段階までの各プレーヤーの選択の記録 定義 • 有限繰り返しゲームG(T)または無限繰り返しゲームG(∞, δ)において、プレーヤーの戦略とは、各段階で、それまでに 起こり得た全ての歴史のそれぞれに応じプレーヤーがどの 行動を取るかを指定したものである 戦略=完全な行動計画 (戦略さえあれば代理人がプレーヤーに代わってプレー可能) サブゲームの定義 サブゲーム(subgame): • 元のゲームの一部分で、ある1つの歴史があり、それがプ レーヤー間の共有知識となっている任意の点を起点とし、 そのあとがプレーされるゲームのこと • 有限繰り返しゲームG(T)で第t+1段階から始まるサブゲー ムとは、GがT-t回プレーされる繰り返しゲームのことで、 G(T-t)と書かれる ⇒ 第t+1段階から始まるサブゲームは第t段階までの可能なプ レーの歴史それぞれに対応して1個ずつ存在する • 無限繰り返しゲームG(∞, δ)において第t+1段階から始まる サブゲームは、第t段階までに起こり得たプレーの歴史の数 と同数存在し、それぞれがもとのゲームと同じになる サブゲームの例 • 無限繰り返しの囚人のジレンマゲームで、第1段階の起こり うる歴史は4つある; (L1, L2), (L1, R2), (R1, L2), (R1, R2) ⇒ 第2段階から始まるサブゲームは 歴史が(L1, L2)のサブゲーム 歴史が(L1, R2)のサブゲーム 歴史が(R1, L2)のサブゲーム 歴史が(R1, R2)のサブゲーム の4つ • 第2段階から始まるサブゲームは第2段階のステージゲー ムだけでなくその後全ての段階のステージゲームを含んで いる サブゲーム完全の定義 サブゲーム完全 (Selten 1965): • ナッシュ均衡はそこでのプレーヤーの戦略がどのサブゲー ムにおいてもナッシュ均衡となるとき、サブゲーム完全 (subgame-pefect)であるという ⇒ ナッシュ均衡を精緻化した概念 • ① ⇒ ② ⇒ 無限繰り返しの囚人のジレンマゲームにおけるトリガー戦 略は、サブゲーム完全 それ以前の結果が全て(R1, R2)のサブゲーム トリガー戦略がナッシュ均衡 それ以前の結果が一度は(R1, R2)以外を含むサブゲーム トリガー戦略がナッシュ均衡 ((L1, L2)を繰り返すだけ)
© Copyright 2025 ExpyDoc