上級価格理論II 第6回 2011年後期 中村さやか 今日やること 2. 完備情報の動学ゲーム • 2.4 完備不完全情報の動学ゲーム – 2.4.A ゲームの展開型による表現 – 2.4.B サブゲーム完全なナッシュ均衡 ゲームの標準形による表現(復習) ゲームの標準型による表現(normal-form representation) の定義とは、以下を指定すること: (1) ゲームのプレーヤー (2) 各プレーヤーの選択できる戦略の集合(戦略空間) (3) プレーヤーの選択する戦略の組み合わせごとに各プレー ヤーが受け取る利得 ゲームの展開型による表現の定義 ゲームの展開型による表現(extensive-form representation)の定義とは、以下を指定すること: (1) (2a) (2b) (2c) (3) ゲームのプレーヤー 各プレーヤーにいつ手番が回ってくるか 自分の手番で各プレーヤーは何ができるか 自分の手番が来たときプレーヤーは何を知っているか プレーヤーの選択する戦略の組み合わせごとに 各プレーヤーが受け取る利得 展開型ゲームの例 1 2 L R 2 L’ R’ L’ R’ 3 1 1 2 2 1 0 0 プレーヤー1の利得 プレーヤー2の利得 1. プレーヤー1がその行動 a1 を実行可能集合 A1={L,R} から 選ぶ 2. プレーヤー2は a1 を見て、そのあと行動 a2 を実行可能集合 A2={L’,R’}から選ぶ 3. 利得 u1(a1, a2), u2(a1, a2) が決まる ゲームの木の構造 1 2 L R 2 L’ R’ L’ R’ 3 1 1 2 2 1 0 0 プレーヤー1の利得 プレーヤー2の利得 点 (node)と2点を結ぶ(向きのついた)枝から構成 • 決定節 (decision node): • 終節 (terminal node): 利得の書いてあるところ 枝の入ってこない始点 (initial node)が1つある 標準型と展開型 • • 静学ゲームは標準形、動学ゲームでは展開型で表現すると 分析上便利 どんなゲームでも、標準型・展開型両方で表現可能 標準型と展開型の違い • 標準型: 戦略空間を指定 • 展開型: 以下を指定 (2a) 各プレーヤーにいつ手番が回ってくるか (2b) 自分の手番で各プレーヤーは何ができるか (2c) 自分の手番が来たときプレーヤーは何を知っているか 戦略の定義(復習) 定義 • プレーヤーの戦略とは完全な行動計画のことで、そのプ レーヤーが行動を起こすことになるかもしれないそれぞれ の事態でどの実行可能な行動を取るかをすべて漏れなく指 定したものである ⇒ ありとあらゆる事態について行動を指定しないとナッシュ均 衡の考え方を適用できない ⇒ 行動空間と戦略空間は必ずしも一致しない 戦略空間の例 1 2 L R 2 L’ R’ L’ R’ 3 1 1 2 2 1 0 0 プレーヤー1の利得 プレーヤー2の利得 プレーヤー2の戦略:(a1がLの時の行動、 a1がRの時の行動) 行動空間: A2={L, R} 戦略空間: A2={(L’,L’), (L’, R’), (R’, L’), (R’, R’)} 展開型で表現されたゲームの標準形の表現 • 上でゲームの木で表現されたゲームを標準形で表現 プレーヤー2 (L’,L’) プレーヤー1 (L’, R’) (R’, L’) (R’, R’) L 3, 1 3, 1 1, 2 1, 2 R 2, 1 0, 0 2, 1 0, 0 同時手番ゲームの展開型による表現 1. プレーヤー1がその行動 a1 を実行可能集合 A1から選ぶ 2. プレーヤー2はプレーヤー1の行動 a1 を見ずに、行動 a2 を 実行可能集合 A2から選ぶ 3. 利得が u1(a1, a2), u2(a1, a2) として決定される ⇒ 1. と 2. を入れ替えても同じ ⇒ 互いに相手が何をしたかについての情報がない 情報集合の定義 • プレーヤーの情報集合(information set)とは、次の2条件を 満たす決定節の集まりである i. プレーヤーは情報集合に含まれるどの節でも自分の手番 になっている ii. 情報集合に含まれる1つの節にゲームのプレーが到達した とき、プレーヤーはその情報集合に含まれる節のうちどこ に自分がいるのか区別できない ※ 同一の情報集合に属する各節では、プレーヤーの取りうる 行動の集合(行動空間)が同じでなければならない (そうでなければ行動空間を見れば自分がどの節にいるか 推測できる) ※ どの節もどれか1つの情報集合に入っている (含まれる節が1つだけの情報集合もある) 情報集合の例 囚人1 黙秘 自白 囚人2 黙秘 自白 3 1 1 2 黙秘 2 1 自白 0 0 プレーヤー1の利得 プレーヤー2の利得 • 情報集合に含まれている節を○で囲んでその横にプレー ヤーの名前を書く • 囚人2は2つの節のうちどちらに自分がいるのかわからない • 各決定節では1人しか動かない: 同時に動く場合も、1人が 先に動き、残りがその動きを知らずに動く、と表現 完全情報と不完全情報 完全情報の定義: • ゲームのどの手番においても、そこで動くプレーヤーがそれ までのゲームの完全な歴史を知っていること ⇔ どの情報集合もただ一つの節のみを含む 不完全情報の定義: • ゲームの少なくとも1つの手番で、そこで動くプレーヤーがそ れまでのゲームの完全な歴史を知らないこと ⇔ 少なくとも1つの情報集合が複数の節を含む サブゲームの厳密な定義 定義: 展開型ゲームのサブゲームとは、 a. それ自体が1節のみを含む情報集合になっている決定節n (ただしゲームの最初の決定節は除く)から始まり b. ゲームの木のnより後に続くすべての決定節および終節を 含み(かつnの後に来ない節は1つも含まず)、 c. どの情報集合をも切断しないもの である 注:ここでは全体のゲームをサブゲームとはみなさないが、みな す人もいる (議論の本質には全く関係なし) サブゲームの例 1 L R 2 2 L’ R’ L’ R’ 3 1 1 2 2 1 0 0 サブゲームは2つ プレーヤー1の利得 プレーヤー2の利得 サブゲームが存在しない例 囚人1 黙秘 自白 囚人2 黙秘 自白 3 1 1 2 黙秘 2 1 自白 0 0 プレーヤー1の利得 プレーヤー2の利得 • サブゲームは情報集合を切断できないので、ここではサブ ゲームは存在しない サブゲームと歴史 • サブゲームでは、そこまでの完全な歴史がその後に動くプ レーヤー間の共有知識になっている サブゲームの定義: どの情報集合をも切断しない ⇒ n以降の任意の節n’が複数の節を含む情報集合に入ってい る場合、その情報集合に含まれる全ての節がサブゲームに 入っている ⇒ その情報集合に含まれる全ての節がn以降にきている ⇒ n’で手番を持つプレーヤーは、(少なくとも)nまでの完全な 歴史を知っている サブゲーム完全の定義(復習) サブゲーム完全 (Selten 1965): • ナッシュ均衡はそこでのプレーヤーの戦略がどのサブゲー ムにおいてもナッシュ均衡となるとき、サブゲーム完全 (subgame-pefect)であるという ⇒ 逆向き推論法による「結果」とサブゲーム完全なナッシュ均 衡はどう違うか? 均衡: 戦略(=完全な行動計画)の集まり 結果: 結果として何が選ばれたか 「結果」と「均衡」 ① 2段階の完備完全情報ゲーム(2.1.Aの復習): 1. プレーヤー1が実行可能な行動の集合A1から行動a1を選ぶ 2. プレーヤー2はa1を見たうえで実行可能な行動の集合A2か ら行動a2を選ぶ 3. それぞれの利得 u1 (a1, a2), u2 (a1, a2) が決まる 逆向き推論法による結果: (a*1, R2(a*1)) サブゲーム完全なナッシュ均衡: (a*1, R2(a1)) R2(a1): 起こりうるすべてのa1に対して選ぶべき行動を指定 「結果」と均衡 ①’ 1 L R 2 2 L’ R’ L’ R’ 3 1 1 2 2 1 0 0 プレーヤー1の利得 プレーヤー2の利得 逆向き推論法による結果: (R, L’) サブゲーム完全なナッシュ均衡: (R, (R’, L’)) ナッシュ均衡: (R, (R’, L’)) 及び (L, (R’, R’)) ⇒信憑性のない脅しを含んでいる 「結果」と「均衡」 ② 2段階の完備不完全情報ゲーム(2.2.Aの復習): 1. プレーヤー1とプレーヤー2が同時に行動a1とa2をそれぞれ の実行可能集合A1とA2から選ぶ 2. プレーヤー3とプレーヤー4が第1段階の結果(a1, a2)を観 察し、そのあと同時に行動a3とa4をそれぞれの実行可能集 合A3とA4から選ぶ 3. 利得が ui (a1, a2, a3, a4), i=1, 2, 3, 4 で与えられる サブゲーム完全な結果: (a*1, a*2, a*3 (a*1, a*2), a*4(a*1, a*2)) サブゲーム完全なナッシュ均衡: (a*1, a*2, a*3 (a1, a2), a*4(a1, a2)) 逆向き推論法と情報集合 囚人1 黙秘 自白 囚人2 黙秘 自白 3 1 1 2 黙秘 2 1 自白 0 0 プレーヤー1の利得 プレーヤー2の利得 囚人2は自分がどちらの節にいるか知らずに行動を決定 ⇒ 3章でこういう場合での逆向き推論法について扱う サブゲーム完全なナッシュ均衡の存在 • 完備情報の有限動学ゲームにおいて、混合戦略を許容す ればサブゲーム完全なナッシュ均衡は必ず存在 完備情報の有限動学ゲーム: プレーヤー数が有限で、 各プレーヤーの実行可能な戦略も 有限個のゲーム 証明: 省略 (岡田 p130-132参照)
© Copyright 2024 ExpyDoc