経済学のためのゲーム理論入門 第 2 章 完備情報の動学ゲーム 2.12 まず,標準形ゲーム G = ⟨I, Ai , ui ⟩ (i ∈ I = {1, 2, ..., n}) を定義する.ここで,I はプレイヤー の集合,Ai はプレイヤー i の選択可能な行動の全体集合,ui はプレイヤー i の利得関数である. 「繰り返しゲーム」とは,この同じゲーム G が何期間も繰り返し行われるような動学ゲームのこと 指している.繰り返しゲームにおけるプレイヤーの戦略を定義する前に,ゲームの履歴(history) を定義したい*1 .無限回繰り返しゲーム G∞ における第 t 期以前の履歴 ht を,以下のように定義 する. (定義 1)繰り返しゲームにおける履歴 (1) t = 1 の時,ht = h1 = e (empty) (2) t > 1 の時,ht = (a1 , a2 , ..., at−1 ) ここで,ak (k = 1, 2, .., t − 1) は,第 k 期におけるゲーム G の結果を表している.そして, ak ∈ A = A1 × · · · × An である. 第 T 期までの有限回繰り返しゲームにおける履歴の定義については,上の(定義 1)において, 適宜 t < T などと制約を加えてやればよい.そして,繰り返しゲームにおけるプレイヤーの戦略 を,以下のように定義する. (定義 2)繰り返しゲームにおける戦略 第 t 期までの可能な履歴 ht の全体集合を H t とおく.この時,無限回繰り返しゲーム G∞ の第 t 期におけるプレイヤー i の純粋戦略空間 Sit は, Sit = {sti | sti : H t → Ai } というように,第 t 期までの可能な履歴の集合 H t から行動空間 Ai への関数として定義すること ができる.そして,無限回繰り返しゲーム G∞ におけるプレイヤー i の純粋戦略空間 Si は,第 t 期における戦略 sti の列の集合として定義することができる.すなわち, Si = {si | si = {sti }∞ t=1 } と定義できる.また,無限回繰り返しゲーム G∞ におけるサブゲームを以下に定義する. *1 本書においては「履歴」ではなく「歴史」という用語が用いられている. 1 経済学のためのゲーム理論入門 第 2 章 完備情報の動学ゲーム (定義 3)無限回繰り返しゲームにおけるサブゲーム 任意の t について,G∞ の第 t 期から始まるサブゲームは,もとのゲーム全体 G∞ に等しい. (定義 4)有限回繰り返しゲームにおけるサブゲーム 第 T 期までの有限回繰り返しゲーム GT における「第 t + 1 期から始まるサブゲーム」とは,G が T − t 回プレイされる繰り返しゲームのことを指す. また,上で定義されたようなある戦略の組が,「繰り返しゲームにおけるサブゲーム完全均衡であ る」とは, 「そこでの各プレイヤーの戦略の組が,以上で定義した全てのサブゲームにおいて Nash 均衡となっている」ということを意味する. 2
© Copyright 2025 ExpyDoc