経済学のためのゲーム理論入門第 2 章完備情報の動学ゲーム 2.12 まず，標準形ゲーム G = ⟨I, Ai , ui ⟩ (i ∈ I = {1, 2, ..., n}) を定義する．ここで，I はプレイヤーの集合，Ai はプレイヤー i の選択可能な行動の全体集合，ui はプレイヤー i の利得関数である．「繰り返しゲーム」とは，この同じゲーム G が何期間も繰り返し行われるような動学ゲームのこと指している．繰り返しゲームにおけるプレイヤーの戦略を定義する前に，ゲームの履歴（history）を定義したい*1 ．無限回繰り返しゲーム G∞ における第 t 期以前の履歴 ht を，以下のように定義する．（定義 1）繰り返しゲームにおける履歴 (1) t = 1 の時，ht = h1 = e (empty) (2) t > 1 の時，ht = (a1 , a2 , ..., at−1 ) ここで，ak (k = 1, 2, .., t − 1) は，第 k 期におけるゲーム G の結果を表している．そして， ak ∈ A = A1 × · · · × An である．第 T 期までの有限回繰り返しゲームにおける履歴の定義については，上の（定義 1）において，適宜 t < T などと制約を加えてやればよい．そして，繰り返しゲームにおけるプレイヤーの戦略を，以下のように定義する．（定義 2）繰り返しゲームにおける戦略第 t 期までの可能な履歴 ht の全体集合を H t とおく．この時，無限回繰り返しゲーム G∞ の第 t 期におけるプレイヤー i の純粋戦略空間 Sit は， Sit = {sti | sti : H t → Ai } というように，第 t 期までの可能な履歴の集合 H t から行動空間 Ai への関数として定義することができる．そして，無限回繰り返しゲーム G∞ におけるプレイヤー i の純粋戦略空間 Si は，第 t 期における戦略 sti の列の集合として定義することができる．すなわち， Si = {si | si = {sti }∞ t=1 } と定義できる．また，無限回繰り返しゲーム G∞ におけるサブゲームを以下に定義する． *1 本書においては「履歴」ではなく「歴史」という用語が用いられている． 1 経済学のためのゲーム理論入門第 2 章完備情報の動学ゲーム（定義 3）無限回繰り返しゲームにおけるサブゲーム任意の t について，G∞ の第 t 期から始まるサブゲームは，もとのゲーム全体 G∞ に等しい．（定義 4）有限回繰り返しゲームにおけるサブゲーム第 T 期までの有限回繰り返しゲーム GT における「第 t + 1 期から始まるサブゲーム」とは，G が T − t 回プレイされる繰り返しゲームのことを指す．また，上で定義されたようなある戦略の組が，「繰り返しゲームにおけるサブゲーム完全均衡である」とは，「そこでの各プレイヤーの戦略の組が，以上で定義した全てのサブゲームにおいて Nash 均衡となっている」ということを意味する． 2