量子ゲーム理論とは何か - 第2土曜会ホームぺージ

量子ゲーム理論とは何か
脇本佑紀
平成二十五年七月十三日
1 前口上
1927
ハイゼンベルグの不確定性原理
1930
ゲーデルの不完全性定理
1936
アローの不可能性定理
20 世紀は “天才” の時代であり、躍進の時代であった。ヒルベルトが居て、ゲーデルが生まれた。アイン
シュタインが居て、ハイゼンヘルグが生まれた。ヴィトゲンシュタインが居て、サルトルが生まれた。“天才”
達が時代を動かした。その流れに乗った、とは思いたくないが、多くの人々が無下に死んでいった、激戦の時
代でもあった。人々が混濁とした時の奔流に押し流されるままに迎えたこの 21 世紀は、内省の時代であると
言っても良かろう。これといって輝く “天才” はいないが、その代わり、平凡ながらも、たくさんの人々が考
えている。かつての遺産、20 世紀の産物、人類史上の “怪物” をどう扱っていくのかを。国家という “怪物”、
文明という “怪物”、形式化された学問という “怪物”......。
そんな “怪物” 達の中に一際重要な三体が居る。上にあげた三つの定理である。「不」の字が異彩を放つこの
三体は我々に根源的な問いを投げかける。見るということ、分かるということ、決めるということ......。そう、
人類は飼いならさなくてはならない。この三体を。答えなければならない。その問いに。これは歴史を背負う
生き物としての宿命である。全知全能の神は既に死んだ。黄泉の国か天の岩戸か、定理の見えぬところに逃げ
果せた。そう、21 世紀は人類 (と謙虚な神々) の時代でもあるのだ。知性を持ちものを理解しうると宣うすべ
ての存在が気にせずには居られぬこの命題、人類史を賭すに足るこの命題達はじつのところ希望なのである。
これらの命題を手にしうる者のみが人類足りうる存在であると言っても過言ではない。我々は実存を手にした
のだ。
そんな実存を手にする人々の一つの集まりである第二土曜会は主に「ゲーデルの不完全性定理」を軸にして
活動するものでありますが、今回の脇本の発表では少しの寄り道、一休みとして「アローの不可能性定理」と
の関わりが強い「ゲーム理論」について取扱うことに致します。
CAFEE BREAK: アローの不可能性定理
アローは選択肢が持ちうる 2 つの公理と 4 つの民主性条件が互いに相反することを示した。民主性条件の中に「独裁者
の不在」が含まれるため、
「民主主義はパラドックスを含み、それを解消するためには独裁者が必要」という刺激的な文言
によって紹介されることも多い。Wikipedia を参考にすると定理、条件は次の通り。二つの選択肢 a, b 及び個人 i に対し
て a が b よりも好ましいときに a >i b、社会全体に対して好ましいときに a > b と書く。
公理:
1. (完備性)∀a, b; a >∗ b ∨ a <∗ b
1
2. (推移性)a >∗ b ∧ b >∗ c ⇒ a >∗ c
条件:
1.
2.
3.
4.
(普遍性) ∀i, a, b; a >i b ∨ a <i b
(パレート原則) ∀i; a >i b ⇒ a > b
(独立性) a > b ⇒ ∀i; a >i b ∨ a <i b
(非独裁制) ¬∃i; a >i b ⇒ a > b
普遍性とは如何なる選択も禁止されないということで、独立性とは社会の選択は個人の選択によってのみ決定するという
ことである。
2 導入
蜘蛛の糸という話がある。これは個々の人間が自分の利益を最大にしようと振る舞った結果全体として損を
してしまった、という話の好例である。このような話はいくらでもあって、枚挙するに暇ない。個々の顧客に
目を向けるあまり全体掌握が疎かになり破綻したリーマンブラザースや、アローの不可能性定理が予言する民
主主義の結果としての独裁者の誕生など。
このような「ある価値観に基づく選択」を定量的に扱う理論をゲーム理論と言う。またこの「蜘蛛の糸」的
現象をパラドックスとかディレンマと表現する。この意味でアローの不可能性定理はまさにパラドックスなの
である。選挙もパラドックスに満ち溢れている。これは決して紙上に収まる問題ではない。人類のために解決
せねばならない問題である。“ゲーム” に勝敗を求める時代は疾うの昔に過ぎ去った。現代はどう win-win の
関係を築くか、すなわち如何に呉越同舟を実現するかに主眼が置かれつつある。すなわち、パラドックスに立
ち向かうということである。マルクス主義的な在り方から脱却しようとしている、と表現してもよかろう。む
しろこのパラドックスを無意識に避けているから我々人類は言語を獲得して以来多少の淘汰を受けつつも子孫
繁栄誠に結構な状況に甘んじていられるのである。裏を返せば現代我々を取り巻く選択環境がそれぞれの人間
の意志をうまく反映するようにできていない、ということでもある。
「呉越同舟」の実現のために、あるいは我々人間そのもののより深い理解のために役立つと期待されている
のが「量子ゲーム理論」である。ここでは統括的な説明はほとんどせずに一つの伝統的な例......「囚人のディ
レンマ」を挙げ、いわゆる古典ゲーム理論を紹介した後に量子ゲーム理論について述べることにする。「囚人
のディレンマ」はアローの不可能性定理に代表される蜘蛛の糸的現象を象徴的に描き出したモデルの一つで
ある。
なお、計算やその結果は [1] を参照している。
3 古典ゲーム理論
簡単のため二人二択のゲームに付いて述べることにする。ゲーム理論は各プレイヤー A , B の持つ選択肢
(a0 , a1 ), (b0 , b1 ) それぞれに “利得” を付与する機能を持った行列値関数、ゲームテーブル A, B によって定義
される。
Aij = A(ai , bj ), Bij = B(ai , bj )
(1)
すなわち行列の組がゲームを定義するのである。
こ の ま ま で は 解 析 が で き な い た め 、各 々 の 選 択 肢 (a0 , a1 ), (b0 , b1 ) を そ の 選 択 を す る “確
率”p = (p0 , p1 ), q = (q0 , q1 ) に 置 き 換 え て 考 え る こ と に す る 。コ イ ン ト ス の よ う に ど ち ら を 選 ん で
も変わらないと言った状況は、まさに p0 = p1 = q0 = q1 = 1/2 であったのだ、と捉えるわけだ。そうしたと
2
き上のゲームテーブルに対応するものが各プレイヤー毎に定義された効用関数 ΠA , ΠB であり、この効用関数
をそれぞれ最大化する組 p∗ , q ∗ のことをナッシュ均衡と呼ぶ。
ΠA (p, q ∗ )
p=p∗
= max {ΠA (p, q ∗ )} , ΠB (p∗ , q)
p
q=q ∗
= max {ΠA (p∗ , q)}
q
(2)
ナッシュ均衡が指し示す選択肢がゲームの解、結果となる。
ゲームテーブルが与えられれば諸々の考察の下に効用関数を決定することができる。古典ゲーム理論の場
合、各プレイヤーの選択はそれぞれ独立であることから、Aij , Bij が選択される確率 Pij は積 pi qj で表されて
ΠA (p, q) =
X
Aij pi qj , ΠB (p, q) =
i,j
X
Bij pi qj
(3)
i,j
となる。要はテーブルの各成分を線形につないだだけである。
いま、次のようなゲームテーブルを考えよう。このゲームこそが彼の「囚人のディレンマ」である。
A=
1 5
1
, B=
0 3
5
0
3
(4)
行列の各成分と各プレイヤー A , B の選択との対応は表 1 の通り。
片方のみが黙秘した場合彼は刑に処され自白した側は釈放された上に恩賞が与えられる。両方が自白した場
合は双方とも刑に処されはするものの多少は軽く、両者とも黙秘を貫いた場合は証拠不十分で釈放、といった
塩梅である。もちろん互いの相手の選択を知ることはできない。
この状況を古典ゲーム理論で考えたときの効用関数は次のようになる。なお p0 = 1 − p1 , q0 = 1 − q1 と
した。
ΠA (p, q) = (1 − p1 )(1 − q1 ) + 5(1 − p1 )q1 + 3p1 q1
ΠB (p, q) = (1 − p1 )(1 − q1 ) + 5p1 (1 − q1 ) + 3p1 q1
(5)
(6)
具体的な解析方法について述べると、これは一般に不動点を求める問題となり、私の手に余るためここでは
触れないことにする。
ただ、その解をイメージするのは容易である。各プレイヤーの効用関数を見て、適当な初期点から、交互に
己れの高みを目指して登っていけばよい。表 1 を見て、例えば (p1 , q1 ) = (1/2, 1/2) の点から始めるとしよ
う。プレイヤー A は p1 を、プレイヤー B は q1 を制御することができる。A は p1 を減らした方がより高い
“利得” を得ることができるので、次の点は (p1 , q1 ) = (1/2 − δ, 1/2)。B にとっても同様なので、また次は、
(p1 , q1 ) = (1/2 − δ, 1/2 − δ)、......。最終的に落ち着く点、ナッシュ均衡は p∗ = (1, 0), q ∗ = (1, 0)、すなわち
両者とも自白、となる。B がいかなる選択をしようとも A は自白をした方が高い “利得” を得ることが出来、
B についても然りなのだから当然の結果である。
表1
行列の成分と各プレイヤーの選択との対応
B
H
HH 自白
HH 黙秘
HH
HH
自白
自白
H
H
H
H
A H
HH 自白 HHH 黙秘
HH
HH
黙秘
H
H
H 黙秘
H
H
3
5
5
4
4
3
3
2
ΠA
ΠB
2
1
1
0
0
1
1
1
0.8
q1
0.4
0.2
0.2
0.8
0.6
0.6
0.4
1
0.8
0.8
0.6
q1
p1
0 0
0.6
0.4
0.4
0.2
0.2
p1
0 0
図1
各プレイヤーの効用関数
しかし、全体を見てみると、互いに黙秘すること、それが最も “利得” の高い行動であることは明らかであ
2 5
A+B =
5 6
ろう。
(7)
互いが “合理的” に行動する以上この点 (p1 , q1 ) = (1, 1) はナッシュ均衡と成り得ない。この不条理こそが「囚
人のディレンマ」なのである。
TEA BREAK: ゲームとその自由度
いまこの日本国はコンシュマー・フリーを問わず数えきれぬほどのゲームで満たされている。多くのゲームはストー
リーやルールそして「クリア」なる概念を有しており、選択によって進行していく。したがって極端に高い自由度はプレ
イヤーを困惑させる。しかし中にはそのような枠からはみ出たゲームも存在する。例えば「ゆめにっき」*1 というフリー
ゲームは主人公の恐ろしくも魅力的な夢の世界をさ迷う “ゲーム” であり、結末らしき結末はあるもののストーリーは存
在しない。
自由度の高さで言えば、コンピューターゲームではなく TRPG—Table-talk Role Playing Game—が最高であろう。
私は高校生のときに友人と「A の魔方陣」*2 に興じたことがある。長続きはしなかったものの大変楽しい経験であった。
4 量子ゲーム理論
上ではプレイヤー A , B のもつ選択肢 (a0 , a1 ), (b0 , b1 ) それぞれに確率を与えたのであるが、ここではそれ
ぞれの選択肢を基底ベクトル (|0iA , |1iA ) , (|0iB , |1iB ) に対応させて、プレイヤーの状態ベクトル
|αiA = α0 |0iA + α1 |1iA
(8)
|βiB = β0 |0iB + β1 |1iB
(9)
2
2
を考えることにしよう。先ほど用いた確率 (p0 , p1 ), (q0 , q1 ) との対応は pi = |A hi|αiA | , qi = |B hi|βiB | (i =
0, 1) となる。
ここで効用関数を得るために式 (3) 前後に対応して “利得” Aij , Bij が選択される確率 Pij を求めなければ
ならない。それには系がとりうるすべての状態を計上する必要があるが、[1] によればそのような状態はテン
*1
*2
http://www3.nns.ne.jp/pri/tk-mto/
http://www.alfasystem.net/A/magic.html
4
図2
量子ゲーム理論における囚人の利得
3
3
2.5
2.5
2
2
ΠA
ΠB
1.5
1.5
1
1
1
1
1
0.8
0.4
0.2
0.2
0.8
0.6
0.6
0.4
q1
1
0.8
0.8
0.6
q1
p1
0.6
0.4
0.4
0.2
0 0
0.2
p1
0 0
ソル積 |αiA ⊗ |βiB に次なる演算子 J(γ1 , γ2 ) を掛けることによって実現することができる。
J(γ1 , γ2 ) = eiγ1 S/2 eiγ2 CS/2
(10)
ここで S, C の定義は次の通り。
S|iiA ⊗ |jiB = |jiA ⊗ |iiB
(11)
C|iiA ⊗ |jiB = |1 − iiA ⊗ |1 − jiB
(12)
2
したがって Pij は |A hi| ⊗B hj|J(γ1 , γ2 )|αiA ⊗ |βiB | で与えられる。ここで演算子 J(γ1 , γ2 ) が A 及び B
エ ン タ ン グ ル さ
の状態をもつれあわせているということに注目されたい。
[1] に拠ると計算の結果は以下のようになる。なお引数はすべて省略した。
X
Q
ΠA =
AC
ij pi qj + ΠA
(13)
i,j
ΠB =
X
C
pi qj + ΠQ
Bij
B
(14)
i,j
γ1
γ2
γ1 Aij + cos2
− cos2
Aji + sin2
2
2
2
γ1
γ2
γ1
= cos2 Bij + cos2
− cos2
Bji + sin2
2
2
2
2
AC
ij = cos
C
Bij
γ2
A1−i,1−j
2
γ2
B1−i,1−j
2
√
(16)
√
ΠQ
A = − p0 p1 q0 q1 {G+ sin(ξ + χ) + G− sin(ξ − χ)}
√
ΠQ
B = − p0 p1 q0 q1 {H+ sin(χ + ξ) + H− sin(χ − ξ)}
(17)
G+ = (A00 − A11 ) sin γ1
(19)
G− = (A01 − A10 ) sin γ2
H+ = (B00 − B11 ) sin γ1
H− = (B01 − B10 ) sin γ2
(20)
(21)
(22)
ここで新たに導入されたパラメーター ξ, χ は、(8)、(9) 式で定義された重みを (α0 , α1 ) =
(β0 , β1 ) =
(15)
(18)
√
√
p0 , p1 eiξ ,
√
q0 , q1 eiχ と書いたときの位相因子である。パラメータ γ1 , γ2 , ξ, χ が囚人たちに “量子効果”
を与えることになる。
5
γ1 = π/2, γ1 = ξ = χ = 0 とすると、効用関数 ΠA , ΠB のグラフは図 2 のようになる。
この場合のナッシュ均衡は p∗ = (0, 1), q ∗ (0, 1) となり、囚人たちは互いに黙秘することを選択する。“量子
効果” がパラドックスを解消したのだ。
注意しなければならないことは、量子効果があれば必ずディレンマが解消される、というわけではないとい
うことである。それでも、個人個人が私利私欲に走りどう転んでも蜘蛛の糸を断ってしまう状況よりは、はる
かに救われている。
WINE BREAK: 究極のゲーム
人類の誰しもが興じているゲームはウィトゲンシュタインの「言語ゲーム」であると言ってもよかろう。尤も、このゲー
ムの場合、ルールよりもプレイが先立っている点が異質である。プレイがルールを造り、そのルールがまたプレイを既定
する。若者はしばしばルール通りのプレイを期待する......「いつやるの?」この事実はまさに言語のゲーム的側面を端的
に表したものといえよう。一方、ルールから逸脱してみせること、これもまた価値ある行為とみなされることもある。禅
問答は無意識のうちの束縛を解くために講じられる手段であるし、
「Carpe Diem」...... この論理的には意味不明な言葉が
心を揺さぶることを私は否定できない。
5 議論
古典ゲーム理論においては合理的思考の下で個人が利得を追求すると全体としての幸福が実現されないこと
を見た。また量子ゲーム理論がこれを解消しうるということを確認した。ここで問題となるのは、もし現実の
肉体を持つ我々が囚人であったら、どの選択をするのだろうかということである。黙秘なる選択肢、いちかば
ちかの選択を行いうるということは容易に想像できよう。すなわち、人間の思考は量子的である...... 誤解を招
エ ン タ ン グ ル し て
かぬように表現すれば、我々の状態は既にもつれあっている。おそらく、道徳とか、個人に対する信用とか、
そういうものがもつれを生じさせているのであろうことは想像に難くないが、これらを定量化することはこれ
からの学際的課題であろう。
6 後尻下
情報伝達手段としての言語は完全足り得ない。これは人間を取り巻く不条理の中でも取り分け大きな問題で
ある。だが、量子ゲーム理論にまつわる議論は、言語の不完全性が生む情報の不確定性こそが我々を囚人とい
う身分から解き放っているのではないかと思わせてくれる。じっさい、確かなもの、確かな方法という幻想さ
え打ち砕ければ、可能なのだ。ここでは、何が、とは言わないことにするが、そうして、我々はコミュニティ
というものを手にしてからずっと、生き永らえてきたのである。我々の脳は古典的な機構で動作しているが、
ク ラ ス タ
言語の不完全性が脳の集合系に量子状態を生む。それはきっと、進化の過程で調律された絶妙な不確定性なの
ではないかと思う。おそらく “怪物” はすでに、我々と歩みを共にしていたのである......。
参考文献
[1] “量子ゲーム理論”, 全卓樹, シュミレーション&ゲーミング, 21(1), 16-26, 2011
6