ゲーム理論

ゲーム理論
経営学研究会
経営学部 3回生 横尾千尋
目標
• ナッシュ均衡をみつけることができるようになる。
– 支配戦略とはなにか?
– 最適反応戦略とはなにか?
– 囚人のジレンマを理解する。
限定合理性
• 1. 選択をする際に得られる情報が不完全
• 2. 完全な選択肢のリストを作成できない
• 3. 自分がした選択の結果が正確に予測でき
ない。
⇒これらを明確に定義
(ゲーム的シチュエーションをつくる)
個人主義・合理主義の前提
• 自分の好みや意志をしっかり持ち、
自分の目的に合わせて、
最良の方法を考えて行動する。
– 簡単には同調したり、協調したり、しない。
• Win-Win の関係を指向する必要性。
– 簡単には騙されない。また、騙さない。
• 一方だけが得をするビジネスモデルでは生き残れない。
Case1 セボンとローソスの顧客獲得戦争
どちらの駅に出店するか?
A駅の利用客 1200人
B駅の利用客 300人
違う場所に出店すれば、利用客を独占
同じ場所に出店すると、ローソスが人気
ローソスはセボンの2倍顧客を獲得できる
A駅に出店 =セボン400人、ローソス800人
B駅に出店 =セボン100人、ローソス200人
客数を利得と考える
出典: 首都大学東京 「ゲーム理論1」講義資料 渡辺隆裕
ゲームの要素 (3つ)
• プレーヤー
• 戦略
• 利得
• プレーヤー
– セボン と ローソス
• 戦略
– セボンの戦略
» A駅に出店する or B駅に出店する
– ローソスの戦略
» A駅に出店する or B駅に出店する
利得の整理
• 戦略の組み合わせによる結果と利得
セボン
の戦略
A駅
A駅
B駅
B駅
ローソス
の戦略
A駅
B駅
A駅
B駅
セボン ローソス
の利得 の利得
400
800
1200
300
300
1200
100
200
ゲームの要素(3つ)を1つの利得表に
セボン\ローソス A駅
B駅
A駅
(400 , 800) (1200 , 300)
B駅
(300 , 1200) (100 , 200)
左側がセボンの利得
セボン\ローソス A駅
B駅
A駅
(400 , 800) (1200 , 300)
B駅
(300 , 1200) (100 , 200)
右側がローソスの利得
セボン\ローソス A駅
B駅
A駅
(400 , 800) (1200 , 300)
B駅
(300 , 1200) (100 , 200)
セボンがA駅、ローソスがB駅を選択したとき
セボン\ローソス A駅
B駅
A駅
(400 , 800)
(1200 , 300)
B駅
(300 , 1200) (100 , 200)
⇒セボンの利得は1200、ローソスの利得は300
セボンがB駅、ローソスがA駅を選択したとき
セボン\ローソス
A駅
B駅
A駅
(400 , 800)
(1200 , 300)
B駅
(300 , 1200) (100 , 200)
⇒セボンの利得は300、ローソスの利得は1200
ゲームを解く とは?
• 自分を含めたすべてのプレーヤーが、どのよ
うな戦略を選択するかを予測すること
⇒ このことを、ゲームを解く と呼ぶ
ゲームの解は、すべてのプレーヤーの戦略の組
EX: (A駅, A駅) ○
(300, 1200) ×
ゲームを解くために必要な思考方法
• 1. 各プレーヤーの視点にたつこと。
• 2. 自分以外のプレーヤーのすべての戦略に
対して、どの戦略が自分の利得を一番高くす
るかを考えること。
Step1 支配戦略を探す
• 支配戦略
– 相手のどの戦略に対しても、自分の他の戦略よ
りも良い戦略
支配戦略があるときは、その戦略を選択する
また相手もそうするだろう
セボンの視点にたつ
ローソスがA駅に出店するとき、
セボン\ローソス
A駅
B駅
A駅
(400 , 800)
(1200 , 300)
B駅
(300 , 1200) (100 , 200)
セボンは、A駅に出店する方が良い
ローソスがB駅に出店するとき、
セボン\ローソス
A駅
B駅
A駅
(400 , 800)
(1200 , 300)
B駅
(300 , 1200) (100 , 200)
やっぱりセボンは、A駅に出店する方が良い
⇒A駅を選ぶことは、セボンの支配戦略
ローソスの視点にたつ
セボンがA駅に出店するとき、
セボン\ローソス
A駅
B駅
A駅
(400 , 800)
(1200 , 300)
B駅
(300 , 1200) (100 , 200)
ローソスは、A駅に出店する方が良い
セボンがB駅に出店するとき、
セボン\ローソス
A駅
B駅
A駅
(400 , 800)
(1200 , 300)
B駅
(300 , 1200) (100 , 200)
やっぱりローソスは、A駅に出店する方が良い
⇒A駅を選ぶことは、ローソスにとっても支配戦略
A駅はセボンの支配戦略
A駅はローソスにとっても支配戦略
支配戦略は、相手のどの戦略に対しても、自分
の他の戦略よりも良い戦略なので、支配戦略
があれば、プレーヤーは支配戦略を選ぶ
↓
Case1 のゲームの解は、(A, A) となる
各プレーヤーが支配戦略を選ぶゲームの解を、
支配戦略均衡 という。
Case2 セボンとローソスのコンビニ戦争 Part2
どちらの駅に出店するか?
A駅の利用客 600人
B駅の利用客 300人
違う場所に出店すれば、利用客を独占
同じ場所に出店すると、ローソスが人気
ローソスはセボンの2倍顧客を獲得できる
A駅に出店 =セボン200人、ローソス400人
B駅に出店 =セボン100人、ローソス200人
客数を利得と考える
出典: 首都大学東京 「ゲーム理論1」講義資料 渡辺隆裕
ローソスがA駅のとき?ローソスがB駅のとき?
セボン\ローソ
ス
A駅
B駅
A駅
B駅
(200 , 400) (600 , 300)
(300 , 600) (100 , 200)
セボンには支配戦略がない!
あなたがセボンだったら、どうしますか?
セボン\ローソ
ス
A駅
B駅
A駅
B駅
(200 , 400) (600 , 300)
(300 , 600) (100 , 200)
• ゲーム理論を習わない人の考え方
一番高い利得(600)を考えると、A駅かな?
一番低い利得(100)は避けたいから、やっぱりA駅かな?
⇒このようなだめもとな選び方ではだめ
Step2 自分に支配戦略がないときは、
相手の支配戦略を探す
• 支配戦略がないときは、相手の戦略に対して、
自分の最適な戦略を選ぶ。
• 最適反応戦略
– 相手の戦略に応じた最適の戦略のこと。
ローソスの立場にたってみると・・・
セボン\ローソ
ス
A駅
B駅
A駅
B駅
(200 , 400) (600 , 300)
(300 , 600) (100 , 200)
• ローソスにとって、A駅を選ぶことは支配戦略
=ローソスがA駅に出店することは確実
⇒セボンは、ローソスがA駅に出店したときの
最適反応戦略B駅 をえらぶ!
A駅はローソスにとって支配戦略
B駅はセボンにとって、ローソスの支配戦略に対
する最適反応戦略
2人ゲームにおいて一方のプレーヤーに支配戦
略がある場合、そのプレーヤーは支配戦略を
選び、もう一方は、その最適反応戦略を選ぶ
↓
Case2 のゲームの解は、(B, A) となる
お互いに支配戦略がないときは、最適反応戦略同
士の組み合わせがゲームの解となる。
ナッシュ均衡
• すべてのプレーヤーが最適反応戦略を取り
合う戦略の組をナッシュ均衡と呼ぶ
– 均衡とは、その状態から、自分だけでは、それ以
上利得を高くできない状態
ゲームの解=ナッシュ均衡
• 支配戦略均衡
• 片方に支配戦略がある戦略の組み合わせ
⇒ナッシュ均衡の特殊ケース
戦略形ゲーム(同時手番ゲーム)のゲームの解は、
すべてナッシュ均衡!
戦略形ゲーム(同時手番ゲーム)には、少なくとも必
ず1つはナッシュ均衡がある。
Case3 2国間の環境問題
A国とB国は、1つの湖をはさむ隣国同士だ。
両国は、湖の水を汲み上げ、産業に利用している。
しかしながら、最近湖の汚染が激しく、
両国に浄化基準の強化が求められている。
両国が同時に浄化基準を強化する
⇒ 両国ともに費用は増えるが、水質は改善 それぞれ利益+3億
片方が行い、片方は行わない
⇒ 水質は改善するが、
⇒ 浄化基準を強化した方が、費用増で相手国に産業で遅れ 損失−10億
⇒ 浄化基準を強化しない方は、別のところに投資ができて産業力UP 利益+6億
両社とも行わない
⇒ 水質は改善せず、環境問題は悪化。産業にも悪影響 それぞれ 損失−5億
出典: 渡辺隆裕 「図解雑学 ゲーム理論」 ナツメ社
利得表に整理してみる
A国\B国
協力する
協力しない
協力する
(3 , 3)
(6 , -10)
協力しない
(-10 , 6)
(-5 , -5)
相手が「協力する」ならば?
「協力しない」ならば?
A国\B国
協力する
協力しない
協力する
(3 , 3)
(6 , -10)
協力しない
(-10 , 6)
(-5 , -5)
A国\B国
協力する
協力しない
協力する
(3 , 3)
(6 , -10)
協力しない
(-10 , 6)
(-5 , -5)
(協力しない, 協力しない)が、Case2 の解
• 相手が「協力する」とき、自分は「協力しない」
を選んだ方がいい
• 相手が「協力しない」とき、自分は「協力しな
い」を選んだ方がいい
– すなわち「協力しない」ことは、双方にとって支配
戦略 =(協力しない, 協力しない)はこのゲーム
の支配戦略均衡
• しかし、双方が「協力しない」を選んだときより、
双方が「協力する」を選んだときの方が利得
が高い
• 囚人のジレンマ!
囚人のジレンマ
• オリジナルは、数学者タッカー(A.W.Tucker)が
作り出した以下のようなストーリー
• 2人の囚人AとBは共犯で、1つの重罪を犯して
いる。しかし、証拠はない。
• 2人は、別の軽微の刑(2年)で収容されてい
る。
• 警察は、2人に司法取引を持ちかける。
「お前一人が罪を認めれば、今すぐ釈放だ」
利得表は
囚人A\囚人B
黙秘
自白
黙秘
(2 , 2)
(0 , 10)
自白
(10 , 0)
(5 , 5)
2人は自白を選ぶ
囚人のジレンマ
• 囚人のジレンマは、私たちの身近にあふれて
いる。
– ゴミ問題、環境問題、内戦、紛争
– 町内会の役員、家族内のルール
– 価格競争、動植物の乱獲
など
囚人のジレンマの解決策
•
•
•
•
トラスト(提携)
カルテル(談合)
罰則
コミットメント(自分は裏切らないと宣言する)
⇒「協力する」が、自分の支配戦略だと信じ込ませ
る。
• トリガー戦略
• しっぺ返し戦略
ケーススタディー1 デート
エドワード\ベラ 映画のチケッ フットボール
トを買う
のチケットを買
う
(2 , 2)
映画のチケットを (4 , 6)
買う
(6 , 4)
フットボールのチ (2 , 2)
ケットを買う
ケーススタディー2
囚人のジレンマ的状況のストーリーと利得表を
つくってみよう!
参考文献
• 首都大学東京 「ゲーム理論1」講義資料 渡
辺隆裕
• 渡辺隆裕 「図解雑学 ゲーム理論」 ナツメ
社