2014/5/22 鞍点のないゲーム 純粋戦略・・・ある1つの戦略を確定的に選択 マキシミン、ミニマックス ⇒ 最適戦略(鞍点) 鞍点・・・自分の最適戦略が相手も最適戦略 次のゲームの最適戦略は? P2の戦略 B1 B2 A1 5 2 P1の 戦略 A2 3 4 P1の戦略(マキシミン)・・・A1:2、A2:3 ⇒ A2 P2の戦略(ミニマックス)・・・B1:5、B2:4 ⇒ B2 しかし、お互いに相手の戦略は分かっている 鞍点のないゲーム ~続き~ P1の 戦略 A1 A2 ① P2の戦略がB2ならP1は戦略(A2)の変更不要 ② P1の戦略がA2ならP2は戦略B1への変更が有利 ③ P2が戦略をB1に変更することは予測できるので、P1は 戦略をA1に変更した方が有利 ④ この行動も予想できるのでP2は戦略をB2に変更する ・・・ ⇒ 純粋戦略では最適戦略が定まらない(鞍点がない) 混合戦略 鞍点のないゲームでは、複数の戦略を確率的に混合 して期待利得(期待損失)の最大化(最小化)をはかる P1が戦略(A1, A2)をとる確率:(p1, p2)・・・p1+p2=1 P2が戦略(B1, B2)をとる確率:(q1, q2) ・・・q1+q2=1 P1の 戦略 A1(p1) A2(p2) P2の戦略 B1(q1) B2(q2) 5 2 3 4 P1の期待利得が最大になる確率(p1, p2)を定める P2の期待損失が最小になる確率(q1, q2)を定める P1の戦略 ~続き~ q1、q2は未知なので最悪の場合を想定する (1) 3 + 2p1 < 4-2p1 のとき、(つまり、p1 < 1/4 ) q1=1、q2=0で最小期待利得 3 + 2p1 となる (2) 3 + 2p1 > 4-2p1 のとき、 (つまり、p1 > 1/4 ) q1=0、q2=1で最小期待利得 4-2p1 となる したがって、最小期待利得zは p1 < 1/4 のとき、 z = 3 + 2p1 p1 > 1/4 のとき、 z = 4-2p1 この利得が最大になるようなp1を求める マクシミンより P1の戦略: A2 ミニマックスより P2の戦略: B2 P2の戦略 B1 B2 5 2 3 4 P1の戦略 P1の期待利得 P2の戦略がB1のとき 利得1=5 p1 + 3 p2=5 p1 + 3 (1 - p1)=3 + 2 p1 P2の戦略がB2のとき 利得2=2 p1 + 4 p2= 2 p1 + 4 (1 - p1)=4 - 2 p1 P2がB1、B2を選択する確率はq1、q2なので 期待利得=利得1 x q1 + 利得2 x q2 =(3 + 2 p1) q1 + (4 - 2 p1) q2 最小期待利得の最大化 zを縦軸、p1を横軸として最小期待利得を図示する 右の図より2つの直線の交点で最大となる 3 + 2p1= 4-2p1 z z = 3+2p1 ∴ p1= 1/4 4 このときの利得は、 z =3 + 2×(1/4)=3.5 5 3.5 3 z = 4-2p1 2 0 1/4 P1の最適戦略は、 戦略(A1, A2)を確率( p1, p2 )=( 1/4, 3/4 ) でとる このとき、期待利得は3.5 p1 1 1 2014/5/22 P2の戦略 P2の期待損失 P1がA1をとったとき 5q1+2q2=5q1+2(1-q1)=2+3q1 P2の戦略 ~続き~ P1の A1: p1 戦略 A2: p 2 P2の戦略 B1: q1 B2: q2 5 2 3 4 (2) 2+3q1 > 4-q1 のとき、 (つまり、q1 > 1/2) p1=1、p2=0で最大損失 2+3q1 となる P1がA2をとったとき 3q1+4q2=3q1+4(1-q1)=4 - q1 したがって、最大期待損失zは q1 < 1/2 のとき、 z = 4-q1 q1 > 1/2 のとき、 z = 2 + 3q1 この損失が最小になるようなq1を求める P1がA1、A2を選択する確率はp1、p2なので 期待損失= (2+3q1) p1 + (4 - q1) p2 最大損失の最小化 ミニマックス定理 右の図より2つの直線の交点で最小となる 3q1 + 2= 4-q1 z = 2+3q1 5 ∴ q1= 1/2 4 3.5 3 このときの利得は、 z = 4 -q1 2 z = 4-1/2=3.5 q1 0 p1、p2は未知なので、最悪の場合を想定する (1) 2+3q1 < 4-q1 のとき、 (つまり、q1 < 1/2) p1=0、p2=1で最大損失 4-q1 となる 1/2 1 P2の最適戦略は、 戦略(B1, B2)を確率(q1, q2)=(1/2, 1/2)でとる このとき、期待損失は3.5 2人定和ゲームが鞍点を持つならば純粋戦 略により最適戦略を求めることができる。 鞍点が存在しない場合でも、混合戦略を許せ ば、各プレイヤーの最適戦略は必ず存在し、 ゲームの値zを求めることができる。 ⇒ 相手がどのような戦略をとろうとも期待利得 (損失)はz以上(以下)となる。 ジョン・フォン・ノイマン 練習1 混合戦略により次のゲームにおける解を求めよ。 P1の 戦略 A1: p1 A2: p2 P2の戦略 B1: q1 B2: q2 1 3 5 2 練習2 次のゲームにおいて (1)両者ともA3を選択することはないことを示せ (2)このゲームが完全決定的でないことを示せ (3)混合戦略によりゲームの解を求めよ A1: p1 P1の A2: p2 戦略 A3: p3 P2の戦略 A1: q1 A2: q2 A3: q3 70, 30 55, 45 71, 29 55, 45 70, 30 75, 25 51, 49 35, 65 70, 30 2
© Copyright 2024 ExpyDoc