演 習 問 題 科目 年 月 日( ) 時限施行 採 点 学部 学科 年 組 番 担当者

演習問題
演習 7 次の利得行列を持つ2人ゼロ和ゲームの最適混合戦略とゲーム値を求めよ.
HH
HH B
HH
A
A1
B1
B2
6
5
A2
2
8
1
=
u
+
u2
1
問 1. A が2つの戦略 A1 , A2 をとる確率を x1 , x2 = 0 (x1 + x2 = 1),
B が2つの戦略 B1 , B2 をとる確率を y1 , y2 = 0 (y1 + y2 = 1) とする. y = (vu1 , vu2 ) = (
なる.
x = (x , x ), y = (y , y ) とおくとき,A の期待利得は
上の問題を以下の手順で解答せよ.
1
2
1
(1) B の立場で求める:定理 5 により,純粋戦略 i に対して
{
i = (1, 0) の場合, E(i, y) =
5v
uj = yj /v とおくと,y1 + y2 = 1 であるから
y1
y2
y1 + y2
1
u1 + u2 =
+
=
=
v
v
v
v


 w = u1 + u2 → 最大化

v → 最小化


u1 +
u2 5 1
y1 +
y2 5 v
⇒ 
u1 +
u2 5 1


y1 +
y2 5 v

 u = 0 (i = 1, 2)
i
yi = 0 (i = 1, 2)
という線形計画法の問題になる.
スラック変数
を導入して


u1
u1
+u2 →
+
u2 +
最大化
u1
+
=1
=1
u2 +
シンプレックス表で解く
cj →
↓ 基底変数
定数項 θ
=v
j = (0, 1) の場合, E(x, j) =
uj = xj /v とおくと,x1 + x2 = 1 であるから
5v
i = (0, 1) の場合, E(i, y) =



と
(2) A の立場で求める:定理 5 により,純粋戦略 j に対して
{
j = (1, 0) の場合, E(x, j) =
=v
問 2. v をゲーム値とする.





) であり,ゲーム値 v は
,
2
E(x, y) =






.したがって,B の最適戦略は
v=
u1 + u2 =
x1
x2
x1 + x2
1
+
=
=
v
v
v
v



w = u1 + u2 → 最小化



v → 最大化





u1 +
u2 = 1

x1 +
x2 = v
⇒ 
u1 +
u2 = 1



x1 +
x2 = v



 u = 0 (i = 1, 2)

 x = 0 (i = 1, 2)
i
i
という線形計画法の問題になる.
双対定理を利用して解く
主問題

w1 +





 制約条件:

双対問題

w2 → 最大化 
u1 + u2 → 最小化





 制約条件:
w1 +
w2 5
u1 +
u2 = 1






w1 +
w2 5
u1 +
u2 = 1








u1 = 0, u2 = 0
w1 = 0, w2 = 0
⇑
⇓
w
+
w
→
最大化
u
+
1 ) (
2
1 ) ( u)
2 → 最小化
(
)
( )
(
( )
⇐
w1
u1
5
=
w2
u2
第
以上の手続きで,双対問題を主問題に直して解く.その解法は,実
1
は変数が ui から wi に代わるだけで,B の解法のシンプレックス表
段
と全く同じものになる.したがって,(w1 , w2 ) = (
zj
cj − zj
最適解であり,目的関数の最大値は
第
双対問題の解(u1 , u2 ) を求める.
2
シンプレックス表第3段の zj の行の (z3 , z4 ) の値に等しいので
(
)
(u1 , u2 ) = (z3 , z4 ) =
,
段
zj
cj − zj
1
=
u1 + u2
最適戦略は x = (vu1 , vu2 ) = (
,
3
段
だから v =
u1 + u 2 =
第
zj
cj − zj
これより,(u1 , u2 ) = (
最大値は
.したがって,A の
) であり,ゲーム値 v は
となる.
,
) が最適解であり,目的関数の
である.u1 + u2 =
学部
先生 氏名
(答) A の最適戦略は x = (
y=(
だから
年
科目
担当者
)が
,
である.
月
,
日(
学科 ), で,ゲーム値は
)
年 , B の最適戦略は
,
である.
時限施行
組
番
採
点