演習問題 10 +答え

数学 I 前期 演習問題 10
1. p を 0 ≦ p ≦ 1 を満たす数とする.a, b を数とするとき,下の図の点 X(x, y) の
座標 (x, y) を求めよ.
6
b
X
a
-
1−p
1
点 (0, a), (1, b) を通る直線であるから, 傾きは b − a となり,直線の方
程式は
y = (b − a)x + a
0
となり,X の x 座標は 1 − p であるから y 座標は
y = (b − a)(1 − p) + a = pa + (1 − p)b となり,
X = (1 − p, pa + (1 − p)b)
2. 次の行列ゲームを解け.
(
)
a b
行列ゲーム
の混合戦略 p = (p1 , P2 ), q = (q1 , q2 ) の期待値は
c d
E(p, q) = ap1 q1 + bp1 q2 + cp2 q1 + dp2 q2
min max, max min 定理によると,
max min E(p, q) = min max E(p, q)
p
q
q
この値をゲームの値という。
min E(p, q) = min{ap1 + cp2 , bp1 + dp2 }
q
max E(p, q) = max{aq1 + bq2 , cq1 + dq2 }
p
よりゲームの最適戦略、ゲームの値を求める。
p
(
)
4 2
1 5
(1)
6
4
Z
2p1 + 5p2
5
2 ZZ
Z1
-
4p1 + p2
6
4H
H
1
5
q1 + 5q2
HH 2
4q1 + 2q2
-
2
1
4p1 + p2 = 2p1 + 5p2 と p1 + p2 = 1 より p1 = , p2 =
3
{ 3
2p1 + 5p2 0 ≦ p2 ≦ 31
min E(p, q) = min{4p1 + p2 , 2p1 + 5p2 } =
1
q
4p1 + p2
< p2
3
)
(
2 1
これより max min E(p, q) は (p1 , p2 ) =
,
のときで、ゲームの値
p
q
3 3
は 4p1 + p2 = 3
1
1
同様に 4q1 + 2q2 = q1 + 5q2 と q1 + q2 = 1 より q1 = , q2 =
2
2
{
4q1 + 2q2 0 ≦ q2 ≦ 21
1
p
q1 + 5q2
< q2
2
(
)
1 1
これより min max E(p, q) は (q1 , q2 ) =
,
のときで、ゲームの値
q
p
2 2
は 4q1 + 2q2 = 3
max E(p, q) = min{4q1 + 2q2 , q1 + 5q2 } =
(
(2)
3
)
3 0
−2 1
6
\
\ 1
p2
0 \
\
\ −2
3p1 − 2p2
3
6
Z
Z
−2 Z 1
Z 0 -
−2q1 + q2
3q1
1
1
3p1 − 2p2 = p2 と p1 + p2 = 1 より p1 = , p2 =
2
{ 2
3p1 − 2p2 0 ≦ p2 ≦ 12
min E(p, q) = min{3p1 − 2p2 , p2 } =
1
q
< p2
p2
2
(
)
1 1
これより max min E(p, q) は (p1 , p2 ) =
,
のときで、ゲームの値
p
q
2 2
1
は p2 =
2
1
5
同様に 3q1 = −2q1 + q2 と q1 + q2 = 1 より q1 = , q2 =
6
6
{
3q1
0 ≦ q2 ≦ 56
max E(p, q) = min{3q1 , −2q1 + q2 } =
5
p
−2q1 + q2
< q2
6
)
(
1 5
,
のときで、ゲームの値
これより min max E(p, q) は (q1 , q2 ) =
q
p
6 6
1
は 3q1 =
2
(
)
2 1
(3)
3 −2
6
3
2 1
Z
Z
2p1 + 3p2
-
Z
Z −2 p1 − 2p2
6
3
2\
XXX
\ X1
\
\
\ −2
2q1 + q2
3q1 − 2q2
図より min E(p, q) = min{2p1 + 3p2 , p1 − 2p2 } = p1 − 2p2
q
これより max min E(p, q) は (p1 , p2 ) = (1, 0) のときで、ゲームの値は
p
p1 − 2p2 = 1
q
3
1
同様に 2q1 + q2 = 3q1 − 2q2 と q1 + q2 = 1 より q1 = , q2 =
4
4
{
3q1 − 2q2 0 ≦ q2 ≦
max E(p, q) = min{2q1 + q2 , 3q1 − 2q2 } =
1
p
2q1 + q2
< q2
4
1
4
図よりこのグラフは単調減少であるから、min max E(p, q) は (q1 , q2 ) =
q
(0, 1) のときで、ゲームの値は 2q1 + q2 = 1
p