数学 I 前期 演習問題 10 1. p を 0 ≦ p ≦ 1 を満たす数とする.a, b を数とするとき,下の図の点 X(x, y) の 座標 (x, y) を求めよ. 6 b X a - 1−p 1 点 (0, a), (1, b) を通る直線であるから, 傾きは b − a となり,直線の方 程式は y = (b − a)x + a 0 となり,X の x 座標は 1 − p であるから y 座標は y = (b − a)(1 − p) + a = pa + (1 − p)b となり, X = (1 − p, pa + (1 − p)b) 2. 次の行列ゲームを解け. ( ) a b 行列ゲーム の混合戦略 p = (p1 , P2 ), q = (q1 , q2 ) の期待値は c d E(p, q) = ap1 q1 + bp1 q2 + cp2 q1 + dp2 q2 min max, max min 定理によると, max min E(p, q) = min max E(p, q) p q q この値をゲームの値という。 min E(p, q) = min{ap1 + cp2 , bp1 + dp2 } q max E(p, q) = max{aq1 + bq2 , cq1 + dq2 } p よりゲームの最適戦略、ゲームの値を求める。 p ( ) 4 2 1 5 (1) 6 4 Z 2p1 + 5p2 5 2 ZZ Z1 - 4p1 + p2 6 4H H 1 5 q1 + 5q2 HH 2 4q1 + 2q2 - 2 1 4p1 + p2 = 2p1 + 5p2 と p1 + p2 = 1 より p1 = , p2 = 3 { 3 2p1 + 5p2 0 ≦ p2 ≦ 31 min E(p, q) = min{4p1 + p2 , 2p1 + 5p2 } = 1 q 4p1 + p2 < p2 3 ) ( 2 1 これより max min E(p, q) は (p1 , p2 ) = , のときで、ゲームの値 p q 3 3 は 4p1 + p2 = 3 1 1 同様に 4q1 + 2q2 = q1 + 5q2 と q1 + q2 = 1 より q1 = , q2 = 2 2 { 4q1 + 2q2 0 ≦ q2 ≦ 21 1 p q1 + 5q2 < q2 2 ( ) 1 1 これより min max E(p, q) は (q1 , q2 ) = , のときで、ゲームの値 q p 2 2 は 4q1 + 2q2 = 3 max E(p, q) = min{4q1 + 2q2 , q1 + 5q2 } = ( (2) 3 ) 3 0 −2 1 6 \ \ 1 p2 0 \ \ \ −2 3p1 − 2p2 3 6 Z Z −2 Z 1 Z 0 - −2q1 + q2 3q1 1 1 3p1 − 2p2 = p2 と p1 + p2 = 1 より p1 = , p2 = 2 { 2 3p1 − 2p2 0 ≦ p2 ≦ 12 min E(p, q) = min{3p1 − 2p2 , p2 } = 1 q < p2 p2 2 ( ) 1 1 これより max min E(p, q) は (p1 , p2 ) = , のときで、ゲームの値 p q 2 2 1 は p2 = 2 1 5 同様に 3q1 = −2q1 + q2 と q1 + q2 = 1 より q1 = , q2 = 6 6 { 3q1 0 ≦ q2 ≦ 56 max E(p, q) = min{3q1 , −2q1 + q2 } = 5 p −2q1 + q2 < q2 6 ) ( 1 5 , のときで、ゲームの値 これより min max E(p, q) は (q1 , q2 ) = q p 6 6 1 は 3q1 = 2 ( ) 2 1 (3) 3 −2 6 3 2 1 Z Z 2p1 + 3p2 - Z Z −2 p1 − 2p2 6 3 2\ XXX \ X1 \ \ \ −2 2q1 + q2 3q1 − 2q2 図より min E(p, q) = min{2p1 + 3p2 , p1 − 2p2 } = p1 − 2p2 q これより max min E(p, q) は (p1 , p2 ) = (1, 0) のときで、ゲームの値は p p1 − 2p2 = 1 q 3 1 同様に 2q1 + q2 = 3q1 − 2q2 と q1 + q2 = 1 より q1 = , q2 = 4 4 { 3q1 − 2q2 0 ≦ q2 ≦ max E(p, q) = min{2q1 + q2 , 3q1 − 2q2 } = 1 p 2q1 + q2 < q2 4 1 4 図よりこのグラフは単調減少であるから、min max E(p, q) は (q1 , q2 ) = q (0, 1) のときで、ゲームの値は 2q1 + q2 = 1 p
© Copyright 2025 ExpyDoc