6.大人数クラスの運営法 ゲーム理論 • 出席の取り方 →出席表を2回まわす 1回目10:50~ 2回目11:20~ 所要時間:40分 • まわし方(4通り) T1(前,前),T2(前,後) T3(後,前),T4(後,後) 滞在時間 T1 T2 T3 T4 35 75 45 75 b 35 55 35 55 b 35 55 35 55 c 50 50 50 50 c 50 50 50 50 d 55 35 55 35 d 55 35 55 35 e 45 75 35 a 75 T1 T2 T3 T1(前,前) T2(前,後) T3(後,前) T4(後,後) T4 前提 • 取り得る手の集合 S1=bに座る S2=cに座る S3=dに座る T1=(前,前) T2=(前,後) T3=(後,前) T4=(後,後) • 学生がSj、教授がTkを 選んだときの 学生の利得(教授の損失)ajkを 学生が教室に座っていないで 済む時間(分) とする S1 S2 S3 T1 55 40 35 T2 35 40 55 T3 55 40 35 T4 35 40 55 ゼロ和2人ゲーム 教授から学生への支払い行列は 55 A 40 35 35 55 40 55 40 35 35 40 55 55 A'= 40 35 S2 , T1 S1, T1 S1, T2 S3 , T1 S3 , T2 35 40 55 混合戦略 学生のミニマクス戦略 • 学生がS1,S2,S3を選ぶ確率 →それぞれχ1,χ2,χ3とする • 教授が T1を選んだ時の平均的利益→z1 T2を選んだ時の平均的利益→z2 とする • 学生はz1とz2の最悪のケースを想定して 小さい方を最大にするχ1,χ2,χ3を選ぶ 定式化 目的関数:z=min{z1,z2} 制約条件: χ1+χ2+χ3=1 z1=55χ1+40χ2+35χ3 z2=35χ1+40χ2+55χ3 χ1≧ 0,χ2≧ 0,χ3≧0 →最大化 ・・・① ・・・② ・・・③ 変形後 目的関数:35+20χ1+5χ2 →最大化 制約条件: 2χ1+χ2=1 χ1+χ2≦1 χ1≧0,χ2≧0 ⇒χ1*= 1 *=0,χ *= ,χ 2 3 2 1 ,z2*=45 混合戦略 教授のマクシミン戦略 • 教授がT1,T2を選ぶ確率 →それぞれy1,y2とする • 学生がS1,S2,S3を選んだ時の平均損失 →それぞれw1,w2,w3とする • 教授はw1,w2,w3の中で最大のものを 最小とするy1,y2を選ぶ 定式化 目的関数:w=max{w1,w2,w3} →最小化 制約条件: y1+y2=1 ・・・① w1=55y1+35y2 ・・・② w2=40y1+40y2 ・・・③ w3=35y1+55y2 ・・・④ y1≧0,y2≧0 変形後 w1=20y1+35 w2=40 w3=-20y1+55 最大値を0≦y1≦1のもとで 最小化 1 1 ⇒y1* = 2 ,y2* = 2 ,w* =45 均衡点 学生の平均利益 (y1 ,y2 )=(1/2,1/2) 1 1 1 55χ1+40χ2+35χ3 + 35χ1+40χ2+55χ3 = 90χ1+80χ2+90χ3 2 2 2 →45よりも増加できない 教授の平均損失(χ1 ,χ2,χ3 ) =(1/2,0,1/2) 1 55 y1+35 y2 + 1 35 y1+55 y2 =45 y1+y2 2 2 →45よりも減少できない 均衡点 学生,教授のどちらも自分の戦略は変えない 学生のミニマクス戦略(χ1*, χ2*,χ3*) 教授のマクシミン戦略(y1*,y2*,y3*) を、出席ゲームの“均衡解”という 一般化(ミニマクス戦略) z1=a11χ1++am1χm zn=a1nχ1++amnχm z=min{z1,・・・,zn}を最大化する 確率ベクトル(χ1,・・・,χm)を選択 としたとき 線形計画問題に定式化 目的関数: z →最大化 制約条件: z≦a11χ1+・・・+am1χm z≦a1nχ1+・・・+amnχm χ1+・・・+χm=1 χ1≧0,・・・,χm≧0 一般化(マクシミン戦略) w1=a11 y1++a1n yn wm=am1 y1++amn yn としたとき w=max{w1,・・・,wm}を最小化する 確率ベクトル(y1,・・・,yn)を選択 線形計画問題に定式化 目的関数: w →最小化 制約条件: w≧ a11y1+・・・+a1nyn w≧ am1y1+・・・+amnyn y1+・・・+yn=1 y1≧ 0,・・・,yn≧ 0 ミニマクス定理 線形計画問題に変形した2つの問題の 最適解をそれぞれ (χ1*,・・・,χm*,z*),(y1*,・・・,yn*,w*) とする ⇒w* =z* が成立 (χ1* ,・・・,χm* ),(y1* ,・・・,yn* )が それぞれの“均衡戦略”となる
© Copyright 2024 ExpyDoc