Document

6.大人数クラスの運営法
ゲーム理論
• 出席の取り方
→出席表を2回まわす
1回目10:50~
2回目11:20~
所要時間:40分
• まわし方(4通り)
T1(前,前),T2(前,後)
T3(後,前),T4(後,後)
滞在時間
T1
T2
T3
T4
35
75
45
75
b 35
55
35
55
b 35 55 35 55
c
50
50
50
50
c 50 50 50 50
d 55
35
55
35
d 55 35 55 35
e
45
75
35
a
75
T1 T2 T3
T1(前,前) T2(前,後) T3(後,前) T4(後,後)
T4
前提
• 取り得る手の集合
S1=bに座る
S2=cに座る
S3=dに座る
T1=(前,前)
T2=(前,後)
T3=(後,前)
T4=(後,後)
• 学生がSj、教授がTkを
選んだときの
学生の利得(教授の損失)ajkを
学生が教室に座っていないで
済む時間(分)
とする
S1
S2
S3
T1
55
40
35
T2
35
40
55
T3
55
40
35
T4
35
40
55
ゼロ和2人ゲーム
教授から学生への支払い行列は
55
A  40
35
35
55
40
55
40
35
35 
40 
55 
55
A'=
40


35
S2 , T1   S1, T1   S1, T2 
 
S3 , T1   S3 , T2 
35 
40 

55 

混合戦略
学生のミニマクス戦略
• 学生がS1,S2,S3を選ぶ確率
→それぞれχ1,χ2,χ3とする
• 教授が
T1を選んだ時の平均的利益→z1
T2を選んだ時の平均的利益→z2
とする
• 学生はz1とz2の最悪のケースを想定して
小さい方を最大にするχ1,χ2,χ3を選ぶ
定式化
目的関数:z=min{z1,z2}
制約条件:
χ1+χ2+χ3=1
z1=55χ1+40χ2+35χ3
z2=35χ1+40χ2+55χ3
χ1≧ 0,χ2≧ 0,χ3≧0
→最大化
・・・①
・・・②
・・・③
変形後
目的関数:35+20χ1+5χ2 →最大化
制約条件:
2χ1+χ2=1
χ1+χ2≦1
χ1≧0,χ2≧0
⇒χ1*=
1
*=0,χ *=
,χ
2
3
2
1
,z2*=45
混合戦略
教授のマクシミン戦略
• 教授がT1,T2を選ぶ確率
→それぞれy1,y2とする
• 学生がS1,S2,S3を選んだ時の平均損失
→それぞれw1,w2,w3とする
• 教授はw1,w2,w3の中で最大のものを
最小とするy1,y2を選ぶ
定式化
目的関数:w=max{w1,w2,w3} →最小化
制約条件:
y1+y2=1
・・・①
w1=55y1+35y2 ・・・②
w2=40y1+40y2 ・・・③
w3=35y1+55y2 ・・・④
y1≧0,y2≧0
変形後
w1=20y1+35
w2=40
w3=-20y1+55
最大値を0≦y1≦1のもとで
最小化
1
1
⇒y1* = 2 ,y2* = 2 ,w* =45
均衡点
学生の平均利益
(y1 ,y2 )=(1/2,1/2)
1
1
1
55χ1+40χ2+35χ3 + 35χ1+40χ2+55χ3 = 90χ1+80χ2+90χ3 
2
2
2
→45よりも増加できない
教授の平均損失(χ1 ,χ2,χ3 ) =(1/2,0,1/2)
1
55 y1+35 y2 + 1 35 y1+55 y2 =45 y1+y2 
2
2
→45よりも減少できない
均衡点
学生,教授のどちらも自分の戦略は変えない
学生のミニマクス戦略(χ1*, χ2*,χ3*)
教授のマクシミン戦略(y1*,y2*,y3*)
を、出席ゲームの“均衡解”という
一般化(ミニマクス戦略)
z1=a11χ1++am1χm

zn=a1nχ1++amnχm
z=min{z1,・・・,zn}を最大化する
確率ベクトル(χ1,・・・,χm)を選択
としたとき
線形計画問題に定式化
目的関数: z →最大化
制約条件:
z≦a11χ1+・・・+am1χm

z≦a1nχ1+・・・+amnχm
χ1+・・・+χm=1
χ1≧0,・・・,χm≧0
一般化(マクシミン戦略)
w1=a11 y1++a1n yn

wm=am1 y1++amn yn
としたとき
w=max{w1,・・・,wm}を最小化する
確率ベクトル(y1,・・・,yn)を選択
線形計画問題に定式化
目的関数: w →最小化
制約条件:
w≧ a11y1+・・・+a1nyn

w≧ am1y1+・・・+amnyn
y1+・・・+yn=1
y1≧ 0,・・・,yn≧ 0
ミニマクス定理
線形計画問題に変形した2つの問題の
最適解をそれぞれ
(χ1*,・・・,χm*,z*),(y1*,・・・,yn*,w*) とする
⇒w* =z* が成立
(χ1* ,・・・,χm* ),(y1* ,・・・,yn* )が
それぞれの“均衡戦略”となる