ゲーム理論とは 2人以上のプレイヤーの意思決定 の分析をする理論 ゲーム理論の構成要素 (同時ゲームの場合) プレイヤー、戦略、利得 プレイヤー:ゲームをする意思決定者(太郎 vs 二郎、とか、A社 vs B社、 とか、国家 vs 国民) 戦略:プレイヤーが選択できる行動(グー or チョキ or パー、とか、 賛成 or 反対、とか、増税 or そのままor 減税 ) 利得:選択した行動が与える利益(勝ち+1 or 負け -1 or あいこ 0, とか、 利潤が +80億 or - 20 億、とか 懲役 5 年 or 懲役 1年) じゃんけんの例 太郎 二郎 グー チョキ パー グー 0 -1 +1 チョキ +1 0 -1 パー -1 +1 0 表内の数値は、太郎の立場での利得 二郎の利得は上の表の値に-1 をかけたもの: ゼロ和ゲーム じゃんけん min max Min グー チョキ パー グー 0 -1 +1 チョキ +1 0 -1 パー -1 +1 0 あきらかに +1 +1 Min of Max -1 -1 Max of Min = -1 +1 Max -1 太郎 二郎 Max Min of Max = + 1 Max of Min 混合戦略とMN均衡点 太郎 二郎 グー チョキ パー グー p1 p1q2 0 q 3 p1q3 p2 q3 q2 定理(ミニマックスの定理): max min E(p,q) p p2 - p2 q1 0 q1 チョキ q 太郎と二郎の それぞれの手に パー p 3 確率 (p1 , p2 , p3 )、 確率 ( q1 ,q2 ,q3 ) という確率を p3q1 あたえ、太郎が p3q2 得る特典の期待 値 を E(p,q) とする。 0 は当然ですが、実は = min max E(p,q) 今この値は 0。 q p この値を与える (p,q) をゲームの均衡点という。 Nashの考え方?(じゃんけん) 太郎 二郎 グー チョキ パー グー (0,0) (-1,+1) ( +1,-1) チョキ (+1,-1) (0,0) ( -1,+1) パー (-1,+1) (+1,-1) ( 0,0) (a,b): a は太郎の利得、b は二郎の利得 (0,0) となっている3点をナッシュの均衡点という。 しかし、これではナッシュの考え方の真価が分かりにくいとおもいます。実際、じゃんけんに必勝 法は無いので、どの手を出せばよいかという情報は得られない。 (どちらが多いか?)Nashの考え 入試を2月前 半にする いつもと一緒 (2月後半) 入試を3月に する 入試を2月前 半にする (150,100) (150,250) ( 100,250) いつもと一緒(2 月後半) (250,150) (90,60) ( 100,150) (250,100) (150,100) ( 60,40) N大学 P大学 入試を3月に する 一大学のみを受験する人が500人、2月前半に試験があれば受験したい人が250人、 2月後半に試験があれば受験したい人が 150人、3月に試験があれば受験したい人 が100人,同じ時期に行うと、N大学のほうがちょっと人気があるとする。自分の希望に あてはまる時期に受験者ないと、別の大学を受験してしまう。 (a,b): a は N大学はの利得(受験者数)、b はP大学の利得(受験者数) (どちらが多いか?)Nashの考え 入試を2月前 半にする いつもと一緒 (2月後半) 入試を3月に する 入試を2月前 半にする (150,100) (150,250) ( 100,250) いつもと一緒(2 月後半) (250,150) (90,60) ( 100,150) (250,100) (150,100) ( 60,40) N大学 P大学 入試を3月に する N大学の立場では、2月前半にするのが有利です(支配戦略)。 この時は、N大学は必ず最良の手をとると考える。その中で、 P大学にとっての最良の手は、いつもと同様の2月後半が最良。 (a,b): a は N大学はの利得(受験者数)、b はP大学の利得(受験者数) (どちらが多いか?)Nashの考え 入試を2月前 半にする いつもと一緒 (2月後半) 入試を3月に する 入試を2月前 半にする (150,100) (150,250) ( 100,250) いつもと一緒(2 月後半) (250,150) (90,60) ( 100,150) (250,100) (150,100) ( 60,40) N大学 P大学 入試を3月に する (250,150) がナッシュ均衡点と呼ばれる解です。 (a,b): a は N大学はの利得(受験者数)、b はP大学の利得(受験者数) 囚人のジレンマ 太郎 黙秘 自白 黙秘 -3、-3 0、-4 自白 -4、0 -1、-1 二郎 囚人のジレンマ 太郎 黙秘 自白 黙秘 -3、-3 0、-4 自白 -4、0 -1、-1 二郎
© Copyright 2024 ExpyDoc