42020 – KE3 – 4.3.1 Investitionsanreize - Gefangenendilemma Beispiel: Investitionsanreiz (Gefangenendilemma: Opportunistisches Verhalten lohnt sich nicht, die beste Lösung für beide Seiten ist wenn beide Seiten sich bewegen) Ausgangspunkt: 1. Zulieferer und Abnehmer sind über einen langfristigen Vertrag miteinander verbunden. 2. Zulieferer steht vor der Entscheidung eine spezifische Investition in Qualitätssicherung durchzuführen, wobei sich deren Auswirkung erst nach einiger Zeit bemerkbar machen. 3. Abnehmer sichert Investitionsbeihilfe zu 4. Verhalten der beiden Spieler kann erst nach einer gewissen Zeit vom jeweils anderen beobachtet werden Fall A: Vertrag ohne Anreizsystem Fall B: Vertrag mit Anreizsystem Nichteinhaltung der Investitionsbeihilfe durch Abnehmer: 6 Einheiten Strafe Nichteinhaltung der Investition durch Zulieferer: 6 Einheiten Strafe Beobachter zur Überwachung der Einhaltung der Investition: 1 Einheit Kosten für Abnehmer Fall A Der linke Tabelleneintrag (x, ·) ist der Gewinn des Zeilenspielers „Zulieferer = Z“, der rechte Tabelleneintrag (·, x) der des Spaltenspielers „Abnehmer = A“. Für Z ist es besser ”nicht investieren“, falls A”nicht investiert“ und ”nicht investieren“, falls A ”investiert“. Die Entscheidung von Z hängt folglich davon ab, was er bezüglich der Entscheidung A erwartet. Für A gilt umgekehrt dasselbe! Für A ist es besser ”nicht investieren“, falls Z ”nicht investiert“ und ”nicht investieren“, falls Z ”investiert“. Weder eine Situation, in der beide investieren, noch die Situation, in der beide nicht investieren, ist ”stabil“. Bimatrix: Zulieferer =Z Rolf Baumanns + - Abnehmer = A + 2 , 12 7,7 10 , 0 5,5 SS12 Seite 1 42020 – KE3 – 4.3.1 Investitionsanreize - Gefangenendilemma Analyse: Ohne eine vertragliche Garantie (Fall A) wird weder der Abnehmer (A) eine Investitionshilfe leisten noch der Zulieferer (Z) die Investition tätigen, so dass ohne Kooperation zwischen den Partnern die dominante Lösung (5/5) gewählt wird. Würden sich die Partner absprechen und sich auch an ihre Absprache halten, so wäre für beide das bessere Kooperationsergebnis (7/7) erreichbar. Aber wer garantiert, dass sich die jeweils andere Partei an die Abmachung hält? Opportunismus im Sinne einer Nichteinhaltung der Absprache wäre für beide Parteien die interessanteste Lösung, da dies – auf Kosten des Partners – den meisten Profit einbringen würde. Fall B Fall B zeigt das Rückzahlungsergebnis, welches auf ein Anreizsystem basiert. Deutlich wird, dass sich Opportunismus nun weder für den Zulieferer noch für den Abnehmer lohnt. Aus Eigeninteresse wird also nun die beste Lösung gewählt. Würden sich die Partner vertrauen, so könnte auch die 1 Einheit für die Kontrollinstanz gespart werden. Zulieferer + - Abnehmer + 7,6 8,5 4,5 5,4 Analyse: Der Abnehmer verpflichtet sich, eine Investitionsbeihilfe zu leisten. Es wird festgelegt, dass er im Falle einer Nichteinhaltung mit einer Konventionalstrafe von 6 Einheiten belegt wird. Beim Zulieferer wird für die Kosten von 1 Einheit ein Beobachter installiert, welcher die Einhaltung der Investition durch den Zulieferer überwacht. Bei Nichteinhaltung wird im Gegenzug der Zulieferer mit einer Konventionalstrafe von 6 Einheiten belegt. Die möglichen Ergebnisse zeigen, dass sich Opportunismus nun weder für den Zulieferer noch für den Abnehmer lohnt. Aus Eigeninteresse wird nun also die beste Lösung gewählt. Fall C Zulieferer + - Abnehmer + p (1-p) 7,4 8,5 6,6 w,v q (1-q) Analyse: Kein Nash-Gleichgewicht in reinen Strategien erkennbar Analyse der Parameter v und w Wenn v<6 und w>8 kein Nash-Gleichgewicht in reinen Strategien Vgl. zu Nash-Lösungen in reinen/gemischten Strategien – Holler/Illing: Einführung in die Spieltheorie. Springer. – Riechmann: Spieltheorie. Vahlen. Bilden einer Wahrscheinlichkeitsverteilung und Analyse des ZuliefererAbnehmer-Beziehung über gemischte Strategien Rolf Baumanns SS12 Seite 2 42020 – KE3 – 4.3.1 Investitionsanreize - Gefangenendilemma Bestimmen des Nash-Gleichgewichts in gemischten Strategien: Zulieferer: z 7 p q 6 p 1 q 8 1 p q w 1 p 1 q z 7 p 6 p 8 (1 p ) w (1 p) 7 p 6 p 8 8 p w w p 0 q z 7 p 8 w w p w p 7 p 8 w p (7 w) 8 w p (7 w) 8 w 0 q Auflösen nach p: p 8 w 7w Folgerung: p 0 w Abnehmer: Analoges Vorgehen für die Wahrscheinlichkeit q: A 4 q p 6 1 q p 5 q 1 p v 1 q 1 p A 4 q 6 (1 q) 5 q v (1 q ) 4 q 6 6 q 5 q v v q 0 p A 7 q 6 v v q v q 7 q 6 v q (v 7) v 6 0 p Auflösen nach q: q v6 v7 Folgerung: q 0 v Aussagen: Die Wahrscheinlichkeit p, dass der Abnehmer hilft, steigt, wenn in (HN= Hilft Nicht, IN=Investiert Nicht) die Auszahlung w für den Zulieferer steigt. Die Wahrscheinlichkeit q, dass der Zulieferer investiert, sinkt, wenn in (HN= Hilft Nicht, IN=Investiert Nicht) die Auszahlung v für den Abnehmer steigt. Rolf Baumanns SS12 Seite 3 42020 – KE3 – 4.3.1 Investitionsanreize - Gefangenendilemma Gefangenendilemma Ein Beispiel ist das Gefangenendilemma, ein spieltheoretisches Problem, bei dem genau ein Nash-Gleichgewicht existiert. Hierzu stelle man sich folgende Situation vor: Zwei Gefangene werden verdächtigt, gemeinsam eine Straftat begangen zu haben. Die Höchststrafe für das Verbrechen beträgt fünf Jahre Haft. Beiden Gefangenen wird nun ein Handel angeboten, worüber auch beide informiert sind. Wenn einer allein gesteht und somit seinen Partner mitbelastet, kommt er ohne Strafe davon – der andere muss die vollen fünf Jahre absitzen. Entscheiden sich beide zu schweigen, bleiben nur Indizienbeweise, die aber ausreichen, um beide für zwei Jahre einzusperren. Gestehen aber beide die Tat, erwartet jeden eine Gefängnisstrafe von vier Jahren. Nun werden die Gefangenen unabhängig voneinander befragt. Weder vor noch während der Befragung haben die beiden die Möglichkeit, sich untereinander abzusprechen. Zwar ist es optimal für die beiden Gefangenen, wenn sie beide schweigen. Diese Strategie-Kombination ist aber nicht stabil, weil sich ein einzelner Gefangener durch ein Geständnis einen Vorteil für sich verschaffen kann. Stabil im Sinne eines NashGleichgewichtes ist die Strategie-Kombination, bei der beide Gefangene gestehen: Dann kann sich kein einzelner durch ein Schweigen einen Vorteil verschaffen, so dass ein Nash-Gleichgewicht vorliegt. Dieses Nash-Gleichgewicht liefert aber für beide Gefangene schlechtere Ergebnisse als das beidseitige Schweigen, das nur durch Kooperation fixierbar ist. Die übliche Darstellung solcher Spiele erfolgt mit einer Bimatrix. Gefang.1 gestehen schweigen Gefang. 2 gestehen schweigen -4 , -4 0 , -5 -5 , 0 -2 , -2 Die Strategie Gestehen ist für beide Gefangene die jeweils beste Antwort auf beide möglichen Strategien des Gegners. Als beste Antworten werden jene Strategien bezeichnet, welche die höchste Auszahlung auf die jeweilige Strategie des Gegners einbringen. In der Bimatrix sind sie fett gedruckt. Damit ist auch optisch zu erfassen, dass mit der Strategienkombination (Gestehen, Gestehen) beste Antworten aufeinander treffen. Dieses Aufeinandertreffen von besten Antworten wird als ausgeglichener Zustand angesehen. Denn keiner der beiden Spieler kann durch einseitiges Abweichen von seiner Strategie seine Auszahlung erhöhen. Er würde sie sogar verringern, d. h. weniger Lebensjahre in Freiheit verbringen. In diesem Sinn ist die Strategienkombination (Gestehen,Gestehen) als Lösung des Spiels zu betrachten. Dieses Lösungskonzept, basierend auf dem Ermitteln des Aufeinandertreffens von besten Antworten und damit dem Finden des so genannten Nash-Gleichgewichts. Rolf Baumanns SS12 Seite 4 42020 – KE3 – 4.3.1 Investitionsanreize - Gefangenendilemma Ein einfacher Algorithmus zur Identifizierung von Nash-Gleichgewichten Eine Strategie-Kombination heißt Nash-Gleichgewicht, wenn ihr eine gewisse Stabilität unterstellt werden kann aufgrund der Tatsache, dass kein einzelner Spieler einen Anreiz besitzt, von seiner Strategie abzuweichen. = bei gegebener Strategie aller anderen Spieler lohnt es sich für keinen Spieler, die eigene Strategie zu wechseln („Einseitiges Abweichen lohnt sich nicht“) Reine Strategie Eine Strategie ist ein vollständiger Verhaltensplan eines Spielers. Eine Strategie im spieltheoretischen Sinn muss mehr angeben als eine Strategie im Alltagssinn, nämlich eine exakte Handlungsvorschrift ("Zug") für jede Situation, in die der Spieler kommen kann. Oftmals wird allerdings ein derartiger Verhaltensplan in der spieltheoretischen Darstellung einfach auf den Namen der Strategie reduziert. Es sieht dann so aus, als könne der betreffende Spieler einfach nur zwischen wenigen, einfachen Alternativen wählen, also zum Beispiel zwischen den Strategien A und B. Man sieht dann nicht mehr, dass sich hinter den harmlosen Namen eigentlich komplexe Verhaltenspläne verbergen, sondern es sieht so aus, als hätte das gesamte Spiel nur einen einzigen Zug. Es ist wichtig, die Strategie nicht mit einer Partie zu verwechseln. Wenn man deutlich machen möchte, dass ein Spieler eine Strategie direkt (ohne zwischengeschalteten Zufallsmechanismus) wählt, dann spricht von einer reinen Strategie (im Gegensatz zu einer gemischten Strategie). Nash-Gleichgewicht bei reinen Strategien Es bezeichne die Menge der Strategien (Handlungsalternativen) des i-ten Spielers und das kartesische Produkt dieser Strategienmengen. Unter einem Nash-Gleichgewicht in reinen Strategien versteht man ein Strategieprofil bei dem die Strategie jedes Spielers eine beste Antwort auf die gewählten Strategien der anderen Spieler ist. Wenn alle anderen Spieler an ihren gewählten Strategien festhalten, so ist das Nash-Gleichgewicht bei reinen Strategien formal dadurch gekennzeichnet, dass es für Spieler also kein gibt, das dem Spieler eine höhere Auszahlung verspricht. Man sagt auch, dass Spieler seine Auszahlung durch ein einseitiges Abweichen nicht verbessern kann. Ein Nash-Gleichgewicht zeichnet sich damit dadurch aus, dass sich kein Spieler durch eine einseitige Änderung seiner Strategie verbessern kann. Reine Strategien Liegt ein Spiel in strategischer Form vor, so lassen sich alle Nash-Gleichgewichte in reinen Strategien durch folgenden Algorithmus bestimmen: 1. Optimiere die Entscheidung von Spieler i=1,...,n bei (beliebig) fixierten Strategien aller anderen Spieler: Markiere die unter diesen Umständen erreichbaren höchsten Auszahlungen für Spieler i. Wiederhole dies für alle möglichen Strategiekombinationen der anderen Spieler. 2. Führe 1. für alle Spieler durch. Dann sind genau die Strategienkombinationen Nash-Gleichgewichte, bei denen alle Auszahlungen markiert sind. Diese Vorgehensweise eignet sich nur für eine geringe Anzahl von Spielern und Strategien. Rolf Baumanns SS12 Seite 5 42020 – KE3 – 4.3.1 Investitionsanreize - Gefangenendilemma Beispiel Sei folgendes Spiel in Normalform gegeben: links Spieler oben 4 , 2 1 mitte 2,3 rechts 3 , 0 Spieler 2 mitte 1,1 1,1 0,2 rechts 2,0 1,4 1,3 Dann funktioniert der Algorithmus wie folgt: • i = 1: • gegeben Spieler 2 spielt Rechts: Für Spieler 1 ist oben optimal – markiere die 2 („Oben ist beste Antwort auf Rechts“) • gegeben Spieler 2 spielt Mitte: oben und mitte ist optimal – markiere die beiden 1en • gegeben Spieler 2 spielt Links: oben ist optimal – markiere die 4 • i = 2: • gegeben Spieler 1 spielt oben: Für Spieler 2 ist Links optimal – markiere die 2 • gegeben Spieler 1 spielt mitte: Rechts ist optimal – markiere die 4 • gegeben Spieler 1 spielt unten: Rechts ist optimal – markiere die 3 Das einzige Nash-Gleichgewicht ist also die Strategie, die zur Auszahlung 4, 2 führt: (oben,links). Falls zu überprüfen ist, ob ein Tupel von gemischten Strategien ein NashGleichgewicht ist, funktioniert obiger Algorithmus nur bedingt, da eine unendliche Anzahl an gemischten Strategien überprüft werden müsste. Ein Nash-Gleichgewicht zeichnet sich damit dadurch aus, dass sich kein Spieler durch eine einseitige Änderung seiner Strategie verbessern kann. Gemischte Strategie Die gemischte Strategie ist ein Arte Lautstärkeregler in der Spieltheorie. Wählt ein Spieler eine gemischte Strategie, dann wählt er keine seiner reinen Strategien direkt aus, sondern er wählt statt dessen einen Zufallsmechanismus aus, der anschließend eine reine Strategie wählt. Formal ist eine gemischte Strategie also eine Wahrscheinlichkeitsverteilung über die reinen Strategien eines Spielers, bei der mindestens zwei Strategien mit positiver Wahrscheinlichkeit ausgewählt werden. Wenn ein Spieler über alle seine reinen Strategien mischt (er also jede mit positiver Wahrscheinlichkeit wählt), dann nennt man dies eine vollständig gemischte Strategie. Ausführlicher: Dann vielleicht ein etwas anschaulicheres Beispiel: Ein Spieler hat die beiden Strategien A und B zur Auswahl. Entscheidet er sich nun dafür, A zu wählen, dann wählt er eine reine Strategie (eben die reine Strategie A). Wenn er statt dessen ankündigt, dass er zunächst würfelt und nur dann die reine Strategie A wählt, wenn er eine sechs gewürfelt hat, dann spielt er eine gemischte Strategie. Denn statt einer reinen Strategie hat er nun einen Zufallsmechanismus gewählt, der an seiner Stelle die reine Strategie auswählt. Die gemischte Strategie besteht jetzt darin, dass er A mit einer Wahrscheinlichkeit von 1/6 wählt und B mit einer Wahrscheinlichkeit von 5/6 (also der Gegenwahrscheinlichkeit zu 1/6, weil bei allen anderen Würfen von eins bis fünf die Strategie B gewählt wird). Rolf Baumanns SS12 Seite 6 42020 – KE3 – 4.3.1 Investitionsanreize - Gefangenendilemma In der klassischen Entscheidungstheorie spielt man nicht gegen einen vernunftbegabte Gegenspieler, sondern gegen die Natur, deren Verhalten durch eine Wahrscheinlichkeitsverteilung dargestellt wird. Wenn ein vernunftbegabte Gegenspieler nun aber eine gemischte Strategie spielt, dann wählt er ja auch eine Wahrscheinlichkeitsverteilung, gegen die wir anschließend spielen. Man merkt den Unterschied zwischen den beiden Situationen sofort, wenn man sich klarmacht, wo die Wahrscheinlichkeitsverteilungen herkommen: In der klassischen Entscheidungstheorie wird die Verteilung von einem externen Mechanismus ausgewählt, der keinerlei eigene Interessen verfolgt. Klassischerweise ist das das Wetter, woher auch wohl der Begriff "Spiel gegen die Natur" kommt. Eine gemischte Strategie wird aber von einem vernunftbegabten Gegenspieler gewählt. Und dieser wird die Wahrscheinlichkeitsverteilung so wählen, dass es aus seiner Sicht optimal ist. Während in der klassischen Entscheidungstheorie die Wahrscheinlichkeitsverteilung über die Umweltzustände exogen vorgegeben und unveränderlich ist, wird eine gemischte Strategie aufgrund der Überlegungen und Präferenzen eines vernunftbegabten Gegenspielers ausgewählt, der eigene Interessen verfolgt. Und das ist ein gewaltiger Unterschied. Eine gemischte Strategie braucht man nicht auszurechnen, sondern man gibt sie an, indem man die Wahrscheinlichkeitsverteilung über die reinen Strategien benennt (natürlich so, dass die Wahrscheinlichkeiten sich zu eins ergänzen). Nash-Gleichgewicht bei gemischten Strategien In manchen Fällen lässt man zu, dass die Spieler sich nicht auf eine bestimmte Strategie festlegen, sondern auf eine Wahrscheinlichkeitsverteilung, mit der die i aus i zufällig gezogen werden. Ist i endlich oder zumindest abzählbar, so kann die Wahrscheinlichkeitsverteilung durch einen Vektor si beschrieben werden, wobei die Wahrscheinlichkeit ist, dass die Strategie i , j i gewählt wird. Die gemischte Strategie ist genau dann ein Nash-Gleichgewicht, wenn kein Spieler durch alleiniges Abweichen eine bessere Auszahlung erreichen kann. Existenz eines Nash-Gleichgewichtes Mit Hilfe des Fixpunktsatzes von Kakutani kann man zeigen, dass mindestens ein Nash-Gleichgewicht existieren muss, wenn folgende Voraussetzungen erfüllt sind: 1. Die Auszahlungsfunktionen H i ( 1 ,..., n ) sind stetig und quasikonkav in i . 2. Die Strategiemengen 1 ,..., n sind konvex und kompakt. Häufig werden Spiele so konstruiert, dass die i endlich sind, endliche Mengen können jedoch nicht konvex sein. Allerdings ist die Menge der gemischten Strategien Si über i kompakt und konvex und die entsprechende Erweiterung von H multilinear. Während die Existenz eines Nash-Gleichgewichtes in reinen Strategien also nicht garantiert werden kann, existiert mindestens ein Nash-Gleichgewicht bei einem Spiel in gemischten Strategien. Rolf Baumanns SS12 Seite 7 42020 – KE3 – 4.3.1 Investitionsanreize - Gefangenendilemma Gemischten Strategien Jedes Spiel besitzt mindestens ein Nashgleichgewicht. Bei der Identifizierung von Nash-Gleichgewichten in gemischten Strategien ist es hilfreich, diejenigen gemischten Strategien zu identifizieren, die den Gegenspieler indifferent zwischen seinen Handlungsalternativen machen. Ist solch eine Strategie gefunden, sind alle Handlungen des Gegners beste Antworten. Treffen solche gemischten Strategien aufeinander, so sind sie folglich wechselseitig beste Antworten, es besteht kein Grund zum einseitigen Abweichen und die gemischten Strategien bilden ein Nash-Gleichgewicht. Beispiel: Betrachten Sie die folgende Bi-Matrix: Spieler Oper 1 Fussball q (1-q) Spieler 2 Oper Fussball p (1-p) 3,2 2,3 1,3 4,1 Der Algorithmus funktioniert wie folgt: Spielt Spieler 2 mit einer Wahrscheinlichkeit von p Oper und mit der Gegenwahrscheinlichkeit von (1-p) Fußball, so ergeben sich für Spieler 1 folgende Erwartungsnutzen: E1(O) = 3p + 2(1-p) E1(F) = 1p + 4(1-p) 3p + 2(1-p) = 1q + 4(1-p) 3p + 2 – 2p = 1p + 4 – 4p 1p + 2 = 4 – 3p 4p = 2 p = 1/2 Spieler 1 ist also indifferent zwischen seinen beiden Strategien. Für Spieler 2 lässt sich analog ermitteln, dass er indifferent ist, wenn Spieler 1 mit einer Wahrscheinlichkeit von q = 2/3 Oper und mit (1-q) = 1/3 Fußball spielt. E2(O) = 2q + 3(1-q) E2(F) = 3q + 1(1-q) 2q + 3(1-q) = 3q + 1(1-q) 2q + 3 - 3q = 3q + 1 -1q 3 - 1q = 2q + 1 3q = 2 q = 2/3 Da auf diese beiden Strategien alle Antworten des Gegenspielers beste Antworten sind, sind sie speziell jeweils auch wechselseitig beste Antworten. Somit kann [(2/3;1/3),(1/2;1/2)] als Nash-Gleichgewicht in gemischten Strategien identifiziert werden. Weitere, z.T. auch amüsante Informationen bei (lohnt sich): Christian Rieck www.spieltheorie.de Rolf Baumanns SS12 Seite 8
© Copyright 2024 ExpyDoc