Beispiel: Investitionsanreiz (Gefangenendilemma: Opportunistisches

42020 – KE3 – 4.3.1 Investitionsanreize - Gefangenendilemma
Beispiel: Investitionsanreiz
(Gefangenendilemma: Opportunistisches Verhalten lohnt sich nicht, die beste
Lösung für beide Seiten ist wenn beide Seiten sich bewegen)
Ausgangspunkt:
1. Zulieferer und Abnehmer sind über einen langfristigen Vertrag miteinander
verbunden.
2. Zulieferer steht vor der Entscheidung eine spezifische Investition in
Qualitätssicherung durchzuführen, wobei sich deren Auswirkung erst nach
einiger Zeit bemerkbar machen.
3. Abnehmer sichert Investitionsbeihilfe zu
4. Verhalten der beiden Spieler kann erst nach einer gewissen Zeit vom jeweils
anderen beobachtet werden
Fall A: Vertrag ohne Anreizsystem
Fall B: Vertrag mit Anreizsystem
 Nichteinhaltung der Investitionsbeihilfe durch Abnehmer: 6 Einheiten
Strafe
 Nichteinhaltung der Investition durch Zulieferer: 6 Einheiten Strafe
 Beobachter zur Überwachung der Einhaltung der Investition: 1 Einheit
Kosten für Abnehmer
Fall A
Der linke Tabelleneintrag (x, ·) ist der Gewinn des Zeilenspielers „Zulieferer = Z“,
der rechte Tabelleneintrag (·, x) der des Spaltenspielers „Abnehmer = A“.
Für Z ist es besser ”nicht investieren“, falls A”nicht investiert“ und ”nicht investieren“,
falls A ”investiert“. Die Entscheidung von Z hängt folglich davon ab, was er bezüglich
der Entscheidung A erwartet.
Für A gilt umgekehrt dasselbe!
Für A ist es besser ”nicht investieren“, falls Z ”nicht investiert“ und ”nicht investieren“,
falls Z ”investiert“.
Weder eine Situation, in der beide investieren, noch die Situation, in der beide nicht
investieren, ist ”stabil“.
Bimatrix:
Zulieferer
=Z
 Rolf Baumanns
+
-
Abnehmer = A
+
2 , 12
7,7
10 , 0
5,5
SS12
Seite 1
42020 – KE3 – 4.3.1 Investitionsanreize - Gefangenendilemma
Analyse:

Ohne eine vertragliche Garantie (Fall A) wird weder der Abnehmer (A) eine
Investitionshilfe leisten noch der Zulieferer (Z) die Investition tätigen, so dass
ohne Kooperation zwischen den Partnern die dominante Lösung (5/5) gewählt
wird.
 Würden sich die Partner absprechen und sich auch an ihre Absprache halten,
so wäre für beide das bessere Kooperationsergebnis (7/7) erreichbar. Aber wer
garantiert, dass sich die jeweils andere Partei an die Abmachung hält?
Opportunismus im Sinne einer Nichteinhaltung der Absprache wäre für beide
Parteien die interessanteste Lösung, da dies – auf Kosten des Partners – den
meisten Profit einbringen würde.
Fall B
Fall B zeigt das Rückzahlungsergebnis, welches auf ein Anreizsystem basiert. Deutlich
wird, dass sich Opportunismus nun weder für den Zulieferer noch für den Abnehmer
lohnt. Aus Eigeninteresse wird also nun die beste Lösung gewählt. Würden sich die
Partner vertrauen, so könnte auch die 1 Einheit für die Kontrollinstanz gespart werden.
Zulieferer
+
-
Abnehmer
+
7,6
8,5
4,5
5,4
Analyse:

Der Abnehmer verpflichtet sich, eine Investitionsbeihilfe zu leisten. Es wird
festgelegt, dass er im Falle einer Nichteinhaltung mit einer Konventionalstrafe
von 6 Einheiten belegt wird.

Beim Zulieferer wird für die Kosten von 1 Einheit ein Beobachter installiert,
welcher die Einhaltung der Investition durch den Zulieferer überwacht. Bei
Nichteinhaltung wird im Gegenzug der Zulieferer mit einer Konventionalstrafe
von 6 Einheiten belegt.

Die möglichen Ergebnisse zeigen, dass sich Opportunismus nun weder für den
Zulieferer noch für den Abnehmer lohnt. Aus Eigeninteresse wird nun also die
beste Lösung gewählt.
Fall C
Zulieferer
+
-
Abnehmer
+
p
(1-p)
7,4
8,5
6,6
w,v
q
(1-q)
Analyse:

Kein Nash-Gleichgewicht in reinen Strategien erkennbar

Analyse der Parameter v und w

Wenn v<6 und w>8  kein Nash-Gleichgewicht in reinen Strategien

Vgl. zu Nash-Lösungen in reinen/gemischten Strategien
– Holler/Illing: Einführung in die Spieltheorie. Springer.
– Riechmann: Spieltheorie. Vahlen.

Bilden einer Wahrscheinlichkeitsverteilung und Analyse des ZuliefererAbnehmer-Beziehung über gemischte Strategien
 Rolf Baumanns
SS12
Seite 2
42020 – KE3 – 4.3.1 Investitionsanreize - Gefangenendilemma
Bestimmen des Nash-Gleichgewichts in gemischten Strategien:
Zulieferer:
 z  7  p  q  6  p  1  q   8  1  p   q  w  1  p   1  q 
 z
 7  p  6  p  8  (1  p )  w  (1  p)  7  p  6  p  8  8  p  w  w  p  0
q
 z
 7  p  8  w  w  p  w  p  7  p  8  w   p  (7  w)  8  w  p  (7  w)  8  w  0
q
Auflösen nach p:
p
8 w
7w
Folgerung:
p
0
w
Abnehmer:
Analoges Vorgehen für die Wahrscheinlichkeit q:
 A  4  q  p  6  1  q   p  5  q  1  p   v  1  q   1  p 
 A
 4  q  6  (1  q)  5  q  v  (1  q )  4  q  6  6  q  5  q  v  v  q  0
p
 A
 7  q  6  v  v  q  v  q  7  q  6  v  q  (v  7)  v  6  0
p
Auflösen nach q:
q
v6
v7
Folgerung:
q
0
v
Aussagen:

Die Wahrscheinlichkeit p, dass der Abnehmer hilft, steigt, wenn in (HN= Hilft
Nicht, IN=Investiert Nicht) die Auszahlung w für den Zulieferer steigt.

Die Wahrscheinlichkeit q, dass der Zulieferer investiert, sinkt, wenn in (HN= Hilft
Nicht, IN=Investiert Nicht) die Auszahlung v für den Abnehmer steigt.
 Rolf Baumanns
SS12
Seite 3
42020 – KE3 – 4.3.1 Investitionsanreize - Gefangenendilemma
Gefangenendilemma
Ein Beispiel ist das Gefangenendilemma, ein spieltheoretisches Problem, bei dem
genau ein Nash-Gleichgewicht existiert.
Hierzu stelle man sich folgende Situation vor:
Zwei Gefangene werden verdächtigt, gemeinsam eine Straftat begangen zu haben. Die
Höchststrafe für das Verbrechen beträgt fünf Jahre Haft. Beiden Gefangenen wird nun
ein Handel angeboten, worüber auch beide informiert sind. Wenn einer allein gesteht
und somit seinen Partner mitbelastet, kommt er ohne Strafe davon – der andere muss
die vollen fünf Jahre absitzen. Entscheiden sich beide zu schweigen, bleiben nur
Indizienbeweise, die aber ausreichen, um beide für zwei Jahre einzusperren. Gestehen
aber beide die Tat, erwartet jeden eine Gefängnisstrafe von vier Jahren. Nun werden
die Gefangenen unabhängig voneinander befragt. Weder vor noch während der
Befragung haben die beiden die Möglichkeit, sich untereinander abzusprechen.
Zwar ist es optimal für die beiden Gefangenen, wenn sie beide schweigen. Diese
Strategie-Kombination ist aber nicht stabil, weil sich ein einzelner Gefangener durch
ein Geständnis einen Vorteil für sich verschaffen kann. Stabil im Sinne eines NashGleichgewichtes ist die Strategie-Kombination, bei der beide Gefangene gestehen:
Dann kann sich kein einzelner durch ein Schweigen einen Vorteil verschaffen, so dass
ein Nash-Gleichgewicht vorliegt. Dieses Nash-Gleichgewicht liefert aber für beide
Gefangene schlechtere Ergebnisse als das beidseitige Schweigen, das nur durch
Kooperation fixierbar ist.
Die übliche Darstellung solcher Spiele erfolgt mit einer Bimatrix.
Gefang.1
gestehen
schweigen
Gefang. 2
gestehen
schweigen
-4 , -4
0 , -5
-5 , 0
-2 , -2
Die Strategie Gestehen ist für beide Gefangene die jeweils beste Antwort auf beide
möglichen Strategien des Gegners. Als beste Antworten werden jene Strategien
bezeichnet, welche die höchste Auszahlung auf die jeweilige Strategie des Gegners
einbringen. In der Bimatrix sind sie fett gedruckt. Damit ist auch optisch zu erfassen,
dass mit der Strategienkombination (Gestehen, Gestehen) beste Antworten
aufeinander treffen. Dieses Aufeinandertreffen von besten Antworten wird als
ausgeglichener Zustand angesehen. Denn keiner der beiden Spieler kann durch
einseitiges Abweichen von seiner Strategie seine Auszahlung erhöhen. Er würde sie
sogar verringern, d. h. weniger Lebensjahre in Freiheit verbringen. In diesem Sinn ist
die Strategienkombination (Gestehen,Gestehen) als Lösung des Spiels zu betrachten.
Dieses Lösungskonzept, basierend auf dem Ermitteln des Aufeinandertreffens von
besten Antworten und damit dem Finden des so genannten Nash-Gleichgewichts.
 Rolf Baumanns
SS12
Seite 4
42020 – KE3 – 4.3.1 Investitionsanreize - Gefangenendilemma
Ein einfacher Algorithmus zur Identifizierung von Nash-Gleichgewichten
Eine Strategie-Kombination heißt Nash-Gleichgewicht, wenn ihr eine gewisse Stabilität
unterstellt werden kann aufgrund der Tatsache, dass kein einzelner Spieler einen
Anreiz besitzt, von seiner Strategie abzuweichen.
= bei gegebener Strategie aller anderen Spieler lohnt es sich für keinen Spieler, die
eigene Strategie zu wechseln („Einseitiges Abweichen lohnt sich nicht“)
Reine Strategie
Eine Strategie ist ein vollständiger Verhaltensplan eines Spielers. Eine Strategie im
spieltheoretischen Sinn muss mehr angeben als eine Strategie im Alltagssinn, nämlich
eine exakte Handlungsvorschrift ("Zug") für jede Situation, in die der Spieler kommen
kann.
Oftmals wird allerdings ein derartiger Verhaltensplan in der spieltheoretischen
Darstellung einfach auf den Namen der Strategie reduziert. Es sieht dann so aus, als
könne der betreffende Spieler einfach nur zwischen wenigen, einfachen Alternativen
wählen, also zum Beispiel zwischen den Strategien A und B. Man sieht dann nicht
mehr, dass sich hinter den harmlosen Namen eigentlich komplexe Verhaltenspläne
verbergen, sondern es sieht so aus, als hätte das gesamte Spiel nur einen einzigen
Zug. Es ist wichtig, die Strategie nicht mit einer Partie zu verwechseln.
Wenn man deutlich machen möchte, dass ein Spieler eine Strategie direkt (ohne
zwischengeschalteten Zufallsmechanismus) wählt, dann spricht von einer reinen
Strategie (im Gegensatz zu einer gemischten Strategie).
Nash-Gleichgewicht bei reinen Strategien
Es bezeichne die Menge der Strategien (Handlungsalternativen) des i-ten Spielers und
das kartesische Produkt dieser Strategienmengen.
Unter einem Nash-Gleichgewicht in reinen Strategien versteht man ein Strategieprofil
bei dem die Strategie jedes Spielers eine beste Antwort auf die gewählten Strategien
der anderen Spieler ist. Wenn alle anderen Spieler an ihren gewählten Strategien
festhalten, so ist das Nash-Gleichgewicht bei reinen Strategien formal dadurch
gekennzeichnet, dass es für Spieler also kein gibt, das dem Spieler eine höhere
Auszahlung verspricht.
Man sagt auch, dass Spieler seine Auszahlung durch ein einseitiges Abweichen nicht
verbessern kann. Ein Nash-Gleichgewicht zeichnet sich damit dadurch aus, dass sich
kein Spieler durch eine einseitige Änderung seiner Strategie verbessern kann.
Reine Strategien
Liegt ein Spiel in strategischer Form vor, so lassen sich alle Nash-Gleichgewichte in
reinen Strategien durch folgenden Algorithmus bestimmen:
1. Optimiere die Entscheidung von Spieler i=1,...,n bei (beliebig) fixierten Strategien
aller anderen Spieler:
Markiere die unter diesen Umständen erreichbaren höchsten Auszahlungen für
Spieler i. Wiederhole dies für alle möglichen Strategiekombinationen der anderen
Spieler.
2. Führe 1. für alle Spieler durch.
Dann sind genau die Strategienkombinationen Nash-Gleichgewichte, bei denen alle
Auszahlungen markiert sind. Diese Vorgehensweise eignet sich nur für eine geringe
Anzahl von Spielern und Strategien.
 Rolf Baumanns
SS12
Seite 5
42020 – KE3 – 4.3.1 Investitionsanreize - Gefangenendilemma
Beispiel
Sei folgendes Spiel in Normalform gegeben:
links
Spieler oben 4 , 2
1
mitte
2,3
rechts 3 , 0
Spieler 2
mitte
1,1
1,1
0,2
rechts
2,0
1,4
1,3
Dann funktioniert der Algorithmus wie folgt:
• i = 1:
• gegeben Spieler 2 spielt Rechts: Für Spieler 1 ist oben optimal – markiere die 2
(„Oben ist beste Antwort auf Rechts“)
• gegeben Spieler 2 spielt Mitte: oben und mitte ist optimal – markiere die beiden
1en
• gegeben Spieler 2 spielt Links: oben ist optimal – markiere die 4
• i = 2:
• gegeben Spieler 1 spielt oben: Für Spieler 2 ist Links optimal – markiere die 2
• gegeben Spieler 1 spielt mitte: Rechts ist optimal – markiere die 4
• gegeben Spieler 1 spielt unten: Rechts ist optimal – markiere die 3
Das einzige Nash-Gleichgewicht ist also die Strategie, die zur Auszahlung 4, 2 führt:
(oben,links).
Falls zu überprüfen ist, ob ein Tupel von gemischten Strategien ein NashGleichgewicht ist, funktioniert obiger Algorithmus nur bedingt, da eine unendliche
Anzahl an gemischten Strategien überprüft werden müsste.
Ein Nash-Gleichgewicht zeichnet sich damit dadurch aus, dass sich kein Spieler durch
eine einseitige Änderung seiner Strategie verbessern kann.
Gemischte Strategie
Die gemischte Strategie ist ein Arte Lautstärkeregler in der Spieltheorie.
Wählt ein Spieler eine gemischte Strategie, dann wählt er keine seiner reinen
Strategien direkt aus, sondern er wählt statt dessen einen Zufallsmechanismus aus,
der anschließend eine reine Strategie wählt. Formal ist eine gemischte Strategie also
eine Wahrscheinlichkeitsverteilung über die reinen Strategien eines Spielers, bei der
mindestens zwei Strategien mit positiver Wahrscheinlichkeit ausgewählt werden.
Wenn ein Spieler über alle seine reinen Strategien mischt (er also jede mit positiver
Wahrscheinlichkeit wählt), dann nennt man dies eine vollständig gemischte
Strategie.
Ausführlicher:
Dann vielleicht ein etwas anschaulicheres Beispiel: Ein Spieler hat die beiden
Strategien A und B zur Auswahl. Entscheidet er sich nun dafür, A zu wählen, dann
wählt er eine reine Strategie (eben die reine Strategie A). Wenn er statt dessen
ankündigt, dass er zunächst würfelt und nur dann die reine Strategie A wählt, wenn er
eine sechs gewürfelt hat, dann spielt er eine gemischte Strategie. Denn statt einer
reinen Strategie hat er nun einen Zufallsmechanismus gewählt, der an seiner Stelle die
reine Strategie auswählt. Die gemischte Strategie besteht jetzt darin, dass er A mit
einer Wahrscheinlichkeit von 1/6 wählt und B mit einer Wahrscheinlichkeit von 5/6 (also
der Gegenwahrscheinlichkeit zu 1/6, weil bei allen anderen Würfen von eins bis fünf
die Strategie B gewählt wird).
 Rolf Baumanns
SS12
Seite 6
42020 – KE3 – 4.3.1 Investitionsanreize - Gefangenendilemma
In der klassischen Entscheidungstheorie spielt man nicht gegen einen vernunftbegabte
Gegenspieler, sondern gegen die Natur, deren Verhalten durch eine
Wahrscheinlichkeitsverteilung
dargestellt
wird. Wenn
ein
vernunftbegabte
Gegenspieler nun aber eine gemischte Strategie spielt, dann wählt er ja auch eine
Wahrscheinlichkeitsverteilung, gegen die wir anschließend spielen.
Man merkt den Unterschied zwischen den beiden Situationen sofort, wenn man sich
klarmacht, wo die Wahrscheinlichkeitsverteilungen herkommen: In der klassischen
Entscheidungstheorie wird die Verteilung von einem externen Mechanismus
ausgewählt, der keinerlei eigene Interessen verfolgt. Klassischerweise ist das das
Wetter, woher auch wohl der Begriff "Spiel gegen die Natur" kommt. Eine gemischte
Strategie wird aber von einem vernunftbegabten Gegenspieler gewählt. Und dieser
wird die Wahrscheinlichkeitsverteilung so wählen, dass es aus seiner Sicht optimal ist.
Während in der klassischen Entscheidungstheorie die Wahrscheinlichkeitsverteilung
über die Umweltzustände exogen vorgegeben und unveränderlich ist, wird eine
gemischte Strategie aufgrund der Überlegungen und Präferenzen eines
vernunftbegabten Gegenspielers ausgewählt, der eigene Interessen verfolgt. Und das
ist ein gewaltiger Unterschied.
Eine gemischte Strategie braucht man nicht auszurechnen, sondern man gibt sie an,
indem man die Wahrscheinlichkeitsverteilung über die reinen Strategien benennt
(natürlich so, dass die Wahrscheinlichkeiten sich zu eins ergänzen).
Nash-Gleichgewicht bei gemischten Strategien
In manchen Fällen lässt man zu, dass die Spieler sich nicht auf eine bestimmte
Strategie festlegen, sondern auf eine Wahrscheinlichkeitsverteilung, mit der die  i aus
i zufällig gezogen werden. Ist i endlich oder zumindest abzählbar, so kann die
Wahrscheinlichkeitsverteilung durch einen Vektor si beschrieben werden, wobei die
Wahrscheinlichkeit ist, dass die Strategie  i , j   i gewählt wird.
Die gemischte Strategie ist genau dann ein Nash-Gleichgewicht, wenn kein Spieler
durch alleiniges Abweichen eine bessere Auszahlung erreichen kann.
Existenz eines Nash-Gleichgewichtes
Mit Hilfe des Fixpunktsatzes von Kakutani kann man zeigen, dass mindestens ein
Nash-Gleichgewicht existieren muss, wenn folgende Voraussetzungen erfüllt sind:
1. Die Auszahlungsfunktionen H i ( 1 ,...,  n ) sind stetig und quasikonkav in  i .
2. Die Strategiemengen 1 ,...,  n sind konvex und kompakt.
Häufig werden Spiele so konstruiert, dass die i endlich sind, endliche Mengen
können jedoch nicht konvex sein.
Allerdings ist die Menge der gemischten Strategien Si über i kompakt und konvex
und die entsprechende Erweiterung von H multilinear. Während die Existenz eines
Nash-Gleichgewichtes in reinen Strategien also nicht garantiert werden kann, existiert
mindestens ein Nash-Gleichgewicht bei einem Spiel in gemischten Strategien.
 Rolf Baumanns
SS12
Seite 7
42020 – KE3 – 4.3.1 Investitionsanreize - Gefangenendilemma
Gemischten Strategien
Jedes Spiel besitzt mindestens ein Nashgleichgewicht.
Bei der Identifizierung von Nash-Gleichgewichten in gemischten Strategien ist es
hilfreich, diejenigen gemischten Strategien zu identifizieren, die den Gegenspieler
indifferent zwischen seinen Handlungsalternativen machen. Ist solch eine Strategie
gefunden, sind alle Handlungen des Gegners beste Antworten. Treffen solche
gemischten Strategien aufeinander, so sind sie folglich wechselseitig beste Antworten,
es besteht kein Grund zum einseitigen Abweichen und die gemischten Strategien
bilden ein Nash-Gleichgewicht.
Beispiel: Betrachten Sie die folgende Bi-Matrix:
Spieler
Oper
1
Fussball
q
(1-q)
Spieler 2
Oper Fussball
p
(1-p)
3,2
2,3
1,3
4,1
Der Algorithmus funktioniert wie folgt:
Spielt Spieler 2 mit einer Wahrscheinlichkeit von p Oper und mit der
Gegenwahrscheinlichkeit von (1-p) Fußball, so ergeben sich für Spieler 1 folgende
Erwartungsnutzen:
E1(O) = 3p + 2(1-p)
E1(F) = 1p + 4(1-p)
3p + 2(1-p) = 1q + 4(1-p)
3p + 2 – 2p = 1p + 4 – 4p
1p + 2 = 4 – 3p
4p = 2
p = 1/2
Spieler 1 ist also indifferent zwischen seinen beiden Strategien.
Für Spieler 2 lässt sich analog ermitteln, dass er indifferent ist, wenn Spieler 1 mit einer
Wahrscheinlichkeit von q = 2/3 Oper und mit (1-q) = 1/3 Fußball spielt.
E2(O) = 2q + 3(1-q)
E2(F) = 3q + 1(1-q)
2q + 3(1-q) = 3q + 1(1-q)
2q + 3 - 3q = 3q + 1 -1q
3 - 1q = 2q + 1
3q = 2
q = 2/3
Da auf diese beiden Strategien alle Antworten des Gegenspielers beste Antworten
sind, sind sie speziell jeweils auch wechselseitig beste Antworten. Somit kann
[(2/3;1/3),(1/2;1/2)] als Nash-Gleichgewicht in gemischten Strategien identifiziert
werden.
Weitere, z.T. auch amüsante Informationen bei (lohnt sich):
Christian Rieck www.spieltheorie.de
 Rolf Baumanns
SS12
Seite 8