9.3 Nash-Gleichgewicht

1
9.3 Nash-Gleichgewicht
Die Wirtschaftswissenschaften und die sogenannte Spieltheorie stehen schon immer in
einem engen Zusammenhang. Die Beiträge von Cournot und Bertrand können zu den
frühesten spieltheoretischen Arbeiten gezählt werden. Gleichzeitig haben sie zum
Verständnis von Märkten beigetragen. Die moderne Spieltheorie hat sich immer auf diese
frühen Wurzeln in den Wirtschaftswissenschaften bezogen. Die enge Verbindung wird
auch darin deutlich, daß der Nobelpreis für Wirtschaftswissenschaften 1994 u.a. einem
Mathematiker (Nash) zugesprochen wurde. Nash ist es u.a. zu verdanken, daß die Ideen
von Cournot zum Ergebnis von interdependenten Entscheidungen auf eine viel breitere
Grundlage gestellt wurden. Die Anwendungen haben sich dadurch explosionsartig
vervielfacht. Gerade bei der Anwendung spieltheoretischer Konzepte auf
wirtschaftswissen-schaftliche Fragestellungen fiel auf, daß die von von Neumann,
Morgenstern und Nash gelegten Grundlagen der Spieltheorie nicht für alle
Anwendungsbereiche geeignet sind. Es wurden feinere Werkzeuge gebraucht. Ein solches
Werkzeug, das insbesondere seit den späten 70er Jahren zahlreiche Anwendungen
gefunden hat, ist das Konzept des "Teilspiel-perfekten Gleichgewichts", das auf den
deutschen Wirtschaftswissenschaftler Reinhard Selten zurückgeht. Auch er erhielt u.a.
aufgrund
dieses
zentralen
Beitrages
als
bislang
einziger
deutscher
Wirtschaftswissenschaftler im selben Jahr den Nobelpreis. Wir werden in diesem Abschnitt
einerseits das Gleichgewichtskonzept von Nash und im nächsten Abschnitt das
Gleichgewichtskonzept von Selten skizzieren und mit ihrer Hilfe andererseits einige
Aspekte des Cournot-Modells besprechen.
Kommen wir zunächst zu dem Gleichgewichtsbegriff von Nash. Dieser entspricht einer
direkten Übertragung des Cournot-Gleichgewichts auf einen allgemeineren Kontext. Wir
werden hier nur zwei Entscheidungsträger thematisieren. Alles, was hier besprochen wird,
läßt sich jedoch auch auf beliebig viele Entscheidungsträger verallgemeinern. Die
Entscheidungsträger heißen in der Spieltheorie Spieler. In dem Cournot-Modell waren die
beiden Unternehmen die Spieler. Jeder Spieler ist erstens durch die ihm offenstehenden
Strategien charakterisiert. Diese werden allgemein in einer Strategienmenge
zusammengefaßt. Im Cournot-Modell sind die Strategieentscheidungen die
Mengenentscheidungen. Die Strategienmenge ist dort die Menge aller nicht negativen
Mengen (jede Menge kann grundsätzlich gewählt werden, negative Mengen machen keinen
Sinn). Jeder Spieler ist zweitens durch eine Auszahlungsfunktion (pay-off function)
charakterisiert. Die Auszahlungsfunktion hängt von den gewählten Strategien beider
Spieler ab. Wenn man mit u1 die Auszahlungsfunktion des ersten Spielers und mit aj die
2
Strategie des Spielers j bezeichnet, dann ist der Wert der Auszahlungsfunktion für den
ersten Spieler
u1(a1, a2)
und für den zweiten Spieler
u2(a1, a2).
Darin kommt die Interdependenz der Entscheidungen zum Ausdruck. Im Cournot-Modell
entspricht die Gewinnfunktion in Abhängigkeit der Outputmengen der beiden
Unternehmen der Auszahlungsfunktion. Ein Spiel kann daher durch die Strategienmengen
Ai und die Auszahlungsfunktionen ui vollständig beschrieben werden. Welche
Entscheidungen die Spieler in einem solchen Spiel treffen werden, wird durch das NashGleichgewicht beschrieben. Es ist wie folgt definiert:
Die Strategien (a1∗ , a 2∗ ) heißen Nash-Gleichgewicht, wenn folgende Bedingungen erfüllt
sind:
u1 (a1∗ , a 2∗ ) ≥ u1 (a1 , a 2∗ ) ∀a1 ∈ A1
u2 (a1∗ , a 2∗ ) ≥ u2 (a1∗ , a 2 ) ∀a 2 ∈ A2 .
Vergleicht man für das Cournot-Modell, welche Strategienkombinationen ein NashGleichgewicht darstellen, so sind es genau die Mengenkombinationen, die in diesem
Modell Cournot-Gleichgewicht genannt wurden.
Dies sieht man am schnellsten ein, wenn man beispielsweise die erste Bedingung wie folgt
ausdrückt: Bei gegebener Wahl des zweiten Spielers a 2∗ , wird im Nash-Gleichgewicht die
Strategie des ersten Spieler so gewählt, daß seine Auszahlungsfunktion maximiert wird. In
der Sprache des Cournot-Modells: Bei gegebener Menge des zweiten Unternehmens q 2C
muß das erste Unternehmen die Menge so wählen, daß sein Gewinn maximiert wird. Das
bedeutet aber, daß die Wahl so getroffen wird, daß die Mengenkombination auf der
Reaktionsfunktion des ersten Unternehmens liegt. Entsprechend fordert die zweite
Bedingung, daß die Kombination auf der Reaktionsfunktion des zweiten Unternehmens
liegt. Die beiden Forderungen zusammen implizieren, daß die Mengenkombination auf
beiden Reaktionsfunktionen liegen muß. Dies charakterisierte aber gerade das CournotGleichgewicht. Fazit: Das Cournot-Gleichgewicht ist ein Spezialfall des NashGleichgewichts. Dasselbe gilt für das Bertrand-Gleichgewicht.
3
Diese Charakterisierung hat dem Cournot-Modell die unberechtigte Kritik beschert, daß es
von "irrationalen" Erwartungen ausgeht. Vordergründig gehen die Unternehmen davon aus,
daß das andere Unternehmen seine Outputmenge nicht ändert. Und die Annahme, daß das
andere Unternehmen seine Menge nie ändert, wurde als Annahme "irrationaler"
Erwartungen interpretiert. Nach der Diskussion in 9.1 dürfte klar sein, daß diese Kritik
nicht berechtigt ist. Das Cournot-Gleichgewicht - und damit auch das Nash-Gleichgewicht
- ist gerade durch Überlegungen darüber geprägt, welche Erwartungen rational sind. Das
eine Unternehmen erwartet, daß das andere Unternehmen nicht von dem Cournot-Niveau
abweicht, weil es keinen Anreiz dazu hat. Das Gleichgewichtskonzept macht keine
Aussage darüber, was die Unternehmen erwarten, wenn sich die Gleichgewichtsmengen
nicht realisieren.
Wir werden das Cournot-Modell nun noch einmal mit Hilfe des Nash-Gleichgewichts
untersuchen. Wir tun dies in einem vereinfachten Kontext, in dem die Unternehmen nur
über eine "hohe" Menge oder eine "niedrige" Menge entscheiden können. Dies wird uns
erlauben, die unterliegenden Annahmen des Cournot-Modells besser zu verstehen.
Die Strategienmengen der beiden Spieler bestehen jetzt nur noch aus zwei möglichen
Strategien. Dies ermöglicht es, die Werte bei allen Kombinationen übersichtlich in einer
Tabelle, der sogenannten Auszahlungsmatrix darzustellen:
Spieler 2
hoch (H)
niedrig (N)
hoch (H)
(u1 ( H , H ), u2 ( H , H ))
(u1 ( H , N ), u2 ( H , N ))
niedrig (N)
(u1 ( N , H ), u2 ( N , H ))
(u1 ( N , N ), u2 ( N , N ))
Spieler 1
In jedem Feld stehen also die Werte der Auszahlungsfunktion für die vier möglichen
verschiedenen Strategienkombinationen. Wir werden nun spezielle Zahlen annehmen.
Spieler 2
H
N
H
(64, 64)
(80, 60)
N
(60, 80)
(72, 72)
Spieler 1
Die Werte auf der Hauptdiagonalen sind dadurch entstanden, daß von einer PreisAbsatzfunktion 24 - y und der Kostenfunktion C(y) ≡ 0 ausgegangen wurde. Links oben
4
stehen die Werte, die sich bei dieser Spezifikation im Cournot-Gleichgewicht ergeben (die
Mengen sind jeweils 8). Rechts unten stehen die Werte für den Fall, daß beide
Unternehmen sich den Monopolgewinn teilen (die Mengen sind dann jeweils 6). Als
Übung vollziehe man dies nach.
Betrachten wir die Auszahlungsmatrix als einzige Information. Sollten die Unternehmen H
oder N wählen? Ist es rational zu erwarten, daß der Spieler 1 N wählt? Offensichtlich ist es
dies nicht. Denn völlig unabhängig davon, was der zweite Spieler wählt, steht sich der erste
Spieler immer besser, wenn er H wählt. Die rationale Erwartung ist demnach die Wahl H
durch den ersten Spieler. Aus denselben Gründen ist es auch rational zu erwarten, daß der
zweite Spieler dieselbe Wahl trifft. Als einzige rationale Erwartung bleibt die Wahl (H, H).
Wir haben hier den Spezialfall eines Spiels, in dem jeweils eine der beiden Strategien
immer besser ist als die andere. Man sagt dann, daß die schlechtere von der besseren
dominiert wird. Hier gelangen wir durch die Elimination dominierter Strategien zu einem
eindeutigen Ergebnis. Es wäre schön, wenn man auf derart einfache Weise stets zu einem
Endergebnis käme. Viele wirtschaftlich interessante Spiele haben leider kein
Gleichgewicht in dominierenden Strategien.
Es ist nun eine einfache Übung, sich zu überlegen, daß das Nash-Gleichgewicht in diesem
Spiel ebenfalls (H, H) ist. Wir haben hier eine zusätzliche Begründung für die Rationalität
des Nash-Gleichgewichts, allerdings nur für die Fälle, in denen es ein Gleichgewicht in
dominierenden Strategien gibt.
Die eigentliche Motivation, das Nash-Gleichgewicht für ein Cournot-Spiel in einem
vereinfachten Kontext zu bestimmen, liegt aber natürlich nicht darin, das CournotGleichgewicht noch einmal herzuleiten. Vielmehr kann man aus der obigen Matrix einige
weitere Aspekte ablesen. Beachten Sie, daß beide Unternehmen einen höheren Gewinn
erzielen würden, wenn sie beide eine geringere Menge gewählt hätten. Sie wählen diese
Möglichkeit nicht, weil sie beide einen einseitigen Anreiz haben, von dieser Wahl
abzuweichen. Wenn sie sich nicht kooperativ verhalten, kommt es wegen dieser
Anreizstruktur für beide zu einem schlechteren Ergebnis. Dies ist eines von vielen
Beispielen für eine Situation, die in der Literatur Gefangenendilemma genannt wird.
Warum dies so heißt, können Sie z.B. bei Varian, Kap. 27 nachlesen. Wir haben im ersten
Kapitel schon einmal eine Situation kennengelernt, die in dieselbe Klasse von Situationen
paßt. Das Gemeinsame an den Situationen, die durch die Problematik des
Gefangenendilemmas beschrieben werden, ist, daß individuelles nichtkooperatives
Verhalten letztendlich allen schadet. Eine kooperative Lösung würde alle Spieler besser
5
stellen. Aber jeder Spieler hat einen individuellen Anreiz, von der kooperativen Lösung
abzuweichen.
Eine Möglichkeit, mit dieser Situation umzugehen, besteht darin, daß sich die beiden
Unternehmen zusammensetzen und gemeinsam beschließen, wieviel die beiden
Unternehmen jeweils produzieren sollen. Wenn sie dies tun, können sie (N, N) beschließen
und sich dadurch beide besser stellen. Solche Produktionsabsprachen werden unter dem
Begriff Kartell zusammengefaßt. Ein Teil der Wettbewerbspolitik befaßt sich gerade mit
der Einschätzung von Kartellen. Kartelle werden als wirtschaftlich schlecht angesehen,
weil sie u.a. die Versorgung der Konsumenten verschlechtern. Deshalb versucht die
Kartellgesetzgebung, solche Kartellabsprachen zu verhindern. Wir werden hier nicht weiter
darauf eingehen. Die entsprechenden Argumente werden sowohl in der Vorlesung "Markt
und Wettbewerb" als auch vertieft in der Vorlesung "Wettbewerbspolitik" thematisiert.
Hier soll nur darauf hingewiesen werden, daß die obige Auszahlungsmatrix auch dazu
herangezogen werden kann, um zu argumentieren, daß ein Kartell mit erheblichen
Stabilitätsproblemen zu kämpfen hat. Jedes Unternehmen hat einen Anreiz, von der
Kartellabsprache abzuweichen. Die Möglichkeit einer Kartellbildung ist oft auch als Kritik
an dem Cournot-Modell vorgetragen worden. Es wurde argumentiert, daß davon
auszugehen ist, daß die Unternehmen ihren gemeinsamen Vorteil einer Kartellabsprache
sehen und ihn auch realisieren werden. Daher sei die Beschreibung eines Marktergebnisses
durch das Cournot-Modell wenig plausibel. Diese Argumentation verkennt jedoch die
zentralen Stabilitätsprobleme von Kartellen.
Als weiterer Kritikpunkt an dem Cournot-Modell wurde seine statische Natur angeführt.
Wie schon im Kontext mit dem Bertrand-Modell macht das Cournot-Modell nur
uneingeschränkten Sinn, wenn wir ein einmaliges Aufeinandertreffen der beiden
Unternehmen modellieren wollen. Wenn die Unternehmen wiederholt aufeinandertreffen,
läßt sich wieder eine andere rationale Strategie als die des Cournot-Gleichgewichts
vorstellen. Dann könnte die Strategie nämlich wie folgt aussehen. Wenn ein Unternehmen
die niedrige Menge wählt, wird auch das andere Unternehmen die niedrige Menge wählen.
Wenn ein Unternehmen einmal die hohe Menge wählt, wird auch das andere Unternehmen
die hohe Menge wählen. Diese gegenseitige Androhung von Vergeltungsmaßnahmen kann
in einem dynamischen (wiederholten) Kontext dazu führen, daß die beiden Unternehmen
bei den niedrigen Mengen und damit bei den höheren Gewinnen bleiben. Jedoch ist auch
diese Möglichkeit zunächst nur eine Denkmöglichkeit. In der Vorlesung
"Wettbewerbspolitik" wird die Wahrscheinlichkeit dafür, daß eine solche Strategie als
6
stabil anzusehen ist, als eher gering eingeschätzt. Die entsprechende Kritik an dem
Cournot-Modell ist daher nicht unbedingt stichhaltig.