Modellieren der Anzahl der versicherten Autos mit Hilfe der

Modellieren der Anzahl der
versicherten Autos mit Hilfe der
Warteschlangentheorie
18. Februar 2016
Erstellt von
Lisa Maria Wanka
Inhaltsverzeichnis
1
Einführung
1.1 Definitionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2 Verwendete Daten und Notationen . . . . . . . . . . . . . . . . . . . . . . . . . .
2
2
3
2 Modellieren der Anzahl der Fahrzeuge
2.1 Hinzufügen und Wegnehmen von Fahrzeugen . . . . . . . . . . . . . . . . . . . .
2.2 Vertragsverlängerung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5
5
6
3 Modell mit einer Inaktivitätsphase
3.1 Modellierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.1.1 Hinzufügen eines Stoßes zum Verlängerungszeitpunkt . . . . . . . . . . . .
7
9
9
4 Statistischer Schluss
4.1 Vollständige Daten . . . . .
4.1.1 Notation . . . . . . .
4.1.2 Likelihood-Funktion
4.2 Unvollständige Daten . . .
4.2.1 Inaktiv vs. Storniert
4.3 Nummerische Anwendung .
4.3.1 Kovariaten . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
10
10
10
11
12
12
15
15
5 Analyse
16
5.1 Erwartete Anzahl versicherter Autos . . . . . . . . . . . . . . . . . . . . . . . . . 17
5.2 Diskontiertes Risikopotential . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
6 Diskussion
21
7 Fazit
22
8 Literatur
23
1
1
Einführung
Das Ziel dieser Arbeit ist die Modellierung der Anzahl der versicherten Autos pro Haushalt. Hierfür wird die Warteschlangentheorie verwendet. Dazu werden vier verschiedene Parameter benötigt, wobei der erste das Hinzufügen von Fahrzeugen in den Versicherungsvertrag modelliert. Der zweite Parameter beschreibt die Wegfallrate von bereits versicherten Autos und der dritte stellt die Kündigungsrate von Versicherungspolicen dar. Da ein Versicherungsvertrag jährlich verlängert werden kann, wird der letzte Parameter dazu verwendet, die
Verlängerungsrate zu modellieren. Mittels statistischer Methoden können diese vier Parameter
geschätzt werden, auch wenn nur zensierte Daten vorliegen.
Der Warteschlangenprozess kann verallgemeinert werden, indem Kovariaten, die die Eigenschaften eines Haushaltes enthalten, zu jedem der Parameter des Modells hinzugefügt werden.
Damit kann vorhergesagt werden, welche Versicherungsnehmer eher dazu neigen, weitere Fahrzeuge zu der Versicherung hinzuzufügen oder zu entfernen, beziehungsweise welche ihren Vertrag
wahrscheinlich kündigen oder jährlich verlängern werden. Die geschätzten Parameter helfen den
Versicherungsbestand genau zu analysieren, da mittels der Warteschlangentheorie verschiedene Arten von Statistiken, die für den Versicherer brauchbar sind, berechnet werden können.
Bespiele dafür sind die erwartete Anzahl von versicherten Autos oder der Kundenertragswert
(engl. customer lifetime value; CLV).
Der Begriff Kundenertragswert kommt aus dem Marketing und erlaubt das Auswählen und
Anvisieren von Langzeitkunden. Diesen Wert, der in den letzten Jahren für die Versicherungswissenschaft immer wichtiger geworden ist, kann der Versicherer für jeden Versicherten bestimmen.
Berechnet wird der Kundenertragswert indem alle zukünftigen Profite eines Versicherten diskontiert werden. Seine Verwendung im Gebiet der Versicherung ist noch sehr neu, wahrscheinlich
aufgrund der Komplexität der Versicherungswissenschaft.
Im zweiten Kapitel wird die Anzahl versicherter Fahrzeuge modelliert. Das beinhaltet das
Bearbeiten eines Modells für das Hinzufügen neuer Fahrzeuge und das Modellieren des Entfernens von Autos aus einem bestehenden Versicherungsvertrag. Ein dritter Prozess, der die
Verlängerung von Verträgen beschreiben soll, wird ebenfalls zu dem Modell hinzugefügt. Später
wird dieses Modell noch verallgemeinert, um die Möglichkeit der Kündigung eines Vertrages
miteinzubeziehen.
Auch der Fall einer Inaktivitätsphase des Vertrages wird im dritten Kapitel berücksichtigt
und in das Modell miteinkalkuliert.
Eine Methode zur Schätzung der Parameter aus vollständigen und zensierten Datensätzen
wird im vierten Abschnitt erläutert und eine Verallgemeinerung, durch Hinzufügen von einigen
erklärenden Variablen zu jedem der Parameter des Modells, wird durchgeführt.
Im fünften Kapitel wird das zuvor erarbeitete Modell angewandt und zur Berechnung verschiedener nützlicher statistischer Daten, wie die erwartete Anzahl versicherter Fahrzeuge oder
der Kundenertragswert, verwendet. Hierfür werden Informationen, die auf einem Portfolio eines
kanadischen Versicherungsunternehmens basieren, herangezogen.
Weitere mögliche Verallgemeinerungen dieses Modells werden im sechsten Kapitel diskutiert
und im siebten Abschnitt wird das Ergebnis dieser Abhandlung erläutert.
1.1
Definitionen
Der Begriff Haushalt bezeichnet einen einzigen Kunden, den Versicherten. Dieser Haushalt kann
mehrere Mitglieder (beziehungsweise Fahrer) und mehrere Autos gesammelt in einem Versicherungsvertrag, der jährlich verlängert werden kann, beinhalten. Der Vertrag ist das Dokument,
das einen Versicherer an den versicherten Haushalt bindet.
2
In dieser Arbeit konzentrieren wir uns auf die Anzahl der Autos, die von dem Vertrag erfasst
werden und zu einem Haushalt gehören. Darüber hinaus werden auch hinzugefügte und entfernte Autos eines Versicherungsvertrags analysiert. Während des Versicherungsschutzes kann ein
Haushalt sich jederzeit entscheiden, den Vertrag zu kündigen, wobei in diesem Fall alle versicherten Autos sofort gekündigt werden. Dieser Vorgang wird als Vertragsbruch oder Stornierung
bezeichnet.
1.2
Verwendete Daten und Notationen
Die Warteschlangentheorie basiert auf den verschiedenen Wartezeiten, bevor sich etwas an der
Anzahl der versicherten Fahrzeuge ändert. Hierfür werden empirische Analysen, gewonnen aus
der Datenbank eines kanadischen Autoversicherungsunternehmens, verwendet. Diese Datenbank
beinhaltet allgemeine Versicherungsinformationen von 322.174 Haushalten im Zeitraum 20032007. Zu beachten ist, dass aufgrund der kurzen Zeitperiode die Daten zensiert sind. Zu jedem
der Haushalte liegen Informationen zu jedem seiner versicherten Fahrzeuge vor. Auch über neue
oder gekündigte Verträge, Vertragsverlängerungen, hinzugefügte oder entfernte Autos gibt es
Daten. Im Kapitel 4.3 werden die Datenbank im Detail analysiert und die Versicherungsinformationen genauer beschrieben, besonders die Merkmale der einzelnen Policen.
Es liegt eine graphische Analyse der Wartezeiten, die in diesem Modell involviert sind,
vor: In Abb. 1.1 wird die Verteilung der Lebensdauer eines Versicherungsvertrags (in Jahren)
dargestellt. Mit der Lebensdauer eines Versicherungsvertrags ist die Zeit zwischen dem Inkrafttreten und der Kündigung oder dem nicht Verlängern des Vertrages gemeint. Um mögliche
Verzerrungen zu vermeiden, betrachten wir im ersten der drei Graphen nur Policen, die im
Zeitraum von 2003-2007 ausgestellt und gekündigt wurden. Diese Auswahl ermöglicht es, die
Daten besser zu verstehen. In dieser Darstellung kann ein großer Ausschlag an jedem Vertragsverlängerungszeitpunkt erkannt werden. Abgesehen von diesen Sprüngen, wird ein exponentielles Abklingen der Werte beobachtet. Anhand des Farbcodes kann festgestellt werden, dass
die meisten der wegfallenden Verträge nur ein Auto versichern. In Abb. 1.1 wird im zweiten
Graphen auch die Zeit, bevor ein Fahrzeug zu einem schon existierenden Versicherungsvertrag
hinzugefügt wird, beobachtet. Hierfür wurde der ganze Datensatz verwendet. Auch für die letzte der drei Illustrationen wurde die volle Datenmenge benutzt. Diese zeigt die Zeitdauer vor
dem Entfernen eines Autos aus dem Versicherungsvertrag, welcher aber trotz des Wegfalles eines Fahrzeugs aufrecht bleibt. Hier kann ebenfalls ein exponentielles Abklingen und Sprünge
zu den Versicherungsverlängerungszeitpunkten erkannt werden. Die Ausreißer sind jedoch im
letzten Graphen nicht so signifikant wie die in den anderen. Das Ziel dieses Projekts ist diese
Beobachtungen mathematisch zu approximieren.
Sei N (t) eine Zufallsvariable, die die Anzahl der Elemente zum Zeitpunkt t im Wartesystem
beschreibt. In diesem Fall ist die Anzahl der Elemente die Anzahl der versicherten Autos in
einem Haushalt. Die Wahrscheinlichkeitsfunktion der Anzahl der versicherten Autos wird ausgedrückt durch
P P r{N (t) = ii} = pi (t). Die wahrscheinlichkeitserzeugende Funktion wird durch
PN (t) (z, t) = ∞
i=0 pi (t) × z beschrieben und ihre Partielle Ableitung bezüglich t ist
∞
X
∂PN (t) (z, t)
dpi (t)
(z, t) =
× zi.
∂t
dt
i=0
Die bedingte Wahrscheinlichkeit wird dargestellt und bezeichnet durch p(j,i) (s, t) =
P r{N (t) = i|N (s) = j}.
3
Abbildung 1.1: 0 Lebensdauer eines Versicherungsvertrags, Zeit vor dem Hinzufügen und Zeit
vor dem Entfernen eines Fahrzeuges.
0
Alle Abbildungen, die in dieser Arbeit gezeigt werden, wurden dem folgenden Artikel entnommen: Boucher,
Jean-Philippe; Couture-Piché, Guillaume. 2015. Modelling the number of insureds’ cars using queuing theory.
Insurance: Mathematics and Economics 64 (2015) 67-76.
4
2
Modellieren der Anzahl der Fahrzeuge
In diesem Abschnitt wird gezeigt, wie die Warteschlangentheorie (basierend auf Newell (1982))
zum Bestimmen der Anzahl der versicherten Autos verwendet werden kann. Zuerst wird ein
Poisson-Prozess verwendet um das Hinzufügen eines neuen Autos zu modellieren, danach ein
weiterer, um das Wegfallen eines Autos aus dem Vertrag darzustellen. In diesem Teil wird es
weniger Details geben, da das Interpretieren der Ergebnisse nur grundlegendes Wissen über die
Warteschlangentheorie erfordert. Trotzdem wird mit dieser Einführung in die Warteschlangentheorie das Erklären einiger Komponenten, die in komplexen Modellen vorkommen (z.B. dritter
Abschnitt), ermöglicht.
2.1
Hinzufügen und Wegnehmen von Fahrzeugen
Abbildung 2.1: Graph eines Poisson-Prozesses
Im Poisson-Prozess (auch Geburtenprozess, dargestellt in Abb. 2.1) gibt es nur eine Komponente
(Geburtenkomponente), die durch den Parameter λ definiert ist. Die Chapman-Kolmogorov
Gleichung ist hier wie folgt definiert:
pi (t) =
∞
X
pj (s)p(j,i) (s, t),
f ür s < t.
j=0
Diese Gleichung wird so gedeutet, dass eine Wahrscheinlichkeit durch die Summe aller möglichen
Pfade dargestellt werden kann. Die Gleichung erfordert, dass wir die bedingten Wahrscheinlichkeiten (es gibt i Fahrzeuge zum Zeitpunkt t + 4t unter der Bedingung, dass es zum Zeitpunkt
t j Fahrzeuge gegeben hat) finden. Dies wird ausgedrückt durch:

λ4t + o(4t)
f ür j = i − 1,



1 − λ4t + o(4t) f ür j = i,
p(j,i) (t, t + 4t) =
o(4t)
f ür j < i − 1



0
sonst
wobei lim4t→0 o(4t)
4t = 0 gilt.
Für dieses erste Modell kann gezeigt werden, dass seine Wahrscheinlichkeitsfunktion so aussieht:
pi (t) =
e−λt (λt)i
,
i!
was die Darstellung der Poissonverteilung ist. Des weiteren bedeutet das, dass der Zählprozess
N (t) mit dem Parameter λt poissonverteilt ist.
5
Abbildung 2.2: Graph eines M/M/∞ Modells
Um ein Modell zu erhalten, das realistischer ist, wird eine weitere Komponente (Todeskomponente hinzugefügt (siehe Abb. 2.2). Die Todeskomponente soll unabhängig vom Geburtenprozess
sein. Das daraus entstehende Modell wird mit M/M/∞ gekennzeichnet. Die Zeit bis zum Hinzukommen eines neuen Elements ist exponentialverteilt. Diese Eigenschaft wird in der Notation
durch das erste M ausgedrückt und bedeutet ”Markov”. In diesem Modell verlässt jedes Element nach einer bestimmten Zeitperiode, die auch exponentialverteilt ist, das System wieder.
Dieser neue Prozess im Modell bezeichnet das zweite M . Das letzte Symbol ∞ bedeutet, dass
der Abgangsprozess (departure process) eines versicherten Autos beginnen kann, bevor der eines
anderen Fahrzeuges noch nicht beendet ist. In diesem Fall bedeutet das, dass unendlich viele
Autos gleichzeitig versichert werden können und es somit keine Warteschlangen gibt.
Demzufolge wird mit einem dynamischen Modell einer Population, welches mit der konstanten Rate λ wächst und mit der Rate iµ schrumpft, gearbeitet. Hierbei ist i die Anzahl der
Elemente der Population zu einer bestimmten Zeit. In diesem Kontext ist die Population die
Anzahl der Autos in einem Haushalt und daher werden die Fahrzeuge mit der Rate λ zu der
Versicherung hinzugefügt und mit der individuellen Rate µ entfernt. Für dieses Modell sind die
bedingten Wahrscheinlichkeiten:

λ4t + o(4t)
f ür j = i − 1,



1 − (λ + iµ)4t + o(4t) f ür j = i,
p(j,i) (t, t + 4t) =
(i + 1)µ4t + o(t)
f ür j = i + 1,



o(4t)
sonst.
Für dieses, aus der Warteschlangentheorie bekannte Modell, ist die Wahrscheinlichkeitsfunktion
beschrieben durch:
h
ii−k
−µt ) λ
min(i,a) e−(1−e
µ (1 − e−µt ) λ
X
µ
a
pi (t) =
e−µtk (1 − e−µt )a−k .
×
k
(i − k)!
k=0
Die wahrscheinlichkeitserzeugende Funktion wird dargestellt durch:
a λ (1−e−µt )(z−1)
PN (t) (z, t) = (z − 1)e−µt + 1 e µ
wobei N (0) = a gilt, was bedeutet, dass die ursprüngliche Anzahl der versicherten Autos (zum
Zeitpunkt 0) a ist.
2.2
Vertragsverlängerung
Es ist möglich, mehr Flexibilität in das Modell M/M/∞ zu bringen, indem der Todesprozess
verallgemeinert wird. Das bedeutet, dass das zweite M zu einem G, das für allgemeine Verteilung (engl. general distribution) steht, wird. Die geplante Verallgemeinerung erlaubt, die
Ausreißer zu den Vertragsverlängerungszeitpunkten in das Modell einzubauen. Wie in Abb.
6
1.1 empirisch gezeigt wird, ist die Wahrscheinlichkeit höher, dass ein Auto an dem jährlichen
Vertragsverlängerungszeitpunkt aus dem Vertrag entfernt wird.
Basierend auf Benes (1957) wird das Modell konstruiert, indem der Prozess in mehrere
Komponenten, die die Anzahl der Autos modellieren, separiert wird. Es kann voraussetzt werden, dass der Prozess N (t) durch N (t) = Z(t) − Y (t) ausgedrückt werden kann. Der Prozess
Z(t) zählt die hinzugefügten Autos bis zum Zeitpunkt t und der Prozess Y (t) zählt die Autos,
die bis zu einem Zeitpunkt t aus dem Versicherungsvertrag entfernt werden.
Für N (0) = 0 ist die Wahrscheinlichkeitsfunktion gegeben durch:
P r(N (t) = i) =
(λtqt )i e−qt λt
,
i!
die eine Poissonverteilung mit Parameter λtqt ist. Der Parameter qt kann als Überlebenswahrscheinlichkeit interpretiert werden und wird definiert durch:
Z t
S(x)
qt =
dx,
t
0
wobei S(·) die Überlebensfunktion der Servicezeit, was in diesem Fall die Zeit, seitdem das Auto
versichert ist, darstellt. Der Ausreißer, der zu jedem Vertragsverlängerungszeitpunkt auftritt,
kann unter Verwendung der folgenden Funktion eingebunden werden:
S(x) = e−µx pbxc ,
wobei x das Alter des Vertrages und p die Wahrscheinlichkeit, dass der Vertrag verlängert wird,
ist. Die Notation b·c bezeichnet hierbei die Abrundungsfunktion.
3
Modell mit einer Inaktivitätsphase
Es wäre interessant das Modell zu verallgemeinern, indem eine Kündigung des Vertrags hinzufügt wird, was bedeutet, dass alle Fahrzeuge eines Haushaltes gleichzeitig das Versicherungsunternehmen verlassen. Dieses Modell wird konstruiert, indem ein weiterer Poisson-Prozess
hinzufügt wird, der den Übergang von Level n ≥ 1 zu 0 mit der Rate γ erlaubt, was den
Effekt der Kündigung schafft. Abb. 3.1 illustriert dieses Modell. Dieser hinzugefügte Prozess
soll unabhängig von den anderen sein. Wenn dieses Modell genauer betrachtet wird, wird ein
konzeptionelles Problem bemerkt, da das Modell zulässt, dass ein Auto zu einem Vertrag hinzugefügt wird, obwohl in ihm eine Zeit lang kein Fahrzeug versichert war (Zustand 0). Diese
Situation ist nicht eingängig, da zu vermuten ist, dass ein Versicherungsvertrag ohne Autos
einem gekündigten Vertrag entspricht. In diesem Sinne ist der Zustand 0 absorbierend1 .
Die empirische Analyse der vorhandenen Daten führt zu einer etwas komplizierteren Lage. Tatsächlich kann es passieren, dass eine Versicherungspolice ohne ein versichertes Fahrzeug nicht
storniert wird. Das bedeutet, dass manchmal ein neues Auto zu einem existierenden Versicherungsvertrag ohne versicherte Fahrzeuge hinzugefügt wird. In dem verwendeten Datensatz ist
dies 1340 mal passiert und die durchschnittliche Zeitdauer des Stadiums 0 ist fast ein halbes
Jahr (0, 4789).
1
Ein Zustand i ∈ I ist absorbierend, wenn {i} eine abgeschlossene Klasse ist. Eine Kommunikationsklasse C ist
abgeschlossen, wenn aus i ∈ C und j erreichbar von i folgt j ∈ C. (Diese Definitionen wurden den Lehrunterlagen
zur Vorlesung Einführung in die Stochastischen Prozesse und Zeitreihen, die von Univ. Prof. Friedrich Hubalek
im Sommersemester 2015 an der Technischen Universität Wien gehalten wurde, entnommen.)
7
Das stellt eine Form der Inaktivität des Vertrages dar, was bedeutet, dass ein Vertrag durch
hinzufügen eines neuen Autos reaktiviert werden kann. Das ist in Situationen vorstellbar, bei
denen der Versicherungsschutz zeitweise deaktiviert werden kann oder die Existenz eines anderen Versicherungstyps, verbunden mit der Autoversicherung, die die komplette Stornierung
der Police verhindert. Aus diesen und weiteren Beispielen, kann der Zustand ohne versichertes
Fahrzeug nicht als absorbierend angenommen werden. Trotzdem muss ein absorbierender Zustand, repräsentierend für die endgültige Stornierung des Vertrages, hinzugefügt werden. Dieser
stellt dann nicht den Versicherungsvertrag ohne versicherte Fahrzeuge, sondern seine endgültige
Auflösung dar.
Abbildung 3.1: Graph eines Warteschlangenmodells, dass die Stornierung des Vertrages erlaubt
Abbildung 3.2: Graph eines Warteschlangenmodells mit einem absorbierenden Zustand 0∗
Hierfür würde ein Modell, wie in Abb. 3.2. illustriert, passen, wo ein neuer absorbierender
Zustand 0∗ beigefügt wird, zudem keine Autos mehr hinzugefügt werden können. Anders gesagt,
tritt der Zustand 0∗ nur ein, wenn der Vertrag storniert wird. Von jedem Zustand kann 0∗ mit
der Rate γ erreicht werden. Diese Situation wird in Kapitel 4 noch einmal genauer beleuchtet,
da bei Versicherungen mit nur einem Auto die Stornierung des Fahrzeuges auch die Stornierung
des Vertrages bedeuten kann und wiederum zwischen der Inaktivität 0 und der Auslöschung 0∗
des Vertrages unterscheiden werden muss.
Die Konstruktion dieses neuen Modells ist komplex und fordert neue Notationen. Zusätzlich
zu N (t), die Anzahl der zum Zeitpunkt t versicherten Autos wird nun die binäre Zufallsvariable
M (t) hinzugefügt. Diese Zufallsvariable sagt aus, ob ein Prozess zum Zeitpunkt t am Leben
oder Tod ist. Das ist in diesem Fall so zu verstehen, dass für M (t) = 1, was dem lebenden Prozess entspricht, der Versicherungsvertrag noch in Kraft ist, beziehungsweise noch nicht aufgelöst
wurde. Ein lebender Prozess ohne Autos im Versicherungsvertrag wird als inaktiv interpretiert
und ist somit im Zustand 0. Andererseits bedeutet M (t) = 0, also im Falle eines toten Prozes8
ses, dass der Haushalt den Versicherungsvertrag storniert hat und der absorbierende Zustand
0∗ erreicht wurde.
3.1
Modellierung
Für dieses Modell sollten die Übergangswahrscheinlichkeiten mithilfe der Chapman-KolmogorovGleichungen berechnet werden. In dieser Arbeit wird jedoch eine einfachere mathematische
Entwicklung verwendet. Zuerst wird die Annahme gemacht, dass der Zeitprozess, der mit der
Zufallsvariable M (t) zusammenhängt, exponentialverteilt ist. Das bedeutet, dass vorausgestzt
wird, dass die Zeit zwischen Beginn und Beendigung des Vertrages U ∼ Exp(γ) ist. Somit gilt
M (t) = 0 wenn t > U und:
P r(M (t) = 1) = e−γt .
(3.1)
Nun kann die Anzahl der Autos für beide Situationen definiert werden:
• Im Fall M (t) = 1: So lange der Haushalt versichert ist, sind die Prozesse des Hinzufügens
und Entfernens der Autos aktiv. Also kann die Nummer der versicherten Autos N (t) mit
dem Warteschlangenmodell M/M/∞ modelliert werden.
• Im Fall M (t) = 0: Wenn eine Stornierung auftritt, ist die Anzahl der versicherten Fahrzeuge 0 und es gilt P r(N (t) = 0|M (t) = 0) = 1.
Infolgedessen kann die gemeinsame wahrscheinlichkeitserzeugende Funktion von N (t) und
M (t) einfach entwickelt werden:
PN (t),M (t) (z, y, t) =
=
1 X
∞
X
m=0 i=0
1 X
∞
X
P r(M (t) = m, N (t) = i)y m z i
P r(N (t) = i|M (t) = m) × P r(M (t) = m)y m z i
m=0 i=0
= P r(M (t) = 0) +
∞
X
P r(N (t) = i|M (t) = 1)
i=0
i
×P r(M (t) = 1)yz
= 1 − e−γt + e−γt yPN (t) (z, t)
= 1 − e−γt + e−γt y((z − 1)e−µt + 1)a
×e
λ
(z−1)(1−e−µt ) µ
.
(3.2)
Die wahrscheinlichkeitserzeugende Funktion des M/M/∞ Modells kann an der rechten Seite
der Gleichung abgelesen werden.
3.1.1
Hinzufügen eines Stoßes zum Verlängerungszeitpunkt
An jedem Ende des Vertragsjahres muss der Versicherte seinen Versicherungsvertrag verlängern.
Es ist möglich, die wahrscheinlichkeitserzeugende Funktion, durch Hinzufügen eines Bernoulli
Versuches, so zu modellieren, dass diese Situation miteinbezogen ist. Um das zu tun wird die
Gleichung (3.1) durch Einbeziehen der Verlängerungswahrscheinlichkeit p verallgemeinert:
P r(M (t) = 1) = e−γt pbtc ,
9
wobei die Variable t wieder für die Zeit in Jahren und die Notation b·c für die Abrundungsfunktion steht. Diese Funktion bewirkt mit einem p < 1 die Erhöhung der Wahrscheinlichkeit
auf Stornierung an jedem Ende des Vertragsjahres. Es ist einfach die Gleichung (3.2) mit dieser
neuen Definition zu überarbeiten um folgendes zu erhalten
PN (t),M (t) (z, y, t) = 1 − e−γt pbtc + e−γt pbtc
×y((z − 1)e−µt + 1)a e
λ
(z−1)(1−e−µt ) µ
(3.3)
Dies ist nun der gesuchte Prozess, um die Anzahl der versicherten Autos zu modellieren.
4
Statistischer Schluss
Mittels der Maximum-Likelihood-Methode ist es möglich, die Parameter λ, γ, µ und p zu
schätzen. Für diese Abschätzungsmethode muss die gemeinsame Wahrscheinlichkeitsdichte gefunden und mit den Beobachtungen aus dem Datensatz abgestimmt werden. Es müssen einige
Annahmen getroffen werden, um mit den Informationen aus den Daten arbeiten zu können.
Zuerst werden die Schritte zur Abschätzung der Parameter aus einem vereinfachten Modell,
in dem es möglich ist, zwischen jedem Ereignis zu unterscheiden, durchgeführt. Danach wird
durch das Einführen von Datenzensur und erklärenden Variablen das Modell angepasst und
verallgemeinert.
4.1
4.1.1
Vollständige Daten
Notation
Um alle Parameter aus dem neuen Modell schätzen zu können, wird eine Liste der in der
Likelihood-Funktion verwendeten Variablen angegeben. Alle möglichen Ereignisse, die während
der Bestehensdauer der Versicherungspolice beobachtet werden, werden vermerkt als
• Ereignis Typ 1 ist das Hinzufügen eines Autos in den Versicherungsvertrag. Die Zufallsvariable E beschreibt die gesamte Anzahl der Ereignisse dieser Art, wobei die Fahrzeuge
ausgenommen sind, die bereits zu Beginn der Beobachtung des Vertrages versichert waren;
• Ereignis Typ 2 ist die Stornierung des Vertrages am Ende des Vertragsjahres. Die Zufallsvariable Q ist die Indikatorvariable dieses Vorfalls, also gilt Q = 1 falls der Vertrag nicht
verlängert wird;
• Ereignis Typ 3 ist der Fall, dass die Versicherungspolice zu einem anderen Zeitpunkt, als
dem Ende des Vertragsjahres storniert wird. Die Zufallsvariable A ist die Indikatorvariable
dieses Vorfalls;
• Ereignis Typ 4 ist das Entfernen eines Fahrzeuges aus dem Versicherungsvertrag. Die
Zufallsvariable S beschreibt die gesamte Anzahl der Ereignisse dieser Art.
Die Anzahl aller Ereignisse K ist die Summe der zuvor erläuterten Elemente, also K = E +
A + Q + S. Auch Notationen zu Variablen, die zeitliche Informationen bezüglich des Vertrags
angeben, werden nun angeführt:
• tj , die Zeit (in Jahren) zu der das j-te Ereignis, das die Anzahl der versicherten Autos
beeinflusst, eintritt;
10
• t˜j , die Zeitdauer (in Jahren) zwischen dem (j − 1)-ten und dem j-ten Ereignis, wobei gilt
t˜j = tj − tj−1 , mit t˜1 = t1 ;
• T , die
der Jahre, die der Vertrag aktiv beziehungsweise inaktiv war, wobei gilt
PAnzahl
K ˜
T = j=1 tj und damit T = tK ;
• Des Weiteren werden die Zufallsvariablen, die die Zeitdauer vor dem Eintreten eines Ereignisses vom Typ 1, 2, 3 oder 4 definieren, bezeichnet mit Ψ1 , Ψ2 , Ψ3 und Ψ4 .
Außerdem sind:
• Nj , eine Variable, die die Anzahl der Autos unmittelbar vor dem Eintreten des j-ten
Ereignisses zählt;
• V , die Summe der Beobachtungszeiten (in Jahren) aller Fahrzeuge eines Haushaltes, also
RT
P
˜
V = 0 N (t)dt = K
j=1 tj Nj .
4.1.2
Likelihood-Funktion
Die Likelihood-Funktionen wurden basierend auf der Arbeit von Benes (1957) für das M/M/∞
Modell entwickelt. Um die Parameter abzuschätzen, wird zuerst die bedingte Likelihood-Funktion,
basierend auf dem Anfangszustand, bestimmt. Deshalb ist die Anzahl der bereits versicherten
Autos im Portfolio nicht interessant (dies ist eine Grundannahme mit der gearbeitet wird),
sondern Prozesse, die sich auf die Anzahl der Fahrzeuge in der Zukunft auswirken. Unter den
Annahmen, die bei der Konstruktion des Systems gemacht wurden, wurden diese Variablen
definiert als Ψ1 ∼ Exp(λ), Ψ2 ∼ Exp(µ), Ψ3 ∼ Exp(γ) und Ψ4 ∼ G(p).
Um die gemeinsame Verteilung aller Ereignisse eines Haushaltes bestimmen zu können,
müssen alle möglichen Fälle analysiert werden. Alle Prozesse werden als unabhängig angenommen, was die Zerlegung des Modells vereinfacht. Zum Beispiel, wissend dass das erste Ereignis
das Hinzufügen eines Fahrzeuges zum Versicherungsvertrag (Ereignis Typ 1) zum beobachteten
Zeitpunkt t˜1 ist, wird folgendes erhalten:
P r(Ψ1 = t˜1 , Ψ2 > t˜1 , Ψ3 > t˜1 , Ψ4 > t˜1 )
˜
˜
˜
˜
= λe−λt1 e−N1 µt1 e−γ t1 ph(t1 ) ,
(4.1)
wobei h(t) eine Funktion ist, die zählt, wie oft ein Haushalt den Vertrag bis zum Zeitpunkt t
verlängert hat. Diese Gleichung wird entwickelt, indem die Eigenschaften des ersten Ereignisses
einer gemeinsamen Exponentialverteilung verwendet werden. Mit einer ähnlichen Entwicklung
ist es möglich die Wahrscheinlichkeiten der Ereignisse vom Typ 2, 3 und 4 zu finden:
P r(Ψ1 > t˜1 , Ψ2 = t˜1 , Ψ3 > t˜1 , Ψ4 > t˜1 )
˜
˜
˜
˜
(4.2)
˜
˜
(4.3)
= e−λt1 N1 µe−N1 µt1 e−γ t1 ph(t1 ) ;
P r(Ψ1 > t˜1 , Ψ2 > t˜1 , Ψ3 = t˜1 , Ψ4 > t˜1 )
˜
˜
= e−λt1 e−N1 µt1 γe−γ t1 ph(t1 ) ;
P r(Ψ1 > t˜1 , Ψ2 > t˜1 , Ψ3 > t˜1 , Ψ4 = t˜1 )
˜
˜
˜
˜
= e−λt1 e−N1 µt1 e−γ t1 ph(t1 )−1 (1 − p).
(4.4)
Da die exponentiellen Prozesse keine Erinnerung haben, ist es möglich das Produkt aller K Ereignisse zu berechnen, um die gemeinsame Verteilung aller Ereignisse eines einzelnen Haushaltes
11
zu erhalten:
E −λ
f (E, A, S, Q, T, V |λ, γ, µ, p) = λ e
× e−γ
PK
PK
˜
j=1 tj
˜
j=1 tj
S
Y
!
µS e−µ
NS
(1 − p)Q p
PK
j=1
PK
j=1
Nj t˜j A
γ
h(t˜j )−Q
∝ λE γ A µS (1 − p)Q e−(λ+γ)T e−µV pbT c−Q ,
wobei die konstanten Koeffizienten in der letzten Gleichung entfernt wurden, da sie zur Berechnung der Maximum Likelihood-Methode nicht benötigt werden. Für alle Φ Haushalte kann die
Likelihood-Funktion ausgedrückt werden durch:
`=
Φ
X
Ei lnλ + Ai lnγ + Si lnµ + Qi ln(1 − p)
i=1
+(bTi c − Qi ) lnp − (λ + γ)Ti − µVi ,
hierbei kennzeichnet der Indizes i den jeweiligen Haushalt. Schlussendlich werden mittels der
Maximierung der Likelihood-Funktion die folgenden Schätzer erhalten:
PΦ
PΦ
PΦ
PΦ
bTi c − Qi
i=1 Ai
i=1 Si
i=1 Ei
, γ̂ = PΦ
, µ̂ = PΦ
, p̂ = i=1
.
λ̂ = PΦ
PΦ
i=1 Ti
i=1 Ti
i=1 Vi
i=1 bTi c
4.2
Unvollständige Daten
Wenn der Zeithorizont des Samples nur 5 Jahre beträgt ist es nicht immer möglich, die ganze Lebensdauer eines Versicherungsvertrages zu beobachten. Daraus folgt, dass der Datensatz
zensiert ist und es nicht möglich ist, die Schätzung, basierend auf den vollständigen Daten, zu
verwenden. Um die Parameter richtig zu schätzen, müssen wichtige Annahmen gemacht werden. Daher wird eine neue Variable Ω, der Beobachtungstag des Datensatzes, eingeführt. Zum
Beispiel im Fall dieser empirischen Analyse, ist dieser Tag der 31. Dezember 2007.
Dadurch ist es nicht möglich zu wissen, was mit einer Police passiert ist, die nicht bis
zu diesem Zeitpunkt storniert wurde. Sie kann kurz darauf storniert worden sein oder ist
möglicherweise immer noch aktiv. Für diese Verträge muss zur Likelihood-Funktion die Zeitperiode zwischen dem letzten beobachteten Ereignis K und Ω hinzufügt werden; das heißt, es
wird eine Wahrscheinlichkeitsfunktion hinzufügt, die angibt, dass keine Ereignisse in diesem
Zeitintervall passieren. Dies entspricht der gemeinsamen Wahrscheinlichkeit des Fortbestandes
von 4 Ereignissen. Bei unabhängigen Zufallsvariablen gilt Folgendes:
P r(Ψ1 > Ω − tK , Ψ2 > Ω − tK , Ψ3 > Ω − tK , Ψ4 > Ω − tK )
= P r(Ψ1 > Ω − tK )P r(Ψ2 > Ω − tK )P r(Ψ3 > Ω − tK )P r(Ψ4 > Ω − tK )
= e−λ(Ω−tK ) e−NK µ(Ω−tK ) e−γ(Ω−tK ) ph(Ω−tk ) .
4.2.1
Inaktiv vs. Storniert
Wenn Zensur vorliegt, muss zwischen einem inaktiven Versicherungsvertrag (Zustand 0) und
einem stornierten Versicherungsvertrag (Zustand 0∗ ) unterschieden werden. Denn in Fällen wo
nur ein Auto zur Zeit tK versichert ist, also NK = 1, schauen die Ereignisse Typ 3 und Typ 4
gleich aus.
12
Zuerst wird eine neue Indikatorvariable AS(Ω − tK ) = AS = 1 eingeführt, was bedeutet,
dass diese unbekannte Situation die Dauer Ω − tK hat. Da mit exponentiellen Zufallsvariablen
gearbeitet wird, ist es möglich Gleichung (4.2) und (4.3) aufzusummieren. Dadurch wird die
Wahrscheinlichkeit, dass der Haushalt den unbekannten Zustand zum Zeitpunkt tK erreicht,
erhalten. Diese Wahrscheinlichkeit ist ausgedrückt durch e−(λ+µ+γ)t˜K ph(t˜K ) (µ + γ), dies kann
nun in die Likelihood-Funktion eingefügt werden.
Wegen den Eigenschaften der Exponentialverteilung sind die Wahrscheinlichkeiten, dass sich
ein Haushalt im Zustand 0∗ (Ereignis Typ 3) oder im Zustand 0 (Ereignis Typ 4) befindet,
gegeben durch:
γ
γ+µ
µ
P r(M (tK ) = 1, N (tK ) = 0|AS = 1) =
.
γ+µ
P r(M (tK ) = 0|AS = 1) =
Es ist möglich, die Zeit Ω − tK in die Likelihood-Funktion zu inkludieren, um herauszufinden
welches Ereignis (Typ 3 oder Typ 4) wahrscheinlicher ist. Wenn keine Verlängerung zwischen
den Zeitpunkten tK und Ω durchführbar ist, sind 3 Situationen zur Zeit tK möglich:
• Ein Ereignis Typ 3 tritt zur Zeit tK ein, was bedeutet, dass der Vertrag gekündigt wurde.
• Ein Ereignis Typ 4 tritt zur Zeit tK ein und kein weiteres Ereignis geschieht bis zum
Zeitpunkt Ω. Das würde bedeuten, dass der Versicherungsvertrag inaktiv ist.
• Ein Ereignis Typ 4 tritt zur Zeit tK ein und ein Ereignis Typ 3 geschieht zwischen der
Zeitdauer (tK , Ω), sodass der Versicherungsvertrag storniert ist.
Anstatt jede dieser Wahrscheinlichkeiten zu berechnen, ist es einfacher die Gegenwahrscheinlichkeit zu finden. Diese Gegenwahrscheinlichkeit entspricht einem Ereignis: ein Ereignis Typ 4
tritt zur Zeit tK auf, gefolgt von dem Hinzufügen eines Autos während des Zeitintervalls (tK , Ω).
Diese Wahrscheinlichkeit kann wie folgt berechnet werden:
P r(M (tK ) = 1, N (tK ) = 0|AS = 1)P r(Ψ1 < min(Ψ3 , Ω − tK ))
µ
λ
=
(1 − e−(γ+λ)(Ω−tK ) )
.
γ+µ
λ+γ
(4.5)
Dies entspricht dem Produkt von drei Wahrscheinlichkeiten: die Wahrscheinlichkeit, dass ein Ereignis Typ 4 zur Zeit tK auftritt, die Wahrscheinlichkeit, dass Ereignisse vom Typ 1 oder 3 vor
dem Zeitpunkt Ω eintreten und die Wahrscheinlichkeit, dass das letzte Ereignis das Hinzufügen
eines Fahrzeuges (Typ 1) ist. Es ist wichtig zu vermerken, dass diese Gleichung nur in Fällen ohne Möglichkeit auf Vertragsverlängerung verwendet werden sollte. Daher muss diese Gleichung
verallgemeinert werden, um jede Vertragsverlängerung in die Berechnung der Wahrscheinlichkeit, in dem unbekannten Zustand zu bleiben, einzugliedern. Um dies zu tun, ist es erforderlich
die Wahrscheinlichkeit des Hinzufügens eines Autos bezüglich jedes Jahres aufzuteilen.
Zuerst müssen jedoch einige Elemente im Detail erklärt werden. Es ist zu bemerken, dass
der Zeitpunkt tK , indem der Status des Versicherten unbekannt wird, nicht unbedingt dem
Zeitpunkt, indem es möglich ist, den Vertrag zu verlängern, entspricht. Das bedeutet, dass die
Zeitperiode vor der ersten Verlängerung und die letzte Zeitperiode vor Ω weniger als ein Jahr
betragen.
Daraus folgt, falls es zumindest eine Vertragsverlängerung in der unbekannten Periode Ω−tK
gibt, ist 1 − {tK } eine Möglichkeit, den unbekannten Zeitabschnitt des Jahres vor der ersten
Verlängerung auszudrücken. Hierbei ist {·} die Funktion, die die Nachkommastellen ausgibt.
13
Ebenso kann der Zeitabschnitt des Jahres vor Ω geschrieben werden als {Ω} und die gesamte
Anzahl der Vertragsverlängerungen in der unbekannten Periode ist bΩc − btK c = R. Damit
erhalten wir folgende Gleichung:
P r(Ψ1 < min(Ψ3 , 1 − {tK }))
{z
}
|
vor erster V erlängerung nach tK
+ P r(min(Ψ3 , Ψ1 , Ψ4 ) > 1 − {tK }) × P r(Ψ1 < min(Ψ3 , 2 − {tK })|min(Ψ3 , Ψ4 , Ψ1 ) > 1 − {tK })
|
{z
}
zwischen erster und zweiter V erlängerung nach tK
+ ···
Diese Gleichung kann als Summe vieler Möglichkeiten, die zwischen jeder Vertragsverlängerung
geschehen können, verstanden werden. Das erste Element ist einfach die Wahrscheinlichkeit,
dass ein Ereignis Typ 1 vor der ersten Vertragsverlängerung nach tK eintritt. Die zweite Komponente der Summe ist also die Wahrscheinlichkeit, dass ein Ereignis Typ 1 auftritt, dieses Mal
aber zwischen der ersten und der zweiten Vertragsverlängerung nach tK . In diesem Fall muss
sich in der Wahrscheinlichkeit widerspiegeln, dass der Vertrag bei der ersten Möglichkeit zur
Verlängerung nach tK auch verlängert wurde. Alle anderen Situationen zwischen den potentiellen Vertragsverlängerungen j und j + 1, für j = 3, ... müssen auch dazugerechnet werden, sodass
gilt:
=
×
+
=
×
P r(Ψ1 < min(Ψ3 , Ψ4 , Ω − tK )|R ≥ 1)
λ λ −(γ+λ)(1−{tK })
1 − e−(γ+λ)(1−{tK }) +
e
γ+λ
γ+λ
p 1 − e−(γ+λ) + · · ·
λ −(γ+λ)(R−{tK }) R e
p 1 − e−(γ+λ){Ω}
γ+λ
λ
1 − e−(γ+λ)(1−{tK }) + e−(γ+λ)(1−{tK }) p 1 − e−(γ+λ)
γ+λ
R−1
1 − pe−(γ+λ)
−(γ+λ){Ω}
−(γ+λ)(R−{tK }) R
,
+e
p 1−e
1 − pe−(γ+λ)
wobei eine Vereinfachung aufgrund der Eigenschaften der geometrischen Reihe gemacht wurde.
Die Fälle R = 0 und R > 0 können zu folgendem kombiniert werden
P r(Ψ1 < min(Ψ3 , Ψ4 , Ω − tK ))P r(M (tK ) = 1, N (tK ) = 0|AS = 1)
µ
λ
=
1{R=0} 1 − e−(γ+λ)(Ω−tK )
γ+µγ+λ
+ 1{R≥1} 1 − e−(γ+λ)(1−{tK })
1 − pe−(γ+λ) R−1
+ e
p 1−e
1 − pe−(γ+λ)
−(γ+λ)(R−{tK }) R
−(γ+λ){Ω}
+ e
p 1−e
≡ G(tK , Ω).
−(γ+λ)(1−{tK })
−(γ+λ)
Im Fall das p = 1 ist, ist die Lösung gegeben durch Gleichung (4.5). Somit wurde die gesuchte
Gegenwahrscheinlichkeit berechnet.
14
Zur Verbesserung des Modells, um die Situationen, in denen es schwer ist, zwischen inaktiven und stornierten Versicherungspolicen zu unterscheiden, einzubeziehen, wird die LikelihoodFunktion angepasst, indem der Term 1 − G(tK , Ω) hinzugefügt wird:
L(λ, γ, µ, p) ∝ e−(λ+γ)T e−µV λE µS
∗
× γ A (1 − p)Q pbT c−Q [(µ + γ)(1 − G)]A ,
wobei A∗ = 1, falls der Versicherte im unbekannten Zustand ist. Unter Verwendung des Logarithmus dieser Funktion und durch das Summieren aller Haushalte eines gegebenen Portfolios,
wird es möglich die vier Parameter λ, γ, µ und p zu schätzen.
4.3
Nummerische Anwendung
Das Modell bezieht sich auf den Versicherungsdatensatz beschrieben in Kapitel 1.2 und die 4
geschätzten Parameter sind in Tabelle 4.1 angeführt. Der Wert λ̂ bedeutet, dass im Durchschnitt alle 0, 07303−1 = 13, 69 Jahre ein Fahrzeug zu dem Vertrag hinzugefügt wird. Der Wert
µ̂ steht dafür, dass ein Auto durchschnittlich 0, 08277−1 = 12, 08 Jahre im Vertrag versichert
ist. Zu bemerken ist, dass die Rate der hinzugefügten Fahrzeuge nicht die der entfernten Autos
ausgleicht, da λ̂ < µ̂. Erwähnenswert ist auch, dass die jährliche Vertragsverlängerungsrate bei
92% und die Wahrscheinlichkeit der Stornierung ungefähr bei 4% liegt. Für den Versicherer
ausgewertet bedeutet das, dass bei der Aufnahme neuer Versicherungsnehmer langfristige Rentabilität sichergestellt werden sollte.
Tabelle 4.1
Geschätzte Parameter (Standardfehler)
Hinzufügen λ
Stornierung γ
Entfernung µ
0,0730 (0,0003) 0,0400 (0,0003) 0,0828 (0,0003)
4.3.1
Verlängerung p
0,9179 (0,0003)
Kovariaten
Manche Haushaltsprofile neigen eher dazu, Fahrzeuge zum Versicherungsvertrag hinzuzufügen,
andere eher dazu, Fahrzeuge zu entfernen. Ebenso gibt es Profile, die eher stornieren als andere,
und verschiedene Typen von Versicherungsnehmern haben auch eine höhere beziehungsweise
niedrigere Verlängerungsrate. Deshalb scheint das Hinzufügen von Kovariaten zu jedem Parameter des Warteschlangenprozesses gerechtfertigt.
In Tabelle 4.2 sind die Kovariaten, die den Vektor Xi zu jedem Haushalt definieren, angegeben. Die Gültigkeitsdaten der Versicherungsverträge werden verwendet, um die Stabilität der
Haushalte, die sich im Juli versichern lassen, zu zeigen. Auch wenn sich die Merkmale eines
Haushaltes während des Jahres verändern können, werden nur die Merkmale, die im ersten
Vertrag beobachtet werden, betrachtet. Es wird davon ausgegangen, dass der Effekt minimal
ist, da die Zeitspanne des Datensatzes recht kurz ist und die meisten Haushalte ihre Risiko
Charakteristiken nicht während des Jahres verändern.
Eine Linkfunktion g(Xi β) ist dann versehen mit jedem Parameter, wobei β der zu schätzende
Parametervektor ist. In diesem Modell soll für die Parameter λ, γ, µ ∈ R+ gelten, weshalb eine
logarithmische Linkfunktion gewählt wird, da diese gewährleistet, dass die Parameter immer positiv sind. Außerdem muss der Parameter, der die Verlängerungswahrscheinlichkeit beschreibt,
exp(X β )
p ∈ [0, 1] erfüllen, weshalb der Logit-Link verwendet wird, das heißt pi = 1+exp(Xi i βp ) . Die
p
geschätzten Werte des Parametervektors β sind in Tabelle 4.3 angeführt.
15
Das Ziel eines Versicherers sollte das Maximieren der Anzahl der versicherten Autos zur Zeit
t sein. In diesem Fall wird nach hohen Werten der Parameter λ und p, kombiniert mit niedrigen
Werten für µ und γ gesucht. Die Ergebnisse lassen vermuten, dass manche Kovariaten, wie der
Familienstand oder X6 (Versicherte mit Gültigkeitsdatum am 1. Juli), einen großen Einfluss
haben. Zusätzlich liefern Versicherungsnehmer, die ihren Vertrag am ersten Tag eines Monates
verlängern, erhöhte Stabilität. Die Kovariate X4, die für Versicherte, die weniger als 9 Jahre
bei dem Unternehmen versichert sind, steht, zeigt höhere Loyalität zum Versicherungsunternehmen. Um zu testen, ob die erklärenden Variablen auch statistisch signifikant sind, wurde ein
Wald-Test mit einem Konfidenzintervall von 95% zu jedem der Parameter durchgeführt. Daraus
folgt, dass β5 nicht in β λ , β γ und β µ enthalten ist und β2 nicht in β γ .
Tabelle 4.2
Binäre Variablen, die die verfügbaren Informationen eines Haushaltes zusammenfassen
Variable Beschreibung
X1
Gibt 1 aus, falls der Haushalt aus dem allgemeinen Markt kommt
(entgegengesetzt der Gruppenversicherung)
X2
Gibt 1 aus, falls der Haushalt zumindest ein gemietetes Auto besitzt
X3
Gibt 1 aus, falls die Versicherten nicht verheiratet sind
X4
Gibt 1 aus, falls der Haushalt weniger als 9 Jahre bei diesem
Unternehmen versichert ist
X5
Gibt 1 aus, falls das Gültigkeitsdatum des Vertrages zwischen
Januar und Juli liegt
X6
Gibt 1 aus, falls das Gültigkeitsdatum des Vertrages im Juli liegt
X7
Gibt 1 aus, falls das Gültigkeitsdatum des Vertrages am ersten
Tag eines Monats liegt
Tabelle 4.3
Geschätzte Parameter für den
Parameter βλ
β0
-2,494 (0,015)
β1
-0,264 (0,009)
β2
-0,142 (0,011)
β3
-0,454 (0,009)
β4
0,201 (0,014)
β5
β6
-0,098 (0,012)
β7
-0,129 (0,009)
5
Prozess mit Kovariaten
βγ
βµ
-3,709 (0,039) -2,726
-0,070 (0,019) 0,122
-0,048
0,214 (0,018) 0,410
0,677 (0,038) 0,130
-0,181 (0,029)
-0,647 (0,021)
(0,014)
(0,009)
(0,011)
(0,008)
(0,013)
-0,034 (0,012)
-0,129 (0,009)
βp
2,769
-0,152
0,092
-0,246
-0,399
0,137
0,400
0,089
(0,019)
(0,010)
(0,013)
(0,009)
(0,017)
(0,009)
(0,016)
(0,010)
Analyse
In diesem Kapitel werden Anwendungen, die die geschätzten Parameter aus dem vorherigen
Kapitel (angeführt in Tabelle 4.3) verwenden, gezeigt. Obwohl im Folgenden mit den Parametern
λ̂, γ̂, µ̂ und p̂ gearbeitet wird, wird der Einfachheit halber die Notation λ, γ, µ und p verwendet.
Es wurden 5 Profile ausgewählt, um zu zeigen, welche Auswirkungen die Marktsegmentierung hat. Von 96 Profilen werden nur einige typische Versicherungsnehmer verwendet, um die
Ergebnisse dieser Analyse zu zeigen. Das erste ausgewählte Profil E ist die beste Art eines
Haushaltes bezüglich erwarteter versicherter Autos und das schlechteste Profil wird mit Haushalt A bezeichnet. Zur Veranschaulichung werden auch 3 durchschnittliche Typen (B, C, D)
16
betrachtet. Tabelle 5.1 stellt jedes Profil bezüglich seiner Kovariaten dar. Es ist festzustellen,
dass der einzige Unterschied zwischen Haushalt Typ B und D im Familienstand liegt. An den
Ergebnissen, gezeigt in Tabelle 4.3, kann erkannt werden, dass diese Kovariate einen erheblichen
Einfluss auf die Parameter des Modells hat. In Tabelle 5.2 sind die Werte der Parameter λ, γ,
µ und p für jedes Profil aufgelistet.
Tabelle 5.1
Kovariaten jedes Profils
Parameter
X1 X2 X3
Haushalt A 1
0
1
Haushalt B
1
1
1
Haushalt C
0
0
1
Haushalt D 1
1
0
Haushalt E
0
1
0
X4
1
0
0
0
0
Tabelle 5.2
Parameterwerte jedes Profils
Parameter
λ
γ
Haushalt A 0,0492 0,0557
Haushalt B 0,0349 0,0283
Haushalt C 0,0460 0,0159
Haushalt D 0,0550 0,0228
Haushalt E 0,0570 0,0107
5.1
X5
0
0
0
0
0
µ
0,1270
0,1063
0,0868
0,0705
0,0530
X6
0
0
0
0
1
X7
0
0
1
0
1
p
0,87795
0,92154
0,93163
0,93756
0,96608
Erwartete Anzahl versicherter Autos
Mithilfe der wahrscheinlichkeitserzeugenden Funktion des kompletten Prozesses, die in Kapitel 3.1.1 gezeigt wurde, können interessante Eigenschaften gefunden werden. Um Notationen
und Berechnungen zu vereinfachen, wird die Variable H(t) verwendet, um die Anzahl der versicherten Fahrzeuge eines aktiven oder inaktiven Versicherungsnehmers
darzustellen. Es gilt
n
H(t) = M (t) × N (t). Mit dem Wissen, dass P r(X = n) = d Pdz(z=0)
gilt,
ist es möglich die
n
erwartete Anzahl der versicherten Autos H(t) mithilfe des Folgenden zu berechnen:
E[H(t)] =
∞
∂PN (t),M (t) (z = 1, y = 1, t) X
(1)
=
ipi 1i−1 1.
∂z
i=0
Der erwartete Wert für diesen Prozess wird unter Verwendung von Gleichung (3.3) berechnet.
Zuerst wird nach z abgeleitet:
∂PN (t),M (t) (z,t)
∂z
h
a (z−1)(1−e−µt ) λ i
µ
∂ 1 − e−γt pbtc 1 − (z − 1)e−µt + 1 ye
=
=
×
∂z
a−1 (z−1)(1−e−µt ) λ
µ
e p
(z − 1)e
+1
ye
h
i
λ
ae−µt + (z − 1)e−µt + 1 1 − e−µt
.
µ
−γt btc
−µt
17
Nun wird z = 1 und y = 1 gesetzt, um den erwarteten Wert zu erhalten:
E[H(t)] =
∂PH(t) (z = 1, t)
∂z
= e
−γt btc
p
ae
−µt
−µt
+ 1−e
λ
µ
.
Mit ähnlichen Rechnungen können auch andere Momente der Verteilung gefunden werden, wie
zum Beispiel die Varianz oder auch höhere Momente. Diese Berechnungen können auch auf
alle anderen wahrscheinlichkeitserzeugende Funktionen, die in dieser Arbeit vorgekommen sind,
angewandt werden.
Für jedes Profil wurde die erwartete Anzahl der versicherten Autos berechnet. Die Ergebnisfunktion ist in Abb. 5.1 dargestellt. Für die Illustration wurde der Wert c = 0 gesetzt, was
bedeutet, dass die Versicherungsnehmer am Beginn ihres Vertrages sind und in einem Jahr
die nächste Möglichkeit zur Verlängerung der Police besteht. In der Darstellung kann sehr gut
der Stoß zu jedem Vertragsverlängerungszeitpunkt, der durch den Parameter p erzeugt wird, erkannt werden. In Tabelle 5.3 sind die numerischen Werte der erwarteten Anzahl der versicherten
Fahrzeuge nach 5 Jahren, gleich nach der Vertragsverlängerung abzulesen. Es ist festzustellen,
dass die ursprüngliche Anzahl der versicherten Autos den erwarteten Wert linear erhöhen.
Die Ergebnisse weisen auf einen großen Unterschied zwischen den Profilen hin, wobei es
zum Beispiel scheint, als ob Haushalt E viel vorteilhafter für den Versicherer ist als Haushalt
A. Daraus folgt, dass ein Versicherungsunternehmen seinen Marketingaufwand an bestimmte
Typen von Versicherungsnehmer anpassen sollte, in diesem Fall an Haushalte vom Typ E anstatt
an welche vom Typ A. Außerdem sollten Versicherer manchen versicherten Profilen, die geringere
administrative Kosten verursachen, eine Ermäßigung anbieten, da sie dann länger bei dem
Unternehmen bleiben.
Abbildung 5.1: Erwartete Anzahl versicherter Autos zum Zeitpunkt t
18
Tabelle 5.3
Erwartete Anzahl versicherter Autos nach 5
Ursprüngliche Anzahl der 1
2
versicherten Autos (a)
Haushalt A
0,281 0,490
Haushalt B
0,417 0,756
Haushalt C
0,541 0,961
Haushalt D
0,604 1,058
Haushalt E
0,812 1,424
5.2
Jahren
3
4
0,700
1,096
1,381
1,513
2,036
0,909
1,435
1,801
1,967
2,648
Diskontiertes Risikopotential
Der diskontierte Geldwert eines Haushaltes kann gefunden werden, indem der derzeitige Wert
von Cash Flows der Zukunft berechnet wird. Das Ergebnis wird im Marketing Kundenertragswert (CLV) genannt.
In diesem Fall wird angenommen, dass das Versicherungsunternehmen einen Profit von $1
für jede, ein Jahr dauernde Beobachtung eines Autos macht. Diese Annahme kann ganz einfach
zu einer realistischeren abgeändert werden. Auch der Diskontierungssatz δ ist vorgegeben. Um
den Kundenertragswert zu berechnen, ist es notwendig den derzeitigen Wert einer zukünftigen
Exposition bis zur Zeit T , unter Verwendung eines kontinuierlichen Diskontierungssatzes δ,
auszurechnen. Der Kundenertragswert wird mit ωT bezeichnet und kann berechnet werden,
indem die Variable H(t) mit Hilfe der Riemann Summe integriert wird:
Z
T
−δt
H(t)e
ωT =
0
n
δiT
T X
iT
dt = lim
H
e− n ,
n→∞ n
n
(5.1)
i=1
Der erwartete Wert kann einfach herausgefunden werden:
n
δiT
T X
iT
E(ωT ) = lim
e− n
E H
n→∞ n
n
i=1
Z T
=
E(H(t))e−δt dt.
0
In Tabelle 5.4 sind die erwarteten Werte jedes Haushaltes abzulesen, unter der Annahme, dass
der Haushalt zum Zeitpunkt t = 0 zwei Autos versichert hat. Auf lange Zeit werden die Unterschiede zwischen den Haushaltsprofilen sichtbar. Haushalt E ist nach 20 Jahren durchschnittlich
2,5 mal profitabler als Haushalt A.
In der Marketing Literatur ist es eher unüblich, den Kundenertragswert für große Zeithorizonte zu berechnen. Trotzdem ist es in diesem Fall nützlich, dieses Resultat auszurechnen,
da es einem erlaubt, einfache Gleichungen zu erhalten. Mit Gleichung (5.1) ist es möglich, den
gesamten Profit auszurechnen, indem man T gegen unendlich gehen lässt. Dieser Wert wird als
ω ≡ limT →∞ ωT definiert.
19
Sein Erwartungswert wird folgendermaßen berechnet:
Z ∞
E(H(t))e−δt dt
E(ω) =
0
Z ∞
−µt
−µt λ
−(γ+δ)t btc
ae
+ 1−e
=
e
p
dt
µ
0
∞ Z i+1
X
λ
dt
=
e−(γ+δ)t pi ae−µt + 1 − e−µt
µ
i
i=0
∞
X
e−i(γ+δ+µ) − e−(i+1)(γ+δ+µ) i
=
a
p
γ+δ+µ
i=0
e−i(γ+δ) − e−(i+1)(γ+δ) λ i
p
+
(γ + δ)µ
e−i(γ+δ+µ) − e−(i+1)(γ+δ+µ) λ i
−
p
(γ + δ + µ)µ
1 − e−(γ+δ+µ) a − µλ
=
(γ + δ + µ) 1 − e−(γ+δ+µ) p
1 − e−(γ+δ) λ
,
+
(γ + δ)µ 1 − e−(γ+δ) p
Hierbei ist a die Anzahl der versicherten Autos zum Zeitpunkt t = 0. Die numerischen Ergebnisse, die in Tabelle 5.5 aufgelistet sind, zeigen einen großen Unterschied zwischen dem besten
und dem schlechtesten Haushalt. Demzufolge sollte ein Versicherungsunternehmen die Versicherungsnehmer anvisieren, die die Kovariaten wie Haushalt E haben. Diese Analyse basiert auf
einem $1 Profit pro Haushalt. Dies kann durch einen Profit, proportional zur Prämie verallgemeinert werden. Außerdem kann unter Verwendung dieses Modells und eines Wirtschaftsmodells
zur Preiselastizität die Prämie als Funktion von zukünftigen Profiten dargestellt werden.
Tabelle 5.4
Kundenertragswert von
2% Diskontierungssatz
Anzahl der Jahre (T)
Haushalt A
Haushalt B
Haushalt C
Haushalt D
Haushalt E
Haushalten mit zwei versicherten Fahrzeugen zur Zeit t = 0, mit einem
1
1,833
1,869
1,904
1,917
1,946
5
5,468
6,359
7,003
7,286
8,218
10
6,720
8,581
10,104
10,823
13,553
Tabelle 5.5
Kundenertragswert, mit 2% Diskontierungssatz
Anzahl der versicherten Autos 1
2
zur Zeit t = 0, (a)
Haushalt A
3,964
7,161
Haushalt B
5,588
9,992
Haushalt C
7,661
13,011
Haushalt D
8,782
14,586
Haushalt E
16,130 24,735
20
7,122
9,731
12,237
13,506
19,433
3
4
10,358
14,395
18,361
20,390
33,340
13,555
18,799
23,711
26,194
41,945
Hierbei wurde eine Approximation mit der Kovariate X4, die fixiert wurde, obwohl sie sich
20
eigentlich über die Zeit verändern sollte, durchgeführt. Diese Approximation bezieht sich nur
auf den Haushalt A.
6
Diskussion
Wie schon zuvor erwähnt, deuten die numerischen Ergebnisse dieser empirischen Untersuchung
darauf hin, dass ein Versicherer sich manchen Haushalten mehr widmen sollte als anderen. Es
ist jedoch wichtig, sich in Erinnerung zu behalten, dass die getroffenen Schlussfolgerungen auf
einigen Annahmen bezüglich des Modells basieren.
In dem vorigen Kapitel dieser Arbeit wurde schon festgestellt, dass die Annahme über die
Profitkomponente der Prämie verallgemeinert werden sollte, um realistischer zu sein. Auch andere Veränderungen sind möglich. Die erklärenden Variablen sollten etwas dynamischer sein,
um die Veränderungen eines Haushaltes während der Zeit wiederzugeben. Zum Beispiel sollte sich logischerweise die Kovariate, die die versicherte Zeit bei dem Unternehmen modelliert
(X4), über das Jahr verändern. Auch der Schadensverlauf könnte zum Modell hinzufügt werden.
Dadurch würde sich die Anpassung des Modells verbessern, vor allem Parameter p, die Vertragsverlängerungsrate. Intuitiv lässt sich vermuten, dass das Verhalten eines Versicherungsnehmers
nicht das gleiche ist, nachdem er eine Schadenforderung während des Jahres eingereicht hat.
Diese Verhaltensveränderung wäre wahrscheinlich verbunden mit der Erhöhung der Prämie.
In so einer Verallgemeinerung des Modells könnte auch ein System von Erfahrungstarifierung
(zum Beispiel das Bonus-Malus-System) eingeführt werden. Das Hunger nach Bonus Phänomen
sollte auch hinzugefügt werden, um ein nützlicheres Modell und einen realistischeren Ansatz zu
erhalten.
Andere interessante Verallgemeinerungen des Modells sind auch noch möglich. Es sollte eine
Abhängigkeit zwischen den vier Prozessen des Modells in zukünftigen Modellierungen eingefügt
werden. Zum Beispiel wirkt eine Abhängigkeit zwischen der Kündigungsrate und dem Datum
der Vertragsverlängerung logisch. Ein Versicherungsnehmer der über die Preise am Versicherungsmarkt informiert ist, sollte eine höhere Wahrscheinlichkeit haben, das Versicherungsunternehmen während der Versicherungsdauer und am Vertragsverlängerungszeitpunkt zu verlassen.
Ebenfalls scheint es naheliegend, dass ein Versicherter, der ein neues Auto zum Versicherungsvertrag hinzufügen lässt, eher dazu neigt, ein Fahrzeug aus dem Vertrag zu entfernen. Noch
allgemeiner sollte ein Versicherungsnehmer, der viele neue Autos versichern lässt, auch viele
Autos wieder aus dem Vertrag nehmen. Auch andere Arten von Abhängigkeit zwischen den
Prozessen sind möglich. Jedoch sollte das Hinzufügen von Kovariaten in das Modell die Auswirkung solcher Abhängigkeiten verringern, auch wenn die Struktur der Abhängigkeit offensichtlich
ist.
Auch wenn das Einbinden von Abhängigkeit zwischen den Prozessen eine interessante Verallgemeinerung des Modells sein kann, sind die einfacheren Generalisierungen wahrscheinlich
trotzdem nützlicher. Zum Beispiel sollte das Verwenden von anderen Wartezeitverteilungen zur
Modellierung des Prozesses erwägt werden (Gamma statt der Exponentialverteilung zum Beispiel). Die Anwendung des in dieser Arbeit vorgestellten Modells in anderen Branchen (wie
Gruppenversicherung oder Hausversicherung) ist ebenfalls ein interessanter Zugang. Auch das
Vermischen mehrerer Brachen kann betrachtet werden.
21
7
Fazit
Das Ziel war die Anzahl der versicherten Fahrzeuge für jeden Haushalt zu modellieren. Beginnend mit einem Poisson-Prozess ist es möglich, mehrere Typen von Warteschlangenmodellen zu
verallgemeinern. Das Modell das in dieser Arbeit vorgestellt wurde, kann als Generalisierung
des M/M/∞ Prozesses gesehen werden. Es wurde ein neuer Todeszustand zum System hinzugefügt, der die Möglichkeit der Stornierung oder des Nicht-Verlängerns eines Vertrages darstellt.
Aufgrund der empirischen Daten ist zu erkennen, dass zwischen einer gekündigten Police und
einem inaktiven Vertrag unterschieden werden sollte.
Dieses neue Modell benötigt vier Parameter: einen Parameter, der die Aufnahmerate von
Autos in den Versicherungsvertrag modelliert, einen zweiten, der die Entfernungsrate versicherter Fahrzeuge darstellt, einen dritten der die Kündigungsrate der Police modelliert, und
zuletzt einen Parameter zur Modellierung der Vertragsverlängerungsrate. Mittels statistischer
Methoden ist es möglich diese Parameter zu schätzen, indem die Eigenschaften der Exponentialverteilung verwendet und die möglichen Ereignisse aufbereitet werden. Da hier mit zensierten
Daten gearbeitet wurde, ist ein Weg zur Schätzung der Parameter, für den Fall, dass nicht
zwischen dem inaktiven und dem stornierten Versicherungsvertrag unterschieden werden kann,
entwickelt worden.
Es wurde auch versucht, dieses neue Warteschlangensystem zu verallgemeinern, indem erklärende Variablen zu jedem der vier Parameter hinzugefügt wurden. Dann war es möglich
herauszufinden, welche Profile von Vertragsinhabern eher dazu neigen, Fahrzeuge zum Vertrag
hinzuzufügen oder zu entfernen, ihn zu kündigen oder die Police jährlich zu verlängern. Die
erhaltenen geschätzten Parameter halfen das Versicherungsportfolio im Detail zu analysieren,
da mehrere Arten von Statistiken, die für Versicherer nützlich sein können, entwickelt wurden,
wie die erwartete Anzahl versicherter Autos oder der Kundenertragswert, der die zukünftigen
Profite verbunden mit einem Versicherten berechnet.
Dieses Modell dürfte eine gute Approximation der empirischen Daten sein und stellt einen
interessanten ersten Schritt in das Modellieren von Abgangszeiten in der Versicherung dar. Es
wäre wahrscheinlich angebracht, dieses Modell noch weiter zu verbessern, wobei bereits einige
Verallgemeinerungen durchgeführt wurden.
Weiter ist zu beachten, dass diese Analyse nur die Entwicklung der Haushalte, die bereits im
Portfolio sind, untersucht. Daher beinhaltet das Modell nicht das Hinzufügen weiterer Policen zu
dem Portfolio. Folglich nimmt die Anzahl der Haushalte im Portfolio mit der Zeit ab. Jedoch war
das eigentliche Ziel dieser Arbeit, die Veränderung der Anzahl der versicherten Fahrzeuge eines
konkreten Haushaltes sowie das Verhalten des Versicherten und den Einfluss der Eigenschaften
eines Haushaltes zu analysieren. Wenn ein Versicherungsunternehmen die Entwicklung seines
gesamten Portfolios analysieren will, sollte es das Hinzukommen neuer Haushalte miteinkalkulieren. Der Versicherer könnte demnach den Geldwert des Portfolios (auch Kundeneigenkapital)
analog zur Berechnung des Kundenertragswertes kalkulieren.
22
8
Literatur
Benes, V.E., 1957a. Fluctuations of telephone traffic. Bell Syst. Tech. J. 36, 965-973.
Benes, V.E., 1957b. A sufficient set of statistics for a simple telephone exchange model. Bell
Syst. Tech. J. 36, 939-964.
Boucher, Jean-Philippe; Couture-Piché, Guillaume. 2015. Modelling the number of insureds’
cars using queuing theory. Insurance: Mathematics and Economics 64 (2015) 67-76.
Löpker, Andreas. Frühjahrstrimester 2014. Warteschlangentheorie.
Hamburg: Helmut-Schmidt-Universität.
Newell, G., 1982. Applications of Queueing Theory. In: Monographs on Statistics and Applied
Probability , Chapman and Hall.
23