Modellieren der Anzahl der versicherten Autos mit Hilfe der

Modellieren der Anzahl der
versicherten Autos mit Hilfe der
Warteschlangentheorie
18. Februar 2016
Erstellt von
Lisa Maria Wanka
Inhaltsverzeichnis
1
Einführung
1.1 Definitionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2 Verwendete Daten und Notationen . . . . . . . . . . . . . . . . . . . . . . . . . .
2
2
3
2 Modellieren der Anzahl der Fahrzeuge
2.1 Hinzufügen und Wegnehmen von Fahrzeugen . . . . . . . . . . . . . . . . . . . .
2.2 Vertragsverlängerung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5
5
6
3 Modell mit einer Inaktivitätsphase
3.1 Modellierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.1.1 Hinzufügen eines Stoßes zum Verlängerungszeitpunkt . . . . . . . . . . . .
7
9
9
4 Statistischer Schluss
4.1 Vollständige Daten . . . . .
4.1.1 Notation . . . . . . .
4.1.2 Likelihood-Funktion
4.2 Unvollständige Daten . . .
4.2.1 Inaktiv vs. Storniert
4.3 Nummerische Anwendung .
4.3.1 Kovariaten . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
10
10
10
11
12
12
15
15
5 Analyse
16
5.1 Erwartete Anzahl versicherter Autos . . . . . . . . . . . . . . . . . . . . . . . . . 17
5.2 Diskontiertes Risikopotential . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
6 Diskussion
21
7 Fazit
22
8 Literatur
23
1
1
Einführung
Das Ziel dieser Arbeit ist die Modellierung der Anzahl der versicherten Autos pro Haushalt. Hierfür wird die Warteschlangentheorie verwendet. Dazu werden vier verschiedene Parameter benötigt, wobei der erste das Hinzufügen von Fahrzeugen in den Versicherungsvertrag modelliert. Der zweite Parameter beschreibt die Wegfallrate von bereits versicherten Autos und der dritte stellt die Kündigungsrate von Versicherungspolicen dar. Da ein Versicherungsvertrag jährlich verlängert werden kann, wird der letzte Parameter dazu verwendet, die
Verlängerungsrate zu modellieren. Mittels statistischer Methoden können diese vier Parameter
geschätzt werden, auch wenn nur zensierte Daten vorliegen.
Der Warteschlangenprozess kann verallgemeinert werden, indem Kovariaten, die die Eigenschaften eines Haushaltes enthalten, zu jedem der Parameter des Modells hinzugefügt werden.
Damit kann vorhergesagt werden, welche Versicherungsnehmer eher dazu neigen, weitere Fahrzeuge zu der Versicherung hinzuzufügen oder zu entfernen, beziehungsweise welche ihren Vertrag
wahrscheinlich kündigen oder jährlich verlängern werden. Die geschätzten Parameter helfen den
Versicherungsbestand genau zu analysieren, da mittels der Warteschlangentheorie verschiedene Arten von Statistiken, die für den Versicherer brauchbar sind, berechnet werden können.
Bespiele dafür sind die erwartete Anzahl von versicherten Autos oder der Kundenertragswert
(engl. customer lifetime value; CLV).
Der Begriff Kundenertragswert kommt aus dem Marketing und erlaubt das Auswählen und
Anvisieren von Langzeitkunden. Diesen Wert, der in den letzten Jahren für die Versicherungswissenschaft immer wichtiger geworden ist, kann der Versicherer für jeden Versicherten bestimmen.
Berechnet wird der Kundenertragswert indem alle zukünftigen Profite eines Versicherten diskontiert werden. Seine Verwendung im Gebiet der Versicherung ist noch sehr neu, wahrscheinlich
aufgrund der Komplexität der Versicherungswissenschaft.
Im zweiten Kapitel wird die Anzahl versicherter Fahrzeuge modelliert. Das beinhaltet das
Bearbeiten eines Modells für das Hinzufügen neuer Fahrzeuge und das Modellieren des Entfernens von Autos aus einem bestehenden Versicherungsvertrag. Ein dritter Prozess, der die
Verlängerung von Verträgen beschreiben soll, wird ebenfalls zu dem Modell hinzugefügt. Später
wird dieses Modell noch verallgemeinert, um die Möglichkeit der Kündigung eines Vertrages
miteinzubeziehen.
Auch der Fall einer Inaktivitätsphase des Vertrages wird im dritten Kapitel berücksichtigt
und in das Modell miteinkalkuliert.
Eine Methode zur Schätzung der Parameter aus vollständigen und zensierten Datensätzen
wird im vierten Abschnitt erläutert und eine Verallgemeinerung, durch Hinzufügen von einigen
erklärenden Variablen zu jedem der Parameter des Modells, wird durchgeführt.
Im fünften Kapitel wird das zuvor erarbeitete Modell angewandt und zur Berechnung verschiedener nützlicher statistischer Daten, wie die erwartete Anzahl versicherter Fahrzeuge oder
der Kundenertragswert, verwendet. Hierfür werden Informationen, die auf einem Portfolio eines
kanadischen Versicherungsunternehmens basieren, herangezogen.
Weitere mögliche Verallgemeinerungen dieses Modells werden im sechsten Kapitel diskutiert
und im siebten Abschnitt wird das Ergebnis dieser Abhandlung erläutert.
1.1
Definitionen
Der Begriff Haushalt bezeichnet einen einzigen Kunden, den Versicherten. Dieser Haushalt kann
mehrere Mitglieder (beziehungsweise Fahrer) und mehrere Autos gesammelt in einem Versicherungsvertrag, der jährlich verlängert werden kann, beinhalten. Der Vertrag ist das Dokument,
das einen Versicherer an den versicherten Haushalt bindet.
2
In dieser Arbeit konzentrieren wir uns auf die Anzahl der Autos, die von dem Vertrag erfasst
werden und zu einem Haushalt gehören. Darüber hinaus werden auch hinzugefügte und entfernte Autos eines Versicherungsvertrags analysiert. Während des Versicherungsschutzes kann ein
Haushalt sich jederzeit entscheiden, den Vertrag zu kündigen, wobei in diesem Fall alle versicherten Autos sofort gekündigt werden. Dieser Vorgang wird als Vertragsbruch oder Stornierung
bezeichnet.
1.2
Verwendete Daten und Notationen
Die Warteschlangentheorie basiert auf den verschiedenen Wartezeiten, bevor sich etwas an der
Anzahl der versicherten Fahrzeuge ändert. Hierfür werden empirische Analysen, gewonnen aus
der Datenbank eines kanadischen Autoversicherungsunternehmens, verwendet. Diese Datenbank
beinhaltet allgemeine Versicherungsinformationen von 322.174 Haushalten im Zeitraum 20032007. Zu beachten ist, dass aufgrund der kurzen Zeitperiode die Daten zensiert sind. Zu jedem
der Haushalte liegen Informationen zu jedem seiner versicherten Fahrzeuge vor. Auch über neue
oder gekündigte Verträge, Vertragsverlängerungen, hinzugefügte oder entfernte Autos gibt es
Daten. Im Kapitel 4.3 werden die Datenbank im Detail analysiert und die Versicherungsinformationen genauer beschrieben, besonders die Merkmale der einzelnen Policen.
Es liegt eine graphische Analyse der Wartezeiten, die in diesem Modell involviert sind,
vor: In Abb. 1.1 wird die Verteilung der Lebensdauer eines Versicherungsvertrags (in Jahren)
dargestellt. Mit der Lebensdauer eines Versicherungsvertrags ist die Zeit zwischen dem Inkrafttreten und der Kündigung oder dem nicht Verlängern des Vertrages gemeint. Um mögliche
Verzerrungen zu vermeiden, betrachten wir im ersten der drei Graphen nur Policen, die im
Zeitraum von 2003-2007 ausgestellt und gekündigt wurden. Diese Auswahl ermöglicht es, die
Daten besser zu verstehen. In dieser Darstellung kann ein großer Ausschlag an jedem Vertragsverlängerungszeitpunkt erkannt werden. Abgesehen von diesen Sprüngen, wird ein exponentielles Abklingen der Werte beobachtet. Anhand des Farbcodes kann festgestellt werden, dass
die meisten der wegfallenden Verträge nur ein Auto versichern. In Abb. 1.1 wird im zweiten
Graphen auch die Zeit, bevor ein Fahrzeug zu einem schon existierenden Versicherungsvertrag
hinzugefügt wird, beobachtet. Hierfür wurde der ganze Datensatz verwendet. Auch für die letzte der drei Illustrationen wurde die volle Datenmenge benutzt. Diese zeigt die Zeitdauer vor
dem Entfernen eines Autos aus dem Versicherungsvertrag, welcher aber trotz des Wegfalles eines Fahrzeugs aufrecht bleibt. Hier kann ebenfalls ein exponentielles Abklingen und Sprünge
zu den Versicherungsverlängerungszeitpunkten erkannt werden. Die Ausreißer sind jedoch im
letzten Graphen nicht so signifikant wie die in den anderen. Das Ziel dieses Projekts ist diese
Beobachtungen mathematisch zu approximieren.
Sei N (t) eine Zufallsvariable, die die Anzahl der Elemente zum Zeitpunkt t im Wartesystem
beschreibt. In diesem Fall ist die Anzahl der Elemente die Anzahl der versicherten Autos in
einem Haushalt. Die Wahrscheinlichkeitsfunktion der Anzahl der versicherten Autos wird ausgedrückt durch
P P r{N (t) = ii} = pi (t). Die wahrscheinlichkeitserzeugende Funktion wird durch
PN (t) (z, t) = ∞
i=0 pi (t) × z beschrieben und ihre Partielle Ableitung bezüglich t ist
∞
X
∂PN (t) (z, t)
dpi (t)
(z, t) =
× zi.
∂t
dt
i=0
Die bedingte Wahrscheinlichkeit wird dargestellt und bezeichnet durch p(j,i) (s, t) =
P r{N (t) = i|N (s) = j}.
3
Abbildung 1.1: 0 Lebensdauer eines Versicherungsvertrags, Zeit vor dem Hinzufügen und Zeit
vor dem Entfernen eines Fahrzeuges.
0
Alle Abbildungen, die in dieser Arbeit gezeigt werden, wurden dem folgenden Artikel entnommen: Boucher,
Jean-Philippe; Couture-Piché, Guillaume. 2015. Modelling the number of insureds’ cars using queuing theory.
Insurance: Mathematics and Economics 64 (2015) 67-76.
4
2
Modellieren der Anzahl der Fahrzeuge
In diesem Abschnitt wird gezeigt, wie die Warteschlangentheorie (basierend auf Newell (1982))
zum Bestimmen der Anzahl der versicherten Autos verwendet werden kann. Zuerst wird ein
Poisson-Prozess verwendet um das Hinzufügen eines neuen Autos zu modellieren, danach ein
weiterer, um das Wegfallen eines Autos aus dem Vertrag darzustellen. In diesem Teil wird es
weniger Details geben, da das Interpretieren der Ergebnisse nur grundlegendes Wissen über die
Warteschlangentheorie erfordert. Trotzdem wird mit dieser Einführung in die Warteschlangentheorie das Erklären einiger Komponenten, die in komplexen Modellen vorkommen (z.B. dritter
Abschnitt), ermöglicht.
2.1
Hinzufügen und Wegnehmen von Fahrzeugen
Abbildung 2.1: Graph eines Poisson-Prozesses
Im Poisson-Prozess (auch Geburtenprozess, dargestellt in Abb. 2.1) gibt es nur eine Komponente
(Geburtenkomponente), die durch den Parameter λ definiert ist. Die Chapman-Kolmogorov
Gleichung ist hier wie folgt definiert:
pi (t) =
∞
X
pj (s)p(j,i) (s, t),
f ür s < t.
j=0
Diese Gleichung wird so gedeutet, dass eine Wahrscheinlichkeit durch die Summe aller möglichen
Pfade dargestellt werden kann. Die Gleichung erfordert, dass wir die bedingten Wahrscheinlichkeiten (es gibt i Fahrzeuge zum Zeitpunkt t + 4t unter der Bedingung, dass es zum Zeitpunkt
t j Fahrzeuge gegeben hat) finden. Dies wird ausgedrückt durch:

λ4t + o(4t)
f ür j = i − 1,



1 − λ4t + o(4t) f ür j = i,
p(j,i) (t, t + 4t) =
o(4t)
f ür j < i − 1



0
sonst
wobei lim4t→0 o(4t)
4t = 0 gilt.
Für dieses erste Modell kann gezeigt werden, dass seine Wahrscheinlichkeitsfunktion so aussieht:
pi (t) =
e−λt (λt)i
,
i!
was die Darstellung der Poissonverteilung ist. Des weiteren bedeutet das, dass der Zählprozess
N (t) mit dem Parameter λt poissonverteilt ist.
5
Abbildung 2.2: Graph eines M/M/∞ Modells
Um ein Modell zu erhalten, das realistischer ist, wird eine weitere Komponente (Todeskomponente hinzugefügt (siehe Abb. 2.2). Die Todeskomponente soll unabhängig vom Geburtenprozess
sein. Das daraus entstehende Modell wird mit M/M/∞ gekennzeichnet. Die Zeit bis zum Hinzukommen eines neuen Elements ist exponentialverteilt. Diese Eigenschaft wird in der Notation
durch das erste M ausgedrückt und bedeutet ”Markov”. In diesem Modell verlässt jedes Element nach einer bestimmten Zeitperiode, die auch exponentialverteilt ist, das System wieder.
Dieser neue Prozess im Modell bezeichnet das zweite M . Das letzte Symbol ∞ bedeutet, dass
der Abgangsprozess (departure process) eines versicherten Autos beginnen kann, bevor der eines
anderen Fahrzeuges noch nicht beendet ist. In diesem Fall bedeutet das, dass unendlich viele
Autos gleichzeitig versichert werden können und es somit keine Warteschlangen gibt.
Demzufolge wird mit einem dynamischen Modell einer Population, welches mit der konstanten Rate λ wächst und mit der Rate iµ schrumpft, gearbeitet. Hierbei ist i die Anzahl der
Elemente der Population zu einer bestimmten Zeit. In diesem Kontext ist die Population die
Anzahl der Autos in einem Haushalt und daher werden die Fahrzeuge mit der Rate λ zu der
Versicherung hinzugefügt und mit der individuellen Rate µ entfernt. Für dieses Modell sind die
bedingten Wahrscheinlichkeiten:

λ4t + o(4t)
f ür j = i − 1,



1 − (λ + iµ)4t + o(4t) f ür j = i,
p(j,i) (t, t + 4t) =
(i + 1)µ4t + o(t)
f ür j = i + 1,



o(4t)
sonst.
Für dieses, aus der Warteschlangentheorie bekannte Modell, ist die Wahrscheinlichkeitsfunktion
beschrieben durch:
h
ii−k
−µt ) λ
min(i,a) e−(1−e
µ (1 − e−µt ) λ
X
µ
a
pi (t) =
e−µtk (1 − e−µt )a−k .
×
k
(i − k)!
k=0
Die wahrscheinlichkeitserzeugende Funktion wird dargestellt durch:
a λ (1−e−µt )(z−1)
PN (t) (z, t) = (z − 1)e−µt + 1 e µ
wobei N (0) = a gilt, was bedeutet, dass die ursprüngliche Anzahl der versicherten Autos (zum
Zeitpunkt 0) a ist.
2.2
Vertragsverlängerung
Es ist möglich, mehr Flexibilität in das Modell M/M/∞ zu bringen, indem der Todesprozess
verallgemeinert wird. Das bedeutet, dass das zweite M zu einem G, das für allgemeine Verteilung (engl. general distribution) steht, wird. Die geplante Verallgemeinerung erlaubt, die
Ausreißer zu den Vertragsverlängerungszeitpunkten in das Modell einzubauen. Wie in Abb.
6
1.1 empirisch gezeigt wird, ist die Wahrscheinlichkeit höher, dass ein Auto an dem jährlichen
Vertragsverlängerungszeitpunkt aus dem Vertrag entfernt wird.
Basierend auf Benes (1957) wird das Modell konstruiert, indem der Prozess in mehrere
Komponenten, die die Anzahl der Autos modellieren, separiert wird. Es kann voraussetzt werden, dass der Prozess N (t) durch N (t) = Z(t) − Y (t) ausgedrückt werden kann. Der Prozess
Z(t) zählt die hinzugefügten Autos bis zum Zeitpunkt t und der Prozess Y (t) zählt die Autos,
die bis zu einem Zeitpunkt t aus dem Versicherungsvertrag entfernt werden.
Für N (0) = 0 ist die Wahrscheinlichkeitsfunktion gegeben durch:
P r(N (t) = i) =
(λtqt )i e−qt λt
,
i!
die eine Poissonverteilung mit Parameter λtqt ist. Der Parameter qt kann als Überlebenswahrscheinlichkeit interpretiert werden und wird definiert durch:
Z t
S(x)
qt =
dx,
t
0
wobei S(·) die Überlebensfunktion der Servicezeit, was in diesem Fall die Zeit, seitdem das Auto
versichert ist, darstellt. Der Ausreißer, der zu jedem Vertragsverlängerungszeitpunkt auftritt,
kann unter Verwendung der folgenden Funktion eingebunden werden:
S(x) = e−µx pbxc ,
wobei x das Alter des Vertrages und p die Wahrscheinlichkeit, dass der Vertrag verlängert wird,
ist. Die Notation b·c bezeichnet hierbei die Abrundungsfunktion.
3
Modell mit einer Inaktivitätsphase
Es wäre interessant das Modell zu verallgemeinern, indem eine Kündigung des Vertrags hinzufügt wird, was bedeutet, dass alle Fahrzeuge eines Haushaltes gleichzeitig das Versicherungsunternehmen verlassen. Dieses Modell wird konstruiert, indem ein weiterer Poisson-Prozess
hinzufügt wird, der den Übergang von Level n ≥ 1 zu 0 mit der Rate γ erlaubt, was den
Effekt der Kündigung schafft. Abb. 3.1 illustriert dieses Modell. Dieser hinzugefügte Prozess
soll unabhängig von den anderen sein. Wenn dieses Modell genauer betrachtet wird, wird ein
konzeptionelles Problem bemerkt, da das Modell zulässt, dass ein Auto zu einem Vertrag hinzugefügt wird, obwohl in ihm eine Zeit lang kein Fahrzeug versichert war (Zustand 0). Diese
Situation ist nicht eingängig, da zu vermuten ist, dass ein Versicherungsvertrag ohne Autos
einem gekündigten Vertrag entspricht. In diesem Sinne ist der Zustand 0 absorbierend1 .
Die empirische Analyse der vorhandenen Daten führt zu einer etwas komplizierteren Lage. Tatsächlich kann es passieren, dass eine Versicherungspolice ohne ein versichertes Fahrzeug nicht
storniert wird. Das bedeutet, dass manchmal ein neues Auto zu einem existierenden Versicherungsvertrag ohne versicherte Fahrzeuge hinzugefügt wird. In dem verwendeten Datensatz ist
dies 1340 mal passiert und die durchschnittliche Zeitdauer des Stadiums 0 ist fast ein halbes
Jahr (0, 4789).
1
Ein Zustand i ∈ I ist absorbierend, wenn {i} eine abgeschlossene Klasse ist. Eine Kommunikationsklasse C ist
abgeschlossen, wenn aus i ∈ C und j erreichbar von i folgt j ∈ C. (Diese Definitionen wurden den Lehrunterlagen
zur Vorlesung Einführung in die Stochastischen Prozesse und Zeitreihen, die von Univ. Prof. Friedrich Hubalek
im Sommersemester 2015 an der Technischen Universität Wien gehalten wurde, entnommen.)
7
Das stellt eine Form der Inaktivität des Vertrages dar, was bedeutet, dass ein Vertrag durch
hinzufügen eines neuen Autos reaktiviert werden kann. Das ist in Situationen vorstellbar, bei
denen der Versicherungsschutz zeitweise deaktiviert werden kann oder die Existenz eines anderen Versicherungstyps, verbunden mit der Autoversicherung, die die komplette Stornierung
der Police verhindert. Aus diesen und weiteren Beispielen, kann der Zustand ohne versichertes
Fahrzeug nicht als absorbierend angenommen werden. Trotzdem muss ein absorbierender Zustand, repräsentierend für die endgültige Stornierung des Vertrages, hinzugefügt werden. Dieser
stellt dann nicht den Versicherungsvertrag ohne versicherte Fahrzeuge, sondern seine endgültige
Auflösung dar.
Abbildung 3.1: Graph eines Warteschlangenmodells, dass die Stornierung des Vertrages erlaubt
Abbildung 3.2: Graph eines Warteschlangenmodells mit einem absorbierenden Zustand 0∗
Hierfür würde ein Modell, wie in Abb. 3.2. illustriert, passen, wo ein neuer absorbierender
Zustand 0∗ beigefügt wird, zudem keine Autos mehr hinzugefügt werden können. Anders gesagt,
tritt der Zustand 0∗ nur ein, wenn der Vertrag storniert wird. Von jedem Zustand kann 0∗ mit
der Rate γ erreicht werden. Diese Situation wird in Kapitel 4 noch einmal genauer beleuchtet,
da bei Versicherungen mit nur einem Auto die Stornierung des Fahrzeuges auch die Stornierung
des Vertrages bedeuten kann und wiederum zwischen der Inaktivität 0 und der Auslöschung 0∗
des Vertrages unterscheiden werden muss.
Die Konstruktion dieses neuen Modells ist komplex und fordert neue Notationen. Zusätzlich
zu N (t), die Anzahl der zum Zeitpunkt t versicherten Autos wird nun die binäre Zufallsvariable
M (t) hinzugefügt. Diese Zufallsvariable sagt aus, ob ein Prozess zum Zeitpunkt t am Leben
oder Tod ist. Das ist in diesem Fall so zu verstehen, dass für M (t) = 1, was dem lebenden Prozess entspricht, der Versicherungsvertrag noch in Kraft ist, beziehungsweise noch nicht aufgelöst
wurde. Ein lebender Prozess ohne Autos im Versicherungsvertrag wird als inaktiv interpretiert
und ist somit im Zustand 0. Andererseits bedeutet M (t) = 0, also im Falle eines toten Prozes8
ses, dass der Haushalt den Versicherungsvertrag storniert hat und der absorbierende Zustand
0∗ erreicht wurde.
3.1
Modellierung
Für dieses Modell sollten die Übergangswahrscheinlichkeiten mithilfe der Chapman-KolmogorovGleichungen berechnet werden. In dieser Arbeit wird jedoch eine einfachere mathematische
Entwicklung verwendet. Zuerst wird die Annahme gemacht, dass der Zeitprozess, der mit der
Zufallsvariable M (t) zusammenhängt, exponentialverteilt ist. Das bedeutet, dass vorausgestzt
wird, dass die Zeit zwischen Beginn und Beendigung des Vertrages U ∼ Exp(γ) ist. Somit gilt
M (t) = 0 wenn t > U und:
P r(M (t) = 1) = e−γt .
(3.1)
Nun kann die Anzahl der Autos für beide Situationen definiert werden:
• Im Fall M (t) = 1: So lange der Haushalt versichert ist, sind die Prozesse des Hinzufügens
und Entfernens der Autos aktiv. Also kann die Nummer der versicherten Autos N (t) mit
dem Warteschlangenmodell M/M/∞ modelliert werden.
• Im Fall M (t) = 0: Wenn eine Stornierung auftritt, ist die Anzahl der versicherten Fahrzeuge 0 und es gilt P r(N (t) = 0|M (t) = 0) = 1.
Infolgedessen kann die gemeinsame wahrscheinlichkeitserzeugende Funktion von N (t) und
M (t) einfach entwickelt werden:
PN (t),M (t) (z, y, t) =
=
1 X
∞
X
m=0 i=0
1 X
∞
X
P r(M (t) = m, N (t) = i)y m z i
P r(N (t) = i|M (t) = m) × P r(M (t) = m)y m z i
m=0 i=0
= P r(M (t) = 0) +
∞
X
P r(N (t) = i|M (t) = 1)
i=0
i
×P r(M (t) = 1)yz
= 1 − e−γt + e−γt yPN (t) (z, t)
= 1 − e−γt + e−γt y((z − 1)e−µt + 1)a
×e
λ
(z−1)(1−e−µt ) µ
.
(3.2)
Die wahrscheinlichkeitserzeugende Funktion des M/M/∞ Modells kann an der rechten Seite
der Gleichung abgelesen werden.
3.1.1
Hinzufügen eines Stoßes zum Verlängerungszeitpunkt
An jedem Ende des Vertragsjahres muss der Versicherte seinen Versicherungsvertrag verlängern.
Es ist möglich, die wahrscheinlichkeitserzeugende Funktion, durch Hinzufügen eines Bernoulli
Versuches, so zu modellieren, dass diese Situation miteinbezogen ist. Um das zu tun wird die
Gleichung (3.1) durch Einbeziehen der Verlängerungswahrscheinlichkeit p verallgemeinert:
P r(M (t) = 1) = e−γt pbtc ,
9
wobei die Variable t wieder für die Zeit in Jahren und die Notation b·c für die Abrundungsfunktion steht. Diese Funktion bewirkt mit einem p < 1 die Erhöhung der Wahrscheinlichkeit
auf Stornierung an jedem Ende des Vertragsjahres. Es ist einfach die Gleichung (3.2) mit dieser
neuen Definition zu überarbeiten um folgendes zu erhalten
PN (t),M (t) (z, y, t) = 1 − e−γt pbtc + e−γt pbtc
×y((z − 1)e−µt + 1)a e
λ
(z−1)(1−e−µt ) µ
(3.3)
Dies ist nun der gesuchte Prozess, um die Anzahl der versicherten Autos zu modellieren.
4
Statistischer Schluss
Mittels der Maximum-Likelihood-Methode ist es möglich, die Parameter λ, γ, µ und p zu
schätzen. Für diese Abschätzungsmethode muss die gemeinsame Wahrscheinlichkeitsdichte gefunden und mit den Beobachtungen aus dem Datensatz abgestimmt werden. Es müssen einige
Annahmen getroffen werden, um mit den Informationen aus den Daten arbeiten zu können.
Zuerst werden die Schritte zur Abschätzung der Parameter aus einem vereinfachten Modell,
in dem es möglich ist, zwischen jedem Ereignis zu unterscheiden, durchgeführt. Danach wird
durch das Einführen von Datenzensur und erklärenden Variablen das Modell angepasst und
verallgemeinert.
4.1
4.1.1
Vollständige Daten
Notation
Um alle Parameter aus dem neuen Modell schätzen zu können, wird eine Liste der in der
Likelihood-Funktion verwendeten Variablen angegeben. Alle möglichen Ereignisse, die während
der Bestehensdauer der Versicherungspolice beobachtet werden, werden vermerkt als
• Ereignis Typ 1 ist das Hinzufügen eines Autos in den Versicherungsvertrag. Die Zufallsvariable E beschreibt die gesamte Anzahl der Ereignisse dieser Art, wobei die Fahrzeuge
ausgenommen sind, die bereits zu Beginn der Beobachtung des Vertrages versichert waren;
• Ereignis Typ 2 ist die Stornierung des Vertrages am Ende des Vertragsjahres. Die Zufallsvariable Q ist die Indikatorvariable dieses Vorfalls, also gilt Q = 1 falls der Vertrag nicht
verlängert wird;
• Ereignis Typ 3 ist der Fall, dass die Versicherungspolice zu einem anderen Zeitpunkt, als
dem Ende des Vertragsjahres storniert wird. Die Zufallsvariable A ist die Indikatorvariable
dieses Vorfalls;
• Ereignis Typ 4 ist das Entfernen eines Fahrzeuges aus dem Versicherungsvertrag. Die
Zufallsvariable S beschreibt die gesamte Anzahl der Ereignisse dieser Art.
Die Anzahl aller Ereignisse K ist die Summe der zuvor erläuterten Elemente, also K = E +
A + Q + S. Auch Notationen zu Variablen, die zeitliche Informationen bezüglich des Vertrags
angeben, werden nun angeführt:
• tj , die Zeit (in Jahren) zu der das j-te Ereignis, das die Anzahl der versicherten Autos
beeinflusst, eintritt;
10
• t˜j , die Zeitdauer (in Jahren) zwischen dem (j − 1)-ten und dem j-ten Ereignis, wobei gilt
t˜j = tj − tj−1 , mit t˜1 = t1 ;
• T , die
der Jahre, die der Vertrag aktiv beziehungsweise inaktiv war, wobei gilt
PAnzahl
K ˜
T = j=1 tj und damit T = tK ;
• Des Weiteren werden die Zufallsvariablen, die die Zeitdauer vor dem Eintreten eines Ereignisses vom Typ 1, 2, 3 oder 4 definieren, bezeichnet mit Ψ1 , Ψ2 , Ψ3 und Ψ4 .
Außerdem sind:
• Nj , eine Variable, die die Anzahl der Autos unmittelbar vor dem Eintreten des j-ten
Ereignisses zählt;
• V , die Summe der Beobachtungszeiten (in Jahren) aller Fahrzeuge eines Haushaltes, also
RT
P
˜
V = 0 N (t)dt = K
j=1 tj Nj .
4.1.2
Likelihood-Funktion
Die Likelihood-Funktionen wurden basierend auf der Arbeit von Benes (1957) für das M/M/∞
Modell entwickelt. Um die Parameter abzuschätzen, wird zuerst die bedingte Likelihood-Funktion,
basierend auf dem Anfangszustand, bestimmt. Deshalb ist die Anzahl der bereits versicherten
Autos im Portfolio nicht interessant (dies ist eine Grundannahme mit der gearbeitet wird),
sondern Prozesse, die sich auf die Anzahl der Fahrzeuge in der Zukunft auswirken. Unter den
Annahmen, die bei der Konstruktion des Systems gemacht wurden, wurden diese Variablen
definiert als Ψ1 ∼ Exp(λ), Ψ2 ∼ Exp(µ), Ψ3 ∼ Exp(γ) und Ψ4 ∼ G(p).
Um die gemeinsame Verteilung aller Ereignisse eines Haushaltes bestimmen zu können,
müssen alle möglichen Fälle analysiert werden. Alle Prozesse werden als unabhängig angenommen, was die Zerlegung des Modells vereinfacht. Zum Beispiel, wissend dass das erste Ereignis
das Hinzufügen eines Fahrzeuges zum Versicherungsvertrag (Ereignis Typ 1) zum beobachteten
Zeitpunkt t˜1 ist, wird folgendes erhalten:
P r(Ψ1 = t˜1 , Ψ2 > t˜1 , Ψ3 > t˜1 , Ψ4 > t˜1 )
˜
˜
˜
˜
= λe−λt1 e−N1 µt1 e−γ t1 ph(t1 ) ,
(4.1)
wobei h(t) eine Funktion ist, die zählt, wie oft ein Haushalt den Vertrag bis zum Zeitpunkt t
verlängert hat. Diese Gleichung wird entwickelt, indem die Eigenschaften des ersten Ereignisses
einer gemeinsamen Exponentialverteilung verwendet werden. Mit einer ähnlichen Entwicklung
ist es möglich die Wahrscheinlichkeiten der Ereignisse vom Typ 2, 3 und 4 zu finden:
P r(Ψ1 > t˜1 , Ψ2 = t˜1 , Ψ3 > t˜1 , Ψ4 > t˜1 )
˜
˜
˜
˜
(4.2)
˜
˜
(4.3)
= e−λt1 N1 µe−N1 µt1 e−γ t1 ph(t1 ) ;
P r(Ψ1 > t˜1 , Ψ2 > t˜1 , Ψ3 = t˜1 , Ψ4 > t˜1 )
˜
˜
= e−λt1 e−N1 µt1 γe−γ t1 ph(t1 ) ;
P r(Ψ1 > t˜1 , Ψ2 > t˜1 , Ψ3 > t˜1 , Ψ4 = t˜1 )
˜
˜
˜
˜
= e−λt1 e−N1 µt1 e−γ t1 ph(t1 )−1 (1 − p).
(4.4)
Da die exponentiellen Prozesse keine Erinnerung haben, ist es möglich das Produkt aller K Ereignisse zu berechnen, um die gemeinsame Verteilung aller Ereignisse eines einzelnen Haushaltes
11
zu erhalten:
E −λ
f (E, A, S, Q, T, V |λ, γ, µ, p) = λ e
× e−γ
PK
PK
˜
j=1 tj
˜
j=1 tj
S
Y
!
µS e−µ
NS
(1 − p)Q p
PK
j=1
PK
j=1
Nj t˜j A
γ
h(t˜j )−Q
∝ λE γ A µS (1 − p)Q e−(λ+γ)T e−µV pbT c−Q ,
wobei die konstanten Koeffizienten in der letzten Gleichung entfernt wurden, da sie zur Berechnung der Maximum Likelihood-Methode nicht benötigt werden. Für alle Φ Haushalte kann die
Likelihood-Funktion ausgedrückt werden durch:
`=
Φ
X
Ei lnλ + Ai lnγ + Si lnµ + Qi ln(1 − p)
i=1
+(bTi c − Qi ) lnp − (λ + γ)Ti − µVi ,
hierbei kennzeichnet der Indizes i den jeweiligen Haushalt. Schlussendlich werden mittels der
Maximierung der Likelihood-Funktion die folgenden Schätzer erhalten:
PΦ
PΦ
PΦ
PΦ
bTi c − Qi
i=1 Ai
i=1 Si
i=1 Ei
, γ̂ = PΦ
, µ̂ = PΦ
, p̂ = i=1
.
λ̂ = PΦ
PΦ
i=1 Ti
i=1 Ti
i=1 Vi
i=1 bTi c
4.2
Unvollständige Daten
Wenn der Zeithorizont des Samples nur 5 Jahre beträgt ist es nicht immer möglich, die ganze Lebensdauer eines Versicherungsvertrages zu beobachten. Daraus folgt, dass der Datensatz
zensiert ist und es nicht möglich ist, die Schätzung, basierend auf den vollständigen Daten, zu
verwenden. Um die Parameter richtig zu schätzen, müssen wichtige Annahmen gemacht werden. Daher wird eine neue Variable Ω, der Beobachtungstag des Datensatzes, eingeführt. Zum
Beispiel im Fall dieser empirischen Analyse, ist dieser Tag der 31. Dezember 2007.
Dadurch ist es nicht möglich zu wissen, was mit einer Police passiert ist, die nicht bis
zu diesem Zeitpunkt storniert wurde. Sie kann kurz darauf storniert worden sein oder ist
möglicherweise immer noch aktiv. Für diese Verträge muss zur Likelihood-Funktion die Zeitperiode zwischen dem letzten beobachteten Ereignis K und Ω hinzufügt werden; das heißt, es
wird eine Wahrscheinlichkeitsfunktion hinzufügt, die angibt, dass keine Ereignisse in diesem
Zeitintervall passieren. Dies entspricht der gemeinsamen Wahrscheinlichkeit des Fortbestandes
von 4 Ereignissen. Bei unabhängigen Zufallsvariablen gilt Folgendes:
P r(Ψ1 > Ω − tK , Ψ2 > Ω − tK , Ψ3 > Ω − tK , Ψ4 > Ω − tK )
= P r(Ψ1 > Ω − tK )P r(Ψ2 > Ω − tK )P r(Ψ3 > Ω − tK )P r(Ψ4 > Ω − tK )
= e−λ(Ω−tK ) e−NK µ(Ω−tK ) e−γ(Ω−tK ) ph(Ω−tk ) .
4.2.1
Inaktiv vs. Storniert
Wenn Zensur vorliegt, muss zwischen einem inaktiven Versicherungsvertrag (Zustand 0) und
einem stornierten Versicherungsvertrag (Zustand 0∗ ) unterschieden werden. Denn in Fällen wo
nur ein Auto zur Zeit tK versichert ist, also NK = 1, schauen die Ereignisse Typ 3 und Typ 4
gleich aus.
12
Zuerst wird eine neue Indikatorvariable AS(Ω − tK ) = AS = 1 eingeführt, was bedeutet,
dass diese unbekannte Situation die Dauer Ω − tK hat. Da mit exponentiellen Zufallsvariablen
gearbeitet wird, ist es möglich Gleichung (4.2) und (4.3) aufzusummieren. Dadurch wird die
Wahrscheinlichkeit, dass der Haushalt den unbekannten Zustand zum Zeitpunkt tK erreicht,
erhalten. Diese Wahrscheinlichkeit ist ausgedrückt durch e−(λ+µ+γ)t˜K ph(t˜K ) (µ + γ), dies kann
nun in die Likelihood-Funktion eingefügt werden.
Wegen den Eigenschaften der Exponentialverteilung sind die Wahrscheinlichkeiten, dass sich
ein Haushalt im Zustand 0∗ (Ereignis Typ 3) oder im Zustand 0 (Ereignis Typ 4) befindet,
gegeben durch:
γ
γ+µ
µ
P r(M (tK ) = 1, N (tK ) = 0|AS = 1) =
.
γ+µ
P r(M (tK ) = 0|AS = 1) =
Es ist möglich, die Zeit Ω − tK in die Likelihood-Funktion zu inkludieren, um herauszufinden
welches Ereignis (Typ 3 oder Typ 4) wahrscheinlicher ist. Wenn keine Verlängerung zwischen
den Zeitpunkten tK und Ω durchführbar ist, sind 3 Situationen zur Zeit tK möglich:
• Ein Ereignis Typ 3 tritt zur Zeit tK ein, was bedeutet, dass der Vertrag gekündigt wurde.
• Ein Ereignis Typ 4 tritt zur Zeit tK ein und kein weiteres Ereignis geschieht bis zum
Zeitpunkt Ω. Das würde bedeuten, dass der Versicherungsvertrag inaktiv ist.
• Ein Ereignis Typ 4 tritt zur Zeit tK ein und ein Ereignis Typ 3 geschieht zwischen der
Zeitdauer (tK , Ω), sodass der Versicherungsvertrag storniert ist.
Anstatt jede dieser Wahrscheinlichkeiten zu berechnen, ist es einfacher die Gegenwahrscheinlichkeit zu finden. Diese Gegenwahrscheinlichkeit entspricht einem Ereignis: ein Ereignis Typ 4
tritt zur Zeit tK auf, gefolgt von dem Hinzufügen eines Autos während des Zeitintervalls (tK , Ω).
Diese Wahrscheinlichkeit kann wie folgt berechnet werden:
P r(M (tK ) = 1, N (tK ) = 0|AS = 1)P r(Ψ1 < min(Ψ3 , Ω − tK ))
µ
λ
=
(1 − e−(γ+λ)(Ω−tK ) )
.
γ+µ
λ+γ
(4.5)
Dies entspricht dem Produkt von drei Wahrscheinlichkeiten: die Wahrscheinlichkeit, dass ein Ereignis Typ 4 zur Zeit tK auftritt, die Wahrscheinlichkeit, dass Ereignisse vom Typ 1 oder 3 vor
dem Zeitpunkt Ω eintreten und die Wahrscheinlichkeit, dass das letzte Ereignis das Hinzufügen
eines Fahrzeuges (Typ 1) ist. Es ist wichtig zu vermerken, dass diese Gleichung nur in Fällen ohne Möglichkeit auf Vertragsverlängerung verwendet werden sollte. Daher muss diese Gleichung
verallgemeinert werden, um jede Vertragsverlängerung in die Berechnung der Wahrscheinlichkeit, in dem unbekannten Zustand zu bleiben, einzugliedern. Um dies zu tun, ist es erforderlich
die Wahrscheinlichkeit des Hinzufügens eines Autos bezüglich jedes Jahres aufzuteilen.
Zuerst müssen jedoch einige Elemente im Detail erklärt werden. Es ist zu bemerken, dass
der Zeitpunkt tK , indem der Status des Versicherten unbekannt wird, nicht unbedingt dem
Zeitpunkt, indem es möglich ist, den Vertrag zu verlängern, entspricht. Das bedeutet, dass die
Zeitperiode vor der ersten Verlängerung und die letzte Zeitperiode vor Ω weniger als ein Jahr
betragen.
Daraus folgt, falls es zumindest eine Vertragsverlängerung in der unbekannten Periode Ω−tK
gibt, ist 1 − {tK } eine Möglichkeit, den unbekannten Zeitabschnitt des Jahres vor der ersten
Verlängerung auszudrücken. Hierbei ist {·} die Funktion, die die Nachkommastellen ausgibt.
13
Ebenso kann der Zeitabschnitt des Jahres vor Ω geschrieben werden als {Ω} und die gesamte
Anzahl der Vertragsverlängerungen in der unbekannten Periode ist bΩc − btK c = R. Damit
erhalten wir folgende Gleichung:
P r(Ψ1 < min(Ψ3 , 1 − {tK }))
{z
}
|
vor erster V erlängerung nach tK
+ P r(min(Ψ3 , Ψ1 , Ψ4 ) > 1 − {tK }) × P r(Ψ1 < min(Ψ3 , 2 − {tK })|min(Ψ3 , Ψ4 , Ψ1 ) > 1 − {tK })
|
{z
}
zwischen erster und zweiter V erlängerung nach tK
+ ···
Diese Gleichung kann als Summe vieler Möglichkeiten, die zwischen jeder Vertragsverlängerung
geschehen können, verstanden werden. Das erste Element ist einfach die Wahrscheinlichkeit,
dass ein Ereignis Typ 1 vor der ersten Vertragsverlängerung nach tK eintritt. Die zweite Komponente der Summe ist also die Wahrscheinlichkeit, dass ein Ereignis Typ 1 auftritt, dieses Mal
aber zwischen der ersten und der zweiten Vertragsverlängerung nach tK . In diesem Fall muss
sich in der Wahrscheinlichkeit widerspiegeln, dass der Vertrag bei der ersten Möglichkeit zur
Verlängerung nach tK auch verlängert wurde. Alle anderen Situationen zwischen den potentiellen Vertragsverlängerungen j und j + 1, für j = 3, ... müssen auch dazugerechnet werden, sodass
gilt:
=
×
+
=
×
P r(Ψ1 < min(Ψ3 , Ψ4 , Ω − tK )|R ≥ 1)
λ λ −(γ+λ)(1−{tK })
1 − e−(γ+λ)(1−{tK }) +
e
γ+λ
γ+λ
p 1 − e−(γ+λ) + · · ·
λ −(γ+λ)(R−{tK }) R e
p 1 − e−(γ+λ){Ω}
γ+λ
λ
1 − e−(γ+λ)(1−{tK }) + e−(γ+λ)(1−{tK }) p 1 − e−(γ+λ)
γ+λ
R−1
1 − pe−(γ+λ)
−(γ+λ){Ω}
−(γ+λ)(R−{tK }) R
,
+e
p 1−e
1 − pe−(γ+λ)
wobei eine Vereinfachung aufgrund der Eigenschaften der geometrischen Reihe gemacht wurde.
Die Fälle R = 0 und R > 0 können zu folgendem kombiniert werden
P r(Ψ1 < min(Ψ3 , Ψ4 , Ω − tK ))P r(M (tK ) = 1, N (tK ) = 0|AS = 1)
µ
λ
=
1{R=0} 1 − e−(γ+λ)(Ω−tK )
γ+µγ+λ
+ 1{R≥1} 1 − e−(γ+λ)(1−{tK })
1 − pe−(γ+λ) R−1
+ e
p 1−e
1 − pe−(γ+λ)
−(γ+λ)(R−{tK }) R
−(γ+λ){Ω}
+ e
p 1−e
≡ G(tK , Ω).
−(γ+λ)(1−{tK })
−(γ+λ)
Im Fall das p = 1 ist, ist die Lösung gegeben durch Gleichung (4.5). Somit wurde die gesuchte
Gegenwahrscheinlichkeit berechnet.
14
Zur Verbesserung des Modells, um die Situationen, in denen es schwer ist, zwischen inaktiven und stornierten Versicherungspolicen zu unterscheiden, einzubeziehen, wird die LikelihoodFunktion angepasst, indem der Term 1 − G(tK , Ω) hinzugefügt wird:
L(λ, γ, µ, p) ∝ e−(λ+γ)T e−µV λE µS
∗
× γ A (1 − p)Q pbT c−Q [(µ + γ)(1 − G)]A ,
wobei A∗ = 1, falls der Versicherte im unbekannten Zustand ist. Unter Verwendung des Logarithmus dieser Funktion und durch das Summieren aller Haushalte eines gegebenen Portfolios,
wird es möglich die vier Parameter λ, γ, µ und p zu schätzen.
4.3
Nummerische Anwendung
Das Modell bezieht sich auf den Versicherungsdatensatz beschrieben in Kapitel 1.2 und die 4
geschätzten Parameter sind in Tabelle 4.1 angeführt. Der Wert λ̂ bedeutet, dass im Durchschnitt alle 0, 07303−1 = 13, 69 Jahre ein Fahrzeug zu dem Vertrag hinzugefügt wird. Der Wert
µ̂ steht dafür, dass ein Auto durchschnittlich 0, 08277−1 = 12, 08 Jahre im Vertrag versichert
ist. Zu bemerken ist, dass die Rate der hinzugefügten Fahrzeuge nicht die der entfernten Autos
ausgleicht, da λ̂ < µ̂. Erwähnenswert ist auch, dass die jährliche Vertragsverlängerungsrate bei
92% und die Wahrscheinlichkeit der Stornierung ungefähr bei 4% liegt. Für den Versicherer
ausgewertet bedeutet das, dass bei der Aufnahme neuer Versicherungsnehmer langfristige Rentabilität sichergestellt werden sollte.
Tabelle 4.1
Geschätzte Parameter (Standardfehler)
Hinzufügen λ
Stornierung γ
Entfernung µ
0,0730 (0,0003) 0,0400 (0,0003) 0,0828 (0,0003)
4.3.1
Verlängerung p
0,9179 (0,0003)
Kovariaten
Manche Haushaltsprofile neigen eher dazu, Fahrzeuge zum Versicherungsvertrag hinzuzufügen,
andere eher dazu, Fahrzeuge zu entfernen. Ebenso gibt es Profile, die eher stornieren als andere,
und verschiedene Typen von Versicherungsnehmern haben auch eine höhere beziehungsweise
niedrigere Verlängerungsrate. Deshalb scheint das Hinzufügen von Kovariaten zu jedem Parameter des Warteschlangenprozesses gerechtfertigt.
In Tabelle 4.2 sind die Kovariaten, die den Vektor Xi zu jedem Haushalt definieren, angegeben. Die Gültigkeitsdaten der Versicherungsverträge werden verwendet, um die Stabilität der
Haushalte, die sich im Juli versichern lassen, zu zeigen. Auch wenn sich die Merkmale eines
Haushaltes während des Jahres verändern können, werden nur die Merkmale, die im ersten
Vertrag beobachtet werden, betrachtet. Es wird davon ausgegangen, dass der Effekt minimal
ist, da die Zeitspanne des Datensatzes recht kurz ist und die meisten Haushalte ihre Risiko
Charakteristiken nicht während des Jahres verändern.
Eine Linkfunktion g(Xi β) ist dann versehen mit jedem Parameter, wobei β der zu schätzende
Parametervektor ist. In diesem Modell soll für die Parameter λ, γ, µ ∈ R+ gelten, weshalb eine
logarithmische Linkfunktion gewählt wird, da diese gewährleistet, dass die Parameter immer positiv sind. Außerdem muss der Parameter, der die Verlängerungswahrscheinlichkeit beschreibt,
exp(X β )
p ∈ [0, 1] erfüllen, weshalb der Logit-Link verwendet wird, das heißt pi = 1+exp(Xi i βp ) . Die
p
geschätzten Werte des Parametervektors β sind in Tabelle 4.3 angeführt.
15
Das Ziel eines Versicherers sollte das Maximieren der Anzahl der versicherten Autos zur Zeit
t sein. In diesem Fall wird nach hohen Werten der Parameter λ und p, kombiniert mit niedrigen
Werten für µ und γ gesucht. Die Ergebnisse lassen vermuten, dass manche Kovariaten, wie der
Familienstand oder X6 (Versicherte mit Gültigkeitsdatum am 1. Juli), einen großen Einfluss
haben. Zusätzlich liefern Versicherungsnehmer, die ihren Vertrag am ersten Tag eines Monates
verlängern, erhöhte Stabilität. Die Kovariate X4, die für Versicherte, die weniger als 9 Jahre
bei dem Unternehmen versichert sind, steht, zeigt höhere Loyalität zum Versicherungsunternehmen. Um zu testen, ob die erklärenden Variablen auch statistisch signifikant sind, wurde ein
Wald-Test mit einem Konfidenzintervall von 95% zu jedem der Parameter durchgeführt. Daraus
folgt, dass β5 nicht in β λ , β γ und β µ enthalten ist und β2 nicht in β γ .
Tabelle 4.2
Binäre Variablen, die die verfügbaren Informationen eines Haushaltes zusammenfassen
Variable Beschreibung
X1
Gibt 1 aus, falls der Haushalt aus dem allgemeinen Markt kommt
(entgegengesetzt der Gruppenversicherung)
X2
Gibt 1 aus, falls der Haushalt zumindest ein gemietetes Auto besitzt
X3
Gibt 1 aus, falls die Versicherten nicht verheiratet sind
X4
Gibt 1 aus, falls der Haushalt weniger als 9 Jahre bei diesem
Unternehmen versichert ist
X5
Gibt 1 aus, falls das Gültigkeitsdatum des Vertrages zwischen
Januar und Juli liegt
X6
Gibt 1 aus, falls das Gültigkeitsdatum des Vertrages im Juli liegt
X7
Gibt 1 aus, falls das Gültigkeitsdatum des Vertrages am ersten
Tag eines Monats liegt
Tabelle 4.3
Geschätzte Parameter für den
Parameter βλ
β0
-2,494 (0,015)
β1
-0,264 (0,009)
β2
-0,142 (0,011)
β3
-0,454 (0,009)
β4
0,201 (0,014)
β5
β6
-0,098 (0,012)
β7
-0,129 (0,009)
5
Prozess mit Kovariaten
βγ
βµ
-3,709 (0,039) -2,726
-0,070 (0,019) 0,122
-0,048
0,214 (0,018) 0,410
0,677 (0,038) 0,130
-0,181 (0,029)
-0,647 (0,021)
(0,014)
(0,009)
(0,011)
(0,008)
(0,013)
-0,034 (0,012)
-0,129 (0,009)
βp
2,769
-0,152
0,092
-0,246
-0,399
0,137
0,400
0,089
(0,019)
(0,010)
(0,013)
(0,009)
(0,017)
(0,009)
(0,016)
(0,010)
Analyse
In diesem Kapitel werden Anwendungen, die die geschätzten Parameter aus dem vorherigen
Kapitel (angeführt in Tabelle 4.3) verwenden, gezeigt. Obwohl im Folgenden mit den Parametern
λ̂, γ̂, µ̂ und p̂ gearbeitet wird, wird der Einfachheit halber die Notation λ, γ, µ und p verwendet.
Es wurden 5 Profile ausgewählt, um zu zeigen, welche Auswirkungen die Marktsegmentierung hat. Von 96 Profilen werden nur einige typische Versicherungsnehmer verwendet, um die
Ergebnisse dieser Analyse zu zeigen. Das erste ausgewählte Profil E ist die beste Art eines
Haushaltes bezüglich erwarteter versicherter Autos und das schlechteste Profil wird mit Haushalt A bezeichnet. Zur Veranschaulichung werden auch 3 durchschnittliche Typen (B, C, D)
16
betrachtet. Tabelle 5.1 stellt jedes Profil bezüglich seiner Kovariaten dar. Es ist festzustellen,
dass der einzige Unterschied zwischen Haushalt Typ B und D im Familienstand liegt. An den
Ergebnissen, gezeigt in Tabelle 4.3, kann erkannt werden, dass diese Kovariate einen erheblichen
Einfluss auf die Parameter des Modells hat. In Tabelle 5.2 sind die Werte der Parameter λ, γ,
µ und p für jedes Profil aufgelistet.
Tabelle 5.1
Kovariaten jedes Profils
Parameter
X1 X2 X3
Haushalt A 1
0
1
Haushalt B
1
1
1
Haushalt C
0
0
1
Haushalt D 1
1
0
Haushalt E
0
1
0
X4
1
0
0
0
0
Tabelle 5.2
Parameterwerte jedes Profils
Parameter
λ
γ
Haushalt A 0,0492 0,0557
Haushalt B 0,0349 0,0283
Haushalt C 0,0460 0,0159
Haushalt D 0,0550 0,0228
Haushalt E 0,0570 0,0107
5.1
X5
0
0
0
0
0
µ
0,1270
0,1063
0,0868
0,0705
0,0530
X6
0
0
0
0
1
X7
0
0
1
0
1
p
0,87795
0,92154
0,93163
0,93756
0,96608
Erwartete Anzahl versicherter Autos
Mithilfe der wahrscheinlichkeitserzeugenden Funktion des kompletten Prozesses, die in Kapitel 3.1.1 gezeigt wurde, können interessante Eigenschaften gefunden werden. Um Notationen
und Berechnungen zu vereinfachen, wird die Variable H(t) verwendet, um die Anzahl der versicherten Fahrzeuge eines aktiven oder inaktiven Versicherungsnehmers
darzustellen. Es gilt
n
H(t) = M (t) × N (t). Mit dem Wissen, dass P r(X = n) = d Pdz(z=0)
gilt,
ist es möglich die
n
erwartete Anzahl der versicherten Autos H(t) mithilfe des Folgenden zu berechnen:
E[H(t)] =
∞
∂PN (t),M (t) (z = 1, y = 1, t) X
(1)
=
ipi 1i−1 1.
∂z
i=0
Der erwartete Wert für diesen Prozess wird unter Verwendung von Gleichung (3.3) berechnet.
Zuerst wird nach z abgeleitet:
∂PN (t),M (t) (z,t)
∂z
h
a (z−1)(1−e−µt ) λ i
µ
∂ 1 − e−γt pbtc 1 − (z − 1)e−µt + 1 ye
=
=
×
∂z
a−1 (z−1)(1−e−µt ) λ
µ
e p
(z − 1)e
+1
ye
h
i
λ
ae−µt + (z − 1)e−µt + 1 1 − e−µt
.
µ
−γt btc
−µt
17
Nun wird z = 1 und y = 1 gesetzt, um den erwarteten Wert zu erhalten:
E[H(t)] =
∂PH(t) (z = 1, t)
∂z
= e
−γt btc
p
ae
−µt
−µt
+ 1−e
λ
µ
.
Mit ähnlichen Rechnungen können auch andere Momente der Verteilung gefunden werden, wie
zum Beispiel die Varianz oder auch höhere Momente. Diese Berechnungen können auch auf
alle anderen wahrscheinlichkeitserzeugende Funktionen, die in dieser Arbeit vorgekommen sind,
angewandt werden.
Für jedes Profil wurde die erwartete Anzahl der versicherten Autos berechnet. Die Ergebnisfunktion ist in Abb. 5.1 dargestellt. Für die Illustration wurde der Wert c = 0 gesetzt, was
bedeutet, dass die Versicherungsnehmer am Beginn ihres Vertrages sind und in einem Jahr
die nächste Möglichkeit zur Verlängerung der Police besteht. In der Darstellung kann sehr gut
der Stoß zu jedem Vertragsverlängerungszeitpunkt, der durch den Parameter p erzeugt wird, erkannt werden. In Tabelle 5.3 sind die numerischen Werte der erwarteten Anzahl der versicherten
Fahrzeuge nach 5 Jahren, gleich nach der Vertragsverlängerung abzulesen. Es ist festzustellen,
dass die ursprüngliche Anzahl der versicherten Autos den erwarteten Wert linear erhöhen.
Die Ergebnisse weisen auf einen großen Unterschied zwischen den Profilen hin, wobei es
zum Beispiel scheint, als ob Haushalt E viel vorteilhafter für den Versicherer ist als Haushalt
A. Daraus folgt, dass ein Versicherungsunternehmen seinen Marketingaufwand an bestimmte
Typen von Versicherungsnehmer anpassen sollte, in diesem Fall an Haushalte vom Typ E anstatt
an welche vom Typ A. Außerdem sollten Versicherer manchen versicherten Profilen, die geringere
administrative Kosten verursachen, eine Ermäßigung anbieten, da sie dann länger bei dem
Unternehmen bleiben.
Abbildung 5.1: Erwartete Anzahl versicherter Autos zum Zeitpunkt t
18
Tabelle 5.3
Erwartete Anzahl versicherter Autos nach 5
Ursprüngliche Anzahl der 1
2
versicherten Autos (a)
Haushalt A
0,281 0,490
Haushalt B
0,417 0,756
Haushalt C
0,541 0,961
Haushalt D
0,604 1,058
Haushalt E
0,812 1,424
5.2
Jahren
3
4
0,700
1,096
1,381
1,513
2,036
0,909
1,435
1,801
1,967
2,648
Diskontiertes Risikopotential
Der diskontierte Geldwert eines Haushaltes kann gefunden werden, indem der derzeitige Wert
von Cash Flows der Zukunft berechnet wird. Das Ergebnis wird im Marketing Kundenertragswert (CLV) genannt.
In diesem Fall wird angenommen, dass das Versicherungsunternehmen einen Profit von $1
für jede, ein Jahr dauernde Beobachtung eines Autos macht. Diese Annahme kann ganz einfach
zu einer realistischeren abgeändert werden. Auch der Diskontierungssatz δ ist vorgegeben. Um
den Kundenertragswert zu berechnen, ist es notwendig den derzeitigen Wert einer zukünftigen
Exposition bis zur Zeit T , unter Verwendung eines kontinuierlichen Diskontierungssatzes δ,
auszurechnen. Der Kundenertragswert wird mit ωT bezeichnet und kann berechnet werden,
indem die Variable H(t) mit Hilfe der Riemann Summe integriert wird:
Z
T
−δt
H(t)e
ωT =
0
n
δiT
T X
iT
dt = lim
H
e− n ,
n→∞ n
n
(5.1)
i=1
Der erwartete Wert kann einfach herausgefunden werden:
n
δiT
T X
iT
E(ωT ) = lim
e− n
E H
n→∞ n
n
i=1
Z T
=
E(H(t))e−δt dt.
0
In Tabelle 5.4 sind die erwarteten Werte jedes Haushaltes abzulesen, unter der Annahme, dass
der Haushalt zum Zeitpunkt t = 0 zwei Autos versichert hat. Auf lange Zeit werden die Unterschiede zwischen den Haushaltsprofilen sichtbar. Haushalt E ist nach 20 Jahren durchschnittlich
2,5 mal profitabler als Haushalt A.
In der Marketing Literatur ist es eher unüblich, den Kundenertragswert für große Zeithorizonte zu berechnen. Trotzdem ist es in diesem Fall nützlich, dieses Resultat auszurechnen,
da es einem erlaubt, einfache Gleichungen zu erhalten. Mit Gleichung (5.1) ist es möglich, den
gesamten Profit auszurechnen, indem man T gegen unendlich gehen lässt. Dieser Wert wird als
ω ≡ limT →∞ ωT definiert.
19
Sein Erwartungswert wird folgendermaßen berechnet:
Z ∞
E(H(t))e−δt dt
E(ω) =
0
Z ∞
−µt
−µt λ
−(γ+δ)t btc
ae
+ 1−e
=
e
p
dt
µ
0
∞ Z i+1
X
λ
dt
=
e−(γ+δ)t pi ae−µt + 1 − e−µt
µ
i
i=0
∞
X
e−i(γ+δ+µ) − e−(i+1)(γ+δ+µ) i
=
a
p
γ+δ+µ
i=0
e−i(γ+δ) − e−(i+1)(γ+δ) λ i
p
+
(γ + δ)µ
e−i(γ+δ+µ) − e−(i+1)(γ+δ+µ) λ i
−
p
(γ + δ + µ)µ
1 − e−(γ+δ+µ) a − µλ
=
(γ + δ + µ) 1 − e−(γ+δ+µ) p
1 − e−(γ+δ) λ
,
+
(γ + δ)µ 1 − e−(γ+δ) p
Hierbei ist a die Anzahl der versicherten Autos zum Zeitpunkt t = 0. Die numerischen Ergebnisse, die in Tabelle 5.5 aufgelistet sind, zeigen einen großen Unterschied zwischen dem besten
und dem schlechtesten Haushalt. Demzufolge sollte ein Versicherungsunternehmen die Versicherungsnehmer anvisieren, die die Kovariaten wie Haushalt E haben. Diese Analyse basiert auf
einem $1 Profit pro Haushalt. Dies kann durch einen Profit, proportional zur Prämie verallgemeinert werden. Außerdem kann unter Verwendung dieses Modells und eines Wirtschaftsmodells
zur Preiselastizität die Prämie als Funktion von zukünftigen Profiten dargestellt werden.
Tabelle 5.4
Kundenertragswert von
2% Diskontierungssatz
Anzahl der Jahre (T)
Haushalt A
Haushalt B
Haushalt C
Haushalt D
Haushalt E
Haushalten mit zwei versicherten Fahrzeugen zur Zeit t = 0, mit einem
1
1,833
1,869
1,904
1,917
1,946
5
5,468
6,359
7,003
7,286
8,218
10
6,720
8,581
10,104
10,823
13,553
Tabelle 5.5
Kundenertragswert, mit 2% Diskontierungssatz
Anzahl der versicherten Autos 1
2
zur Zeit t = 0, (a)
Haushalt A
3,964
7,161
Haushalt B
5,588
9,992
Haushalt C
7,661
13,011
Haushalt D
8,782
14,586
Haushalt E
16,130 24,735
20
7,122
9,731
12,237
13,506
19,433
3
4
10,358
14,395
18,361
20,390
33,340
13,555
18,799
23,711
26,194
41,945
Hierbei wurde eine Approximation mit der Kovariate X4, die fixiert wurde, obwohl sie sich
20
eigentlich über die Zeit verändern sollte, durchgeführt. Diese Approximation bezieht sich nur
auf den Haushalt A.
6
Diskussion
Wie schon zuvor erwähnt, deuten die numerischen Ergebnisse dieser empirischen Untersuchung
darauf hin, dass ein Versicherer sich manchen Haushalten mehr widmen sollte als anderen. Es
ist jedoch wichtig, sich in Erinnerung zu behalten, dass die getroffenen Schlussfolgerungen auf
einigen Annahmen bezüglich des Modells basieren.
In dem vorigen Kapitel dieser Arbeit wurde schon festgestellt, dass die Annahme über die
Profitkomponente der Prämie verallgemeinert werden sollte, um realistischer zu sein. Auch andere Veränderungen sind möglich. Die erklärenden Variablen sollten etwas dynamischer sein,
um die Veränderungen eines Haushaltes während der Zeit wiederzugeben. Zum Beispiel sollte sich logischerweise die Kovariate, die die versicherte Zeit bei dem Unternehmen modelliert
(X4), über das Jahr verändern. Auch der Schadensverlauf könnte zum Modell hinzufügt werden.
Dadurch würde sich die Anpassung des Modells verbessern, vor allem Parameter p, die Vertragsverlängerungsrate. Intuitiv lässt sich vermuten, dass das Verhalten eines Versicherungsnehmers
nicht das gleiche ist, nachdem er eine Schadenforderung während des Jahres eingereicht hat.
Diese Verhaltensveränderung wäre wahrscheinlich verbunden mit der Erhöhung der Prämie.
In so einer Verallgemeinerung des Modells könnte auch ein System von Erfahrungstarifierung
(zum Beispiel das Bonus-Malus-System) eingeführt werden. Das Hunger nach Bonus Phänomen
sollte auch hinzugefügt werden, um ein nützlicheres Modell und einen realistischeren Ansatz zu
erhalten.
Andere interessante Verallgemeinerungen des Modells sind auch noch möglich. Es sollte eine
Abhängigkeit zwischen den vier Prozessen des Modells in zukünftigen Modellierungen eingefügt
werden. Zum Beispiel wirkt eine Abhängigkeit zwischen der Kündigungsrate und dem Datum
der Vertragsverlängerung logisch. Ein Versicherungsnehmer der über die Preise am Versicherungsmarkt informiert ist, sollte eine höhere Wahrscheinlichkeit haben, das Versicherungsunternehmen während der Versicherungsdauer und am Vertragsverlängerungszeitpunkt zu verlassen.
Ebenfalls scheint es naheliegend, dass ein Versicherter, der ein neues Auto zum Versicherungsvertrag hinzufügen lässt, eher dazu neigt, ein Fahrzeug aus dem Vertrag zu entfernen. Noch
allgemeiner sollte ein Versicherungsnehmer, der viele neue Autos versichern lässt, auch viele
Autos wieder aus dem Vertrag nehmen. Auch andere Arten von Abhängigkeit zwischen den
Prozessen sind möglich. Jedoch sollte das Hinzufügen von Kovariaten in das Modell die Auswirkung solcher Abhängigkeiten verringern, auch wenn die Struktur der Abhängigkeit offensichtlich
ist.
Auch wenn das Einbinden von Abhängigkeit zwischen den Prozessen eine interessante Verallgemeinerung des Modells sein kann, sind die einfacheren Generalisierungen wahrscheinlich
trotzdem nützlicher. Zum Beispiel sollte das Verwenden von anderen Wartezeitverteilungen zur
Modellierung des Prozesses erwägt werden (Gamma statt der Exponentialverteilung zum Beispiel). Die Anwendung des in dieser Arbeit vorgestellten Modells in anderen Branchen (wie
Gruppenversicherung oder Hausversicherung) ist ebenfalls ein interessanter Zugang. Auch das
Vermischen mehrerer Brachen kann betrachtet werden.
21
7
Fazit
Das Ziel war die Anzahl der versicherten Fahrzeuge für jeden Haushalt zu modellieren. Beginnend mit einem Poisson-Prozess ist es möglich, mehrere Typen von Warteschlangenmodellen zu
verallgemeinern. Das Modell das in dieser Arbeit vorgestellt wurde, kann als Generalisierung
des M/M/∞ Prozesses gesehen werden. Es wurde ein neuer Todeszustand zum System hinzugefügt, der die Möglichkeit der Stornierung oder des Nicht-Verlängerns eines Vertrages darstellt.
Aufgrund der empirischen Daten ist zu erkennen, dass zwischen einer gekündigten Police und
einem inaktiven Vertrag unterschieden werden sollte.
Dieses neue Modell benötigt vier Parameter: einen Parameter, der die Aufnahmerate von
Autos in den Versicherungsvertrag modelliert, einen zweiten, der die Entfernungsrate versicherter Fahrzeuge darstellt, einen dritten der die Kündigungsrate der Police modelliert, und
zuletzt einen Parameter zur Modellierung der Vertragsverlängerungsrate. Mittels statistischer
Methoden ist es möglich diese Parameter zu schätzen, indem die Eigenschaften der Exponentialverteilung verwendet und die möglichen Ereignisse aufbereitet werden. Da hier mit zensierten
Daten gearbeitet wurde, ist ein Weg zur Schätzung der Parameter, für den Fall, dass nicht
zwischen dem inaktiven und dem stornierten Versicherungsvertrag unterschieden werden kann,
entwickelt worden.
Es wurde auch versucht, dieses neue Warteschlangensystem zu verallgemeinern, indem erklärende Variablen zu jedem der vier Parameter hinzugefügt wurden. Dann war es möglich
herauszufinden, welche Profile von Vertragsinhabern eher dazu neigen, Fahrzeuge zum Vertrag
hinzuzufügen oder zu entfernen, ihn zu kündigen oder die Police jährlich zu verlängern. Die
erhaltenen geschätzten Parameter halfen das Versicherungsportfolio im Detail zu analysieren,
da mehrere Arten von Statistiken, die für Versicherer nützlich sein können, entwickelt wurden,
wie die erwartete Anzahl versicherter Autos oder der Kundenertragswert, der die zukünftigen
Profite verbunden mit einem Versicherten berechnet.
Dieses Modell dürfte eine gute Approximation der empirischen Daten sein und stellt einen
interessanten ersten Schritt in das Modellieren von Abgangszeiten in der Versicherung dar. Es
wäre wahrscheinlich angebracht, dieses Modell noch weiter zu verbessern, wobei bereits einige
Verallgemeinerungen durchgeführt wurden.
Weiter ist zu beachten, dass diese Analyse nur die Entwicklung der Haushalte, die bereits im
Portfolio sind, untersucht. Daher beinhaltet das Modell nicht das Hinzufügen weiterer Policen zu
dem Portfolio. Folglich nimmt die Anzahl der Haushalte im Portfolio mit der Zeit ab. Jedoch war
das eigentliche Ziel dieser Arbeit, die Veränderung der Anzahl der versicherten Fahrzeuge eines
konkreten Haushaltes sowie das Verhalten des Versicherten und den Einfluss der Eigenschaften
eines Haushaltes zu analysieren. Wenn ein Versicherungsunternehmen die Entwicklung seines
gesamten Portfolios analysieren will, sollte es das Hinzukommen neuer Haushalte miteinkalkulieren. Der Versicherer könnte demnach den Geldwert des Portfolios (auch Kundeneigenkapital)
analog zur Berechnung des Kundenertragswertes kalkulieren.
22
8
Literatur
Benes, V.E., 1957a. Fluctuations of telephone traffic. Bell Syst. Tech. J. 36, 965-973.
Benes, V.E., 1957b. A sufficient set of statistics for a simple telephone exchange model. Bell
Syst. Tech. J. 36, 939-964.
Boucher, Jean-Philippe; Couture-Piché, Guillaume. 2015. Modelling the number of insureds’
cars using queuing theory. Insurance: Mathematics and Economics 64 (2015) 67-76.
Löpker, Andreas. Frühjahrstrimester 2014. Warteschlangentheorie.
Hamburg: Helmut-Schmidt-Universität.
Newell, G., 1982. Applications of Queueing Theory. In: Monographs on Statistics and Applied
Probability , Chapman and Hall.
23

Download Report