Modellieren der Anzahl der versicherten Autos mit Hilfe der Warteschlangentheorie 18. Februar 2016 Erstellt von Lisa Maria Wanka Inhaltsverzeichnis 1 Einführung 1.1 Definitionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Verwendete Daten und Notationen . . . . . . . . . . . . . . . . . . . . . . . . . . 2 2 3 2 Modellieren der Anzahl der Fahrzeuge 2.1 Hinzufügen und Wegnehmen von Fahrzeugen . . . . . . . . . . . . . . . . . . . . 2.2 Vertragsverlängerung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 5 6 3 Modell mit einer Inaktivitätsphase 3.1 Modellierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.1.1 Hinzufügen eines Stoßes zum Verlängerungszeitpunkt . . . . . . . . . . . . 7 9 9 4 Statistischer Schluss 4.1 Vollständige Daten . . . . . 4.1.1 Notation . . . . . . . 4.1.2 Likelihood-Funktion 4.2 Unvollständige Daten . . . 4.2.1 Inaktiv vs. Storniert 4.3 Nummerische Anwendung . 4.3.1 Kovariaten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 10 10 11 12 12 15 15 5 Analyse 16 5.1 Erwartete Anzahl versicherter Autos . . . . . . . . . . . . . . . . . . . . . . . . . 17 5.2 Diskontiertes Risikopotential . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 6 Diskussion 21 7 Fazit 22 8 Literatur 23 1 1 Einführung Das Ziel dieser Arbeit ist die Modellierung der Anzahl der versicherten Autos pro Haushalt. Hierfür wird die Warteschlangentheorie verwendet. Dazu werden vier verschiedene Parameter benötigt, wobei der erste das Hinzufügen von Fahrzeugen in den Versicherungsvertrag modelliert. Der zweite Parameter beschreibt die Wegfallrate von bereits versicherten Autos und der dritte stellt die Kündigungsrate von Versicherungspolicen dar. Da ein Versicherungsvertrag jährlich verlängert werden kann, wird der letzte Parameter dazu verwendet, die Verlängerungsrate zu modellieren. Mittels statistischer Methoden können diese vier Parameter geschätzt werden, auch wenn nur zensierte Daten vorliegen. Der Warteschlangenprozess kann verallgemeinert werden, indem Kovariaten, die die Eigenschaften eines Haushaltes enthalten, zu jedem der Parameter des Modells hinzugefügt werden. Damit kann vorhergesagt werden, welche Versicherungsnehmer eher dazu neigen, weitere Fahrzeuge zu der Versicherung hinzuzufügen oder zu entfernen, beziehungsweise welche ihren Vertrag wahrscheinlich kündigen oder jährlich verlängern werden. Die geschätzten Parameter helfen den Versicherungsbestand genau zu analysieren, da mittels der Warteschlangentheorie verschiedene Arten von Statistiken, die für den Versicherer brauchbar sind, berechnet werden können. Bespiele dafür sind die erwartete Anzahl von versicherten Autos oder der Kundenertragswert (engl. customer lifetime value; CLV). Der Begriff Kundenertragswert kommt aus dem Marketing und erlaubt das Auswählen und Anvisieren von Langzeitkunden. Diesen Wert, der in den letzten Jahren für die Versicherungswissenschaft immer wichtiger geworden ist, kann der Versicherer für jeden Versicherten bestimmen. Berechnet wird der Kundenertragswert indem alle zukünftigen Profite eines Versicherten diskontiert werden. Seine Verwendung im Gebiet der Versicherung ist noch sehr neu, wahrscheinlich aufgrund der Komplexität der Versicherungswissenschaft. Im zweiten Kapitel wird die Anzahl versicherter Fahrzeuge modelliert. Das beinhaltet das Bearbeiten eines Modells für das Hinzufügen neuer Fahrzeuge und das Modellieren des Entfernens von Autos aus einem bestehenden Versicherungsvertrag. Ein dritter Prozess, der die Verlängerung von Verträgen beschreiben soll, wird ebenfalls zu dem Modell hinzugefügt. Später wird dieses Modell noch verallgemeinert, um die Möglichkeit der Kündigung eines Vertrages miteinzubeziehen. Auch der Fall einer Inaktivitätsphase des Vertrages wird im dritten Kapitel berücksichtigt und in das Modell miteinkalkuliert. Eine Methode zur Schätzung der Parameter aus vollständigen und zensierten Datensätzen wird im vierten Abschnitt erläutert und eine Verallgemeinerung, durch Hinzufügen von einigen erklärenden Variablen zu jedem der Parameter des Modells, wird durchgeführt. Im fünften Kapitel wird das zuvor erarbeitete Modell angewandt und zur Berechnung verschiedener nützlicher statistischer Daten, wie die erwartete Anzahl versicherter Fahrzeuge oder der Kundenertragswert, verwendet. Hierfür werden Informationen, die auf einem Portfolio eines kanadischen Versicherungsunternehmens basieren, herangezogen. Weitere mögliche Verallgemeinerungen dieses Modells werden im sechsten Kapitel diskutiert und im siebten Abschnitt wird das Ergebnis dieser Abhandlung erläutert. 1.1 Definitionen Der Begriff Haushalt bezeichnet einen einzigen Kunden, den Versicherten. Dieser Haushalt kann mehrere Mitglieder (beziehungsweise Fahrer) und mehrere Autos gesammelt in einem Versicherungsvertrag, der jährlich verlängert werden kann, beinhalten. Der Vertrag ist das Dokument, das einen Versicherer an den versicherten Haushalt bindet. 2 In dieser Arbeit konzentrieren wir uns auf die Anzahl der Autos, die von dem Vertrag erfasst werden und zu einem Haushalt gehören. Darüber hinaus werden auch hinzugefügte und entfernte Autos eines Versicherungsvertrags analysiert. Während des Versicherungsschutzes kann ein Haushalt sich jederzeit entscheiden, den Vertrag zu kündigen, wobei in diesem Fall alle versicherten Autos sofort gekündigt werden. Dieser Vorgang wird als Vertragsbruch oder Stornierung bezeichnet. 1.2 Verwendete Daten und Notationen Die Warteschlangentheorie basiert auf den verschiedenen Wartezeiten, bevor sich etwas an der Anzahl der versicherten Fahrzeuge ändert. Hierfür werden empirische Analysen, gewonnen aus der Datenbank eines kanadischen Autoversicherungsunternehmens, verwendet. Diese Datenbank beinhaltet allgemeine Versicherungsinformationen von 322.174 Haushalten im Zeitraum 20032007. Zu beachten ist, dass aufgrund der kurzen Zeitperiode die Daten zensiert sind. Zu jedem der Haushalte liegen Informationen zu jedem seiner versicherten Fahrzeuge vor. Auch über neue oder gekündigte Verträge, Vertragsverlängerungen, hinzugefügte oder entfernte Autos gibt es Daten. Im Kapitel 4.3 werden die Datenbank im Detail analysiert und die Versicherungsinformationen genauer beschrieben, besonders die Merkmale der einzelnen Policen. Es liegt eine graphische Analyse der Wartezeiten, die in diesem Modell involviert sind, vor: In Abb. 1.1 wird die Verteilung der Lebensdauer eines Versicherungsvertrags (in Jahren) dargestellt. Mit der Lebensdauer eines Versicherungsvertrags ist die Zeit zwischen dem Inkrafttreten und der Kündigung oder dem nicht Verlängern des Vertrages gemeint. Um mögliche Verzerrungen zu vermeiden, betrachten wir im ersten der drei Graphen nur Policen, die im Zeitraum von 2003-2007 ausgestellt und gekündigt wurden. Diese Auswahl ermöglicht es, die Daten besser zu verstehen. In dieser Darstellung kann ein großer Ausschlag an jedem Vertragsverlängerungszeitpunkt erkannt werden. Abgesehen von diesen Sprüngen, wird ein exponentielles Abklingen der Werte beobachtet. Anhand des Farbcodes kann festgestellt werden, dass die meisten der wegfallenden Verträge nur ein Auto versichern. In Abb. 1.1 wird im zweiten Graphen auch die Zeit, bevor ein Fahrzeug zu einem schon existierenden Versicherungsvertrag hinzugefügt wird, beobachtet. Hierfür wurde der ganze Datensatz verwendet. Auch für die letzte der drei Illustrationen wurde die volle Datenmenge benutzt. Diese zeigt die Zeitdauer vor dem Entfernen eines Autos aus dem Versicherungsvertrag, welcher aber trotz des Wegfalles eines Fahrzeugs aufrecht bleibt. Hier kann ebenfalls ein exponentielles Abklingen und Sprünge zu den Versicherungsverlängerungszeitpunkten erkannt werden. Die Ausreißer sind jedoch im letzten Graphen nicht so signifikant wie die in den anderen. Das Ziel dieses Projekts ist diese Beobachtungen mathematisch zu approximieren. Sei N (t) eine Zufallsvariable, die die Anzahl der Elemente zum Zeitpunkt t im Wartesystem beschreibt. In diesem Fall ist die Anzahl der Elemente die Anzahl der versicherten Autos in einem Haushalt. Die Wahrscheinlichkeitsfunktion der Anzahl der versicherten Autos wird ausgedrückt durch P P r{N (t) = ii} = pi (t). Die wahrscheinlichkeitserzeugende Funktion wird durch PN (t) (z, t) = ∞ i=0 pi (t) × z beschrieben und ihre Partielle Ableitung bezüglich t ist ∞ X ∂PN (t) (z, t) dpi (t) (z, t) = × zi. ∂t dt i=0 Die bedingte Wahrscheinlichkeit wird dargestellt und bezeichnet durch p(j,i) (s, t) = P r{N (t) = i|N (s) = j}. 3 Abbildung 1.1: 0 Lebensdauer eines Versicherungsvertrags, Zeit vor dem Hinzufügen und Zeit vor dem Entfernen eines Fahrzeuges. 0 Alle Abbildungen, die in dieser Arbeit gezeigt werden, wurden dem folgenden Artikel entnommen: Boucher, Jean-Philippe; Couture-Piché, Guillaume. 2015. Modelling the number of insureds’ cars using queuing theory. Insurance: Mathematics and Economics 64 (2015) 67-76. 4 2 Modellieren der Anzahl der Fahrzeuge In diesem Abschnitt wird gezeigt, wie die Warteschlangentheorie (basierend auf Newell (1982)) zum Bestimmen der Anzahl der versicherten Autos verwendet werden kann. Zuerst wird ein Poisson-Prozess verwendet um das Hinzufügen eines neuen Autos zu modellieren, danach ein weiterer, um das Wegfallen eines Autos aus dem Vertrag darzustellen. In diesem Teil wird es weniger Details geben, da das Interpretieren der Ergebnisse nur grundlegendes Wissen über die Warteschlangentheorie erfordert. Trotzdem wird mit dieser Einführung in die Warteschlangentheorie das Erklären einiger Komponenten, die in komplexen Modellen vorkommen (z.B. dritter Abschnitt), ermöglicht. 2.1 Hinzufügen und Wegnehmen von Fahrzeugen Abbildung 2.1: Graph eines Poisson-Prozesses Im Poisson-Prozess (auch Geburtenprozess, dargestellt in Abb. 2.1) gibt es nur eine Komponente (Geburtenkomponente), die durch den Parameter λ definiert ist. Die Chapman-Kolmogorov Gleichung ist hier wie folgt definiert: pi (t) = ∞ X pj (s)p(j,i) (s, t), f ür s < t. j=0 Diese Gleichung wird so gedeutet, dass eine Wahrscheinlichkeit durch die Summe aller möglichen Pfade dargestellt werden kann. Die Gleichung erfordert, dass wir die bedingten Wahrscheinlichkeiten (es gibt i Fahrzeuge zum Zeitpunkt t + 4t unter der Bedingung, dass es zum Zeitpunkt t j Fahrzeuge gegeben hat) finden. Dies wird ausgedrückt durch: λ4t + o(4t) f ür j = i − 1, 1 − λ4t + o(4t) f ür j = i, p(j,i) (t, t + 4t) = o(4t) f ür j < i − 1 0 sonst wobei lim4t→0 o(4t) 4t = 0 gilt. Für dieses erste Modell kann gezeigt werden, dass seine Wahrscheinlichkeitsfunktion so aussieht: pi (t) = e−λt (λt)i , i! was die Darstellung der Poissonverteilung ist. Des weiteren bedeutet das, dass der Zählprozess N (t) mit dem Parameter λt poissonverteilt ist. 5 Abbildung 2.2: Graph eines M/M/∞ Modells Um ein Modell zu erhalten, das realistischer ist, wird eine weitere Komponente (Todeskomponente hinzugefügt (siehe Abb. 2.2). Die Todeskomponente soll unabhängig vom Geburtenprozess sein. Das daraus entstehende Modell wird mit M/M/∞ gekennzeichnet. Die Zeit bis zum Hinzukommen eines neuen Elements ist exponentialverteilt. Diese Eigenschaft wird in der Notation durch das erste M ausgedrückt und bedeutet ”Markov”. In diesem Modell verlässt jedes Element nach einer bestimmten Zeitperiode, die auch exponentialverteilt ist, das System wieder. Dieser neue Prozess im Modell bezeichnet das zweite M . Das letzte Symbol ∞ bedeutet, dass der Abgangsprozess (departure process) eines versicherten Autos beginnen kann, bevor der eines anderen Fahrzeuges noch nicht beendet ist. In diesem Fall bedeutet das, dass unendlich viele Autos gleichzeitig versichert werden können und es somit keine Warteschlangen gibt. Demzufolge wird mit einem dynamischen Modell einer Population, welches mit der konstanten Rate λ wächst und mit der Rate iµ schrumpft, gearbeitet. Hierbei ist i die Anzahl der Elemente der Population zu einer bestimmten Zeit. In diesem Kontext ist die Population die Anzahl der Autos in einem Haushalt und daher werden die Fahrzeuge mit der Rate λ zu der Versicherung hinzugefügt und mit der individuellen Rate µ entfernt. Für dieses Modell sind die bedingten Wahrscheinlichkeiten: λ4t + o(4t) f ür j = i − 1, 1 − (λ + iµ)4t + o(4t) f ür j = i, p(j,i) (t, t + 4t) = (i + 1)µ4t + o(t) f ür j = i + 1, o(4t) sonst. Für dieses, aus der Warteschlangentheorie bekannte Modell, ist die Wahrscheinlichkeitsfunktion beschrieben durch: h ii−k −µt ) λ min(i,a) e−(1−e µ (1 − e−µt ) λ X µ a pi (t) = e−µtk (1 − e−µt )a−k . × k (i − k)! k=0 Die wahrscheinlichkeitserzeugende Funktion wird dargestellt durch: a λ (1−e−µt )(z−1) PN (t) (z, t) = (z − 1)e−µt + 1 e µ wobei N (0) = a gilt, was bedeutet, dass die ursprüngliche Anzahl der versicherten Autos (zum Zeitpunkt 0) a ist. 2.2 Vertragsverlängerung Es ist möglich, mehr Flexibilität in das Modell M/M/∞ zu bringen, indem der Todesprozess verallgemeinert wird. Das bedeutet, dass das zweite M zu einem G, das für allgemeine Verteilung (engl. general distribution) steht, wird. Die geplante Verallgemeinerung erlaubt, die Ausreißer zu den Vertragsverlängerungszeitpunkten in das Modell einzubauen. Wie in Abb. 6 1.1 empirisch gezeigt wird, ist die Wahrscheinlichkeit höher, dass ein Auto an dem jährlichen Vertragsverlängerungszeitpunkt aus dem Vertrag entfernt wird. Basierend auf Benes (1957) wird das Modell konstruiert, indem der Prozess in mehrere Komponenten, die die Anzahl der Autos modellieren, separiert wird. Es kann voraussetzt werden, dass der Prozess N (t) durch N (t) = Z(t) − Y (t) ausgedrückt werden kann. Der Prozess Z(t) zählt die hinzugefügten Autos bis zum Zeitpunkt t und der Prozess Y (t) zählt die Autos, die bis zu einem Zeitpunkt t aus dem Versicherungsvertrag entfernt werden. Für N (0) = 0 ist die Wahrscheinlichkeitsfunktion gegeben durch: P r(N (t) = i) = (λtqt )i e−qt λt , i! die eine Poissonverteilung mit Parameter λtqt ist. Der Parameter qt kann als Überlebenswahrscheinlichkeit interpretiert werden und wird definiert durch: Z t S(x) qt = dx, t 0 wobei S(·) die Überlebensfunktion der Servicezeit, was in diesem Fall die Zeit, seitdem das Auto versichert ist, darstellt. Der Ausreißer, der zu jedem Vertragsverlängerungszeitpunkt auftritt, kann unter Verwendung der folgenden Funktion eingebunden werden: S(x) = e−µx pbxc , wobei x das Alter des Vertrages und p die Wahrscheinlichkeit, dass der Vertrag verlängert wird, ist. Die Notation b·c bezeichnet hierbei die Abrundungsfunktion. 3 Modell mit einer Inaktivitätsphase Es wäre interessant das Modell zu verallgemeinern, indem eine Kündigung des Vertrags hinzufügt wird, was bedeutet, dass alle Fahrzeuge eines Haushaltes gleichzeitig das Versicherungsunternehmen verlassen. Dieses Modell wird konstruiert, indem ein weiterer Poisson-Prozess hinzufügt wird, der den Übergang von Level n ≥ 1 zu 0 mit der Rate γ erlaubt, was den Effekt der Kündigung schafft. Abb. 3.1 illustriert dieses Modell. Dieser hinzugefügte Prozess soll unabhängig von den anderen sein. Wenn dieses Modell genauer betrachtet wird, wird ein konzeptionelles Problem bemerkt, da das Modell zulässt, dass ein Auto zu einem Vertrag hinzugefügt wird, obwohl in ihm eine Zeit lang kein Fahrzeug versichert war (Zustand 0). Diese Situation ist nicht eingängig, da zu vermuten ist, dass ein Versicherungsvertrag ohne Autos einem gekündigten Vertrag entspricht. In diesem Sinne ist der Zustand 0 absorbierend1 . Die empirische Analyse der vorhandenen Daten führt zu einer etwas komplizierteren Lage. Tatsächlich kann es passieren, dass eine Versicherungspolice ohne ein versichertes Fahrzeug nicht storniert wird. Das bedeutet, dass manchmal ein neues Auto zu einem existierenden Versicherungsvertrag ohne versicherte Fahrzeuge hinzugefügt wird. In dem verwendeten Datensatz ist dies 1340 mal passiert und die durchschnittliche Zeitdauer des Stadiums 0 ist fast ein halbes Jahr (0, 4789). 1 Ein Zustand i ∈ I ist absorbierend, wenn {i} eine abgeschlossene Klasse ist. Eine Kommunikationsklasse C ist abgeschlossen, wenn aus i ∈ C und j erreichbar von i folgt j ∈ C. (Diese Definitionen wurden den Lehrunterlagen zur Vorlesung Einführung in die Stochastischen Prozesse und Zeitreihen, die von Univ. Prof. Friedrich Hubalek im Sommersemester 2015 an der Technischen Universität Wien gehalten wurde, entnommen.) 7 Das stellt eine Form der Inaktivität des Vertrages dar, was bedeutet, dass ein Vertrag durch hinzufügen eines neuen Autos reaktiviert werden kann. Das ist in Situationen vorstellbar, bei denen der Versicherungsschutz zeitweise deaktiviert werden kann oder die Existenz eines anderen Versicherungstyps, verbunden mit der Autoversicherung, die die komplette Stornierung der Police verhindert. Aus diesen und weiteren Beispielen, kann der Zustand ohne versichertes Fahrzeug nicht als absorbierend angenommen werden. Trotzdem muss ein absorbierender Zustand, repräsentierend für die endgültige Stornierung des Vertrages, hinzugefügt werden. Dieser stellt dann nicht den Versicherungsvertrag ohne versicherte Fahrzeuge, sondern seine endgültige Auflösung dar. Abbildung 3.1: Graph eines Warteschlangenmodells, dass die Stornierung des Vertrages erlaubt Abbildung 3.2: Graph eines Warteschlangenmodells mit einem absorbierenden Zustand 0∗ Hierfür würde ein Modell, wie in Abb. 3.2. illustriert, passen, wo ein neuer absorbierender Zustand 0∗ beigefügt wird, zudem keine Autos mehr hinzugefügt werden können. Anders gesagt, tritt der Zustand 0∗ nur ein, wenn der Vertrag storniert wird. Von jedem Zustand kann 0∗ mit der Rate γ erreicht werden. Diese Situation wird in Kapitel 4 noch einmal genauer beleuchtet, da bei Versicherungen mit nur einem Auto die Stornierung des Fahrzeuges auch die Stornierung des Vertrages bedeuten kann und wiederum zwischen der Inaktivität 0 und der Auslöschung 0∗ des Vertrages unterscheiden werden muss. Die Konstruktion dieses neuen Modells ist komplex und fordert neue Notationen. Zusätzlich zu N (t), die Anzahl der zum Zeitpunkt t versicherten Autos wird nun die binäre Zufallsvariable M (t) hinzugefügt. Diese Zufallsvariable sagt aus, ob ein Prozess zum Zeitpunkt t am Leben oder Tod ist. Das ist in diesem Fall so zu verstehen, dass für M (t) = 1, was dem lebenden Prozess entspricht, der Versicherungsvertrag noch in Kraft ist, beziehungsweise noch nicht aufgelöst wurde. Ein lebender Prozess ohne Autos im Versicherungsvertrag wird als inaktiv interpretiert und ist somit im Zustand 0. Andererseits bedeutet M (t) = 0, also im Falle eines toten Prozes8 ses, dass der Haushalt den Versicherungsvertrag storniert hat und der absorbierende Zustand 0∗ erreicht wurde. 3.1 Modellierung Für dieses Modell sollten die Übergangswahrscheinlichkeiten mithilfe der Chapman-KolmogorovGleichungen berechnet werden. In dieser Arbeit wird jedoch eine einfachere mathematische Entwicklung verwendet. Zuerst wird die Annahme gemacht, dass der Zeitprozess, der mit der Zufallsvariable M (t) zusammenhängt, exponentialverteilt ist. Das bedeutet, dass vorausgestzt wird, dass die Zeit zwischen Beginn und Beendigung des Vertrages U ∼ Exp(γ) ist. Somit gilt M (t) = 0 wenn t > U und: P r(M (t) = 1) = e−γt . (3.1) Nun kann die Anzahl der Autos für beide Situationen definiert werden: • Im Fall M (t) = 1: So lange der Haushalt versichert ist, sind die Prozesse des Hinzufügens und Entfernens der Autos aktiv. Also kann die Nummer der versicherten Autos N (t) mit dem Warteschlangenmodell M/M/∞ modelliert werden. • Im Fall M (t) = 0: Wenn eine Stornierung auftritt, ist die Anzahl der versicherten Fahrzeuge 0 und es gilt P r(N (t) = 0|M (t) = 0) = 1. Infolgedessen kann die gemeinsame wahrscheinlichkeitserzeugende Funktion von N (t) und M (t) einfach entwickelt werden: PN (t),M (t) (z, y, t) = = 1 X ∞ X m=0 i=0 1 X ∞ X P r(M (t) = m, N (t) = i)y m z i P r(N (t) = i|M (t) = m) × P r(M (t) = m)y m z i m=0 i=0 = P r(M (t) = 0) + ∞ X P r(N (t) = i|M (t) = 1) i=0 i ×P r(M (t) = 1)yz = 1 − e−γt + e−γt yPN (t) (z, t) = 1 − e−γt + e−γt y((z − 1)e−µt + 1)a ×e λ (z−1)(1−e−µt ) µ . (3.2) Die wahrscheinlichkeitserzeugende Funktion des M/M/∞ Modells kann an der rechten Seite der Gleichung abgelesen werden. 3.1.1 Hinzufügen eines Stoßes zum Verlängerungszeitpunkt An jedem Ende des Vertragsjahres muss der Versicherte seinen Versicherungsvertrag verlängern. Es ist möglich, die wahrscheinlichkeitserzeugende Funktion, durch Hinzufügen eines Bernoulli Versuches, so zu modellieren, dass diese Situation miteinbezogen ist. Um das zu tun wird die Gleichung (3.1) durch Einbeziehen der Verlängerungswahrscheinlichkeit p verallgemeinert: P r(M (t) = 1) = e−γt pbtc , 9 wobei die Variable t wieder für die Zeit in Jahren und die Notation b·c für die Abrundungsfunktion steht. Diese Funktion bewirkt mit einem p < 1 die Erhöhung der Wahrscheinlichkeit auf Stornierung an jedem Ende des Vertragsjahres. Es ist einfach die Gleichung (3.2) mit dieser neuen Definition zu überarbeiten um folgendes zu erhalten PN (t),M (t) (z, y, t) = 1 − e−γt pbtc + e−γt pbtc ×y((z − 1)e−µt + 1)a e λ (z−1)(1−e−µt ) µ (3.3) Dies ist nun der gesuchte Prozess, um die Anzahl der versicherten Autos zu modellieren. 4 Statistischer Schluss Mittels der Maximum-Likelihood-Methode ist es möglich, die Parameter λ, γ, µ und p zu schätzen. Für diese Abschätzungsmethode muss die gemeinsame Wahrscheinlichkeitsdichte gefunden und mit den Beobachtungen aus dem Datensatz abgestimmt werden. Es müssen einige Annahmen getroffen werden, um mit den Informationen aus den Daten arbeiten zu können. Zuerst werden die Schritte zur Abschätzung der Parameter aus einem vereinfachten Modell, in dem es möglich ist, zwischen jedem Ereignis zu unterscheiden, durchgeführt. Danach wird durch das Einführen von Datenzensur und erklärenden Variablen das Modell angepasst und verallgemeinert. 4.1 4.1.1 Vollständige Daten Notation Um alle Parameter aus dem neuen Modell schätzen zu können, wird eine Liste der in der Likelihood-Funktion verwendeten Variablen angegeben. Alle möglichen Ereignisse, die während der Bestehensdauer der Versicherungspolice beobachtet werden, werden vermerkt als • Ereignis Typ 1 ist das Hinzufügen eines Autos in den Versicherungsvertrag. Die Zufallsvariable E beschreibt die gesamte Anzahl der Ereignisse dieser Art, wobei die Fahrzeuge ausgenommen sind, die bereits zu Beginn der Beobachtung des Vertrages versichert waren; • Ereignis Typ 2 ist die Stornierung des Vertrages am Ende des Vertragsjahres. Die Zufallsvariable Q ist die Indikatorvariable dieses Vorfalls, also gilt Q = 1 falls der Vertrag nicht verlängert wird; • Ereignis Typ 3 ist der Fall, dass die Versicherungspolice zu einem anderen Zeitpunkt, als dem Ende des Vertragsjahres storniert wird. Die Zufallsvariable A ist die Indikatorvariable dieses Vorfalls; • Ereignis Typ 4 ist das Entfernen eines Fahrzeuges aus dem Versicherungsvertrag. Die Zufallsvariable S beschreibt die gesamte Anzahl der Ereignisse dieser Art. Die Anzahl aller Ereignisse K ist die Summe der zuvor erläuterten Elemente, also K = E + A + Q + S. Auch Notationen zu Variablen, die zeitliche Informationen bezüglich des Vertrags angeben, werden nun angeführt: • tj , die Zeit (in Jahren) zu der das j-te Ereignis, das die Anzahl der versicherten Autos beeinflusst, eintritt; 10 • t˜j , die Zeitdauer (in Jahren) zwischen dem (j − 1)-ten und dem j-ten Ereignis, wobei gilt t˜j = tj − tj−1 , mit t˜1 = t1 ; • T , die der Jahre, die der Vertrag aktiv beziehungsweise inaktiv war, wobei gilt PAnzahl K ˜ T = j=1 tj und damit T = tK ; • Des Weiteren werden die Zufallsvariablen, die die Zeitdauer vor dem Eintreten eines Ereignisses vom Typ 1, 2, 3 oder 4 definieren, bezeichnet mit Ψ1 , Ψ2 , Ψ3 und Ψ4 . Außerdem sind: • Nj , eine Variable, die die Anzahl der Autos unmittelbar vor dem Eintreten des j-ten Ereignisses zählt; • V , die Summe der Beobachtungszeiten (in Jahren) aller Fahrzeuge eines Haushaltes, also RT P ˜ V = 0 N (t)dt = K j=1 tj Nj . 4.1.2 Likelihood-Funktion Die Likelihood-Funktionen wurden basierend auf der Arbeit von Benes (1957) für das M/M/∞ Modell entwickelt. Um die Parameter abzuschätzen, wird zuerst die bedingte Likelihood-Funktion, basierend auf dem Anfangszustand, bestimmt. Deshalb ist die Anzahl der bereits versicherten Autos im Portfolio nicht interessant (dies ist eine Grundannahme mit der gearbeitet wird), sondern Prozesse, die sich auf die Anzahl der Fahrzeuge in der Zukunft auswirken. Unter den Annahmen, die bei der Konstruktion des Systems gemacht wurden, wurden diese Variablen definiert als Ψ1 ∼ Exp(λ), Ψ2 ∼ Exp(µ), Ψ3 ∼ Exp(γ) und Ψ4 ∼ G(p). Um die gemeinsame Verteilung aller Ereignisse eines Haushaltes bestimmen zu können, müssen alle möglichen Fälle analysiert werden. Alle Prozesse werden als unabhängig angenommen, was die Zerlegung des Modells vereinfacht. Zum Beispiel, wissend dass das erste Ereignis das Hinzufügen eines Fahrzeuges zum Versicherungsvertrag (Ereignis Typ 1) zum beobachteten Zeitpunkt t˜1 ist, wird folgendes erhalten: P r(Ψ1 = t˜1 , Ψ2 > t˜1 , Ψ3 > t˜1 , Ψ4 > t˜1 ) ˜ ˜ ˜ ˜ = λe−λt1 e−N1 µt1 e−γ t1 ph(t1 ) , (4.1) wobei h(t) eine Funktion ist, die zählt, wie oft ein Haushalt den Vertrag bis zum Zeitpunkt t verlängert hat. Diese Gleichung wird entwickelt, indem die Eigenschaften des ersten Ereignisses einer gemeinsamen Exponentialverteilung verwendet werden. Mit einer ähnlichen Entwicklung ist es möglich die Wahrscheinlichkeiten der Ereignisse vom Typ 2, 3 und 4 zu finden: P r(Ψ1 > t˜1 , Ψ2 = t˜1 , Ψ3 > t˜1 , Ψ4 > t˜1 ) ˜ ˜ ˜ ˜ (4.2) ˜ ˜ (4.3) = e−λt1 N1 µe−N1 µt1 e−γ t1 ph(t1 ) ; P r(Ψ1 > t˜1 , Ψ2 > t˜1 , Ψ3 = t˜1 , Ψ4 > t˜1 ) ˜ ˜ = e−λt1 e−N1 µt1 γe−γ t1 ph(t1 ) ; P r(Ψ1 > t˜1 , Ψ2 > t˜1 , Ψ3 > t˜1 , Ψ4 = t˜1 ) ˜ ˜ ˜ ˜ = e−λt1 e−N1 µt1 e−γ t1 ph(t1 )−1 (1 − p). (4.4) Da die exponentiellen Prozesse keine Erinnerung haben, ist es möglich das Produkt aller K Ereignisse zu berechnen, um die gemeinsame Verteilung aller Ereignisse eines einzelnen Haushaltes 11 zu erhalten: E −λ f (E, A, S, Q, T, V |λ, γ, µ, p) = λ e × e−γ PK PK ˜ j=1 tj ˜ j=1 tj S Y ! µS e−µ NS (1 − p)Q p PK j=1 PK j=1 Nj t˜j A γ h(t˜j )−Q ∝ λE γ A µS (1 − p)Q e−(λ+γ)T e−µV pbT c−Q , wobei die konstanten Koeffizienten in der letzten Gleichung entfernt wurden, da sie zur Berechnung der Maximum Likelihood-Methode nicht benötigt werden. Für alle Φ Haushalte kann die Likelihood-Funktion ausgedrückt werden durch: `= Φ X Ei lnλ + Ai lnγ + Si lnµ + Qi ln(1 − p) i=1 +(bTi c − Qi ) lnp − (λ + γ)Ti − µVi , hierbei kennzeichnet der Indizes i den jeweiligen Haushalt. Schlussendlich werden mittels der Maximierung der Likelihood-Funktion die folgenden Schätzer erhalten: PΦ PΦ PΦ PΦ bTi c − Qi i=1 Ai i=1 Si i=1 Ei , γ̂ = PΦ , µ̂ = PΦ , p̂ = i=1 . λ̂ = PΦ PΦ i=1 Ti i=1 Ti i=1 Vi i=1 bTi c 4.2 Unvollständige Daten Wenn der Zeithorizont des Samples nur 5 Jahre beträgt ist es nicht immer möglich, die ganze Lebensdauer eines Versicherungsvertrages zu beobachten. Daraus folgt, dass der Datensatz zensiert ist und es nicht möglich ist, die Schätzung, basierend auf den vollständigen Daten, zu verwenden. Um die Parameter richtig zu schätzen, müssen wichtige Annahmen gemacht werden. Daher wird eine neue Variable Ω, der Beobachtungstag des Datensatzes, eingeführt. Zum Beispiel im Fall dieser empirischen Analyse, ist dieser Tag der 31. Dezember 2007. Dadurch ist es nicht möglich zu wissen, was mit einer Police passiert ist, die nicht bis zu diesem Zeitpunkt storniert wurde. Sie kann kurz darauf storniert worden sein oder ist möglicherweise immer noch aktiv. Für diese Verträge muss zur Likelihood-Funktion die Zeitperiode zwischen dem letzten beobachteten Ereignis K und Ω hinzufügt werden; das heißt, es wird eine Wahrscheinlichkeitsfunktion hinzufügt, die angibt, dass keine Ereignisse in diesem Zeitintervall passieren. Dies entspricht der gemeinsamen Wahrscheinlichkeit des Fortbestandes von 4 Ereignissen. Bei unabhängigen Zufallsvariablen gilt Folgendes: P r(Ψ1 > Ω − tK , Ψ2 > Ω − tK , Ψ3 > Ω − tK , Ψ4 > Ω − tK ) = P r(Ψ1 > Ω − tK )P r(Ψ2 > Ω − tK )P r(Ψ3 > Ω − tK )P r(Ψ4 > Ω − tK ) = e−λ(Ω−tK ) e−NK µ(Ω−tK ) e−γ(Ω−tK ) ph(Ω−tk ) . 4.2.1 Inaktiv vs. Storniert Wenn Zensur vorliegt, muss zwischen einem inaktiven Versicherungsvertrag (Zustand 0) und einem stornierten Versicherungsvertrag (Zustand 0∗ ) unterschieden werden. Denn in Fällen wo nur ein Auto zur Zeit tK versichert ist, also NK = 1, schauen die Ereignisse Typ 3 und Typ 4 gleich aus. 12 Zuerst wird eine neue Indikatorvariable AS(Ω − tK ) = AS = 1 eingeführt, was bedeutet, dass diese unbekannte Situation die Dauer Ω − tK hat. Da mit exponentiellen Zufallsvariablen gearbeitet wird, ist es möglich Gleichung (4.2) und (4.3) aufzusummieren. Dadurch wird die Wahrscheinlichkeit, dass der Haushalt den unbekannten Zustand zum Zeitpunkt tK erreicht, erhalten. Diese Wahrscheinlichkeit ist ausgedrückt durch e−(λ+µ+γ)t˜K ph(t˜K ) (µ + γ), dies kann nun in die Likelihood-Funktion eingefügt werden. Wegen den Eigenschaften der Exponentialverteilung sind die Wahrscheinlichkeiten, dass sich ein Haushalt im Zustand 0∗ (Ereignis Typ 3) oder im Zustand 0 (Ereignis Typ 4) befindet, gegeben durch: γ γ+µ µ P r(M (tK ) = 1, N (tK ) = 0|AS = 1) = . γ+µ P r(M (tK ) = 0|AS = 1) = Es ist möglich, die Zeit Ω − tK in die Likelihood-Funktion zu inkludieren, um herauszufinden welches Ereignis (Typ 3 oder Typ 4) wahrscheinlicher ist. Wenn keine Verlängerung zwischen den Zeitpunkten tK und Ω durchführbar ist, sind 3 Situationen zur Zeit tK möglich: • Ein Ereignis Typ 3 tritt zur Zeit tK ein, was bedeutet, dass der Vertrag gekündigt wurde. • Ein Ereignis Typ 4 tritt zur Zeit tK ein und kein weiteres Ereignis geschieht bis zum Zeitpunkt Ω. Das würde bedeuten, dass der Versicherungsvertrag inaktiv ist. • Ein Ereignis Typ 4 tritt zur Zeit tK ein und ein Ereignis Typ 3 geschieht zwischen der Zeitdauer (tK , Ω), sodass der Versicherungsvertrag storniert ist. Anstatt jede dieser Wahrscheinlichkeiten zu berechnen, ist es einfacher die Gegenwahrscheinlichkeit zu finden. Diese Gegenwahrscheinlichkeit entspricht einem Ereignis: ein Ereignis Typ 4 tritt zur Zeit tK auf, gefolgt von dem Hinzufügen eines Autos während des Zeitintervalls (tK , Ω). Diese Wahrscheinlichkeit kann wie folgt berechnet werden: P r(M (tK ) = 1, N (tK ) = 0|AS = 1)P r(Ψ1 < min(Ψ3 , Ω − tK )) µ λ = (1 − e−(γ+λ)(Ω−tK ) ) . γ+µ λ+γ (4.5) Dies entspricht dem Produkt von drei Wahrscheinlichkeiten: die Wahrscheinlichkeit, dass ein Ereignis Typ 4 zur Zeit tK auftritt, die Wahrscheinlichkeit, dass Ereignisse vom Typ 1 oder 3 vor dem Zeitpunkt Ω eintreten und die Wahrscheinlichkeit, dass das letzte Ereignis das Hinzufügen eines Fahrzeuges (Typ 1) ist. Es ist wichtig zu vermerken, dass diese Gleichung nur in Fällen ohne Möglichkeit auf Vertragsverlängerung verwendet werden sollte. Daher muss diese Gleichung verallgemeinert werden, um jede Vertragsverlängerung in die Berechnung der Wahrscheinlichkeit, in dem unbekannten Zustand zu bleiben, einzugliedern. Um dies zu tun, ist es erforderlich die Wahrscheinlichkeit des Hinzufügens eines Autos bezüglich jedes Jahres aufzuteilen. Zuerst müssen jedoch einige Elemente im Detail erklärt werden. Es ist zu bemerken, dass der Zeitpunkt tK , indem der Status des Versicherten unbekannt wird, nicht unbedingt dem Zeitpunkt, indem es möglich ist, den Vertrag zu verlängern, entspricht. Das bedeutet, dass die Zeitperiode vor der ersten Verlängerung und die letzte Zeitperiode vor Ω weniger als ein Jahr betragen. Daraus folgt, falls es zumindest eine Vertragsverlängerung in der unbekannten Periode Ω−tK gibt, ist 1 − {tK } eine Möglichkeit, den unbekannten Zeitabschnitt des Jahres vor der ersten Verlängerung auszudrücken. Hierbei ist {·} die Funktion, die die Nachkommastellen ausgibt. 13 Ebenso kann der Zeitabschnitt des Jahres vor Ω geschrieben werden als {Ω} und die gesamte Anzahl der Vertragsverlängerungen in der unbekannten Periode ist bΩc − btK c = R. Damit erhalten wir folgende Gleichung: P r(Ψ1 < min(Ψ3 , 1 − {tK })) {z } | vor erster V erlängerung nach tK + P r(min(Ψ3 , Ψ1 , Ψ4 ) > 1 − {tK }) × P r(Ψ1 < min(Ψ3 , 2 − {tK })|min(Ψ3 , Ψ4 , Ψ1 ) > 1 − {tK }) | {z } zwischen erster und zweiter V erlängerung nach tK + ··· Diese Gleichung kann als Summe vieler Möglichkeiten, die zwischen jeder Vertragsverlängerung geschehen können, verstanden werden. Das erste Element ist einfach die Wahrscheinlichkeit, dass ein Ereignis Typ 1 vor der ersten Vertragsverlängerung nach tK eintritt. Die zweite Komponente der Summe ist also die Wahrscheinlichkeit, dass ein Ereignis Typ 1 auftritt, dieses Mal aber zwischen der ersten und der zweiten Vertragsverlängerung nach tK . In diesem Fall muss sich in der Wahrscheinlichkeit widerspiegeln, dass der Vertrag bei der ersten Möglichkeit zur Verlängerung nach tK auch verlängert wurde. Alle anderen Situationen zwischen den potentiellen Vertragsverlängerungen j und j + 1, für j = 3, ... müssen auch dazugerechnet werden, sodass gilt: = × + = × P r(Ψ1 < min(Ψ3 , Ψ4 , Ω − tK )|R ≥ 1) λ λ −(γ+λ)(1−{tK }) 1 − e−(γ+λ)(1−{tK }) + e γ+λ γ+λ p 1 − e−(γ+λ) + · · · λ −(γ+λ)(R−{tK }) R e p 1 − e−(γ+λ){Ω} γ+λ λ 1 − e−(γ+λ)(1−{tK }) + e−(γ+λ)(1−{tK }) p 1 − e−(γ+λ) γ+λ R−1 1 − pe−(γ+λ) −(γ+λ){Ω} −(γ+λ)(R−{tK }) R , +e p 1−e 1 − pe−(γ+λ) wobei eine Vereinfachung aufgrund der Eigenschaften der geometrischen Reihe gemacht wurde. Die Fälle R = 0 und R > 0 können zu folgendem kombiniert werden P r(Ψ1 < min(Ψ3 , Ψ4 , Ω − tK ))P r(M (tK ) = 1, N (tK ) = 0|AS = 1) µ λ = 1{R=0} 1 − e−(γ+λ)(Ω−tK ) γ+µγ+λ + 1{R≥1} 1 − e−(γ+λ)(1−{tK }) 1 − pe−(γ+λ) R−1 + e p 1−e 1 − pe−(γ+λ) −(γ+λ)(R−{tK }) R −(γ+λ){Ω} + e p 1−e ≡ G(tK , Ω). −(γ+λ)(1−{tK }) −(γ+λ) Im Fall das p = 1 ist, ist die Lösung gegeben durch Gleichung (4.5). Somit wurde die gesuchte Gegenwahrscheinlichkeit berechnet. 14 Zur Verbesserung des Modells, um die Situationen, in denen es schwer ist, zwischen inaktiven und stornierten Versicherungspolicen zu unterscheiden, einzubeziehen, wird die LikelihoodFunktion angepasst, indem der Term 1 − G(tK , Ω) hinzugefügt wird: L(λ, γ, µ, p) ∝ e−(λ+γ)T e−µV λE µS ∗ × γ A (1 − p)Q pbT c−Q [(µ + γ)(1 − G)]A , wobei A∗ = 1, falls der Versicherte im unbekannten Zustand ist. Unter Verwendung des Logarithmus dieser Funktion und durch das Summieren aller Haushalte eines gegebenen Portfolios, wird es möglich die vier Parameter λ, γ, µ und p zu schätzen. 4.3 Nummerische Anwendung Das Modell bezieht sich auf den Versicherungsdatensatz beschrieben in Kapitel 1.2 und die 4 geschätzten Parameter sind in Tabelle 4.1 angeführt. Der Wert λ̂ bedeutet, dass im Durchschnitt alle 0, 07303−1 = 13, 69 Jahre ein Fahrzeug zu dem Vertrag hinzugefügt wird. Der Wert µ̂ steht dafür, dass ein Auto durchschnittlich 0, 08277−1 = 12, 08 Jahre im Vertrag versichert ist. Zu bemerken ist, dass die Rate der hinzugefügten Fahrzeuge nicht die der entfernten Autos ausgleicht, da λ̂ < µ̂. Erwähnenswert ist auch, dass die jährliche Vertragsverlängerungsrate bei 92% und die Wahrscheinlichkeit der Stornierung ungefähr bei 4% liegt. Für den Versicherer ausgewertet bedeutet das, dass bei der Aufnahme neuer Versicherungsnehmer langfristige Rentabilität sichergestellt werden sollte. Tabelle 4.1 Geschätzte Parameter (Standardfehler) Hinzufügen λ Stornierung γ Entfernung µ 0,0730 (0,0003) 0,0400 (0,0003) 0,0828 (0,0003) 4.3.1 Verlängerung p 0,9179 (0,0003) Kovariaten Manche Haushaltsprofile neigen eher dazu, Fahrzeuge zum Versicherungsvertrag hinzuzufügen, andere eher dazu, Fahrzeuge zu entfernen. Ebenso gibt es Profile, die eher stornieren als andere, und verschiedene Typen von Versicherungsnehmern haben auch eine höhere beziehungsweise niedrigere Verlängerungsrate. Deshalb scheint das Hinzufügen von Kovariaten zu jedem Parameter des Warteschlangenprozesses gerechtfertigt. In Tabelle 4.2 sind die Kovariaten, die den Vektor Xi zu jedem Haushalt definieren, angegeben. Die Gültigkeitsdaten der Versicherungsverträge werden verwendet, um die Stabilität der Haushalte, die sich im Juli versichern lassen, zu zeigen. Auch wenn sich die Merkmale eines Haushaltes während des Jahres verändern können, werden nur die Merkmale, die im ersten Vertrag beobachtet werden, betrachtet. Es wird davon ausgegangen, dass der Effekt minimal ist, da die Zeitspanne des Datensatzes recht kurz ist und die meisten Haushalte ihre Risiko Charakteristiken nicht während des Jahres verändern. Eine Linkfunktion g(Xi β) ist dann versehen mit jedem Parameter, wobei β der zu schätzende Parametervektor ist. In diesem Modell soll für die Parameter λ, γ, µ ∈ R+ gelten, weshalb eine logarithmische Linkfunktion gewählt wird, da diese gewährleistet, dass die Parameter immer positiv sind. Außerdem muss der Parameter, der die Verlängerungswahrscheinlichkeit beschreibt, exp(X β ) p ∈ [0, 1] erfüllen, weshalb der Logit-Link verwendet wird, das heißt pi = 1+exp(Xi i βp ) . Die p geschätzten Werte des Parametervektors β sind in Tabelle 4.3 angeführt. 15 Das Ziel eines Versicherers sollte das Maximieren der Anzahl der versicherten Autos zur Zeit t sein. In diesem Fall wird nach hohen Werten der Parameter λ und p, kombiniert mit niedrigen Werten für µ und γ gesucht. Die Ergebnisse lassen vermuten, dass manche Kovariaten, wie der Familienstand oder X6 (Versicherte mit Gültigkeitsdatum am 1. Juli), einen großen Einfluss haben. Zusätzlich liefern Versicherungsnehmer, die ihren Vertrag am ersten Tag eines Monates verlängern, erhöhte Stabilität. Die Kovariate X4, die für Versicherte, die weniger als 9 Jahre bei dem Unternehmen versichert sind, steht, zeigt höhere Loyalität zum Versicherungsunternehmen. Um zu testen, ob die erklärenden Variablen auch statistisch signifikant sind, wurde ein Wald-Test mit einem Konfidenzintervall von 95% zu jedem der Parameter durchgeführt. Daraus folgt, dass β5 nicht in β λ , β γ und β µ enthalten ist und β2 nicht in β γ . Tabelle 4.2 Binäre Variablen, die die verfügbaren Informationen eines Haushaltes zusammenfassen Variable Beschreibung X1 Gibt 1 aus, falls der Haushalt aus dem allgemeinen Markt kommt (entgegengesetzt der Gruppenversicherung) X2 Gibt 1 aus, falls der Haushalt zumindest ein gemietetes Auto besitzt X3 Gibt 1 aus, falls die Versicherten nicht verheiratet sind X4 Gibt 1 aus, falls der Haushalt weniger als 9 Jahre bei diesem Unternehmen versichert ist X5 Gibt 1 aus, falls das Gültigkeitsdatum des Vertrages zwischen Januar und Juli liegt X6 Gibt 1 aus, falls das Gültigkeitsdatum des Vertrages im Juli liegt X7 Gibt 1 aus, falls das Gültigkeitsdatum des Vertrages am ersten Tag eines Monats liegt Tabelle 4.3 Geschätzte Parameter für den Parameter βλ β0 -2,494 (0,015) β1 -0,264 (0,009) β2 -0,142 (0,011) β3 -0,454 (0,009) β4 0,201 (0,014) β5 β6 -0,098 (0,012) β7 -0,129 (0,009) 5 Prozess mit Kovariaten βγ βµ -3,709 (0,039) -2,726 -0,070 (0,019) 0,122 -0,048 0,214 (0,018) 0,410 0,677 (0,038) 0,130 -0,181 (0,029) -0,647 (0,021) (0,014) (0,009) (0,011) (0,008) (0,013) -0,034 (0,012) -0,129 (0,009) βp 2,769 -0,152 0,092 -0,246 -0,399 0,137 0,400 0,089 (0,019) (0,010) (0,013) (0,009) (0,017) (0,009) (0,016) (0,010) Analyse In diesem Kapitel werden Anwendungen, die die geschätzten Parameter aus dem vorherigen Kapitel (angeführt in Tabelle 4.3) verwenden, gezeigt. Obwohl im Folgenden mit den Parametern λ̂, γ̂, µ̂ und p̂ gearbeitet wird, wird der Einfachheit halber die Notation λ, γ, µ und p verwendet. Es wurden 5 Profile ausgewählt, um zu zeigen, welche Auswirkungen die Marktsegmentierung hat. Von 96 Profilen werden nur einige typische Versicherungsnehmer verwendet, um die Ergebnisse dieser Analyse zu zeigen. Das erste ausgewählte Profil E ist die beste Art eines Haushaltes bezüglich erwarteter versicherter Autos und das schlechteste Profil wird mit Haushalt A bezeichnet. Zur Veranschaulichung werden auch 3 durchschnittliche Typen (B, C, D) 16 betrachtet. Tabelle 5.1 stellt jedes Profil bezüglich seiner Kovariaten dar. Es ist festzustellen, dass der einzige Unterschied zwischen Haushalt Typ B und D im Familienstand liegt. An den Ergebnissen, gezeigt in Tabelle 4.3, kann erkannt werden, dass diese Kovariate einen erheblichen Einfluss auf die Parameter des Modells hat. In Tabelle 5.2 sind die Werte der Parameter λ, γ, µ und p für jedes Profil aufgelistet. Tabelle 5.1 Kovariaten jedes Profils Parameter X1 X2 X3 Haushalt A 1 0 1 Haushalt B 1 1 1 Haushalt C 0 0 1 Haushalt D 1 1 0 Haushalt E 0 1 0 X4 1 0 0 0 0 Tabelle 5.2 Parameterwerte jedes Profils Parameter λ γ Haushalt A 0,0492 0,0557 Haushalt B 0,0349 0,0283 Haushalt C 0,0460 0,0159 Haushalt D 0,0550 0,0228 Haushalt E 0,0570 0,0107 5.1 X5 0 0 0 0 0 µ 0,1270 0,1063 0,0868 0,0705 0,0530 X6 0 0 0 0 1 X7 0 0 1 0 1 p 0,87795 0,92154 0,93163 0,93756 0,96608 Erwartete Anzahl versicherter Autos Mithilfe der wahrscheinlichkeitserzeugenden Funktion des kompletten Prozesses, die in Kapitel 3.1.1 gezeigt wurde, können interessante Eigenschaften gefunden werden. Um Notationen und Berechnungen zu vereinfachen, wird die Variable H(t) verwendet, um die Anzahl der versicherten Fahrzeuge eines aktiven oder inaktiven Versicherungsnehmers darzustellen. Es gilt n H(t) = M (t) × N (t). Mit dem Wissen, dass P r(X = n) = d Pdz(z=0) gilt, ist es möglich die n erwartete Anzahl der versicherten Autos H(t) mithilfe des Folgenden zu berechnen: E[H(t)] = ∞ ∂PN (t),M (t) (z = 1, y = 1, t) X (1) = ipi 1i−1 1. ∂z i=0 Der erwartete Wert für diesen Prozess wird unter Verwendung von Gleichung (3.3) berechnet. Zuerst wird nach z abgeleitet: ∂PN (t),M (t) (z,t) ∂z h a (z−1)(1−e−µt ) λ i µ ∂ 1 − e−γt pbtc 1 − (z − 1)e−µt + 1 ye = = × ∂z a−1 (z−1)(1−e−µt ) λ µ e p (z − 1)e +1 ye h i λ ae−µt + (z − 1)e−µt + 1 1 − e−µt . µ −γt btc −µt 17 Nun wird z = 1 und y = 1 gesetzt, um den erwarteten Wert zu erhalten: E[H(t)] = ∂PH(t) (z = 1, t) ∂z = e −γt btc p ae −µt −µt + 1−e λ µ . Mit ähnlichen Rechnungen können auch andere Momente der Verteilung gefunden werden, wie zum Beispiel die Varianz oder auch höhere Momente. Diese Berechnungen können auch auf alle anderen wahrscheinlichkeitserzeugende Funktionen, die in dieser Arbeit vorgekommen sind, angewandt werden. Für jedes Profil wurde die erwartete Anzahl der versicherten Autos berechnet. Die Ergebnisfunktion ist in Abb. 5.1 dargestellt. Für die Illustration wurde der Wert c = 0 gesetzt, was bedeutet, dass die Versicherungsnehmer am Beginn ihres Vertrages sind und in einem Jahr die nächste Möglichkeit zur Verlängerung der Police besteht. In der Darstellung kann sehr gut der Stoß zu jedem Vertragsverlängerungszeitpunkt, der durch den Parameter p erzeugt wird, erkannt werden. In Tabelle 5.3 sind die numerischen Werte der erwarteten Anzahl der versicherten Fahrzeuge nach 5 Jahren, gleich nach der Vertragsverlängerung abzulesen. Es ist festzustellen, dass die ursprüngliche Anzahl der versicherten Autos den erwarteten Wert linear erhöhen. Die Ergebnisse weisen auf einen großen Unterschied zwischen den Profilen hin, wobei es zum Beispiel scheint, als ob Haushalt E viel vorteilhafter für den Versicherer ist als Haushalt A. Daraus folgt, dass ein Versicherungsunternehmen seinen Marketingaufwand an bestimmte Typen von Versicherungsnehmer anpassen sollte, in diesem Fall an Haushalte vom Typ E anstatt an welche vom Typ A. Außerdem sollten Versicherer manchen versicherten Profilen, die geringere administrative Kosten verursachen, eine Ermäßigung anbieten, da sie dann länger bei dem Unternehmen bleiben. Abbildung 5.1: Erwartete Anzahl versicherter Autos zum Zeitpunkt t 18 Tabelle 5.3 Erwartete Anzahl versicherter Autos nach 5 Ursprüngliche Anzahl der 1 2 versicherten Autos (a) Haushalt A 0,281 0,490 Haushalt B 0,417 0,756 Haushalt C 0,541 0,961 Haushalt D 0,604 1,058 Haushalt E 0,812 1,424 5.2 Jahren 3 4 0,700 1,096 1,381 1,513 2,036 0,909 1,435 1,801 1,967 2,648 Diskontiertes Risikopotential Der diskontierte Geldwert eines Haushaltes kann gefunden werden, indem der derzeitige Wert von Cash Flows der Zukunft berechnet wird. Das Ergebnis wird im Marketing Kundenertragswert (CLV) genannt. In diesem Fall wird angenommen, dass das Versicherungsunternehmen einen Profit von $1 für jede, ein Jahr dauernde Beobachtung eines Autos macht. Diese Annahme kann ganz einfach zu einer realistischeren abgeändert werden. Auch der Diskontierungssatz δ ist vorgegeben. Um den Kundenertragswert zu berechnen, ist es notwendig den derzeitigen Wert einer zukünftigen Exposition bis zur Zeit T , unter Verwendung eines kontinuierlichen Diskontierungssatzes δ, auszurechnen. Der Kundenertragswert wird mit ωT bezeichnet und kann berechnet werden, indem die Variable H(t) mit Hilfe der Riemann Summe integriert wird: Z T −δt H(t)e ωT = 0 n δiT T X iT dt = lim H e− n , n→∞ n n (5.1) i=1 Der erwartete Wert kann einfach herausgefunden werden: n δiT T X iT E(ωT ) = lim e− n E H n→∞ n n i=1 Z T = E(H(t))e−δt dt. 0 In Tabelle 5.4 sind die erwarteten Werte jedes Haushaltes abzulesen, unter der Annahme, dass der Haushalt zum Zeitpunkt t = 0 zwei Autos versichert hat. Auf lange Zeit werden die Unterschiede zwischen den Haushaltsprofilen sichtbar. Haushalt E ist nach 20 Jahren durchschnittlich 2,5 mal profitabler als Haushalt A. In der Marketing Literatur ist es eher unüblich, den Kundenertragswert für große Zeithorizonte zu berechnen. Trotzdem ist es in diesem Fall nützlich, dieses Resultat auszurechnen, da es einem erlaubt, einfache Gleichungen zu erhalten. Mit Gleichung (5.1) ist es möglich, den gesamten Profit auszurechnen, indem man T gegen unendlich gehen lässt. Dieser Wert wird als ω ≡ limT →∞ ωT definiert. 19 Sein Erwartungswert wird folgendermaßen berechnet: Z ∞ E(H(t))e−δt dt E(ω) = 0 Z ∞ −µt −µt λ −(γ+δ)t btc ae + 1−e = e p dt µ 0 ∞ Z i+1 X λ dt = e−(γ+δ)t pi ae−µt + 1 − e−µt µ i i=0 ∞ X e−i(γ+δ+µ) − e−(i+1)(γ+δ+µ) i = a p γ+δ+µ i=0 e−i(γ+δ) − e−(i+1)(γ+δ) λ i p + (γ + δ)µ e−i(γ+δ+µ) − e−(i+1)(γ+δ+µ) λ i − p (γ + δ + µ)µ 1 − e−(γ+δ+µ) a − µλ = (γ + δ + µ) 1 − e−(γ+δ+µ) p 1 − e−(γ+δ) λ , + (γ + δ)µ 1 − e−(γ+δ) p Hierbei ist a die Anzahl der versicherten Autos zum Zeitpunkt t = 0. Die numerischen Ergebnisse, die in Tabelle 5.5 aufgelistet sind, zeigen einen großen Unterschied zwischen dem besten und dem schlechtesten Haushalt. Demzufolge sollte ein Versicherungsunternehmen die Versicherungsnehmer anvisieren, die die Kovariaten wie Haushalt E haben. Diese Analyse basiert auf einem $1 Profit pro Haushalt. Dies kann durch einen Profit, proportional zur Prämie verallgemeinert werden. Außerdem kann unter Verwendung dieses Modells und eines Wirtschaftsmodells zur Preiselastizität die Prämie als Funktion von zukünftigen Profiten dargestellt werden. Tabelle 5.4 Kundenertragswert von 2% Diskontierungssatz Anzahl der Jahre (T) Haushalt A Haushalt B Haushalt C Haushalt D Haushalt E Haushalten mit zwei versicherten Fahrzeugen zur Zeit t = 0, mit einem 1 1,833 1,869 1,904 1,917 1,946 5 5,468 6,359 7,003 7,286 8,218 10 6,720 8,581 10,104 10,823 13,553 Tabelle 5.5 Kundenertragswert, mit 2% Diskontierungssatz Anzahl der versicherten Autos 1 2 zur Zeit t = 0, (a) Haushalt A 3,964 7,161 Haushalt B 5,588 9,992 Haushalt C 7,661 13,011 Haushalt D 8,782 14,586 Haushalt E 16,130 24,735 20 7,122 9,731 12,237 13,506 19,433 3 4 10,358 14,395 18,361 20,390 33,340 13,555 18,799 23,711 26,194 41,945 Hierbei wurde eine Approximation mit der Kovariate X4, die fixiert wurde, obwohl sie sich 20 eigentlich über die Zeit verändern sollte, durchgeführt. Diese Approximation bezieht sich nur auf den Haushalt A. 6 Diskussion Wie schon zuvor erwähnt, deuten die numerischen Ergebnisse dieser empirischen Untersuchung darauf hin, dass ein Versicherer sich manchen Haushalten mehr widmen sollte als anderen. Es ist jedoch wichtig, sich in Erinnerung zu behalten, dass die getroffenen Schlussfolgerungen auf einigen Annahmen bezüglich des Modells basieren. In dem vorigen Kapitel dieser Arbeit wurde schon festgestellt, dass die Annahme über die Profitkomponente der Prämie verallgemeinert werden sollte, um realistischer zu sein. Auch andere Veränderungen sind möglich. Die erklärenden Variablen sollten etwas dynamischer sein, um die Veränderungen eines Haushaltes während der Zeit wiederzugeben. Zum Beispiel sollte sich logischerweise die Kovariate, die die versicherte Zeit bei dem Unternehmen modelliert (X4), über das Jahr verändern. Auch der Schadensverlauf könnte zum Modell hinzufügt werden. Dadurch würde sich die Anpassung des Modells verbessern, vor allem Parameter p, die Vertragsverlängerungsrate. Intuitiv lässt sich vermuten, dass das Verhalten eines Versicherungsnehmers nicht das gleiche ist, nachdem er eine Schadenforderung während des Jahres eingereicht hat. Diese Verhaltensveränderung wäre wahrscheinlich verbunden mit der Erhöhung der Prämie. In so einer Verallgemeinerung des Modells könnte auch ein System von Erfahrungstarifierung (zum Beispiel das Bonus-Malus-System) eingeführt werden. Das Hunger nach Bonus Phänomen sollte auch hinzugefügt werden, um ein nützlicheres Modell und einen realistischeren Ansatz zu erhalten. Andere interessante Verallgemeinerungen des Modells sind auch noch möglich. Es sollte eine Abhängigkeit zwischen den vier Prozessen des Modells in zukünftigen Modellierungen eingefügt werden. Zum Beispiel wirkt eine Abhängigkeit zwischen der Kündigungsrate und dem Datum der Vertragsverlängerung logisch. Ein Versicherungsnehmer der über die Preise am Versicherungsmarkt informiert ist, sollte eine höhere Wahrscheinlichkeit haben, das Versicherungsunternehmen während der Versicherungsdauer und am Vertragsverlängerungszeitpunkt zu verlassen. Ebenfalls scheint es naheliegend, dass ein Versicherter, der ein neues Auto zum Versicherungsvertrag hinzufügen lässt, eher dazu neigt, ein Fahrzeug aus dem Vertrag zu entfernen. Noch allgemeiner sollte ein Versicherungsnehmer, der viele neue Autos versichern lässt, auch viele Autos wieder aus dem Vertrag nehmen. Auch andere Arten von Abhängigkeit zwischen den Prozessen sind möglich. Jedoch sollte das Hinzufügen von Kovariaten in das Modell die Auswirkung solcher Abhängigkeiten verringern, auch wenn die Struktur der Abhängigkeit offensichtlich ist. Auch wenn das Einbinden von Abhängigkeit zwischen den Prozessen eine interessante Verallgemeinerung des Modells sein kann, sind die einfacheren Generalisierungen wahrscheinlich trotzdem nützlicher. Zum Beispiel sollte das Verwenden von anderen Wartezeitverteilungen zur Modellierung des Prozesses erwägt werden (Gamma statt der Exponentialverteilung zum Beispiel). Die Anwendung des in dieser Arbeit vorgestellten Modells in anderen Branchen (wie Gruppenversicherung oder Hausversicherung) ist ebenfalls ein interessanter Zugang. Auch das Vermischen mehrerer Brachen kann betrachtet werden. 21 7 Fazit Das Ziel war die Anzahl der versicherten Fahrzeuge für jeden Haushalt zu modellieren. Beginnend mit einem Poisson-Prozess ist es möglich, mehrere Typen von Warteschlangenmodellen zu verallgemeinern. Das Modell das in dieser Arbeit vorgestellt wurde, kann als Generalisierung des M/M/∞ Prozesses gesehen werden. Es wurde ein neuer Todeszustand zum System hinzugefügt, der die Möglichkeit der Stornierung oder des Nicht-Verlängerns eines Vertrages darstellt. Aufgrund der empirischen Daten ist zu erkennen, dass zwischen einer gekündigten Police und einem inaktiven Vertrag unterschieden werden sollte. Dieses neue Modell benötigt vier Parameter: einen Parameter, der die Aufnahmerate von Autos in den Versicherungsvertrag modelliert, einen zweiten, der die Entfernungsrate versicherter Fahrzeuge darstellt, einen dritten der die Kündigungsrate der Police modelliert, und zuletzt einen Parameter zur Modellierung der Vertragsverlängerungsrate. Mittels statistischer Methoden ist es möglich diese Parameter zu schätzen, indem die Eigenschaften der Exponentialverteilung verwendet und die möglichen Ereignisse aufbereitet werden. Da hier mit zensierten Daten gearbeitet wurde, ist ein Weg zur Schätzung der Parameter, für den Fall, dass nicht zwischen dem inaktiven und dem stornierten Versicherungsvertrag unterschieden werden kann, entwickelt worden. Es wurde auch versucht, dieses neue Warteschlangensystem zu verallgemeinern, indem erklärende Variablen zu jedem der vier Parameter hinzugefügt wurden. Dann war es möglich herauszufinden, welche Profile von Vertragsinhabern eher dazu neigen, Fahrzeuge zum Vertrag hinzuzufügen oder zu entfernen, ihn zu kündigen oder die Police jährlich zu verlängern. Die erhaltenen geschätzten Parameter halfen das Versicherungsportfolio im Detail zu analysieren, da mehrere Arten von Statistiken, die für Versicherer nützlich sein können, entwickelt wurden, wie die erwartete Anzahl versicherter Autos oder der Kundenertragswert, der die zukünftigen Profite verbunden mit einem Versicherten berechnet. Dieses Modell dürfte eine gute Approximation der empirischen Daten sein und stellt einen interessanten ersten Schritt in das Modellieren von Abgangszeiten in der Versicherung dar. Es wäre wahrscheinlich angebracht, dieses Modell noch weiter zu verbessern, wobei bereits einige Verallgemeinerungen durchgeführt wurden. Weiter ist zu beachten, dass diese Analyse nur die Entwicklung der Haushalte, die bereits im Portfolio sind, untersucht. Daher beinhaltet das Modell nicht das Hinzufügen weiterer Policen zu dem Portfolio. Folglich nimmt die Anzahl der Haushalte im Portfolio mit der Zeit ab. Jedoch war das eigentliche Ziel dieser Arbeit, die Veränderung der Anzahl der versicherten Fahrzeuge eines konkreten Haushaltes sowie das Verhalten des Versicherten und den Einfluss der Eigenschaften eines Haushaltes zu analysieren. Wenn ein Versicherungsunternehmen die Entwicklung seines gesamten Portfolios analysieren will, sollte es das Hinzukommen neuer Haushalte miteinkalkulieren. Der Versicherer könnte demnach den Geldwert des Portfolios (auch Kundeneigenkapital) analog zur Berechnung des Kundenertragswertes kalkulieren. 22 8 Literatur Benes, V.E., 1957a. Fluctuations of telephone traffic. Bell Syst. Tech. J. 36, 965-973. Benes, V.E., 1957b. A sufficient set of statistics for a simple telephone exchange model. Bell Syst. Tech. J. 36, 939-964. Boucher, Jean-Philippe; Couture-Piché, Guillaume. 2015. Modelling the number of insureds’ cars using queuing theory. Insurance: Mathematics and Economics 64 (2015) 67-76. Löpker, Andreas. Frühjahrstrimester 2014. Warteschlangentheorie. Hamburg: Helmut-Schmidt-Universität. Newell, G., 1982. Applications of Queueing Theory. In: Monographs on Statistics and Applied Probability , Chapman and Hall. 23
© Copyright 2025 ExpyDoc