Dynamisch modelleren van het afkooprisico In samenwerking met

Faculteit Wetenschappen en Bio-ingenieurswetenschappen
Vakgroep Wiskunde
Dynamisch modelleren van het afkooprisico
Masterproef ingediend met het oog op het behalen van de graad van
Master of Science in de Actuari¨ele Wetenschappen
Joachim Hendrickx
Promotor:
Prof. Dr. Kim Everaert
In samenwerking met
MEI 2014
2
white
3
Voorwoord
Na een laatste jaar van werken en studeren, is hier ook mijn tweede masterproef. Deze
masterproef was totaal anders dan de vorige doordat deze van een meer praktische kant uit
gaat. Ik heb me bij het maken van de masterproef verder kunnen bekwamen in de statistiek.
Ook heb ik bepaalde facetten van levensverzekeringen van dichterbij bekeken.
Ik heb de stage bij KBC Verzekeringen als plezierig ervaren en wil hierom ook alle collega’s
bedanken die mij hebben begeleid. Zonder dat ik hopelijk iemand te kort doe, zou ik graag
in het bijzonder een aantal mensen willen bedanken die mee hebben bijgedragen aan mijn
thesis.
Ten eerste bedank ik mijn promotor, prof. dr. Kim Everaert. Ik heb de ondersteuning die
ik van u hebben gekregen als zeer hulpzaam beschouwd. Uw commentaar was steeds zeer
specifiek en duidelijk. Ten tweede bedank ik mijn collega die mij heeft geholpen bij het
project van KBC Verzekeringen, Diggory Kindt. Ik vond het een zeer goede samenwerking
en ik wil u bedanken voor de vrijheid die ik had bij het uitwerken van de studie. Bedankt
ook voor de ondersteuning wanneer ik even niet verder kon. Ten slotte wil ik Elly Van Noten
en Lies Lierman bedanken voor de kans die ik heb gekregen door aan dit project te werken.
Ik vond het een toegevoegde waarde voor mijn studie.
Ik wens u als lezer veel plezier met het lezen van mijn masterproef.
Joachim Hendrickx
19 mei 2014
OPGELET: Dit is de publieke versie van een vertrouwelijke masterproef. De originele
masterproef bevat namelijk vertrouwelijke informatie van KBC Verzekeringen. Deze
informatie is op de volgende manier onleesbaar gemaakt:
4
white
Inhoudsopgave
1 Inleiding
7
2 Het afkooprisico
9
2.1 Effect van afkoop op ALM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.2 Solvency II . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
3 Generalised Linear Models
3.1 Lineaire modellen . . . . . . . . . . . . . . . . . . . .
3.2 De veronderstellingen bij Generalised Linear Models
3.2.1 De exponenti¨ele familie van verdelingen . . .
3.2.2 Link functies . . . . . . . . . . . . . . . . . .
3.3 Het GLM model . . . . . . . . . . . . . . . . . . . .
3.4 De modelparameters schatten . . . . . . . . . . . . .
3.4.1 Numerieke methode voor grote datasets . . .
3.4.2 Significantietesten . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
17
17
18
19
20
21
21
22
22
4 Mogelijke modelparameters
25
4.1 Economische parameters . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
4.2 Polisgegevens . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
4.3 Het afkooppercentage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
5 Afkoop modelleren met GLM
29
5.1 Het logistische model . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
5.2 Praktische problemen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
6 Gewogen lineaire regressie op klassen
6.1 Continue polisvariabelen opdelen in klassen
6.2 Bivariate analyse . . . . . . . . . . . . . . .
6.3 Regressie op polisgegevens . . . . . . . . . .
6.3.1 Significante polisgegevens . . . . . .
6.3.2 Het aantal klassen reduceren . . . .
6.4 Regressie met economische parameters . . .
6.4.1 Dataset met niet-fiscale polissen . .
6.4.2 Dataset met fiscale polissen . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
31
31
33
35
36
38
38
38
40
7 De dynamische formules
43
7.1 Het continu maken van de resterende duurtijd . . . . . . . . . . . . . . . . . . 43
7.2 Afkooppercentages . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
5
6
INHOUDSOPGAVE
8 Besluit
49
A Figuren
A.1 Bivariate Analyse . . . . . . . . . . . . . . . . . . .
A.2 Significante polisgegevens . . . . . . . . . . . . . .
A.3 Regressie met economische parameters: Niet-fiscaal
A.4 Regressie met economische parameters: Fiscaal . .
A.5 Controle modelassumpties: Niet-fiscaal . . . . . . .
A.6 Controle modelassumpties: Fiscaal . . . . . . . . .
51
51
53
55
57
58
61
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
B Het aantal klassen reduceren
65
C Regressie met de volledige dataset
69
Hoofdstuk 1
Inleiding
Voor mijn masterproef heb ik dit onderwerp gekozen, omdat ik zo onmiddellijk theorie in de
praktijk kon omzetten door gebruik te maken van Generalised Linear Models. Het concept
afkoop was iets nieuws voor mij en zo hoopte ik om er meer over te weten te komen. Het
betreft een innovatief onderzoek aangezien er over het dynamisch karakter van afkoop nog
niet veel literatuur is.
We proberen in deze masterproef ten eerste te bepalen welke kenmerken van een polis of van
de verzekeringnemer een effect hebben op het verwacht afkooppercentage. Ten tweede onderzoeken we of er een dynamisch verband is met de marktrente. Dit verband zou namelijk
een extra risico inhouden, zoals uitgelegd zal worden in hoofdstuk 2. In dat hoofdstuk
geven we ook de kadering binnen de nieuwe Europese wetgeving Solvency II. In hoofdstuk 3
leggen we uit wat Generalised Linear Models zijn. We beschouwen daar kort de theorie
hieromtrent. Daarna bekijken we in hoofdstuk 4 welke gegevens we allemaal beschouwen,
zowel polisgegevens als parameters die de economische omgeving reflecteren. Hoofdstuk 5
en 6 gaan dan effectief over de statistische studie die is gebeurd. In hoofdstuk 7 wordt
tot slot de formule toegelicht die we hieruit hebben bekomen. Deze formule is geschikt om
onmiddellijk ge¨ımplementeerd te worden in actuari¨ele cash flow modellen.
Over dit onderwerp is er in de literatuur niet veel te vinden. Kent en Morgan [3] beschrijven
in het algemeen het dynamisch gedrag van verzekeringnemers als het op het uitoefenen
van opties in een levensverzekering aankomt. Hier wordt ook specifieker ingegaan op het
dynamische risico dat verbonden is aan de afkoopoptie. Kim [5] deed een statistische studie
aan de hand van Generalised Linear Models op Koreaanse levensverzekeringen. Hij bekwam
als belangrijkste economische parameters de marktrente, het werkloosheidspercentage en de
economische groei. Tot slot heeft Kiesenbauer [4] ook een statistische studie gedaan. Hij
deed dit voor 130 Duitse levensverzekeraars. Een belangrijke conclusie daar is dat afkooppercentages ook voor een groot deel afhankelijk zijn van de structuur en de geschiedenis
van de verzekeringsmaatschappij. Hij bekomt als economische variabelen het consumentenvertrouwen, de marktrente en de economische groei. Deze twee studies geven al een indicatie
dat er sterk verschillende resultaten bekomen kunnen worden voor verschillende landen en
zelfs voor verschillende bedrijven. Een mogelijk belangrijke oorzaak voor verschillen is de
fiscaliteit. Deze kan sterk verschillen per land.
7
8
HOOFDSTUK 1. INLEIDING
Hoofdstuk 2
Het afkooprisico
In dit hoofdstuk beschrijven we eerst wat we juist beschouwen als afkoop. Daarna bekijken
we welke invloed afkoop heeft op het Asset Liability Management (ALM). Hier zal duidelijk
worden wat het risico is voor verzekeringsmaatschappijen wanneer er veel mensen afkopen.
In de Engelstalige literatuur wordt vaak het woord lapse gebruikt. Hiermee bedoelt men
niet steeds hetzelfde. In het meest specifieke geval gaat het over het afkopen van het
volledige contract. Hierbij krijgt de verzekeringnemer zijn reserve verminderd met een
afkoopvergoeding uitbetaald. Soms gaat het over het gedeeltelijk afkopen van een contract
en dan krijgt de verzekeringnemer een deel van de reserve uitbetaald dat overeenkomt met
dat deel van het contract. In beide gevallen zal de verzekeringsmaatschappij een vergoeding
aanrekenen omdat de verzekeringnemer het contract niet tot einddatum aanhoudt. Deze
vergoeding moet ervoor zorgen dat de verzekeraar gedeeltelijk of volledig vergoed wordt
voor de kosten om de terugbetaling te kunnen doen. Zo wordt het risico dat hiermee verbonden is, verkleind.
Een laatste mogelijkheid is dat men onder lapse ook het stopzetten van de premiebetaling
verstaat, als het contract een periodieke premiebetaling inhoudt. Hiervoor wordt geen boete
aangerekend, maar het risico dat dit met zich meebrengt, is ook niet zo groot als bij de andere
twee gevallen, omdat er geen activa moeten worden verkocht.
De eerste twee gevallen kunnen ondergebracht worden onder de term surrender en het derde
geval onder de term dormancy. In deze masterproef zullen we enkel surrender beschouwen
en we vertalen dit als afkoop. We bekijken hierbij zowel gedeeltelijke als volledige afkoop.
Definitie 2.1. Afkoop is de gebeurtenis waarbij de verzekeringnemer de optie uitoefent
om (een deel van) zijn reserve uitbetaald te krijgen. Hierbij wordt ook (een deel van) het
contract stopgezet.
Het lijkt logisch dat het aantal afkopen zal vari¨eren als economische parameters veranderen.
De meest voor de hand liggende is de marktrente. Als de marktrente bijvoorbeeld groter
wordt dan de gegarandeerde intrest van het contract, kunnen verzekeringnemers een hoger
rendement halen door hun contract af te kopen en de vrijgekomen gelden te herbeleggen
aan de hogere rentevoet. Ze zullen in dit geval dus meer geneigd zijn om af te kopen.
9
10
HOOFDSTUK 2. HET AFKOOPRISICO
2.1
Effect van afkoop op ALM
Het probleem bij afkopen dat zich voor de verzekeraar stelt, is dat de gegarandeerde intrest
nooit perfect hedgebaar is. Het kan dus zijn dat het onmogelijk is om zodanig te investeren
dat zowel uitbetaling bij vervroegd afkopen als op einddatum van het contract volledig
gedekt zijn. In essentie betekent dit dat de duration 1 van het contract niet gekend is, omdat
het tijdstip en de grootte van de betaling nog onzeker zijn.
Om dit duidelijk te maken, beschrijven we eerst een kort voorbeeld waarbij we veronderstellen dat het afkooppercentage statisch is. Daarna is er nog een voorbeeld waarbij we een
statisch afkooppercentage hebben verondersteld, maar waarbij de verzekeringnemers zich
dynamisch gedragen ten opzichte van de intrest. Daar is er een groter risico.
Voorbeeld 2.2. Veronderstel dat we een polis uitschrijven die
• 5 jaar duurt,
• een ´e´enmalige premie heeft van 100,
• een gegarandeerde intrest heeft van 4% op jaarbasis zonder winstdeelname,
• en waarvoor het gemiddelde jaarlijkse afkooppercentage 3,84% is (0,04/1,04)
• en waarvoor de afkoopwaarde gelijk is aan de opgebouwde reserve.
Zo geldt er dat we volgende verwachte toekomstige uitgaven hebben:
Jaar 1
4
Jaar 2
4
Jaar 3
4
Jaar 4
4
Jaar 5
104
Dat de afkoopwaarde elk jaar 4 is, is gemakkelijk te zien. Er geldt namelijk dat na het eerste
jaar de reserve 100 × 1, 04 = 104 is. De verwachte afkoopwaarde die we moeten uitbetalen
is dan 3, 84% × 104 = 4. Omdat er zo 100 in de reserve overblijft, geldt dit elk jaar.
Om ervoor te zorgen dat we aan deze verplichtingen voldoen, kunnen we investeren in 5jarige obligaties met een coupon van 4%. We veronderstellen dat deze bestaat.
Als nu het re¨ele afkooppercentage hoger is dan het veronderstelde, dan moeten we ergens
extra geld vandaan halen. In dit simpele voorbeeld is de enige mogelijkheid het voortijdig
verkopen van obligaties. Dit gebeurt aan marktwaarde en is afhankelijk van de intrest op
dat moment. Op zich is dit geen probleem, want het kan ons verlies opleveren of het kan
ons winst opbrengen, naargelang de intrest is gestegen of gedaald.
Stel dat de intrest is gestegen en de obligaties dus minder waard zijn. We moeten dan meer
obligaties verkopen dan wanneer de intrest stabiel zou zijn gebleven. Maar dan hebben we
niet meer genoeg obligaties om de toekomstige verplichtingen te dekken en zo maken we
verlies.
Het vorige voorbeeld geeft al een idee waarom het belangrijk is om ervoor te zorgen dat de
assets en de liabilities goed op elkaar worden afgestemd. Hierbij moet een zo goed mogelijke
schatting gemaakt worden van de afkoop. Ook toont het aan dat er een afkooprisico is, want
1
De duration is het gewogen gemiddelde van het tijdstip van toekomstige cash-flows. De gewichten zijn
de grootte van de cash flows.
2.1. EFFECT VAN AFKOOP OP ALM
11
bij meer afkopen, kan het zijn dat je verlies maakt.
Ook als er minder afkopen zijn dan verwacht, is dit niet noodzakelijk goed. Want we hebben
dan elk jaar een overschot dat moet worden herbelegd op kortere termijn. Maar de intrest
op kortere termijn is ook lager, zodat de verplichtingen op einddatum groter zijn dan de
beleggingen.
In het statische geval is er dus geen groot probleem, omdat het verwachte afkoopgedrag niet
afhankelijk is van de intrest. Jammer genoeg zullen verzekeringnemers zich niet noodzakelijk
statisch gedragen.
Voor het volgende voorbeeld baseren we ons op een voorbeeld uit [3]. Daarin zullen we zien
dat het probleem groter wordt als de verzekeringnemers dynamisch afkoopgedrag vertonen.
Er zullen namelijk meer afkopen zijn wanneer de intrest stijgt. Dit is juist het geval waarbij
er verlies wordt gerealiseerd bij verkoop van obligaties. En er zullen minder afkopen zijn
als de intrest daalt, zodat we niet aan de goede voorwaarden kunnen beleggen om de verplichtingen te dekken.
Voorbeeld 2.3. Veronderstel dat we een polis uitschrijven die
• 5 jaar duurt,
• een ´e´enmalige premie heeft van 100,
• een gegarandeerde intrest heeft van 4% op jaarbasis met 100% van de return die boven
de gegarandeerde intrest ligt als winstdeelname2 ,
• en waarvoor het gemiddelde jaarlijkse afkooppercentage 4,76% is (0,05/1,05)
• en waarvoor de afkoopwaarde gelijk is aan de opgebouwde reserve, inclusief alle winstdeelnames uit het verleden.
We veronderstellen nu dat we een return van 5% halen op onze obligaties. De winstdeelname
die we dan zullen uitkeren, is gelijk aan 1%, omdat de return die we halen 1% boven de
gegarandeerde intrest ligt. Zo geldt er dat we volgende verwachte toekomstige uitgaven
hebben:
Jaar 1
5
Jaar 2
5
Jaar 3
5
Jaar 4
5
Jaar 5
105
Dat de afkoopwaarde elk jaar 5 is, volgt analoog als in het vorige voorbeeld.
Deze uitgaven zijn dan volledig gedekt door de obligaties met een coupon van 5%.
Als nu de intrest stijgt of daalt terwijl alle andere parameters constant blijven, dan stijgen
of dalen de assets en de liabilities met dezelfde grootte. Als de intrest bijvoorbeeld stijgt
met 2 procentpunt, dan zijn beide waarden 91,8 op t = 0. Omdat we de obligatie gewoon
tot maturiteit kunnen behouden, moeten we geen minwaarde realiseren en is er dus geen
probleem. Laten we nu veronderstellen dat we geen statisch afkooppercentage hebben, maar
een dynamische afkoop die voldoet aan
4, 76% + max(0, m − p) × 10% − min (4, 76%, max(0, p − m) ∗ 5%) ,
(2.1)
2
Dit is niet realistisch omdat we dan nooit winst zouden kunnen maken als verzekeringsmaatschappij. Dit
is dan ook een puur theoretisch voorbeeld.
12
HOOFDSTUK 2. HET AFKOOPRISICO
met m de marktrente en p de intrest van de polis (gegarandeerde intrest + toegekende
winstdeelname). In deze formule stijgt de afkoop als het verschil tussen de marktrente en de
intrest van de polis stijgt. Hierbij is de stijging groter als dit verschil positief is dan wanneer
het verschil negatief is. Figuur 2.1 geeft het afkooppercentage in functie van dit verschil.
Figuur 2.1: Formule (2.1)
Als in dit geval de marktrente met 2 procentpunt stijgt naar 7%, dan stijgt het afkooppercentage naar 24,76%, want de return blijft 5%. Stel dat dit gebeurt in jaar 1. Dan zal
de totale afkoopwaarde die moet worden uitbetaald, 26 (= 24, 76% ∗ 105) bedragen. Maar
omdat de coupon die we krijgen maar 5 is, moeten we obligaties verkopen ter waarde van
21. Dit heeft als gevolg dat we een minwaarde moeten realiseren van
(100 − 91, 8) ∗
21
= 1, 88.
91, 8
Als we nu veronderstellen dat dit verlies een invloed heeft op de returns van de jaren erna,
dan wordt die return 2,57%. Maar we moeten nog steeds 4% gegarandeerde intrest geven
op de polissen die niet zijn afgekocht. In de veronderstelling dat na het eerste jaar het
afkooppercentage terug 4,76% is, worden de verwachte uitgaven dus
Jaar 1
26
Jaar 2
3,91
Jaar 3
3,91
Jaar 4
3,91
Jaar 5
82,16
Dat de betaalde afkoopwaarde elk jaar 3,91 is, komt weer doordat (105−26)×1, 04×0, 0476 =
3, 91. Dit gaat zo verder voor de komende jaren.
De marktwaarde van de obligatie op t = 0 blijft 91,8 zoals in het voorbeeld met een statisch
afkooppercentage, maar de marktwaarde van de verplichtingen op t = 0 wordt
2.2. SOLVENCY II
13
3, 91
3, 91
82, 16
26
3, 91
+
+
+
+
2
3
4
1, 07 1, 07
1, 07
1, 07
1, 075
= 24, 30 + 3, 42 + 3, 19 + 2, 98 + 58, 58
marktwaarde =
= 92, 47.
Door de hoge afkoopwaarde in het eerste jaar, is nu ook de effectieve duration van de liabilities korter dan die van de assets. Deze twee vaststellingen zorgen ervoor dat de assets en
de liabilities niet meer overeenkomen. Maar er stelt zich nog een groter probleem. Doordat
de return lager wordt, zal het verschil tussen de intrest die de verzekeringnemers krijgen en
de marktrente nog groter worden, waardoor het probleem elk jaar groter wordt.
Zo komt de verzekeraar in een negatieve spiraal terecht.
Dus als we in het algemeen investeren aan de verwachte duration van de verplichtingen,
dan is er het risico dat intresten stijgen en een ongerealiseerd verlies cre¨eren. Doordat de
intresten stijgen, zullen er meer afkopen zijn waardoor we een deel van het ongerealiseerde
verlies moeten realiseren.
Een logische reactie is om te investeren aan een kortere duration om dit probleem te
voorkomen. Maar dan is er het risico dat de intresten dalen en dat er minder afkopen
zijn. De overschot die we dan elk jaar hebben aan inkomsten, moet herbelegd worden aan
een lagere intrest. Hierdoor hebben we op einddatum niet genoeg om de verzekeringnemers
terug te betalen.
Deze twee voorbeelden tonen aan waarom het zo belangrijk is om het afkooppercentage
goed te schatten. Een goede schatting kan er voor zorgen dat inkomsten en uitgaven in
de toekomst beter met elkaar overeenkomen. Het afkooprisico bestaat dus uit de mogelijke
afwijking op het toekomstig afkoopgedrag.
Merk wel op dat een inschatting maken van het afkoopgedrag in de praktijk niet simpel
is, omdat daar in ´e´en portefeuille polissen zitten met verschillende gegarandeerde intresten
en verschillende duration. Ook de afkooppercentages kunnen verschillen doordat er een verschillend doelpubliek is of doordat er andere voorwaarden gelden bij afkoop.
Bij het modelleren van het afkooppercentage zal men er dus voor moeten zorgen dat er
voldoende parameters in acht worden genomen die het gedrag kunnen be¨ınvloeden van de
verzekeringnemers.
In deze masterproef zullen we proberen een dynamische formule te bekomen via een statistische benadering. We zullen hierbij proberen gebruik te maken van Generalised Linear
Models. Het volgende hoofdstuk zal hier wat achtergrond rond behandelen. Hierbij zullen
een aantal praktische problemen opduiken. Daarom zullen we toch een meer klassieke aanpak gebruiken om de formule te bekomen.
2.2
Solvency II
In de nieuwe Europese wetgeving, Solvency II, die van kracht wordt vanaf 1 januari 2016,
wordt ook het afkooprisico beschouwd. We geven hier een korte kadering van het afkooprisico
14
HOOFDSTUK 2. HET AFKOOPRISICO
binnen deze wetgeving. Hiervoor hebben we ons gebaseerd op een college aan de VUB [8].
De figuren die we hier gebruiken zijn ook afkomstig van dit college.
Onder Solvency II moeten technische voorzieningen gewaardeerd worden op basis van een
best-estimate inschatting. Dit wil zeggen dat we een zo goed mogelijke, markt-consistente
waardering moeten maken van deze voorzieningen. De buffer tegen insolvabiliteit ligt dan
volledig bij de Solvency Capital Requirement (SCR).
Bij levensverzekeringen wordt de best estimate liabilities berekend als het kansgewogen
gemiddelde van de toekomstige cashoutflows, verminderd met het kansgewogen gemiddelde
van de toekomstige cashinflows. Er wordt rekening gehouden met de tijdswaarde van geld.
Deze berekening moet polis per polis gebeuren. Eventueel mogen polissen wel gegroepeerd
worden in homogene klassen.
De cashoutflows bestaan uit:
• Uitkeringen
– bij overlijden (op basis van de geschatte sterftekansen)
– bij eindetermijn
– bij afkoop (op basis van de geschatte afkooppercentages)
– bij ziekte/invaliditeit
• commissies aan makelaars
• kosten (administratiekosten, beleggingsvergoedingen,. . . )
• eventuele herverzekeringspremies.
De cashinflows bestaan uit:
• de toekomstige premies
• eventuele uitkeringen en winstdeelname van de herverzekeraar.
Bovenop deze best estimate zal er ook nog een risicomarge berekend moeten worden om het
kapitaal te vergoeden dat aangehouden moet worden. Hierbij komt het afkooprisico enkel
impliciet aan bod doordat deze risicomarge wordt berekend aan de hand van de SCR.
De SCR wordt berekend door schokken toe te passen op alle risico’s afzonderlijk en dan de
verschillende vereiste kapitalen te combineren met diversificatie-effecten in acht genomen.
Figuur 2.2 geeft een schematisch overzicht van al deze risico’s. We zullen hier enkel het
afkooprisico bespreken.
white
Het vereiste kapitaal voor het afkooprisico wordt bepaald als het maximum van drie scenario’s:
SCRlapse = max(Lapse up, Lapse down, Lapse mass).
Hierbij is
2.2. SOLVENCY II
15
Figuur 2.2: Solvency Capital Requirement
• Lapse up, een permanente stijging van 50% van de afkooppercentages voor alle polissen
die hierdoor negatief be¨ınvloed worden,
• Lapse down, een permanente daling van 50% van de afkooppercentages voor alle
polissen die hierdoor negatief be¨ınvloed worden,
• Lapse mass, de afkoop van 40% van alle verzekeringspolissen waarvoor de afkoop zou
leiden tot een stijging van de best estimate.
Wanneer we de resultaten van QIS53 bekijken, zien we dat het afkooprisico het grootste deel
van van het onderschrijvingsrisico leven vertegenwoordigd. Dit is te zien in figuur 2.3.
3
QIS staat voor Quantitative Impact Study. Deze werden uitgevoerd door verzekeraars over heel Europa
om de impact van Solvency II in te schatten.
16
HOOFDSTUK 2. HET AFKOOPRISICO
Figuur 2.3: QIS5: verdeling van het onderschrijvingsrisico leven over de subrisico’s
Het afkooprisico situeert zich binnen Solvency II dus zowel in de best estimate als in de
SCR. In de eerste plaats situeert deze studie zich voornamelijk in het bepalen van de afkoopparameter voor de best estimate. Voor de schokken om de SCR te bepalen zou er namelijk
op verschillende manieren kunnen omgegaan worden met het dynamisch karakter van de
afkoop.
Hoofdstuk 3
Generalised Linear Models
Verderop in deze tekst zullen we gebruik maken van Generalised Linear Models, afgekort
GLM. In dit hoofdstuk behandelen we de theoretische achtergrond ervan. Ook bekijken we
in welke vorm we GLM zouden kunnen gebruiken voor het afkooprisico.
Dit hoofdstuk is voornamelijk gebaseerd op [1] en [2].
We beginnen met een korte samenvatting van het klassiek lineair regressiemodel. GLM is
hiervan een uitbreiding, zoals de benaming zelf al zegt.
3.1
Lineaire modellen
Het doel van een lineair model is om een verband te vinden tussen de verklarende variabelen
X en de te verklaren variabele Y. Realisaties van de variabelen worden Xi en Yi genoteerd.
Definitie 3.1. Een lineair model voor Y bestaat uit een vector β en een variantie σ 2
zodat Y geschreven kan worden als
Y = β0 + Xβ + ,
waarbij normaal verdeeld is met verwachtingswaarde 0 en variantie σ 2 .
Voor n observaties en m verklarende variabelen X1 , . . . , Xm zoeken we dus parameters
β1 , . . . , βm zodat
 
  

1
Y1
1 X1,1 · · · X1,m  
 2 
 Y2  1 X2,1 · · · X2,m  β0
  
   
 Y3  1 X3,1 · · · X3,m   β1   3 
=
  
  ..  +   .
 ..   ..
   .. 
..
.
.
..
.. 
 .  .
.
 .
.
βm
n
Yn
1 Xn,1 · · · Xn,m
Hierbij wordt de kleinste kwadraten methode toegepast om het model te schatten. Deze
methode schat β als (X 0 X)−1 X 0 Y .
Als ons model goed is, hebben we dan concreet parameters gevonden zodat voor een volgende
observatie Y ∗ geldt dat
∗
Y ∗ = E[Y ∗ ] + , waarbij E[Y ∗ ] = β0 + β1 X1∗ + β2 X2∗ + · · · + βm Xm
.
17
18
HOOFDSTUK 3. GENERALISED LINEAR MODELS
We veronderstellen dus dat de verwachtingswaarde van Y een lineaire combinatie is van de
verklarende variabelen en dat er een gemeenschappelijke variantie is. Dit kan samengevat
worden in volgende veronderstellingen.
(LM1) Willekeurige component:
Elke realisatie van Y is onafhankelijk en normaal verdeeld. Ze hebben een verschillende verwachtingswaarde µi , maar dezelfde variantie σ 2 .
(LM2) Systematische component:
De verklarende variabelen worden gecombineerd om de verwachtingswaarde van
Y te bekomen:
E[Y ] = Xβ.
Er zijn heel wat beperkingen bij de klassieke lineaire modellen, zoals de normaliteit of
zoals dat µi een lineaire combinatie is van de verklarende variabelen. Daarom worden de
veronderstellingen uitgebreid om zo te komen tot GLM.
3.2
De veronderstellingen bij Generalised Linear Models
Er bestaat een heel scala aan GLMs. Lineaire modellen zijn hiervan een specifiek geval.
De veronderstellingen van normaliteit, constante variantie en additiviteit van verklarende
variabelen worden aangepast. De te verklaren variabele moet niet meer normaal verdeeld
zijn, maar moet behoren tot de exponenti¨ele familie van verdelingen. Het wordt ook mogelijk
om de variantie te laten vari¨eren met de verwachtingswaarde. De additiviteit wordt tot slot
aangepast zodat die enkel nog maar moet gelden in getransformeerde vorm. De veronderstellingen voor GLM worden zo:
(GLM1) Willekeurige component:
Elke realisatie van Y is de realisatie van een verdeling die tot de exponent¨ele
familie behoort.
(GLM2) Systematische component:
De verklarende variabelen worden gecombineerd om de variabele η te bekomen.
Dit gebeurt lineair, dwz
η = Xβ.
(GLM3) Link functie:
De relatie tussen de willekeurige en de systematische component wordt gespecifieerd door een link functie g, die differentieerbaar en monotoon is zodat
g(E[Y ]) = η.
3.2. DE VERONDERSTELLINGEN BIJ GENERALISED LINEAR MODELS
19
Merk op dat de laatste veronderstelling ook kan genoteerd worden als
E[Y ] = µ = g −1 (η).
De normale verdeling behoort ook tot de familie van exponenti¨ele verdelingen, zodat het
lineaire model een specifiek geval is van een GLM. Hierbij is de verdeling de normale verdeling, de variantie constant en de link functie de identieke functie.
3.2.1
De exponenti¨
ele familie van verdelingen
Bij de veronderstellingen voor GLM werd gebruik gemaakt van de exponenti¨ele familie van
verdelingen. Hieronder defini¨eren we deze familie. Daarna geven we nog enkele eigenschappen.
Definitie 3.2. De exponenti¨
ele familie van verdelingen is gedefinieerd als de 2-parameter
familie
yi θi − b(θi )
fi (yi ; θi , φ) = exp
+ c(yi , φ) ,
ai (φ)
waarbij ai (φ), bi (θi ) en c(yi , φ) functies zijn die op voorhand gedefinieerd zijn. θi is gerelateerd aan de verwachtingswaarde en φ is een schaalparameter die gerelateerd is aan de
variantie.
Het is handig om te weten dat voor verdelingen die tot de familie behoren volgende twee
eigenschappen gelden:
• De verdeling is volledig gedefinieerd aan de hand van de verwachtingswaarde en de
variantie.
• De variantie van Yi kan uitgedrukt worden als een functie van de verwachtingswaarde.
Deze functie kunnen we in de volgende vorm schrijven:
V ar(Yi ) =
φV (µi )
.
ωi
Hierbij is V (·) een functie, ook wel de variantiefunctie genoemd. De parameter φ
schaalt de variantie en ωi is een gewicht voor observatie i. Dit gewicht hangt af van
de ’geloofwaardigheid’ van de i-de observatie.
Tot de exponenti¨ele familie behoren onder andere de normale verdeling, de Poisson verdeling,
de binomiale verdeling en de gamma verdeling. Voor de normale verdeling is bijvoorbeeld
V (x) = 1 en voor de binomiale is dit V (x) = x(1 − x).
We bestuderen hieronder nog even kort de gewichten ωi en de schaalparameter φ.
De gewichten ωi
De gewichten maken het mogelijk om gekende informatie over de ’geloofwaardigheid’ van
een observatie mee te nemen in het model. Stel bijvoorbeeld dat niet alle observaties over
dezelfde periode gaan (sommige polissen lopen langer,. . . ). We kunnen dan een groter
gewicht geven aan observaties die gaan over een langere periode, omdat die meer informatie
en minder variabiliteit bevatten. Zo krijgen deze observaties een kleinere variantie en zullen
20
HOOFDSTUK 3. GENERALISED LINEAR MODELS
ze dus het model sterker be¨ınvloeden dan observaties over een kortere periode.
Bij de data die we verderop gebruiken, is er geen reden om te veronderstellen dat bepaalde
observaties ’geloofwaardiger’1 zijn. We gaan hier dus niet verder op in, omdat we alle
gewichten gelijk zullen nemen.
De schaalparameter φ
φ is niet gekend op voorhand. Hij moet geschat worden als we hem willen kennen. Maar dit
is niet nodig om de GLM parameters β te vinden. We hoeven φ enkel te schatten als we de
standaardafwijking van de fouttermen willen weten. In dat geval kan φ behandeld worden
als een extra parameter en geschat worden via de maximum likelihood methode. Het nadeel
hiervan is dat we geen expliciete functie bekomen en dat het lang kan duren.
Alternatieven hiervoor zijn
• de moment schatter (Pearson χ2 statistiek), gedefinieerd als
φˆ =
1 X ωi (Yi − µi )2
,
n−p
V (µi )
i
• en de totale afwijking schatter, gedefinieerd door
φˆ =
D
.
n−p
De totale afwijking D zullen we later defini¨eren.
3.2.2
Link functies
Wegens de veronderstellingen in het lineaire model moesten de effecten daar additief zijn.
Bij GLM wordt deze voorwaarde versoepeld in (GLM3). Nu is het enkel nog nodig dat
een bepaalde transformatie van Y, g(E(Y )), ervoor zorgt dat de effecten additief zijn. Het
is handiger om µi uit te drukken als functie van de verklarende variabelen, zodat typisch de
inverse van g wordt beschouwd. Zo krijgen we
µi = g −1 (ηi ).
Deze link functie moet differentieerbaar en monotoon zijn (ofwel strikt stijgend ofwel strikt
dalend). Enkele voorbeelden van link functies vind je hieronder.
Identiteit
Log
Inverse
Logit
Complementary log-log
1
g(x)
x
ln(x)
1/x ln
g −1 (x)
x
ex
1/x
x
1−x
ln(− ln(1 − x))
1
ex
1+ex
x
− e−e
We gebruiken jaarlijkse data, dus de lengte van de observatie speelt geen rol. Alle data zijn op dezelfde
manier bekomen en hebben dezelfde structuur, dus is er geen reden om grotere gewichten te geven aan
bepaalde observaties
3.3. HET GLM MODEL
3.3
21
Het GLM model
De structuur van het GLM model ziet er samengevat als volgt uit:


X
µi = E[Yi ] = g −1 
Xij βj  ,
j
V ar[Yi ] =
φV (µi )
.
ωi
Hierbij is
Y
de vector met uitkomsten voor de te verklaren variabele voor alle observaties,
g(x)
de link functie (een inverteerbare functie die de link is tussen de verwachtingswaarde
van de te verklaren variabelen en de lineaire combinatie van verklarende variabelen),
X
de matrix die de verklarende variabelen bevat voor alle observaties,
β
een vector met modelparameters die geschat dienen te worden,
φ
een parameter om de functie V (x) te schalen,
V (x)
de variantiefunctie, en
ωi
een gewicht dat een ’geloofwaardigheid’ toewijst aan observatie i.
Bij het opstellen komen Y , X en de ωi uit de data. Hoe deze uit de data worden gehaald
is al onderhevig aan het oordeel van de ontwerper. Verdere assumpties worden gemaakt bij
de keuze van de link functie, de variantiefunctie en ook of de φ mee wordt geschat of op
voorhand wordt vastgelegd.
Typische modelvorm voor afkooppercentages
Wanneer er modellen worden gemaakt om kansen te bepalen, wordt er meestal gewerkt met
het logit model met binomiale fouttermen. De logit functie wordt hier gekozen omdat die
het interval (0, 1) afbeeldt op (−∞, +∞). Een andere mogelijkheid is de complementary
log-log functie.
Omdat afkooppercentages op polisniveau overeenkomen met een kans dat er wordt afgekocht,
zijn dit onmiddellijk twee mogelijke vormen waarmee we aan de slag zouden kunnen in ons
geval.
3.4
De modelparameters schatten
De modelparameters βj zouden we kunnen vinden door toepassing van de maximum likelihood methode. Voor grote datasets is dit in de praktijk niet doenbaar. Daarom wordt er
meestal gewerkt met een numerieke benadering. We vatten eerst de maximum likelihood
methode kort samen. Daarna beschouwen we het Newton-Raphson algoritme dat ook wordt
gebruikt in statistische programma’s als SAS en R.
Kort samengevat zoekt de maximum likelihood methode de parameterwaarden die de grootste kans hebben om onder het beschouwde model de observaties te hebben gegenereerd. Dit
wordt gedaan door de likelihood functie te maximaliseren, of voor praktische redenen de loglikelihood functie. Hierbij wordt de likelihood gedefinieerd als het product van de kansen
22
HOOFDSTUK 3. GENERALISED LINEAR MODELS
dat elke y-waarde wordt geobserveerd. Bij de log-likelihood wordt dit product een som, wat
handiger is om mee te werken.
3.4.1
Numerieke methode voor grote datasets
Het algoritme van Newton-Raphson is een iteratief proces dat de formule
β n+1 = β n − H1 .s
gebruikt. Hierin is β n de n-de iteratieve schatting van de vector met schatters β, s de vector
met eerste afgeleiden van de log-likelihood en H1 de matrix met de tweede afgeleiden van de
log-likelihood. Als startwaarde kan β 0 = 0 gekozen worden, of de resultaten van een ander
statistisch model.
Kort uitgelegd, berekent dit algoritme een nulpunt van s. Maar dit punt is dan een maximum
van de log-likelihood functie en ook van de likelihood functie.
3.4.2
Significantietesten
Significantie zullen we testen door de afwijking te meten van de geobserveerde waarden
ten opzichte van de waarden die we bekomen met het model. Hiervoor defini¨eren we de
afstandsfunctie d(Yi ; µi ) als
Z Yi
Yi − ζ
d(Yi ; µi ) = 2ωi
dζ.
µi V (ζ)
Hierbij vergelijken we observatie Yi met de voorspelde gemiddelde waarde µi onder het
GLM. Wanneer V (x) strikt positief is, is d(Yi ; µi ) positief en voldoet deze functie inderdaad
aan de voorwaarden van een afstandsfunctie.
d(Yi ; µi ) geeft meer gewicht aan het verschil tussen Yi en µi als het gewicht ωi groter is of
als de variantiefunctie V (x) kleiner is. Dit laatste betekent dat wanneer we weten dat Yi
van een verdeling komt met een kleine variantie, een klein verschil toch niet onbelangrijk is.
Als we dit nu sommeren over alle observaties dan bekomen we de totale afwijking D:
Z Yi
n
X
(Yi − ζ)
D=
2ωi
dζ.
V (ζ)
µi
i=1
Tot slot passen we dit nog aan aan de vorm van de verdelingsfunctie. Dit doen we door te
delen door de schaalparameter φ. Zo bekomen we de geschaalde totale afwijking D∗ :
Z
n
X
ωi Yi (Yi − ζ)
∗
D =
2
dζ.
φ µi V (ζ)
i=1
Op deze geschaalde totale afwijking kunnen we verschillende statistische testen toepassen.
E´en van de meest gebruikte is het vergelijken van twee geneste modellen. Hierbij testen we
het verschil tussen twee modellen, waarbij het tweede alle verklarende variabelen van het
eerste bevat. Dit wordt ook wel een Type II test genoemd.
3.4. DE MODELPARAMETERS SCHATTEN
23
Merk eerst op dat D∗ ∼ χ2df , met df het aantal vrijheidsgraden, dit is het aantal observaties min het aantal geschatte parameters. Stel nu dat model 0 is opgebouwd met een
deelverzameling van de parameters waarmee model 1 is opgebouwd. Dan geldt
D0∗ − D1∗ ∼ χ2df0 −df1 .
Een chi-kwadraat maakt het dus mogelijk om te testen of de parameters die verschillen in
beide modellen, een statistisch significant verschil opleveren. Dit meet dus of het opnemen
van een extra parameter het model genoeg verbetert.
Er treedt hierbij wel een probleem op. D∗ is afhankelijk van φ, dus de schaalparameter
kunnen we hiermee niet schatten. Zelfs als we hem niet willen schatten, maar als hij wel
ongekend is, hebben we hetzelfde probleem.
Dit probleem kunnen we oplossen door een F test te doen op D in de plaats van een chikwadraat test op D∗ . Deze test ziet er dan als volgt uit
df1 (D0 − D1 )
∼ χ2df0 −df1 .
(df0 − df1 )D1
24
HOOFDSTUK 3. GENERALISED LINEAR MODELS
Hoofdstuk 4
Mogelijke modelparameters
In dit hoofdstuk bekijken we op voorhand welke gegevens we gaan gebruiken om het model
op te stellen. We maken hierbij een onderscheid tussen twee soorten parameters. Eerst
behandelen we de economische parameters. Deze zijn op een bepaald ogenblik hetzelfde
voor alle polissen. Daarna beschouwen we de polisgegevens. Dit zijn specifieke gegevens
die enkel van toepassing zijn op de desbetreffende polis. Als laatste zullen we ook nog de
afhankelijke variabele bespreken, namelijk het afkooppercentage.
We zullen toelichten wat de bronnen van de gegevens zijn, onder welke vorm we de gegevens
opnemen en waarom we de gegevens onder die vorm opnemen. Hierbij zullen we vermelden wat we verwachten dat het effect gaat zijn. Soms kan het zijn dat we geen invloed
verwachten, maar dat we die parameter toch mee in de analyse opnemen om er zeker van
te zijn dat er geen effect is. Het gaat hier bijvoorbeeld over het geslacht.
In dit project beschouwen we de portefeuille Tak 21 Individueel Modern van KBC verzekeringen, met een historiek van 10 jaar1 . Bij moderne levensverzekeringen wordt de intrestgarantie voor elke premie vastgelegd op het ogenblik van betaling. Deze gegarandeerde
intrest kan eventueel nog verhoogd worden met een winstdeelname. We beschouwen deze
portefeuille omdat we hier het grootste dynamisch effect op de afkoop verwachten.
4.1
Economische parameters
De belangrijkste factor die we zullen beschouwen, is de marktrente. We willen weten of
de marktrente een invloed heeft op het afkoopgedrag omdat dit juist het dynamische risico
inhoudt, zoals in hoofdstuk 2 beschreven. We verwachten dat er meer afkopen zullen zijn
als de marktrente hoger wordt, omdat verzekeringnemers dan de mogelijkheid hebben om
een hogere return te bekomen. Als marktrente beschouwen we Belgische overheidsobligaties.
Meer specifiek zullen we de OLO op 10 jaar gebruiken. We gebruiken Belgische obligaties
omdat de meeste verzekeringnemers Belgen zijn. We gebruiken de obligatie op 10 jaar
omdat dat diegene is die in de media verschijnt en dus diegene waarmee verzekeringnemers
gemakkelijk kunnen vergelijken. We verwachten wel dat andere duurtijden, behalve zeer
korte duurtijden, een gelijkaardig resultaat zullen geven.
1
We gebruiken dus gegevens van 2004 tot 2013.
25
26
HOOFDSTUK 4. MOGELIJKE MODELPARAMETERS
Een tweede parameter die we beschouwen, is de aandelenmarkt. Dit is een mogelijk alternatief voor verzekeringnemers om te beleggen. We verwachten een zelfde soort effect als
bij de marktrente. Om dit uit te drukken, bekijken we de procentuele toename van de
Bel20 en de Eurostoxx50 gedurende het voorgaande jaar. Omdat deze waarschijnlijk sterk
gecorreleerd zijn, mag er wel maar ´e´en van de twee in het model voorkomen. Als ze allebei significant zijn, zullen we onderzoeken welke van de twee het meest significante effect
heeft. Dit komt in feite overeen met bekijken waarmee onze verzekeringnemers het meest
vergelijken, de Belgische markt of de Europese markt.
Een derde factor die een effect zou kunnen hebben, is de werkloosheidsgraad. Als er meer
mensen werkloos zijn, zijn er ook meer mensen die op korte termijn geld nodig zullen hebben.
De kans is dan groter dat mensen moeten afkopen omdat ze het geld nodig hebben.
Een vierde factor is het consumentenvertrouwen. Als dit hoog is, geven mensen meer uit. Ze
investeren dan dus minder. Het is waarschijnlijk dat dit eerder het aantal nieuwe contracten
en nieuwe premies zal be¨ınvloeden, maar we nemen dit toch mee omdat het een factor is die
de economie goed weerspiegelt.
Andere factoren die de economische omgeving bepalen en die we zullen beschouwen, zijn
de economische groei, de inflatie en wisselkoersen. Economische groei drukken we uit in
procentuele toename van het bruto binnenlands product gedurende het voorgaande jaar.
Wisselkoersen geven een indicatie van hoe de Europese economie het doet in vergelijking
met de rest van de wereld. Als wisselkoers beschouwen we enkel de euro-dollar wisselkoers.
Om consistent te zijn met andere modellen van KBC gebruiken we als OLO-gegevens de
historische gegevens die worden gebruikt voor de economische scenario generator van KBC.
De andere parameters hebben we bekomen via de websites van de Nationale Bank van Belgi¨e
[6] en van de Organisation for Economic Co-operation and Development [7].
Tussen de economische parameters zullen er verschillende sterke correlaties zijn. We moeten
dus oppassen voor multicollineariteit. Deze kan vermeden worden door te onderzoeken welke
parameters sterk gecorreleerd zijn en er daarvan telkens maar 1 te behouden. Bij voorkeur
wordt diegene met de grootste significantie bewaard, maar bij sterk gecorreleerde variabelen
zal dit geen groot verschil maken.
Voor deze variabelen nemen we steeds de waarden op 31/12 van het voorgaande jaar, omdat
we ook maar jaarlijkse polisgegevens beschikbaar hebben. We nemen de waarde op het einde
van vorig jaar en niet die in bijvoorbeeld het midden van het jaar, omdat we ervan uit gaan
dat verzekeringnemers beslissingen nemen aan de hand van de meest recente informatie.
Doordat we voor elke economische variabele maar 1 waarde per jaar hebben, zullen er maar
weinig verschillende observaties zijn voor de economische variabelen. In de toekomst zou
deze studie wel op maandelijkse gegevens kunnen uitgevoerd worden, omdat er nu wel maandelijks gegevens worden bewaard.
4.2. POLISGEGEVENS
4.2
27
Polisgegevens
De eerste specifieke parameter is de gegarandeerde intrest van de polis. verzekeringnemers
die een hogere gegarandeerde intrest krijgen, zullen minder gemakkelijk afkopen omdat
het verschil met de marktrente kleiner is. Om deze parameter goed mee te nemen in de
analyse, splitsen we voor deze polissen de reserve per gegarandeerde intrest. Hierbij maken
we abstractie van het feit dat steeds de oudste reserve eerst moet afgekocht worden. Ook
beschouwen we deze parameter samen met de marktrente. We nemen namelijk als verklarende variabele marktrente-gegarandeerde intrest.
De tweede factor is het product. Verschillende producten hebben verschillende voorwaarden
en dus kan het zijn dat het afkoopgedrag anders zal zijn.
Ten derde beschouwen we ook het fiscaal regime van de polis. We verwachten dat dit een
belangrijke parameter zal zijn, omdat er bij afkoop van een fiscaal ingebrachte polis veel
belasting moet betaald worden. Het is dan minder voordelig om naar andere beleggingen
over te schakelen. Hierbij is er wel een uitzondering voor mensen die op vervroegd pensioen
gaan, maar dit zal dan mee uitgedrukt worden in de leeftijdsvariabele.
We maken ook een onderscheid tussen polissen die een fiscaal voordeel genieten van pensioensparen of van langetermijnsparen.
Omdat het fiscaal regime van de polis voor een totaal verschillend gedrag van de verzekeringnemers kan zorgen, bekijken we tijdens de studie ook of het niet beter is om voor de drie
categorie¨en een verschillende analyse te doen.
Een vierde parameter die we beschouwen, is de leeftijd van de verzekeringnemer. Mensen
van verschillende leeftijden hebben andere motieven om af te kopen. Jonge mensen willen
het geld misschien gebruiken om een huis te kopen. Terwijl personen tussen 60 en 65 jaar
willen afkopen wanneer ze op vervroegd pensioen gaan. Ook zou het kunnen dat personen
met een verschillende leeftijd zich meer of minder dynamisch gedragen.
Een vijfde factor die we zullen onderzoeken, is de resterende duurtijd van de polis. De
afkoopvergoeding hangt meestal van de resterende duurtijd af. Dus afkopen kan ’goedkoper’ worden als de resterende duurtijd korter wordt.
Andere factoren die we nog zullen beschouwen, zijn de reserve, het geslacht van de verzekeringnemer, het verkoopskanaal waarbij de polis is afgesloten, de betalingswijze en de
premiefrequentie. Van deze factoren verwachten we niet onmiddellijk een invloed, maar
verzekeringnemers met verschillende gegevens hiervoor kunnen wel een verschillend gedrag
vertonen.
Al deze gegevens komen uit de datacenters van KBC Verzekeringen. We hebben ze beschikbaar op jaarbasis, telkens op 31 december.
4.3
Het afkooppercentage
We hebben per polis en per gegarandeerde intrest steeds de reserve beschikbaar op het 31
december van het voorgaande jaar. De bedragen van de afkopen hebben we beschikbaar op
28
HOOFDSTUK 4. MOGELIJKE MODELPARAMETERS
de datum van afkoop. Deze komen dus niet overeen. Maar we hebben ook wel steeds in
de gegevens staan of het een volledige of gedeeltelijk afkoop was. Voor volledige afkopen
stellen we het afkooppercentage gelijk aan 100%. Voor gedeeltelijke afkopen zijn er dan nog
twee mogelijkheden, afkopen uit een reserve met een andere gegarandeerde intrest dan de
huidige of afkopen uit de reserve met dezelfde gegarandeerde intrest als de huidige.
Voor afkopen uit een reserve met een andere gegarandeerde intrest dan de huidige, kunnen
we veronderstellen dat de reserve toeneemt aan de gegarandeerde intrest. Zo krijgen we
afkoop% =
afkoop
m ,
reserve × (1 + i) 12
met i de gegarandeerde intrest en m het aantal maanden dat voorbij is voordat de afkoop
plaats vindt. In januari is m dus 0, in februari 1 en zo verder.
Voor afkopen uit een reserve met dezelfde gegarandeerde intrest als de huidige kunnen we
dit niet toepassen, omdat het kan zijn dat er gedurende het jaar nog premies zijn betaald.
Hier vermenigvuldigen we de reserve met de toename van de totale reserve van alle polissen
van hetzelfde product. Dit geeft
afkoop% =
afkoop
reserve × 1 +
reserve1 −reserve0
reserve0
×
m
12
,
met reserve0 de totale reserve op het begin van het jaar en reserve1 de totale reserve op het
einde van het jaar. Dit is een benadering, maar deze kan zowel te hoog als te laag zijn omdat
sommige polissen proportioneel gezien meer premie betalen tijdens het jaar dan andere.
Het kan zijn dat dit percentage voor sommige polissen groter wordt dan 100%. In dat geval
stellen we het afkooppercentage gelijk aan 100%.
Hoofdstuk 5
Afkoop modelleren met GLM
In [1], [2], [4] en [5] stelt men telkens voor om afkopen te modelleren aan de hand van een
generalised linear model met de logit link functie en een binomiale verdeling. In [5] wordt
dit ook nog eens onderzocht met de complementary log-log link functie en een binomiale
verdeling. Deze resultaten wijken niet hard af van de studie met de logit link functie.
We zullen hier eerst de theorie verder uitwerken voor het geval met de logit link functie.
Daarna zullen we enkele praktische problemen bespreken die we tegenkomen met deze aanpak. Hierbij beschrijven we ook hoe deze problemen op te lossen zijn door toch nog steeds
gebruik te maken van hetzelfde generalised linear model. Voor de studie hebben we een
andere (meer klassieke) methode uitgewerkt aan de hand van een model met lineaire regressie op homogene klassen. Dit zal aan bod komen in het volgende hoofdstuk.
5.1
Het logistische model
Een generalised linear model wordt volledig gedefinieerd aan de hand van de link functie
en de verdeling van de foutterm. We defini¨eren hier eerst het logistische model. Daarna
zullen we de verschillende karakteristieken ervan afleiden, zoals de variantiefunctie en de
schaalparameter.
Definitie 5.1. Het logistische model heeft als link functie de logit link functie
x
g(x) = ln
,
1−x
en een binomiaal verdeelde foutterm .
Het is duidelijk dat de link functie volgende inverse heeft:
g −1 (x) =
ex
.
1 + ex
Alle observaties beschrijven eenzelfde periode, namelijk 1 jaar. Er is ook geen andere reden
om bepaalde observaties een groter gewicht te geven, dus we stellen wi = 1 voor alle observaties i.
29
30
HOOFDSTUK 5. AFKOOP MODELLEREN MET GLM
De binomiale verdeling heeft als verwachtingswaarde E[] = p, met p de kans op uitkomst
1, en als variantie Var[] = p(1 − p). Het is dus onmiddellijk duidelijk dat
φ = 1, en V (x) = x(1 − x).
Omdat de schaalparameter een constante is, hoeft deze in dit geval niet meer geschat te
worden.
5.2
Praktische problemen
Een eerste praktisch probleem stelt zich bij de vorm van de data. We willen zowel gedeeltelijke als volledige afkopen modelleren. Hiervoor hebben we de afkoop uitgedrukt in een
percentage. De afhankelijke variabele neemt dus waarden aan in [0, 1]. Dit is niet van de
juist vorm om het logistische model te gebruiken. Dit probleem zou opgelost kunnen worden door zowel de kans op afkoop te bepalen voor gedeeltelijke als voor volledige afkoop
afzonderlijk1 . Voor de gedeeltelijke afkopen kunnen we dan een verwacht afkooppercentage
bepalen. Zo bekomen we volgende formule voor het afkooppercentage.
a = P afkoopvolledig + P afkoopgedeeltelijk × E a|afkoopgedeeltelijk ,
met a het afkooppercentage.
De twee kansen op afkoop kunnen bepaald worden met het logistische model, want die kansen
zijn juist de overeenkomende verwachtingswaarden. De verwachte conditionele verwachting
kan aan de hand van lineaire regressie bepaald worden. Dit zorgt er wel voor dat we drie
aparte regressies moeten doen.
Een tweede praktisch probleem stelt zich door de hoeveelheid data. Omdat we alle moderne
tak 21 producten van KBC Verzekeringen samen willen beschouwen en dit over 10 jaar,
beschikken we over ongeveer 8 miljoen observaties. Als we hierop SAS procedures laten
werken, neemt dit telkens toch wat tijd in. Een enkele regressie neemt al ongeveer een half
uur in beslag. Dit zou kunnen verholpen worden door elk product apart te beschouwen.
Beide oplossingen samen zorgen ervoor dat we 30 regressies moeten doen. De aanpak aan
de hand van homogene klassen en een lineaire regressie die we in het volgende hoofdstuk
voorstellen, is veel simpeler en neemt ook minder tijd in beslag.
1
Dit kan gedaan worden door twee datasets te maken. Bij 1 van die datasets stellen we afkopen tussen 0
en 1 gelijk aan 0. Bij de andere stellen we afkopen die 1 zijn, gelijk aan 0. Bij de tweede dataset defini¨eren
we dan nog een dummy variabele om ervoor te zorgen dat de afhankelijke variabele enkel waardes 0 en 1
aanneemt. Het effectieve afkooppercentage bewaren we zodat we dit nog kunnen gebruiken om het verwacht
afkooppercentage te bepalen op voorwaarde dat er een gedeeltelijke afkoop gebeurt.
Hoofdstuk 6
Gewogen lineaire regressie op
klassen
Bij deze methode zoeken we eerst klassen van polissen die zich hetzelfde gedragen. Hiervoor
bepalen we voor elke continue variabele klassen waarvoor het afkooppercentage verschilt.
Dit doen we grafisch. Daarna verdelen we de polissen in groepen van hetzelfde jaar en
met dezelfde polisgegevens. We bepalen een gemiddeld afkooppercentage per groep en dan
bepalen we aan de hand van een gewogen lineaire regressie welke parameters dit percentage
be¨ınvloeden. De gewichten zijn hierbij gelijk aan het aantal observaties in die klasse.
Dan weten we welke polisgegevens een significant effect hebben op het afkooppercentage. We
maken nieuwe klassen waarbij we ons enkel baseren op deze parameters. Als er dan genoeg
observaties per klasse zijn zodat het afkooppercentage normaal verdeeld wordt als gevolg van
de Centrale Limietstelling, dan kunnen we lineaire regressie toepassen. Bij lineaire regressie
moeten namelijk de fouttermen normaal verdeeld zijn. Als de te verklaren variabele normaal
verdeeld is, dan is dat een indicatie dat de fouttermen ook normaal verdeeld zullen zijn. Zo
zou die veronderstelling voor lineaire regressie voldaan zijn.
Om dan de dynamische functie te bekomen, doen we opnieuw een gewogen lineaire regressie
met de overgebleven polisgegevens en de economische parameters.
Voordat we aan de regressies beginnen, controleren we eerst op multicollineariteit.
6.1
Continue polisvariabelen opdelen in klassen
Om genoeg observaties te hebben per klasse, moeten we continue polisvariabelen opdelen in
klassen. Als we dit niet zouden doen, zijn er niet genoeg observaties met exact dezelfde polisgegevens. We maken deze klassen op grafische basis. Later zullen we voor de variabelen
die effectief worden meegenomen, testen of de gemaakte klassen effectief significant verschillende verwachtingswaardes hebben. De eerste variabele waarbij we dit zullen doen,
is de resterende duurtijd. We maken een grafiek die per resterende duurtijd het afkooppercentage weergeeft. Daarop gaan we dan na wanneer het afkooppercentage anders is dan
voor voorgaande resterende duurtijden. Op figuur 6.1 hebben we stippellijnen toegevoegd
om duidelijk te maken welke klassen we hebben gekozen.
De eerste 5 jaren hebben duidelijk een hoger afkooppercentage, wat waarschijnlijk als
oorzaak heeft dat er een verminderde afkoopvergoeding is in de laatste vijf jaren van de
polis. Daarna lijkt er zich een kwadratische trend voor te doen. We kiezen hier klassen van
31
32
HOOFDSTUK 6. GEWOGEN LINEAIRE REGRESSIE OP KLASSEN
Figuur 6.1: Afkooppercentage per resterende duurtijd
tien jaar, dan is er enkel tussen 25 en 35 een grote verandering. Als de resterende duurtijd
groter is dan 45 jaar, is er geen duidelijke trend zichtbaar Er is dan ook meer variantie,
doordat er minder observaties zijn. Hier moeten onze klassen breder zijn omdat er minder
observaties zijn. We kiezen ervoor om dit deel nog in twee te splitsen bij een resterende
duurtijd van 75 jaar. Zo bekomen we dus 7 klassen voor de resterende duurtijd. De grenzen
van deze klassen worden gegeven door 5, 15, 25, 35, 45 en 75 jaar.
Merk op dat er zeer hoge resterende duurtijden zijn. Dit komt doordat polissen zonder
einddatum in het beheersysteem de 110e verjaardag van de verzekeringnemer als einddatum
krijgen.
Op figuur 6.2 doen we nu hetzelfde voor de leeftijd van de verzekeringnemer. Hier zijn verschillende trends zichtbaar. We proberen deze allemaal mee te nemen door als grenzen voor
de klassen de leeftijden 18, 23, 30, 40, 50 en 60 te nemen. Na 60 zijn er ook weer minder
observaties waardoor we deze klasse als de breedste nemen.
Het laatste continue polisgegeven dat we beschouwen, is de reserve. Hierbij geeft figuur
6.3 het afkooppercentage aan per klasse van 10 000 euro. We bekijken dit per 10 000 euro
omdat bijna elke polis een verschillende reserve heeft. Hier is geen duidelijk trend zichtbaar.
Enkel de variantie neemt toe naarmate de reserve groter wordt. Dit heeft waarschijnlijk als
oorzaak dat er minder polissen zijn met grote reserves. We maken hier toch klassen zodat
we kunnen controleren dat er geen verband is. We kiezen voor klassen van 100 000 euro tot
400 000 en daarna ´e´en klasse.
6.2. BIVARIATE ANALYSE
33
Figuur 6.2: Afkooppercentage per leeftijd van de verzekeringnemer
Figuur 6.3: Afkooppercentage per reserve in de polis
6.2
Bivariate analyse
Hier zullen we correlaties onderzoeken om zo multicollineariteit te vermijden. We laten onmiddellijk variabelen weg die een sterke correlatie vertonen. We bekijken enkel correlaties
tussen polisgegevens onderling en tussen economische parameters onderling. Correlaties
tussen polisgegevens en economische variabelen onderzoeken, is niet nuttig doordat polisgegevens meestal weinig vari¨eren in de tijd en economische variabelen constant veranderen.
We beginnen eerst met de correlaties tussen de polisgegevens onderling. Figuur 6.4 geeft
34
HOOFDSTUK 6. GEWOGEN LINEAIRE REGRESSIE OP KLASSEN
deze correlaties weer.
Figuur 6.4: Correlaties van de polisgegevens
Er zijn niet veel hoge correlaties. Enkel tussen de resterende duurtijd van de polis en de
leeftijd van de verzekeringnemer is er een hoge correlatie. Dit is ook logisch omdat je leeftijd
enkel zal toenemen na het afsluiten van een polis. Ook hebben alle polissen die fiscaal zijn
ingebracht als pensioensparen dezelfde eindleeftijd, zodat de correlatie nog sterker wordt.
Omdat de trend in de resterende duurtijd duidelijker is dan bij leeftijd, kiezen we ervoor
om de leeftijd van de verzekeringnemer weg te laten.
We beschouwen nu de correlaties tussen economische gegevens. Herinner dat dit de waarden
zijn op 31/12 van het voorbije jaar. Deze correlaties worden weergegeven in figuur 6.5.
Tussen deze variabelen is er veel correlatie. Een oorzaak van dit feit is dat we maar 10
verschillende observaties hebben. Doordat er veel correlatie is, is het aangeraden om niet
te veel economische variabelen mee op te nemen in het model. Twee variabelen zal waarschijnlijk al het maximum zijn. Van deze economische variabelen zijn er al verschillende die
we onmiddellijk weglaten. Deze worden hieronder opgesomd.
• De groei in de Eurostoxx50, omdat deze een correlatie heeft van 93% met de groei
in de Bel20. We kiezen om de Bel20 te behouden en niet de Eurostoxx50, omdat de
meeste van onze klanten Belg zijn en dus de Bel20 het vaakst in de media zullen zien.
• De inflatie, omdat die sterk gecorreleerd is met de groei in het Bruto Binnenlands
Product, de groei in de Bel20 en het werkloosheidspercentage. De inflatie vertoont
daarentegen geen sterk verband met het afkooppercentage.
6.3. REGRESSIE OP POLISGEGEVENS
35
Figuur 6.5: Correlaties van de economische variabelen
• Het consumentenvertrouwen, omdat die sterk gecorreleerd is met de groei in het Bruto
Binnenlands Product en de groei in de Bel20. Het consumentenvertrouwen vertoont
daarentegen geen sterk verband met het afkooppercentage.
• De euro-dollar wisselkoers, omdat die sterk gecorreleerd is met de groei in de Bel20
en het werkloosheidspercentage. De euro-dollar wisselkoers vertoont daarentegen geen
sterk verband met het afkooppercentage.
Hierbij noemen we twee variabelen sterk gecorreleerd als er een correlatie is van ongeveer
50% of groter. Dat de laatste 3 variabelen geen sterk verband hebben met het afkooppercentage is te zien in de figuren in appendix A.1.
We merken hier ook op dat er geen zichtbaar verband is tussen het afkooppercentage en de
variabele OLO10-intrestgarantie. Als we die plot dan nog eens opnieuw maken voor enkel
de niet-fiscale polissen, dan lijkt het dat er wel een verband is. De interactieterm tussen
OLO10-intrestgarantie en het fiscaal regime zal dus belangrijk zijn. Concreet wil dit zeggen
dat verzekeringnemers met een polis die niet fiscaal is ingebracht anders zullen reageren op
een verandering van de marktrente dan verzekeringnemers die hun polis wel fiscaal hebben
ingebracht. Deze plots zijn te zien in figuur 6.6, links de algemene scatterplot en rechts de
scatterplot voor enkel de niet-fiscale polissen.
6.3
Regressie op polisgegevens
We maken groepen van polissen die voor alle polisgegevens dezelfde waarde hebben of in
dezelfde klasse zitten en die geobserveerd zijn in hetzelfde jaar. We bepalen voor deze
groepen een afkooppercentage. Dit is het gemiddelde van de afkooppercentages van de
polissen. Daarop doen we dan een regressie om te bepalen welke polisgegevens het meest
36
HOOFDSTUK 6. GEWOGEN LINEAIRE REGRESSIE OP KLASSEN
(a)
(b)
Figuur 6.6: Afkooppercentage ten opzichte van OLO10-intrestgarantie
significante effect op het afkooppercentage hebben. Daarna kunnen we dan nieuwe, grotere
groepen maken aan de hand van de meest significante polisgegevens. Aan de hand van deze
nieuwe klassen kunnen we dan een nieuwe regressie doen met de economische variabelen
inbegrepen.
Al deze regressies zijn gewogen lineaire regressies met als gewicht het aantal observaties in
de groep.
6.3.1
Significante polisgegevens
Hiervoor gebruiken we de stapsgewijze automatische procedure in SAS met als selectiecriterium het corrected Akaike Information Criterion (AICc). De SAS-resultaten zijn te
vinden in appendix A.2. We zullen er steeds naar verwijzen.
In het eerste resultaat (in tabel A.4) is te zien dat de reserve niet mee in het model wordt
opgenomen bij de automatische modelselectie. Dit wil zeggen dat het toevoegen van de
reserve het model maar zeer weinig verbetert. Deze variabele kunnen we dus al weglaten.
Omdat de reserve geen effect heeft op het afkooppercentage, is het niet nodig om binnen
de klassen het afkooppercentage te bepalen aan de hand van een gewogen gemiddelde van
de polissen met als gewicht de reserve. We zien ook dat de AICc niet meer sterk daalt bij
toevoeging van het verkoopskanaal, het feit of er een aanvullende ongevalsdekking is en het
feit of er een overlijdensdekking is.
We laten deze 4 variabelen weg bij het bepalen van de groepen van polissen en komen
zo al grotere klassen uit. Hierop doen we opnieuw een regressie om te controleren of ze
nog allemaal bijdragen aan het model, of dat het hiervoor toevallig was dat ze mee waren
opgenomen. Alle effecten worden mee opgenomen in het model, zoals te zien is in tabel
A.5. Als we dan controleren of de residuen normaal verdeeld zijn, blijkt toch dat dit niet
het geval is (zie hiervoor het histogram in figuur A.7). We moeten daarom nog variabelen
weglaten. We zien dat de AICc nog 1700 daalt bij toevoeging van de productklassen, maar
6.3. REGRESSIE OP POLISGEGEVENS
37
bij toevoeging van het geslacht van de verzekeringnemer daalt die nog maar 300. Daarom
kiezen we ervoor om ook het geslacht van de verzekeringnemer, de methode van premiebetaling en het soort overlijdensdekking weg te laten.
Figuur 6.7: Histogrammen van het afkooppercentage en zijn logit getransformeerde
Als we dan de regressie nog eens opnieuw doen met grotere klassen, lijkt er geen variabele
meer te zijn die we kunnen weglaten. Op het histogram in figuur A.8 is wel te zien dat de
residuen nog steeds niet normaal verdeeld zijn. Daarom onderzoeken we de verdeling van
het afkooppercentage en de transformaties ervan. Na enkele pogingen, blijkt dat de logit1
1
Ter herinnering: logit(x) = ln
x
1−x
en zijn inverse is logit−1 (x) =
ex
1+ex
38
HOOFDSTUK 6. GEWOGEN LINEAIRE REGRESSIE OP KLASSEN
transformatie van het afkooppercentage wel bijna normaal verdeeld is. Dit is te zien op
figuur 6.7. Er is nog een grote piek voor de groepen met een afkoop gelijk aan 0%2 , maar
omdat de foutterm normaal verdeeld moet zijn en niet de te verklaren variabele, is dit nu
nog geen probleem. Ook hebben groepen die een afkooppercentage van 0% hebben meestal
minder observaties, zodat het gewicht ervoor zorgt dat ze niet zo hard zullen doorwegen.
6.3.2
Het aantal klassen reduceren
We gaan per overgebleven parameter na of de verwachtingswaarde wel significant verschilt
voor alle klassen. Klassen die niet significant verschillen, kunnen we dan samenvoegen. Dit
staat in detail beschreven in appendix B.
Voor de resterende duurtijd voegen we de twee hoogste klassen samen en voor de premiefrequentie de haljaarlijkse en de kwartaalpremies. Bij de producten zijn er verschillende
die we samenvoegen. Het Life Plan wordt samengevoegd met zijn voorganger de New Life.
De twee groeiplannen (97 en 99) worden samengevoegd en ook de twee spaarplannen (Life
Home Plan en Life Health Plan) worden samengevoegd. Dit zijn intu¨ıtief ook logische
samenvoegingen omdat ze ongeveer dezelfde polisvoorwaarden hebben.
Nu hebben we nog minder klassen waardoor er minder klassen zullen zijn met een afkooppercentage van 0%. In de volgende stap zullen we de economische variabelen toevoegen.
6.4
Regressie met economische parameters
We zoeken nu een formule die het verwacht afkooppercentage bepaalt aan de hand van de 4
polisgegevens die we hiervoor hebben geselecteerd en de economische variabelen. Als we dit
voor alle data samen doen, bekomen we geen goede formule. Er is te veel multicollineariteit
aanwezig in de geselecteerde parameters. De methode om tot deze formule te komen, staat
beschreven in appendix C. Omdat we op figuur 6.6 hebben gezien dat fiscaal ingebrachte
polissen een ander effect van de marktrente op het afkooppercentage vertonen, splitsen we
de data op in twee datasets, ´e´en met de niet fiscaal ingebrachte polissen en ´e´en met de
polissen die wel fiscaal zijn ingebracht. Hopelijk bekomen we door deze twee datasets apart
statistisch te behandelen betere resultaten. Zo bekomen we wel twee verschillende formules.
6.4.1
Dataset met niet-fiscale polissen
Voor het bepalen van een functie voor de niet-fiscale polissen, vertrekken we van dezelfde
indeling in klassen als hiervoor. Het geselecteerde model van een eerste automatische selectie
heeft als economische variabelen enkel de groei in de Bel20 en het verschil tussen de OLO
op 10 jaar en de intrestgarantie. Dit is te zien in tabel A.9.
Maar de groei in Bel20 heeft een negatieve parameterschatting. Dit is tegen onze intu¨ıtie
in. Daarom zoeken we de oorzaak van dit verband. We maken een plot van het gemiddeld
afkooppercentage per groei in Bel20. Hierop is te zien dat er eigenlijk geen effect is. Het
effect wordt voornamelijk veroorzaakt door de observaties in 2009 en 2012. Dit zijn de jaren
2
Omdat de logit functie niet gedefinieerd is in 0 en 1 vervangen we afkoooppercentage van 0% door 0, 01%
en afkooppercentage van 100% door 99, 99%.
6.4. REGRESSIE MET ECONOMISCHE PARAMETERS
39
die volgen op de financi¨ele crisis en de crisis in Griekenland. Het zou daarom niet correct
zijn om deze variabele mee te nemen. We laten deze dan ook weg.
We voegen nu de interactietermen met de resterende economische variabele toe. Dit gebeurt
weer via een automatische selectieprocedure, waarvan de output te vinden is in tabel A.10.
Alle interacties worden mee in het model opgenomen, maar bij de opname van de laatste
twee daalt AICc niet meer sterk. We nemen dus enkel de interactieterm OLO10-igar*produkt
mee in het model. Wanneer dit model geschat wordt (in tabel A.11), heeft geen enkele parameter van deze interactie een schatting die significant verschillend is van 0. Ook heeft dit
als gevolg dat OLO10-igar niet meer significant is. Daarom kiezen we ervoor om ook deze
interactie niet mee in het model op te nemen.
Tot hiertoe hebben we geen rekening gehouden met de winstdeelname die werd gegeven.
We zullen dit hier nog nagaan. Merk wel op dat de winstdeelname een sterke correlatie
(0,45) vertoont met OLO10-igar. Deze sterke correlatie is logisch doordat de beslissing
om winstdeelname te geven, wordt be¨ınvloed door de marktrente. Reserves met een lage
intrestgarantie krijgen ook steeds een hogere winstdeelname.
We testen of winstdeelname mee moet opgenomen worden in het model. In figuur A.12 is
te zien dat dit maar voor een kleine reductie in AICc zorgt. Ook is de parameter die bij de
winstdeelname hoort niet significant verschillend van 0 op een significantieniveau van 95%.
Daarom nemen we de winstdeelname niet mee op als nieuwe variabele.
Omdat winstdeelname een soort van (niet gegarandeerde) intrest is, kunnen we OLO10(igar+wd) opnemen in het model in plaats van OLO10-igar. Als we de adjusted R-square
van deze twee modellen vergelijken, dan zien we dat het model met OLO10-(igar+wd) beter
is dan het andere.
40
HOOFDSTUK 6. GEWOGEN LINEAIRE REGRESSIE OP KLASSEN
Zo bekomen we een finaal model. De parameterschattingen voor de logit getransformeerde
van het afkooppercentage worden gegeven in de volgende tabel. Merk op dat geen enkele
parameter van de productklassen nog significant is, maar we zullen deze toch in het model
houden omdat we dan dezelfde parameters zullen hebben voor fiscale en niet-fiscale polissen.
Voor de niet-fiscale polissen rest ons nu nog om na te gaan of de modelassumpties voor
lineaire regressie voldaan zijn. Dit doen we aan de hand van de figuren in appendix A.5. Op
de eerste figuur is te zien dat de residuen redelijk goed een normale verdeling benaderen. De
drie figuren daarna tonen de gemiddelde residuen per klasse van een bepaald polisgegeven.
Deze residuen zijn zeer klein. Daaruit kunnen we concluderen dat hun effect correct in
het model is opgenomen. De laatste figuur toont het gemiddelde residu ten opzichte van
OLO10-(igar+wd). Om duidelijk te maken dat daar geen trend meer in zit, hebben we de
kleinste kwadraten rechte erdoor getrokken.
Het voorgaande model voldoet dus aan de veronderstellingen voor lineaire regressie. Volgens de adjusted R-square verklaart ongeveer 43% van de variatie in het afkooppercentage.
Verderop zal dit model nog in meer detail beschreven worden.
6.4.2
Dataset met fiscale polissen
Voor de polissen die fiscaal zijn ingebracht, gaan we analoog als hiervoor te werk. We
beschouwen hierbij onmiddellijk OLO10-(igar+wd) in plaats van OLO10-igar, zodat we
voor beide soorten polissen dezelfde parameters gebruiken. Ook controleren we of er een
verschil is tussen polissen die zijn ingebracht als pensioensparen of als langetermijnsparen.
6.4. REGRESSIE MET ECONOMISCHE PARAMETERS
41
Daarom nemen we de dummy variabele van het fiscaal regime nog wel mee.
Een eerste analyse toont ons in figuur A.13 dat de groei in BBP de enige economische
variabele is die wordt opgenomen in het model en dat er nauwelijks een verbetering is in
AICc als we het fiscaal regime mee opnemen. We laten het fiscaal regime dus uit het model.
Als we dit model schatten in tabel A.14, dan zien we dat er meer afkopen zullen zijn als
het BBP sterker groeit. Maar we verwachten juist dat er meer afkopen zullen zijn als de
economische toestand slechter is, omdat mensen hun geld dan harder nodig hebben. We
gaan na wat hiervan de oorzaak is. In de volgende figuur zien we dat er ook hier twee
outliers zijn. Als we deze weglaten, is er geen verband meer te zien.
We controleren nog of er een andere economische variabele moet opgenomen worden in
het model. In figuur A.15 zien we dat de automatische procedure alle andere economische
variabelen mee opneemt in het model, maar dat dat niet zorgt voor een grote daling in
AICc. In het uiteindelijke model beschouwen we dus enkel polisgegevens. De parameterschattingen voor de logit getransformeerde van het afkooppercentage worden gegeven in de
volgende tabel.
42
HOOFDSTUK 6. GEWOGEN LINEAIRE REGRESSIE OP KLASSEN
Merk ook nog op dat dit model zeker voldoet omdat het een adjusted R-square heeft van
0,7288. Dit wil zeggen dat het model 72,88% van de variatie in het afkooppercentage verklaart.
We controleren nu nog de modelassumpties voor de niet-fiscale polissen. Dit doen we aan de
hand van de figuren in appendix A.6. Op de eerste figuur is te zien dat de residuen redelijk
goed een normale verdeling benaderen. De drie figuren daarna tonen de gemiddelde residuen
per klasse van een bepaald polisgegeven. Deze residuen zijn zeer klein. Daaruit kunnen we
concluderen dat hun effect correct in het model is opgenomen. In de laatste figuur gaan we
na of er echt geen effect is van OLO10-(igar+wd). Dit doen we door het gemiddelde residu
te plotten ten opzichte van OLO10-(igar+wd). Daarin zien we inderdaad geen effect.
Het voorgaande model voldoet dus. Verderop zal dit model nog in meer detail beschreven
worden.
Hoofdstuk 7
De dynamische formules
Nu gieten we de twee modellen die we hebben geschat in twee formules, ´e´en voor de fiscale
polissen en ´e´en voor de niet-fiscale polissen. In deze formules zullen we indicatorfuncties
gebruiken. Deze noteren we met P voor de productklassen, R voor de klassen van resterende
duurtijd en F voor de klassen van premiefrequentie. Merk wel op dat we hiervoor ook klassen
hebben samengevoegd1 .
Voor de polissen die niet fiscaal zijn ingebracht, geeft het model als formule
logit(afkoop%) =
+
Rx≤5 +
R5<x≤15
+
R15<x≤25 +
R25<x≤35 +
−
PLifePlan −
PJuniorPlan −
−
F1 −
R35<x≤45
PGroeiplan −
PSelectPlan
× (OLO10 − (igar + wd)).
F2 +
De formule voor polissen die wel fiscaal zijn ingebracht is van dezelfde vorm. Er is hier geen
dynamische term. Merk ook op dat er andere producttypes zijn. Dit komt doordat sommige
producten enkel fiscaal of niet-fiscaal verkocht worden. De formule wordt zo
logit(afkoop%) =
7.1
+
Rx≤5 +
+
R15<x≤25 +
+
PLifePlan +
−
F1 −
R5<x≤15
R25<x≤35 +
PSelectPlan −
R35<x≤45
PVAPZ −
PMVAP
F2 .
Het continu maken van de resterende duurtijd
Voor de resterende duurtijd hebben we in het model 5 parameters, ´e´en voor elke klasse
behalve de hoogste. Maar dan is er een groot verschil in verwacht afkooppercentage tussen
polissen met bijvoorbeeld een resterende duurtijd van 35 jaar en 36 jaar, waarvoor alle andere
gegevens hetzelfde zijn. Om dit te verhelpen, willen we een functie maken die gebaseerd is op
deze 5 parameterschattingen. Voor polissen met een resterende duurtijd groter dan 45 jaar,
behouden we 0 als parameter, omdat we eerder al hebben gezien dat het afkooppercentage
1
Ter herinnering: We hebben voor de premiefrequentie de haljaarlijkse en de kwartaalpremies
samengevoegd. Bij de producten hebben we het Life Plan samengevoegd met New Life. Ook de twee
groeiplannen en de twee spaarplannen zijn samengevoegd.
43
44
HOOFDSTUK 7. DE DYNAMISCHE FORMULES
daar totaal anders is. We zoeken eerst de gemiddelde resterende duurtijd per klasse. Daarna
zoeken we dan een functie die de parameterschattingen benadert in die gemiddeldes.
Voor de niet-fiscale polissen bekomen we volgende klassegemiddeldes.
Klasse
0-5
5-15
15-25
25-35
35-45
Gemiddelde
1,8539
8,6203
17,9667
28,4050
38,0673
Parameter
1,0504
1,1910
1,2827
1,5269
1,6682
We plotten deze punten met de kleinste kwadraten rechte. We duiden hierop ook aan wat
de parameter zou zijn indien we toch klassen behouden.
Omdat dit geen grote verschillen oplevert met de constante waarden per klasse, lijkt dit een
goede manier om de parameters te benaderen. Deze functie komt overeen met p =
.2 De formule voor de afkoop wordt zo
logit(afkoop%) =
+(
−
PLifePlan −
−
F1 − 1.8433F2 +
)Rx≤45
PJuniorPlan −
PGroeiplan −
PSelectPlan
× (OLO10 − (igar + wd)).
We doen hetzelfde voor de polissen die wel fiscaal zijn ingebracht. Dit geeft volgende
klassegemiddeldes.
2
Hierin is p de parameter die bij de resterende duurtijd hoort en r de resterende duurtijd.
7.1. HET CONTINU MAKEN VAN DE RESTERENDE DUURTIJD
Class
0-5
5-15
15-25
25-35
35-45
Gemiddelde
2,1718
9,4380
19,2995
28,8973
37,8273
45
Parameter
1,1121
0,5494
0,6758
1,1574
1,6594
Uit deze gegevens is het onmiddellijk duidelijk dat een lineaire functie geen goede benadering
is. We proberen eerst een kwadratische functie.
Deze functie wordt veel te groot wanneer de resterende duurtijd groter wordt dan 40 jaar.
Ook is de afstand tussen de punten en de rechte relatief groot. Daarom proberen we een
kubische functie. Dit geeft een betere benadering. De volgende figuur geeft deze functie
weer. Hierop hebben we ook aangeduid wat de parameter zou zijn indien we toch klassen
behouden.
46
HOOFDSTUK 7. DE DYNAMISCHE FORMULES
Deze functie wordt gegeven door p =
Als we dit dan vertalen in de algemene formule voor het afkooppercentage, geeft dit
logit(afkoop%) =
7.2
+(
+
PLifePlan +
−
F1 −
.
)Rx≤45
PSelectPlan −
PVAPZ −
PMVAP
F2 .
Afkooppercentages
De voorgaande formules kunnen rechtstreeks ge¨ımplementeerd worden. Maar hoe groot zijn
die afkooppercentages dan in de praktijk? En hoe groot is het dynamische effect? Deze
twee vragen zullen we hier proberen te beantwoorden aan de hand van een paar voorbeelden. We doen dit eerst voor de fiscale polissen, omdat we daar geen dynamische term
hebben. We kunnen hier dus een vast afkooppercentage bepalen als we de poliskenmerken
gegeven hebben. Volgende tabel geeft de afkooppercentages weer van alle productklassen
en voor bepaalde resterende duurtijden. Het gaat hierbij over polissen met maandelijkse
premiebetalingen. Voor polissen met jaarlijkse premiebetaling liggen deze percentages lager.
Deze percentages liggen in lijn met de grootte van de resultaten van voorgaande studies. De
grootte-orde is het enige wat we kunnen vergelijken omdat er vroeger andere klassen waren
gedefinieerd. Merk op dat polissen met een duurtijd van langer dan 45 jaar een zeer laag
7.2. AFKOOPPERCENTAGES
47
afkooppercentage hebben.
Bij de niet-fiscale polissen zagen we dat er wel een dynamisch effect is. Volgende grafieken
laten zien hoe groot dit effect juist is. Op de grafiek geeft de horizontale as steeds weer
hoeveel procentpunt de OLO op tien jaar en de intrestgarantie plus de winstdeelname van
elkaar verschillen. De eerste grafiek geeft het afkooppercentage van een polis in het Life
Plan met maandelijkse premiebetalingen en een resterende duurtijd van 1 jaar.
De volgende grafiek geeft het afkooppercentage van een polis in het Life Plan met jaarlijkse
premiebetalingen en een resterende duurtijd van 20 jaar.
We maken ook nog dezelfde grafieken voor de Groeiplannen. De blauwe is die met maandelijkse premiebetalingen en een resterende duurtijd van 1 jaar, de groene die met jaarlijkse
premiebetalingen en een resterende duurtijd van 20 jaar.
48
HOOFDSTUK 7. DE DYNAMISCHE FORMULES
Het belangrijkste dat we op deze figuren zien, is dat het dynamische effect groter is naarmate
het basisafkooppercentage groter is. Dus als er in het basisgeval meer afkopen zijn, dan zal
ook het dynamisch effect groter zijn. Hierbij bedoelen we met het basisgeval het geval
waarbij OLO10 − (igar + wd) = 0.
Als we de toename in het afkooppercentage beschouwen, bekomen we procentueel ongeveer
een constante toename. Voor een toename in het verschil tussen de OLO op tien jaar en
de som van de gegarandeerde intrest en de winstdeelname van 1 procentpunt, bedraagt de
toename in het afkooppercentage tussen
Hoofdstuk 8
Besluit
Deze masterproef had als doel om statistisch te onderzoeken welke gegevens een effect hebben
op het verwacht afkooppercentage. Ook hebben we daarbij onderzocht of er een dynamisch
verband is. Dit is een verband met de economische omgeving, meer specifiek met de marktrente.
Een eerste onderzoek heeft ons geleerd dat het afkooppercentage het meest afhankelijk is
van het fiscaal regime van de polis, de resterende duurtijd van de polis, het type product en
de premiefrequentie. Daarna hebben we ondervonden dat fiscaal ingebrachte polissen zich
anders gedragen dan polissen die geen fiscaal voordeel genieten. Tot slot hebben we statistisch aangetoond dat polissen die een fiscaal voordeel genieten, een afkoopgedrag vertonen
dat niet afhankelijk is van de economische omgeving. Dit is te verklaren doordat de kost bij
afkoop, groter is dan de opportuniteit die de hogere marktrente biedt. Polissen die een fiscaal
voordeel genieten, worden namelijk extra belast als ze vervroegd worden afgekocht. Voor
niet-fiscale polissen hebben we daarentegen wel een dynamisch verband gevonden. Voor een
toename van OLO10 − (igar + wd) met 1 procentpunt neemt het verwacht afkooppercentage
toe met ongeveer
.
Merk op dat deze resultaten sterk verschillen van [3] en [4]. We bekomen namelijk andere
significante parameters. Maar zoals in de inleiding al werd opgemerkt, zullen de verbanden sterk verschillen per land en zelfs per verzekeringsmaatschappij. We vonden ook wel
meer economische verbanden, maar deze konden we niet correct mee beschouwen in het
model, omdat we te weinig data hebben. Die data zijn dan ook nog eens ’vervuild’ door de
financi¨ele crisis. Deze verbanden konden we niet correct beschouwen omdat we de economische variabelen maar meenemen op 10 verschillende tijdstippen. Dit kan in de toekomst
verholpen worden als er gegevens beschikbaar zouden zijn op maandbasis.
De studie is enkel gebeurd op de portefeuille Tak 21 Individueel Modern. In de toekomst
zullen ook de andere portefeuilles aan bod komen. Hierbij kan ongeveer dezelfde methode
gebruikt worden. Er zullen wel kleine wijzigingen nodig zijn. Zo zal er bij Tak 23 best
gewerkt worden met een risicoscore voor elk fonds, omdat er geen intrestgarantie is. Dit
weerspiegelt dan het rendement en het risico van dat fonds. Men kan hierbij ook kijken wat
de opbrengst was in het voorgaande jaar om de gegarandeerde intrest te vervangen.
49
50
HOOFDSTUK 8. BESLUIT
In deze studie hebben we enkel afkoop beschouwt, en geen premieverval (dormancy). Het
lijkt niet onlogisch dat er hierbij andere variabelen een effect zullen hebben.
Ten slotte kan er nog onderzocht worden wat er met het dynamisch effect moet gebeuren
wanneer de Solvency II-schokken worden toegepast. Er zijn bijvoorbeeld argumenten dat het
dynamisch effect niet mee geschokt moet worden. Voor het Mass Lapse scenario zouden we
kunnen zeggen dat vanaf het tweede jaar de verzekeringnemers nog enkel statisch afkopen,
omdat alle verzekeringnemers die dynamisch afkopen al mee hebben afgekocht met de massa.
De formule die we hier hebben afgeleid zou in dat geval nog kunnen gebruikt worden, omdat
ze bestaat uit een statisch deel en een dynamische term.
Bijlage A
Figuren
A.1
Bivariate Analyse
Figuur A.1: Afkooppercentage ten opzichte van de inflatie
51
52
BIJLAGE A. FIGUREN
Figuur A.2: Afkooppercentage ten opzichte van het consumentenvertrouwen
Figuur A.3: Afkooppercentage ten opzichte van de euro-dollar wisselkoers
white
A.2. SIGNIFICANTE POLISGEGEVENS
A.2
Significante polisgegevens
Figuur A.4: Eerste automatische lineaire regressie op polisgegevens
Figuur A.5: Tweede automatische lineaire regressie op polisgegevens
Figuur A.6: Derde automatische lineaire regressie op polisgegevens
53
54
BIJLAGE A. FIGUREN
Figuur A.7: Histogram van de residuen na de tweede regressie
Figuur A.8: Histogram van de residuen na de derde regressie
white
A.3. REGRESSIE MET ECONOMISCHE PARAMETERS: NIET-FISCAAL
A.3
Regressie met economische parameters: Niet-fiscaal
Figuur A.9: Eerste automatische selectieprocedure
Figuur A.10: Automatische selectieprocedure met interactietermen
55
56
BIJLAGE A. FIGUREN
Figuur A.11: Het model met interactieterm
Figuur A.12: Het model met winstdeelname als aparte variabele
A.4. REGRESSIE MET ECONOMISCHE PARAMETERS: FISCAAL
A.4
Regressie met economische parameters: Fiscaal
Figuur A.13: Eerste automatische selectieprocedure
Figuur A.14: Modelschatting met BBPperc in het model
57
58
BIJLAGE A. FIGUREN
Figuur A.15: Automatische selectieprocedure zonder FISC en BBPperc
A.5
Controle modelassumpties: Niet-fiscaal
Figuur A.16: Histogram residuen
A.5. CONTROLE MODELASSUMPTIES: NIET-FISCAAL
Figuur A.17: Plot residuen ten opzichte van productklasse
Figuur A.18: Plot residuen ten opzichte van premiefrequentie
white
59
60
BIJLAGE A. FIGUREN
Figuur A.19: Plot residuen ten opzichte van klassen resterende duurtijd
Figuur A.20: Plot residuen ten opzichte van OLO10-(igar+wd)
white
A.6. CONTROLE MODELASSUMPTIES: FISCAAL
A.6
Controle modelassumpties: Fiscaal
Figuur A.21: Histogram residuen
Figuur A.22: Plot residuen ten opzichte van productklasse
61
62
BIJLAGE A. FIGUREN
Figuur A.23: Plot residuen ten opzichte van premiefrequentie
Figuur A.24: Plot residuen ten opzichte van klassen resterende duurtijd
A.6. CONTROLE MODELASSUMPTIES: FISCAAL
Figuur A.25: Plot residuen ten opzichte van OLO10-(igar+wd)
63
64
BIJLAGE A. FIGUREN
Bijlage B
Het aantal klassen reduceren
Om het aantal klassen te reduceren, doen we een ANOVA. De Bonferroni t-test duidt dan
klassen aan die op een niveau van 95% een significant verschillend verwacht afkooppercentage
hebben. Deze worden aangeduid met drie sterren.Voor het fiscaal regime zien we dat alledrie
de klassen significant verschillende verwachtingswaarden hebben.
Voor de premiefrequentie zien we dat verzekeringnemers die 2 of 4 keer per jaar een premie
betalen geen significant verschillend verwacht afkooppercentage hebben. We voegen de
haljaarlijkse en de kwartaalpremies dus samen.
65
66
BIJLAGE B. HET AANTAL KLASSEN REDUCEREN
Bij de resterende duurtijd bekijken we enkel opeenvolgende klassen, omdat het niet veel zin
heeft om klassen samen te voegen die niet opeenvolgend zijn. Daarbij zien we dat er maar
2 opeenvolgende klassen zijn die geen significant verschillend verwacht afkooppercentage
hebben. We voegen dus de klasse met resterende duurtijd van 45 jaar tot 75 jaar samen
met de klasse van resterende duurtijd die groter is dan 75 jaar.
67
Om het overzichtelijk te houden, maken we bij de producten een tabel. In deze tabel
staan de kruisjes voor klassen die geen significant verschillend verwacht afkooppercentage
hebben. Als we meer dan twee klassen willen samenvoegen, moeten ze twee aan twee een
niet-significant verschillend verwacht afkooppercentage hebben.
We kunnen dus de producten 11125 en 11128 samenvoegen. Dit zijn het Life Plan en New
Life. Ook de twee groeiplannen, 111291 en 111292, kunnen we samenvoegen. Tot slot
hebben ook het Life Home Plan en het Life Health Plan een verwacht afkooppercentage dat
niet significant verschilt. Dit zijn respectievelijk de producten 1112E en 1112H.
Nadien is er ook getest dat de klassen die we overhouden allemaal een significant verschillend
verwacht afkooppercentage hebben.
68
BIJLAGE B. HET AANTAL KLASSEN REDUCEREN
Bijlage C
Regressie met de volledige dataset
Een automatische stapsgewijze regressie in SAS voegt de variabelen in volgende volgorde
toe:
We willen het probleem van multicollineariteit vermijden. Daarom nemen we enkel de twee
economische variabelen, die het eerst worden toegevoegd, mee op in het model. Dit zijn het
werkloosheidspercentage en het verschil tussen de OLO op tien jaar en de intrestgarantie.
Als we dan kijken of er interactietermen tussen polisgegevens en economische variabelen1
moeten toegevoegd worden, zien we dat een selectie op basis van AICc alle interacties
toevoegt. Zels bij toevoeging van de voorlaatste interactie daalt de AICc nog sterk.
1
We bekijken enkel deze interactie, omdat we willen weten of polissen met bepaalde karakteristieken een
ander effect vertonen van de economische variabelen op het afkooppercentage.
69
70
BIJLAGE C. REGRESSIE MET DE VOLLEDIGE DATASET
Maar dan bekomen we grote schattingen van de parameters in absolute waarde. Deze
schattingen zijn dan nog tegengesteld zodat ze mekaar vaak opheffen. Dit is een gevolg
van de multicollineariteit die in het model zit. We splitsen daarom de dataset op in twee
datasets, ´e´en met de niet fiscaal ingebrachte polissen en ´e´en met de polissen die wel fiscaal
zijn ingebracht. Zo hopen we het probleem van multicollineariteit op te lossen.
Bibliografie
[1] Anderson, D., Feldblum, S., Modlin, C., Schirmacher, D., Schirmacher, E. en Thandi,
N. (2007), A Practioners Guide to Generalised Linear Models: A foundation for theory, interpretation and application, Towers Watson.
[2] Cerchiara, R. R., Edwards, M. en Gambini, A. (2009), Generalized Linear Models
in Life Insurance: Decrements and Risk factor analysis under Solvency II Working
Paper. AFIR Colloquium Rome
[3] Kent, J. en Morgan, E.(2008), Dynamic Policyholder Behaviour, Staple Inn Actuarial
Society.
[4] Kiesenbauer, D. (2012), Main determinants of lapse in the German life insurance
industry, North American Actuarial Journal, 16(1):52-73.
[5] Kim, C. (2005), Modeling Surrender and Lapse Rates with Economic Variables, North
American Actuarial Journal, 9(4):5670.
[6] Nationale Bank van belgi¨e, Macro-economische statistieken, geraadpleegd op 27
november 2013 van http://www.nbb.be/pub/stats/stats.htm?l=nl&tab=Figures.
[7] Organisation for Economic Co-operation and Development, Stat Extracts, geraadpleegd op 27 november 2013 van http://stats.oecd.org/index.aspx.
[8] Vanheule, P., Solvency II, college aan de VUB op 08/05/2014.
71