Multivariate afhankelijkheid

Faculteit Wetenschappen
Departement Wiskunde
Multivariate afhankelijkheid: De vine copula en toepassingen op financi¨ele rendementen
Proefschrift ingediend met het oog op het behalen
van de graad van Master in de Wiskunde
Hering Maxime
Promotor:
MEI 2014
Prof. dr. Christophe Croux
i
Though the road’s been rocky it sure feels good to me
- B. Marley
Samenvatting
Het meten van afhankelijkheden tussen meerdere variabelen is een complexe taak. De klassieke correlatieco¨effici¨ent is vaak ontoereikend, omdat deze enkel lineaire verbanden nagaat,
en ge¨ınspireerd is op de bivariate normale verdeling. Vaak zijn bivariate verdelingen echter
niet normaal, en we hebben nood aan een flexibele klasse van verdelingen; Copula’s helpen
ons hier. De verdelingen van de aparte variabelen worden eerst gekozen, en daarna wordt
een copula geselecteerd om de afhankelijkheidsstructuur te modelleren.
In deze meesterproef behandelen we een multivariate versie van copula’s, die toelaat afhankelijkheden tussen meerdere, zelfs tientallen variabelen, te modelleren. Hiervoor gebruiken
we vines, die de afhankelijkheid tussen meerdere variabelen op een accurate en flexibele manier beschrijft, zonder een te groot aantal parameters te moeten schatten. Het idee is om
de multivariate copula-dichtheid te herschrijven als een product van bivariate (conditionele)
copula’s. Een vine is een verzameling van bomen, waar elke boom een grafische weergave is
van de (conditionele) afhankelijkheden tussen variabelen.
Deze technieken worden toegepast op rendementen van financi¨ele instrumenten, waar er
complexe afhankelijkheden kunnen bestaan. De dynamiek van de aparte tijdreeksen, die
hier dus de rendementen zijn, wordt eerst gemodelleerd met univariate ARMA-GARCH
tijdreeksmodellen. De afhankelijkheden tussen de tijdreeksen worden dan gecapteerd door
een vine copula-verdeling tussen de residuen van de univariate modellen. We leggen uit hoe
de verschillende bouwstenen van de vine worden bekomen, en hoe de paar-copula ontbinding
van een multivariate dichtheidsfunctie kan worden bewezen. Ook wordt gekeken naar twee
mogelijke manieren om het model te verbeteren. In eerste instantie wordt er gestreefd naar
een vereenvoudiging van het model, die het rekenwerk moet verminderen. Vervolgens wordt
gekeken hoe de tijdsvari¨erende afhankelijkheid kan worden ge¨ımplementeerd in het model.
Ter evaluatie van de vine copula wordt op basis van het model de Value-at-Risk dagelijks
berekend en vergeleken met de gerealiseerde rendementen.
ii
iii
Met de recente financi¨ele crisis en de nieuwe Solvency- en Baselregels is het duidelijk geworden dat de klassieke statistische modellen die toegepast werden hun beperkingen hebben.
Het is uitermate belangrijk om de afhankelijkheden tussen verschillende financi¨ele instrumenten mee in rekening te brengen. We illustreren in 3 case-studies hoe de vine copula
modellen hiervoor gebruikt kunnen worden. In een eerste case worden verschillende vine
copulas geconstrueerd voor de maandelijkse rendementen van 14 Europese landen over een
periode van 13 jaar en worden deze met elkaar vergeleken. Een tweede dataset bevat de
dagelijkse rendementen van de BEL20 index en haar componenten samen met hun sectoren
en dit over een periode van 8 jaar. Hierop wordt het Regular Vine Market Sector model
toegepast om voor elk aandeel het specifiek en systematisch risico te bepalen. Ook wordt
aan de hand van de Value-at-Risk bevestigd dat de vine copula een goed model is.
Inhoudsopgave
Samenvatting
ii
Lijst van figuren
vii
Lijst van tabellen
viii
1 Inleiding
1
2 Copula’s
4
2.1
2.2
Fundamentele copula’s . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Elliptische copula’s . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10
11
2.3
Archimedische copula’s . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12
3 Vine en paar-copula ontbinding
17
3.1
3.2
Reguliere vine . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Paar-copula ontbinding . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
18
24
3.3
D-vine en C-vine . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
31
4 Toepassing van vines in finance
34
4.1
Tijdreeksen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
36
4.2
Vine-structuur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.2.1 Maximum Spanning Tree . . . . . . . . . . . . . . . . . . . . . . . . .
38
39
4.2.2
Paar-copula fit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
41
4.2.3
Getransformeerde observaties . . . . . . . . . . . . . . . . . . . . . .
43
Matrix representatie van een reguliere vine . . . . . . . . . . . . . . . . . . .
Gesnoeide en vereenvoudigde reguliere vines . . . . . . . . . . . . . . . . . .
44
47
4.4.1
Gesnoeide reguliere vine . . . . . . . . . . . . . . . . . . . . . . . . .
47
4.4.2
Vereenvoudigde reguliere vine . . . . . . . . . . . . . . . . . . . . . .
49
4.5
Tijdsvari¨erende copula’s . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.5.1 Dynamisch Conditioneel Correlatie-model . . . . . . . . . . . . . . .
51
52
4.6
Model evaluatie aan de hand van Value-at-Risk . . . . . . . . . . . . . . . .
56
4.3
4.4
iv
INHOUDSOPGAVE
v
5 Empirische toepassing
5.1
5.2
5.3
59
Case 1: Maandelijkse rendementen van 14 Europese landen, 1991-2014. . . .
60
5.1.1
5.1.2
Marginale modellen . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Vine constructie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
60
63
5.1.3
Vergelijken van de reguliere vines, de C-vine en de D-vine . . . . . . .
68
5.1.4
Snoeiing en vereenvoudiging van de reguliere vine . . . . . . . . . . .
70
5.1.5
5.1.6
Multivariate student t copula . . . . . . . . . . . . . . . . . . . . . .
Dynamische paar-copula’s . . . . . . . . . . . . . . . . . . . . . . . .
72
72
Case 2: Dagelijkse rendementen BEL 20 componenten met respectievelijke
sectoren, 2006-2014. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
73
5.2.1
5.2.2
76
79
Regulare Vine Market Sector model . . . . . . . . . . . . . . . . . . .
Systematisch en specifiek risico . . . . . . . . . . . . . . . . . . . . .
Case 3: Value-at-Risk model evaluatie
. . . . . . . . . . . . . . . . . . . . .
82
Bibliografie
84
Index
87
A Appendix
88
A.1 Case 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
A.2 Case 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
88
99
A.3 Case 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
Lijst van figuren
2.1
(a) concordante en (b) discordante paren . . . . . . . . . . . . . . . . . . . .
8
3.1
D-vine voor 5 variabelen . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
21
3.2
3.3
j-fold union voor e met j ∈ (0, 1, 2, 3) . . . . . . . . . . . . . . . . . . . . . .
boog e rond top j . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
22
24
3.4
Tn−1 en Tn−2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
27
3.5
Reguliere vine voor 3 variabelen . . . . . . . . . . . . . . . . . . . . . . . . .
30
3.6
C-vine voor 5 variabelen . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
33
4.1
5-dimensionale reguliere vine
. . . . . . . . . . . . . . . . . . . . . . . . . .
45
5.1
Geschatte dichtheidsfunctie voor de rendementen van Belgi¨e . . . . . . . . .
61
5.2
Tijdsvari¨erende volatiliteit voor de rendementen van Belgi¨e
. . . . . . . . .
62
5.3
Transformatie naar uniform verdeelde tijdreeks
. . . . . . . . . . . . . . . .
63
5.4
5.5
Structuur van de eerste boom in de reguliere vine . . . . . . . . . . . . . . .
(a) Alle mogelijke bogen in boom 3 met overeenkomstige Kendall’s tau, (b)
65
de bekomen boomstructuur door het toepassen van het Prim’s algoritme.
.
66
5.6
Structuur van de eerste boom van de D-vine . . . . . . . . . . . . . . . . . .
68
5.7
5.8
Tijdsvari¨erende Kendall tau voor de paren variabelen in boom 1 . . . . . . .
(a) Boom 1 en (b) boom 2 van RVMS-model voor de BEL20 . . . . . . . . .
74
78
5.9
Speciek en systematisch risico bij diversificatie
. . . . . . . . . . . . . . . .
79
5.10 Boom 1 van reguliere vine voor portefeuille . . . . . . . . . . . . . . . . . . .
82
5.11 VaR berekeningen en gerealiseerde log-rendementen . . . . . . . . . . . . . .
83
A.1 Scatterplots boom 1 van reguliere vine . . . . . . . . . . . . . . . . . . . . .
89
A.2 Boom 2 reguliere vine . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
98
A.3 Boom 3 reguliere vine . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
A.4 Boom 1 reguliere vine . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
98
99
A.5 Aandelenkoers van BEL 20 en sectoren . . . . . . . . . . . . . . . . . . . . . 101
A.6 Aandelenkoers van BEL 20 - componenten (1) . . . . . . . . . . . . . . . . . 101
vi
LIJST VAN FIGUREN
vii
A.7 Aandelenkoers van BEL 20 - componenten (2) . . . . . . . . . . . . . . . . . 102
A.8 Log-rendementen van BEL 20 en sectoren . . . . . . . . . . . . . . . . . . . 102
A.9 Log-rendementen van BEL 20 - componenten (1) . . . . . . . . . . . . . . . 103
A.10 Log-rendementen van BEL 20 - componenten (2) . . . . . . . . . . . . . . . 103
A.11 Scatterplots tussen de pseudo-observaties van de BEL20 en de sectoren . . . 104
A.12 Scatterplots tussen de pseudo-observaties van de finanici¨ele sector en haar
aandelen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
A.13 Scatterplots tussen de pseudo-observaties van de consumenten diensten sector
en haar aandelen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
A.14 Scatterplots tussen de pseudo-observaties van de nutssector en haar aandelen
en tussen de basis materialen sector en haar aandelen . . . . . . . . . . . . . 107
A.15 Scatterplots tussen de pseudo-observaties van de overige sectoren en haar aandelen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
A.16 Scatterplots van de pseudo-observaties voor de reguliere vine . . . . . . . . . 109
Lijst van tabellen
5.1
5.2
Beschrijvende statistieken van de rendementen van de 14 Europese landen . .
Per boom het aantal paar-copula’s binnen een bepaalde familie . . . . . . . .
61
67
5.3
Vergelijking van de verschillende vines . . . . . . . . . . . . . . . . . . . . .
69
5.4
Vuong test tussen de verschillende vines . . . . . . . . . . . . . . . . . . . .
69
5.5
5.6
BIC-waardes voor de verschillende snoeiingsniveau’s . . . . . . . . . . . . . .
Vuong test statistieken voor het bepalen van het vereenvoudigingsniveau . .
71
71
5.7
Componenten BEL 20 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
75
5.8
Systematisch en specifiek risico voor de componenten van de BEL20 . . . . .
81
A.1 Geschatte ARMA-GARCH parameters voor de rendementen van de Europese
landen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
viii
90
Hoofdstuk 1
Inleiding
Een van de redenen voor de financi¨ele crisis die begon in 2007 was het niet accuraat vastleggen van de afhankelijkheid tussen verschillende activa. Voor een goed financieel risicobeheer
is er nood aan een goed model die niet enkel de prijs bepaalt voor een groot aantal financi¨ele
instrumenten maar eveneens de afhankelijkheid modelleert tussen de financi¨ele rendementen.
Vroeger werd hiervoor gebruik gemaakt van de correlatieco¨effici¨ent, deze beschrijft goed de
afhankelijkheid voor elliptische verdelingen. Maar deze komen in de praktijk zelden voor
daar men vaak te maken heeft met zware staarten van de verdeling en asymmetrie, die niet
correct worden gemodelleerd aan de hand van elliptische verdelingen. Ook met het oog op
de Basel en Solvency regels in de bank- en verzekeringssector, wordt er steeds meer aangedrongen op een geschikt intern model dat het re¨ele risico correct weergeeft.
Een zeer nuttige functie in dit opzicht is de copula-functie. Aan de hand van deze functie kan de gezamenlijke verdeling van meerdere toevalsvariabelen onderverdeeld worden in
twee bijdragen: de marginale verdeling van iedere variabele en de afhankelijkheid tussen de
verschillende variabelen, beschreven aan de hand van de copula functie. Een ander voordeel van de copula-functie is dat verschillende afhankelijkheidgrootheden kunnen geschreven
worden in functie van de onderliggende copula, dit is onder meer het geval voor de Kendall’s
Tau, de Spearman’s rang correlatie alsook voor de staart-afhankelijkheid. In hoofdstuk 2
wordt een inleiding gegeven over de copula-functie en worden verschillende bivariate copulafamilies beschreven met bijhorende eigenschappen die in de financi¨ele toepassingen gebruikt
zullen worden. Wanneer men gaat kijken naar multivariate copula’s brengt dit verschillende beperkingen met zich mee voor het juist modelleren van de afhankelijkheid. Zo zijn
er tegenover de bivariate copula’s maar een beperkt aantal multivariate copula-klassen. De
flexibiliteit in de staarten van de verdeling kan beperkt gemodelleerd worden aan de hand
van elliptische copula’s. De Gaussiaanse copula heeft geen tail dependence en bij de student
t copula is de tail dependence symmetrisch is en hangt die af van ´e´en enkele parameter voor
1
HOOFDSTUK 1. INLEIDING
2
alle paren variabelen, namelijk het aantal vrijheidsgraden. Voor elliptische copula’s moeten
ook veel parameters worden geschat. Bij de multivariate Archimedische copula’s zijn er ook
parameter beperkingen die een gelijke afhankelijkheid voor elk paar variabelen veronderstellen. Dit brengt opnieuw een beperkte flexibiliteit met zich mee. Om deze flexibiliteit bij het
modelleren van de multivariate afhankelijkheid te verbeteren wordt er verkozen te werken
met vine copula’s eerder dan met multivariate copula’s. Bij een vine copula wordt de multivariate dichtheid ontbonden in een product van univariate dichtheidsfuncties en bivariate
copula-dichtheidsfuncties toegepast op de variabelen, hun verdelingsfuncties en conditionele
verdelingsfuncties. De bivariate copula’s die worden gebruikt in de vine copula zullen verder
paar-copula’s worden genoemd.
Deze vine copula’s kennen vele toepassingen binnen de financi¨ele wereld. Daar is er nood
aan een flexibele multivariate afhankelijkheidsstructuur dat het best overeenkomt met de
realiteit. Zowel in het centrum als in de staart van de verdeling (Value-at-Risk). Logrendementen hebben bekende karakteristieken, ze bezitten een zekere graad van asymmetrie
en hoge kurtosis. De afhankelijkheidsstructuur tussen paren variabelen zullen sterk vari¨eren
gaande van onafhankelijke tot complexe vormen van niet-lineaire afhankelijkheid; de meest
gekende multivariate verdelingen kunnen dit niet allemaal correct weergeven. In dit werk
zal men de vine copula’s toepassen om de afhankelijkheid tussen log-rendementen van verschillende variabelen zo goed mogelijk te modelleren.
In hoofdstuk 3 wordt aangetoond hoe de vine copula wordt geconstrueerd. Hiervoor wordt
eerst een korte introductie gegeven rond grafentheorie. De reguliere vine wordt ingevoerd
als grafisch model voor het beschrijven van een bepaalde afhankelijkheidsstructuur. Met
de bijhorende elementenverzamelingen die de reguliere vine karakteriseren en een aantal eigenschappen. Gebruikmakende van lemma’s wordt er toegewerkt naar de stelling die de
paar-copula ontbinding geeft voor de multivariate verdeling. Tenslotte worden in het hoofdstuk twee speciale reguliere vines gedefinieerd, namelijk de C-vine en de D-vine. In hoofdstuk
4 vervolgens wordt stap-per-stap beschreven hoe de vine copula in theorie kan worden toegepast op financi¨ele rendementen. Dit gebeurt door eerst een correct model te vinden voor de
verschillende univariate tijdreeksen en vervolgens een geschikte vine-structuur te construeren. Er wordt ook getoond hoe een vine-copula kan worden beschreven aan de hand van een
matrices. Bij het construeren van een vine copula moeten heel wat schattingen en modelvergelijkingen worden uitgevoerd. De hoeveelheid werk gaat stijgen met de dimensie van de
dataset; daarom wordt er onderzocht of het mogelijk is van een vine te gaan vereenvoudigen
of snoeien. Er wordt eveneens rekening gehouden met het feit dat de afhankelijkheid tussen
financi¨ele variabelen varieert met de tijd, daarom wordt gekeken naar dynamische copula’s.
HOOFDSTUK 1. INLEIDING
3
Eens het volledige model geconstrueerd is moet tenslotte kunnen worden nagegaan of de vine
copula de afhankelijkheid van de gekozen portefeuille op een correcte manier beschrijft. Deze
evaluatie gebeurd op basis van de Value-at-Risk voorspellingen die worden vergeleken met
de gerealiseerde rendementen. Hiermee wordt onderzocht of het model een goede benadering
is van de realiteit.
In hoofdstuk 5 tenslotte wordt alles wat in theorie werd beschreven toegepast op twee interessante datasets. Een eerste beschrijft de maandelijkse rendementen van 14 Europese landen.
De andere dataset bevat de dagelijkse rendementen van de componenten van de BEL20 index. De implementatie gebeurt in R en men onderschijdt hiervoor drie cases. In de eerste
case wordt voor de Europese landen vier verschillende vines geconstrueerd en worden ze met
elkaar vergeleken. Ook wordt onderzocht of kan worden vereenvoudigd en gesnoeid en of de
afhankelijkheid varieert met de tijd. Op de BEL20 wordt het Regular Vine Market Sector
model toegepast die zal toelaten voor elk aandeel van de BEL20 speciefieke risico-factoren
te bepalen. In een derde case wordt voor een portefeuille van vijf aandelen een reguliere vine
geconstrueerd en worden de rendementen voorspeld gedurende een jaar. Op basis van de
Value-at-Risk wordt dan tenslotte de vine ge¨evalueerd.
Hoofdstuk 2
Copula’s
In dit hoofdstuk worden de concepten rond copula’s ingeleid aan de hand van Kadankova
(2013), Kurowicka & Cooke (2006) en Nelsen (2006) met de nodige definities. Het is dankzij
het theorema van Sklar dat de copula-functie zo interessant is. Deze laat toe de multivariate verdelingsfunctie te beschrijven aan de hand van de marginale verdelingsfuncties en de
afhankelijkheidsstructuur gegeven door de copulafunctie. Vervolgens worden enkele interessante afhankelijkheidsgrootheden gegeven die afgeleid kunnen worden uit de copula en die
later gebruikt zullen worden om de vine-structuur te, zoals de tail dependence, de Kendall’s
tau en de Spearman’s rang correlatie. Tenslotte worden verschillende bivariate copula families beschreven samen met hun respectievelijke karakteristieken. Deze paar-copula’s zal men
gebruiken voor het bekomen van de paar copula ontbinding van de multivariate afhankelijkheid. Doorheen dit werk beschouwt men continue en inverteerbare verdelingsfuncties.
Zij X = (X1 , . . . , Xn ) ∈ Rn een vector van willekeurige variabelen met continue en inverteerbare marginale verdelingsfuncties Fi (x) = P[Xi ≤ x], i ∈ {1, . . . , n} en gezamenlijke verdelingsfunctie F op Rn met Borel sigma algebra B. Beschouw de vector U =
(F1 (X1 ), . . . , Fn (Xn )), waarbij de componenten Ui = Fi (Xi ) wegens de probability integral
transform uniform verdeeld zijn. Dan hebben we ook Xi = F −1 (Ui ) voor i ∈ {1, . . . , n}. De
copula-functie wordt dan gedefinieerd als volgt.
Definitie 2.1 Een n-dimensionale copula is een functie C : [0, 1]n → [0, 1], dat de verdelingsfunctie is van een willekeurige vector (U1 , . . . , Un ) met uniforme marginale verdelingen
op [0, 1]
De n-dimensionale copula bezit volgende eigenschappen:
• C is stijgend in iedere component,
• C(1, 1, . . . , ui , . . . , 1) = ui , i ∈ (1, . . . , n),
4
HOOFDSTUK 2. COPULA’S
5
• C(u1 , . . . , un ) = 0 als een van de argumenten 0 is,
• rechthoek eigenschap: VC (B) ≥ 0 voor alle rechthoeken B =
Qn
i=1 [ai , bi ],
waarbij het
C-volume van B gedefinieerd is als
VC (B) =
2
X
i1 =1
...
2
X
(−1)i1 +...+in C (xi1 , . . . , xin )
in =1
met xj1 = aj en xj2 = bj .
Vertrekkende van een multivariate kansverdeling, kan de copula functie worden geschreven
als,
P (X1 ≤ F −1 (u1 ), . . . , Xn ≤ F −1 (un ))
= P (U1 ≤ u1 , . . . , Un ≤ un )
= C(u1 , . . . , un )
Of ook nog
P (X1 ≤ x1 , . . . , Xn ≤ xn )
= P (F1 (X1 ) ≤ F1 (x1 ), . . . , Fn (Xn ) ≤ Fn (xn ))
= C (F1 (x1 ), . . . , Fn (xn ))
In het bivariaat geval geeft dit dan,
Definitie 2.2 Een bivariate copula is een functie C : [0, 1]2 → [0, 1] met de volgende eigenschappen voor u1 , u2 ∈ [0, 1]:
• C(u1 , 1) = u1 en C(1, u2 ) = u2 ,
• C(u1 , 0) = C(0, u2 ) = 0,
• C is 2-stijgend, dus voor elke u11 , u12 , u21 , u22 ∈ [0, 1] zodat voor u11 ≤ u21 en u12 ≤ u22
geldt,
C(u21 , u22 ) − C(u21 , u12 ) − C(u11 , u22 ) + C(u11 , u12 ) ≥ 0.
De populariteit van de copula-functie is te danken aan het theorema van Sklar (1959) die de
relatie weergeeft tussen de copula C en de verdeling van X = (X1 , . . . , Xn ) en aantoont hoe
de afhankelijkheid tussen de variabelen kan gescheiden worden van de marginale verdelingen.
Stelling 2.1 (Sklar) Gegeven willekeurige variabelen X1 , . . . , Xn met continue verdelingsfuncties F1 , . . . , Fn en gezamenlijke verdelingsfunctie F , dan bestaat er een unieke copula C
zodat voor alle x = (x1 , . . . , xn ) ∈ Rn :
F (x1 , . . . , xn ) = C(F1 (x1 ), . . . , Fn (xn ))
(2.1)
Anderzijds, gegeven verdelingsfuncties F1 , . . . , Fn en een copula C, F gedefinieerd aan de
hand van (2.1) is een n-variate verdelingsfunctie met marginale verdelingen F1 , . . . , Fn .
HOOFDSTUK 2. COPULA’S
6
De copula koppelt dus de marginale verdelingen aan de gezamenlijke verdeling. Uit (2.1)
volgt dat de gezamenlijke verdelingsfunctie kan geconstrueerd worden door eerst de marginale
verdelingen te bepalen, en vervolgens het onderliggende copula-model te selecteren. Indien
de marginale verdelingsfuncties niet continu zijn dan is de copula in (2.1) niet uniek. Het
theorema kan ook worden herschreven als
F F1−1 (u1 ) . . . , Fn−1 (un ) = C (u1 , . . . , un )
(2.2)
Bovenstaande formule geeft weer hoe men de copula kan afleiden uit een bepaalde multivariate verdeling met de marginale verdelingen,
Fi (xi ) = F (∞, . . . , xi , ∞, . . . , ∞) .
Aangezien de copula-functie een verdelingsfunctie is kan hiervoor ook een copula dichtheid
worden afgeleid indien alle afgeleiden bestaan. Dit gebeurt als volgt.
f (x1 , . . . , xn )
=
∂ n F (x1 ,...,xn )
∂x1 ...∂xn
=
∂ n C(F1 (x1 ),...,Fn (xn ))
∂x1 ...∂xn
=
∂ n C(F1 (x1 ),...,Fn (xn ))
f1 (x1 ) . . . fn (xn )
∂F1 (x1 )...∂Fn (xn )
= c(F1 (x1 ), . . . , Fn (xn ))f1 (x1 ) . . . fn (xn )
In de praktijk zal vaak ook de survival copula worden gebruikt. Zij F¯ (x1 , x2 ) = P[X1 >
x1 , X2 > x2 ] een gezamenlijke survival verdelingsfunctie en F¯1 (x1 ) = F¯ (x1 , ∞) en F¯2 (x2 ) =
F¯ (∞, x2 ). Dan geldt
F¯ (x1 , x2 ) = 1 − F1 (x1 ) − F2 (x2 ) + F (x1 , x2 ) = F¯1 (x1 ) + F¯2 (x2 ) − 1 + C(1 − F¯1 (x1 ), 1 − F¯2 (x2 )).
Definitie 2.3 De copula geassocieerd met de gezamenlijke verdeling F¯ is de survival copula
Cˆ en wordt gedefinieerd als Cˆ : [0, 1]2 → [0, 1],
ˆ 1 , u2 ) = u1 + u2 − 1 + C(1 − u1 , 1 − u2 ).
C(u
Men heeft dan ook,
ˆ F¯1 (x1 ), F¯2 (x2 )) = 1 − F1 (x1 ) − F2 (x2 ) + C(F1 (x1 ), F2 (x2 )).
F¯ (x1 , x2 ) = C(
Zoals eerder vermeld heeft de copula als voordeel dat afhankelijkheidsgrootheden in functie
van de copula-functie kunnen worden geschreven. Een van deze afhankelijkheidsgrootheden
die heel belangrijk is in de financi¨ele wereld is de tail dependence. Ze beschrijft de afhankelijkheid van verschillende variabelen in de staart van hun verdeling (zware staarten). De tail
HOOFDSTUK 2. COPULA’S
7
dependence in het bivariaat geval is de kans dat een gebeurtenis met kans kleiner/groter dan
v gebeurt in de eerste variabele gegeven dat een gebeurtenis met kans kleiner/groter dan v
gebeurt in de tweede variabele. Men onderscheidt hierbij de lower tail index en de upper tail
index.
Definitie 2.4 Zij X1 en X2 twee willekeurige variabelen met marginale verdelingsfuncties
F1 en F2 dan wordt de lower tail dependence coefficient gedefineerd als
C(v, v)
λL = lim+ P X1 ≤ F1−1 (v)|X2 ≤ F2−1 (v) = lim+
v→0
v→0
v
en de upper tail dependence coefficient wordt gedefineerd als
1 − 2v + C(v, v)
λU = lim− P X1 ≥ F1−1 (v)|X2 ≥ F1−1 (v) = lim−
.
v→1
v→1
1−v
Indien λL 6= 0 en λU 6= 0 dan zijn de variabelen X1 en X2 respectievelijk lower en upper tail
dependent.
Bij het bepalen van de vine-structuur zal het van belang zijn de variabelen met de sterkste
afhankelijkheid met elkander te verbinden. Voor het bepalen van de bivariate afhankelijkheid
zal men de Kendall’s tau gebruiken, daar deze de algemene afhankelijkheid het best beschrijft.
Andere afhankelijkheidsgrootheden zijn de Pearson’s en de Spearmann’s rang correlatiecoeffici¨ent. Voor twee willekeurige variabelen X1 en X2 wordt de Pearson’s correlatie gegeven
door
ρ = Corr(X1 , X2 ) = p
Cov(X1 , X2 )
Var(X1 )Var(X2 )
.
In de praktijk wordt de Pearson’s correlatie als maar minder gebruikt daar deze enkel lineaire
afhankelijkheid correct meet en niet invariant is voor niet-lineaire stijgende transformaties.
Hierdoor wordt er meer gewerkt met de Spearmann’s rang correlatie en de Kendall’s tau die
enkel afhangen van de onderliggende copula en bijgevolg onafhankelijk zijn van de marginale
verdelingen van X1 en X2 . Ze zijn ook invariant onder monotone stijgende transformaties van
de variabelen X1 en X2 . Beide grootheden zijn gebaseerd op het concept van concordantie .
Definitie 2.5 Twee observaties (x1 , y1 ) en (x2 , y2 ) van een paar continue variabelen (X, Y )
zijn concordant indien beide waarden van het ene paar groter zijn dan de overeenkomstige
waarden van het andere paar, dit is als
x1 < x2 , y1 < y2 of x1 > x2 , y1 > y2 .
Ze zijn discordant als voor het ene paar een waarde groter en de ander waarde kleiner is dan
het andere paar, dit is als
x1 > x2 , y1 < y2 of x1 < x2 , y1 > y2 .
HOOFDSTUK 2. COPULA’S
8
Figuur 2.1: (a) concordante en (b) discordante paren
In Figuur 2.1 wordt een voorbeeld gegeven van een concordant en discordant paar.
Zij (X11 , X12 ), (X21 , X22 ) en (X31 , X32 ) onafhankelijk en identiek verdeelde kopies van (X1 , X2 ).
De Spearmann’s correlatieco¨effici¨ent is proportioneel met de kans van concordantie min de
kans van discordantie van (X11 , X12 ) en (X21 , X32 ),
ρS (X1 , X2 ) = 3 (P [(X11 − X21 ) (X12 − X32 ) > 0] − P [(X11 − X21 ) (X12 − X32 ) < 0]) .
Als X1 en X2 respectievelijk verdelingsfunctie F1 en F2 hebben komt de Spearmann’s correlatie overeen met de Pearson’s correlatie toegpast op de rangen van de variabelen X1 en X2 ,
ρS = ρ(F1 (X1 ), F2 (X2 )). De Kendall’s tau wordt op een gelijkaardige manier gedefinieerd,
deze wordt gegeven als de kans van concordantie min de kans van discordantie van twee
willekeurige variabelen X1 en X2 ,
τ (X1 , X2 ) = P [(X11 − X21 ) (X12 − X22 ) > 0] − P [(X11 − X21 ) (X12 − X22 ) < 0] .
In Kurowicka & Cooke (2006) wordt aangetoond hoe deze twee afhankelijkheidsgrootheden
kunnen worden beschreven in functie van de copula-functie.
Stelling 2.2 Zij X1 en X2 continue willekeurige variablen met copula C dan wordt de Kendall’s tau gegeven door
Z 1Z 1
τ =4
C(u1 , u2 )dC(u1 , u2 ) − 1
0
0
en de Spearman’s correlatie gegeven door
Z 1Z
ρS = 12
0
1
C(u1 , u2 )du1 du2 − 3.
0
Bewijs: Zij (X11 , X12 ) en (X21 , X22 ) gedefinieerd zoals voordien. Aangezien de variabelen
continu zijn geldt
P [(X11 − X21 ) (X12 − X22 ) < 0] = 1 − P [(X11 − X21 ) (X12 − X22 ) > 0] .
HOOFDSTUK 2. COPULA’S
9
Uit de definitie van de Kendall’s tau op basis van concordantie geldt dan
τ (X1 , X2 ) = 2P [(X11 − X21 ) (X12 − X22 ) > 0] − 1.
Men heeft ook dat P [(X11 − X21 ) (X12 − X22 ) > 0] kan herschreven worden als
P [X11 > X21 , X12 > X22 ] + P [X11 < X21 , X12 < X22 ]
en deze kansen kunnen uitgerekend worden door te integreren over de verdeling van (X11 , X12 ).
P [X11 > X21 , X12 > X22 ]
= P [X21 < X11 , X22 < X12 ]
=
R
=
R
R2
R2
P [X21 < x1 , X22 < x2 ] dF (x1 , x2 )
C(F1 (x1 ), F2 (x2 ))dC(F1 (x1 ), F2 (x2 )).
De transformaties u1 = F1 (x1 ) en u2 = F2 (x2 ) geven dan
Z
P [X11 > X21 , X12 > X22 ] =
C(u1 , u2 )dC(u1 , u2 ).
[0,1]2
Op dezelfde manier werkt men P [X11 < X21 , X12 < X22 ] uit gebruikmakend van de survival
copula,
P [X11 < X21 , X12 < X22 ]
= P [X21 > X11 , X22 > X12 ]
=
R
=
R
=
R
R2
R2
R2
P [X21 > x1 , X22 > x2 ] dF (x1 , x2 )
ˆ F¯1 (x1 ), F¯2 (x2 ))dC(F1 (x1 ), F2 (x2 ))
C(
1 − F1 (x1 ) − F2 (x2 ) + C(F1 (x1 ), F2 (x2 ))dC(F1 (x1 ), F2 (x2 )).
Opnieuw de transformaties naar u1 en u2 geven dan
Z
P [X11 < X21 , X12 < X22 ] =
1 − u1 − u2 + C(u1 , u2 )dC(u1 , u2 ).
[0,1]2
Aangezien C de bivariate verdelingsfunctie is van een paar uniform verdeelde variabelen
(U1 , U2 ), geldt E[U1 ] = E[U2 ] = 1/2 en dus
R
P [X11 < X21 , X12 < X22 ] = 1 − 21 − 12 + [0,1]2 C(u1 , u2 )dC(u1 , u2 )
=
R
[0,1]2
C(u1 , u2 )dC(u1 , u2 )
HOOFDSTUK 2. COPULA’S
10
Men verkrijgt dan
Z
P [(X11 − X21 ) (X12 − X22 ) > 0] = 2
C(u1 , u2 )dC(u1 , u2 )
[0,1]2
wat de gewenst formule geeft voor de Kendall’s tau,
Z
τ (X1 , X2 ) = 2P [(X11 − X21 ) (X12 − X22 ) > 0] − 1 = 4
C(u1 , u2 )dC(u1 , u2 ) − 1.
[0,1]2
Voor de Spearmann’s correlatie volgt de formule uit de verwachting en de variantie van een
uniform verdeelde variabele,
ρS (X1 , X2 ) = ρ(F1 (X1 ), F2 (X2 )) = ρ(U1 , U2 ) =
E(U1 U2 ) − 1/4
= 12E(U1 U2 ) − 3.
1/12
Door opnieuw te integreren over de gezamenlijke verdelingsfunctie van (U1 , U2 ) krijgt men,
Z
ρS (X1 , X2 ) = 12
u1 u2 dC(u1 , u2 ) − 3.
[0,1]2
Naargelang de afhankelijkheidsstruuctuur van twee variabelen kan men verschillende bivariate copula’s defini¨eren. Hierbij wordt steeds gewerkt met u1 , u2 ∈ [0, 1].
2.1
Fundamentele copula’s
De fundamentele copula-klasse bevat de copula’s die overeenkomen met onafhankelijkheid
en maximale en minimale afhankelijkheid.
Product copula:
C(u1 , u2 ) = Π(u1 , u2 ) = u1 u2
Deze copula komt overeen met de onafhankelijkheid en heeft als copula dichtheid
c(u1 , u2 ) =
∂ 2 C(u1 , u2 )
∂ 2 u1 u2
=
= 1.
∂u1 ∂u2
∂u1 ∂u2
Comonotoniciteits copula:
C(u1 , u2 ) = M (u1 , u2 ) = min(u1 , u2 )
Deze copula wordt ook de Frechet upper bound genoemd en komt overeen met maximale
afhankelijkheid, de perfecte positieve afhankelijkheid.
HOOFDSTUK 2. COPULA’S
11
Tegencomonotoniciteits copula:
C(u1 , u2 ) = W (u1 , u2 ) = max(u1 + u2 − 1, 0)
Deze copula wordt ook de Frechet lower bound genoemd en komt overeen met de minimale
afhankelijkheid, de perfecte negatieve afhankelijkheid.
Definitie 2.6 Twee willekeurige variabelen X en Y worden comonotoon genoemd indien er
een willekeurige variabele Z en twee niet-dalende functies f en g bestaan zodat X = f (Z)
en Y = g(Z).
Definitie 2.7 Twee willekeurige variabelen X en Y worden tegencomonotoon genoemd indien er een willekeurige variabele Z, een niet-dalende functie f en een niet-stijgende functie
g bestaat zodat X = f (Z) en Y = g(Z).
Voor elke copula geldt:
W (u1 , u2 ) ≤ C(u1 , u2 ) ≤ M (u1 , u2 ).
2.2
Elliptische copula’s
De elliptische copula-klasse bevat copula’s die geassocieerd worden met elliptische verdelingen, en zijn van de vorm (2.2). Ze kunnen makkelijk worden uitgebreid naar hogere dimensies
n en hebben veel parameters (minstens n(n − 1)/2). Daarentegen kunnen asymmetrie en
asymmetrische tail dependence niet worden weergegeven aan de hand van deze copula-klasse.
Simulatie uit elliptische verdelingen is vrij eenvoudig maar de evaluatie van elliptische copula’s moet numeriek gebeuren door de vele integraalberekeningen die nodig zijn. Omwille
van hun impliciete definitie is er ook geen eenvoudige expliciete uitdrukking voor de copula.
Gaussiaanse (normale) copula:
C(u1 , u2 , ρ) = Φ(2)
Φ−1 (u1 ), Φ−1 (u2 ) ,
ρ
(2)
met Φρ de bivariate normale verdeling met correlatie parameter ρ, en Φ−1 de quantielfunctie van een univariate standaard normaal verdeling. De Gaussiaanse copula heeft noch
upper noch lower tail dependence. De hiermee gepaard gaande copula dichtheidsfunctie kan
geschreven worden als
ρ2 (Φ−1 (u1 )2 + Φ−1 (u2 )2 ) − 2ρΦ−1 (u1 )Φ−1 (u2 )
exp −
.
c(u1 , u2 ) = p
2(1 − ρ2 )
1 − ρ2
1
HOOFDSTUK 2. COPULA’S
12
In het artikel Recipe for Disaster: The Formula That Killed Wall Street (2009), legt Felix
Salmon uit hoe de Gaussiaanse copula mee aan de basis ligt van de financi¨ele crisis die begon in 2007. De copula functie was een grote doorbraak in de financi¨ele wereld die toeliet
complexe risico’s op een veel eenvoudigere en accurate manier te modelleren. Er was zodanig
veel geld mee te verdienen dat in Wall Street de beperkingen van de Gaussianse copula vaak
werden genegeerd. De slechte risico-beoordeling aan de hand van deze copula, samen met
de daling van de huisprijzen in de Verenigde Staten, zorgden ervoor dat vele tripel A of
zogezegde risico-vrije obligaties op springen stonden. Het gevolg was de grootste financi¨ele
crisis sinds de Grote Depressie.
Student t copula:
−1
−1
Ct (u1 , u2 , ν, ρ) = t(2)
ν,ρ tν (u1 ), tν (u2 ) ,
(2)
met tν,ρ de bivariate t-verdelingsfunctie met correlatie parameter ρ en ν vrijheidsgraden.
is de inverse functie van de univariate t-verdeling. De t-copula geeft vaak een betere
t−1
ν
empirische fit dan de Gaussiaanse copula daar het extreme waarden beter kan beschrijven.
De student t copula heeft dezelfde tail dependence in beide staarten. De tail dependence
co¨effici¨ent wordt in Heinen & Valdesogo (2009) gegeven als
√
√
ν+1 1−ρ
λ = λU = λL = 2tν+1 −
.
1−ρ
De copula dichtheidsfunctie wordt gegeven door
− ν+2
−1
2
−1
2
−1
2
(u
)
(u
)t
t−1
(u
)
+
t
(u
)
−
2t
Γ(ν + 2/2)/Γ(ν/2)
2
1
2
1
ν
ν
ν
p
1+ ν
,
2
ν(1 − ρ2 )
νπftν (tν−1 (u1 ))ftν (t−1
ν (u2 )) 1 − ρ
met ftν de dichtheidsfunctie van de univariate standaard t verdeling.
2.3
Archimedische copula’s
De Archimedische copula-klasse laat in het bivariaat geval toe een groot aantal copulafamilies te construeren met verschillende karakteristieken zoals de tail dependence, de positieve en negatieve afhankelijkheid, enzovoort. Als men deze klasse wenst uit te breiden naar
meer-dimensionale copula’s worden er echter strenge beperkingen opgelegd voor de variabelen. De hele afhankelijkheidsstructuur hangt namelijk maar van ´e´en of twee parameters
af. In tegenstelling tot de elliptische copula-klasse, is het in de Archimedische copula-klasse
wel mogelijk een expliciete uitdrukking te hebben voor de copula-functie. De Archimedische
copula’s worden geconstrueerd aan de hand van een generator ϕ, waarvan men de pseudo
inverse moet nemen.
HOOFDSTUK 2. COPULA’S
13
Definitie 2.8 De pseudo inverse van f is gedefinieerd als:
(
f −1 (x) 0 ≤ x ≤ f (0)
f [−1] (x) =
0
f (0) ≤ x ≤ ∞
Definitie 2.9 De generator van een copula is een re¨eelwaardige functie ϕ : [0, 1] → [0, ∞]
dat continu, strikt dalend en convex is met ϕ(1) = 0, ϕ(0) ≤ ∞ en ϕ[−1] de pseudo-inverse
van ϕ.
De Archimedische copula met generator ϕ is gedefinieerd als
C (u1 , u2 ) = ϕ[−1] (ϕ(u1 ) + ϕ(u2 )) .
Enkele eigenschappen in verband met de copula dichtheidsfunctie en de afhankelijkheidsgrootheden voor de Archimedische copula worden hier bewezen.
Eigenschap 2.1 De copula-dichtheid van een Archimedische copula met generator ϕ is
c(u1 , u2 ) = −
ϕ00 (C)ϕ0 (u1 )ϕ0 (u2 )
ϕ0 (C)3
Bewijs: Men herschrijft de definitie van een Archimedische copula met generator ϕ als
ϕ(C(u1 , u2 )) = ϕ(u1 ) + ϕ(u2 ).
Men gaat deze formule afleiden naar u1 , u2 en u1 en u2 :
(i)
∂ϕ(C(u1 , u2 )) ∂C(u1 , u2 )
∂ϕ(u1 )
=
,
∂u1
∂u1
∂u1
(ii)
∂ϕ(C(u1 , u2 )) ∂C(u1 , u2 )
∂ϕ(u2 )
=
,
∂u2
∂u2
∂u2
(iii)
∂ 2 ϕ(C(u1 , u2 )) ∂C(u1 , u2 ) ∂C(u1 , u2 ) ∂ϕ(C(u1 , u2 )) ∂ 2 C(u1 , u2 )
+
=0
∂u1 ∂u2
∂u1
∂u2
∂u1
∂u1 ∂u2
Voor een Archimedische copula heeft men dat C(u1 , u2 ) = C(u2 , u1 ) zodat
∂ϕ(C(u1 , u2 ))
∂ϕ(C(u1 , u2 ))
=
= ϕ0 (C)
∂u1
∂u2
Uit (iii) kan men c(u, v) afleiden,
1 ,u2 ) ∂C(u1 ,u2 )
ϕ00 (C) ∂C(u
∂ 2 C(u1 , u2 )
∂u1
∂u2
=−
,
0
∂u1 ∂u2
ϕ (C)
(2.3)
HOOFDSTUK 2. COPULA’S
met ϕ00 (C) =
14
∂ 2 ϕ(C(u1 ,u2 ))
.
∂u1 ∂u2
Uit (i) en (ii) haalt men respectievelijk
∂C(u1 , u2 )
ϕ0 (u1 )
∂C(u1 , u2 )
ϕ0 (u2 )
= 0
en
= 0
.
∂u1
ϕ (C)
∂u2
ϕ (C)
Dit substitueren in (2.3) geeft de gewenste formule voor de copula-dichtheid van een Archimedische copula.
In Kurowicka & Cooke (2006) wordt voor een Archimedische copula de Kendall’s tau bewezen
in functie van de generator ϕ.
Eigenschap 2.2 Zij X en Y willekeurige variabelen met een Archimedische copula C met
generator-functie ϕ. Dan is de Kendall’s tau voor X en Y gegeven door
Z 1
ϕ(t)
τ (X, Y ) = 1 + 4
dt
0
0 ϕ (t)
Bewijs: De definitie van de Kendall’s tau kan herschreven worden als
Z 1Z 1
Z
τ =4
C(u1 , u2 )dC(u1 , u2 ) − 1 = 4
C(u1 , u2 )c(u1 , u2 )du1 du2 − 1.
0
0
[0,1]2
Aan de hand van Eigenschap 2.1 kan men dit herschrijven als
Z
ϕ00 (C)ϕ0 (u1 )ϕ0 (u2 )
C(u1 , u2 )
τ =−
du1 du2 − 1.
ϕ0 (C)3
[0,1]2
(2.4)
Aangezien uit de definitie van de pseudo-inverse van de generator, C(u1 , u2 ) = 0 voor alle
(u1 , u2 ) met ϕ(u1 ) + ϕ(u2 ) = ϕ(0), kan het domein waarover wordt ge¨ıntegreerd, [0, 1]2 ,
geschreven worden als ϕ(u1 ) + ϕ(u2 ) < ϕ(0). Men wenst nu
Z
ϕ00 (C)ϕ0 (u1 )ϕ0 (u2 )
du1 du2
−
C(u1 , u2 )
ϕ0 (C)3
ϕ(u1 )+ϕ(u2 )<ϕ(0)
verder uit te werken. Dit doet men door de transformaties
s = C(u1 , u2 ) = ϕ−1 [ϕ(u1 ) + ϕ(u2 )] en t = u2
toe te passen. Voor de berekening van de Jacobiaan past men de eigenschap
−1
∂(u1 , u2 )
∂(s, t)
=
∂(s, t)
∂(u1 , u2 )
HOOFDSTUK 2. COPULA’S
toe, met
∂(s,t)
∂(u1 ,u2 )
=
ϕ0 (u1 )
.
ϕ0 (C)
15
Men krijgt dan
Z
1
Z
−
1
s
0
s
ϕ00 (s) 0
ϕ0 (s)
0
dtds.
ϕ
(u
)ϕ
(t)
1
ϕ0 (s)3
ϕ0 (u1 )
Vervolgens integreren naar t geeft
Z
1
s
0
ϕ00 (s)
ϕ(s)ds.
ϕ0 (s)2
Na partiele integratie met u = sϕ(s) en dv =
dϕ0 (s)
ϕ0 (s)2
(2.5)
en gebruikmakende van de eigenschappen
van de generator krijgt men voor (2.5),
Z 1
Z 1
Z 1
ϕ(s)
ϕ(s)
1
sds =
ds +
ds + .
0
0
2
0 ϕ (s)
0
0 ϕ (s)
Wat de gewenste formule geeft na substitutie in (2.4),
Z 1
ϕ(t)
τ =4
dt + 1.
0
0 ϕ (t)
Net zoals bij elliptische copula’s kunnen ze gemakkelijk uitgebreid worden naar n-dimensionale
Archimedische copula’s als en slechts als ϕ[−1] ∈ L∞ met
Lm = f : R+ → [0, 1]|f (0) = 1, f (∞) = 0, (−1)k f (k) (x) ≥ 0, k ≤ m .
Of met andere woorden, indien de pseudo-inverse van de generator volledig monotoon is.
In dat geval komt de pseudo-inverse overeen met de inverse van de generator. Zoals eerder
vermeldt beschrijven de multivariate Archimedische copula’s de afhankelijkheid niet goed
in de praktijk aangezien de beschreven afhankelijkheid niet afhangt van de nummering van
de variabelen. Men vermelt hier drie bivariate Archimedische copula’s waarmee in de toepassingen zal worden gewerkt. Ze bezitten elk hun eigen specifieke karakteristieken en dit
zal toelaten in de paar-copula ontbinding om complexe afhankelijkheidsstructuren op een
correcte manier te beschrijven.
Gumbel copula: met generator ϕ(t) = (− ln(t))θ , θ > 0,
C (u1 , u2 , θ) = exp [(− ln(u1 ))θ + (− ln(u2 ))θ ]1/θ .
De Gumbel copula is upper tail dependent, maar niet lower tail dependent.
Clayton copula: met generator ϕ(t) = 1θ (t−θ − 1), θ ∈ [−1, ∞) {−1},
−1/θ
−θ
.
C (u1 , u2 , θ) = [max u−θ
1 + u2 − 1, 0 ]
HOOFDSTUK 2. COPULA’S
16
De Clayton copula is lower tail dependent, maar niet upper tail dependent. Voor θ → 0,
wordt onafhankelijkheid beschreven en voor θ → ∞ bekomt men perfecte positieve afhankelijheid. Voor geen enkele θ-waarde wordt negatieve afhankelijkheid beschreven.
De Frank copula: met generator ϕ(t) = ln
C (u1 , u2 , θ) = −θ
−1
e−θt −1
e−θ −1
, θ ∈] − ∞, ∞[\ {0},
(e−θu1 − 1)(e−θu2 − 1)
ln 1 +
.
e−θ − 1
De Frank copula is symmetrisch in beide staarten en laat negatieve afhankelijkheid tussen
de variabelen toe, dit is voor een negatieve θ. Voor θ → 0 en θ → ∞ wordt opnieuw
respectievelijk onafhankelijkheid en postieve perfecte onafhankelijkheid bekomen. De sterkste afhankelijkheid is in het midden van de verdeling en de Frank copula heeft zwakke tail
dependence.
Hoofdstuk 3
Vine en paar-copula ontbinding
In dit hoofdstuk wordt het concept van vines ingevoerd, en meer specifiek de reguliere vine.
Hiervoor worden hoofdstukken uit Bedford & Cooke (2001) en Bedford & Cooke (2002)
uitgewerkt met behulp van Cooke et al. (2011) en Kurowicka & Cooke (2006). Er wordt
eerst een kleine introductie gegeven over grafentheorie aangezien het vine-concept daarop
gebaseerd is.
Definitie 3.1 Een graaf is een paar verzamelingen, G = (N, E), zodat de bogen E een deelverzameling zijn van {{x, y} : x, y ∈ N }. De elementen van N worden de toppen genoemd.
Een graaf is ongericht indien de orde van de toppen overeenkomstig met een boog willekeurig
is. Indien elke boog een gewicht meekrijgt, w : E → R, wordt de graaf gewogen genoemd.
Indien E = {{x, y} : x, y ∈ N } dan wordt de graaf volledig genoemd. Belangrijke subgrafen
zijn het pad en de omloop.
Definitie 3.2 Een pad is een graaf P = (N, E) met N = {v0 , v1 , . . . , vk } en
E = {{v0 , v1 } , {v1 , v2 } , . . . , {vk−1 , vk }}. Een omloop is een pad met v0 = vk .
Een graaf wordt verbonden genoemd indien tussen elke paar knopen een pad bestaat. De
belangrijkste klasse van grafen dat men in dit hoofdstuk zal nodig hebben zijn de bomen. Een boom is een verbonden graaf zonder omlopen. De boom wordt gekarakteriseerd
door volgende stelling waarbij G ± e betekent dat bij het graaf G de boog e wordt toegevoegd/verwijderd.
Stelling 3.1 De volgende eigenschappen zijn equivalent voor een graaf T = (N, E):
• T is een boom.
• Elk paar toppen van T zijn verbonden aan de hand van een uniek pad in T .
• Voor elke boog e ∈ E geldt dat T verbonden is maar T − e is niet verbonden.
17
HOOFDSTUK 3. VINE EN PAAR-COPULA ONTBINDING
18
• Voor niet-aangrenzende toppen x, y ∈ N geldt dat T geen omloop bevat maar T +{x, y}
wel.
Een spanning tree van een graaf G = (N, E) is een subgraaf T = (NT , ET ), dat een boom is
met NT = N .
Later in dit hoofdstuk zal aan de hand van elementenverzamelingen, eigenschappen en stellingen worden toegewerkt naar de paar-copula ontbinding van de multi-dimensionale dichtheidsfunctie, deze ontbinding is niet uniek. De mogelijke ontbindingen nemen exponentieel
toe met het aantal variabelen waarvan men de afhankelijkheid wenst te bepalen. Om weer te
geven op welke manier de ontbinding gebeurt en op welke variabelen er wordt geconditioneerd
wordt er gewerkt met vines. Een vine is een grafisch model waarmee multi-dimensionale verdelingen worden opgebouwd met gegeven marginale verdelingen. Het is een speciaal geval
van de Cantor bomen en een veralgemening van de Markov bomen. Markov bomen hebben
de strenge voorwaarde dat de variabelen conditioneel onafhankelijk zijn. Een vine V voor
n elementen is een verzameling bomen V = {T1 , . . . , Tn−1 } waarbij de bogen van boom j
de toppen van boom j + 1 zijn, j ∈ {1, . . . , n − 2}. Een reguliere vine is een speciaal geval
waarbij alle beperkingen twee-dimensionaal of conditioneel twee-dimensionaal zijn, hierbij
geldt dat twee bogen in boom j samen een boog in boom j + 1 vormen enkel indien deze
bogen een gezamenlijke top delen, j ∈ {1, . . . , n + 2}.
Definitie 3.3 V is een vine voor n elementen als
• V = {T1 , . . . , Tm },
• T1 is een verbonden boom met toppen N1 = {1, . . . , n}, en bogen E1 ; voor i ∈ {2, . . . , m},
Ti is een boom met toppen Ni ⊂ N1 ∪E1 ∪. . .∪Ei−1 en bogen Ei ⊂ {{e1 , e2 } : e1 , e2 ∈ Ni }.
Nadat de paar-copula ontbinding wordt toegepast in drie dimensies worden tenslotte de Dvine en C-vine gedefinieerd als speciale gevallen van de reguliere vine met een eenvoudigere
vine-structuur en paar-copula ontbinding. Men veronderstelt doorheen dit hoofstuk dat alle
gezamenlijke, marginale en conditionele verdelingen absoluut continu zijn met overeenkomstige dichtheidsfuncties.
3.1
Reguliere vine
Op basis van de definitie van de vine, wordt de reguliere vine als volgt gedefinieerd.
Definitie 3.4 V is een reguliere vine voor n elementen met E(V) = E1 ∪ . . . ∪ En−1 de
verzameling bogen van V als
HOOFDSTUK 3. VINE EN PAAR-COPULA ONTBINDING
19
• m = n − 1,
• Ti is een verbonden boom met bogen Ei en toppen Ni = Ei−1 voor i ∈ {2, . . . , n} en
card(Ni ) = n − (i − 1),
• de proximiteitsvoorwaarde: voor i ∈ {2, . . . , n − 1}, indien a = {a1 , a2 } en b = {b1 , b2 }
twee toppen zijn in Ni verbonden door een boog e ∈ Ei dan geldt card(a ∩ b) = 1.
Een reguliere vine voor n elementen heeft n − 1 bomen, waarbij elke boom Tj bestaat uit
n + 1 − j toppen en n − j bogen. De toppen in de boom Tj zijn nodig om de bogen te
bepalen. Twee toppen in Tj+1 en dus twee bogen in Tj , zijn verbonden via een boog in Tj+1
als de twee bogen in Tj een gemeenschappelijke top delen. Een boog e in boom Tj is een
ongeordend paar toppen van Tj . Omdat Nj ⊂ E0 ∪ E1 ∪ . . . ∪ Ej−1 , met E0 = N1 , bestaan
er bogen e1 ∈ Ei en e2 ∈ Ek , i, k < j zodat e = {e1 , e2 }. De rang van een boog in boom
Tj is j − 1, j ∈ {1, . . . , n − 1}. De graad van een top is het aantal buren die het heeft in
de boom. De proximiteitsvoorwaarde vereist dat twee bogen in boom Ti verenigd worden in
boom Ti+1 enkel en alleen als ze een gemeenschappelijke top delen in Ti .
Er worden nu verschillende verzamelingen toppen en bogen gedefinieerd die handig zullen
zijn bij de vine uitwerking en die zullen toelaten de beperkingen te specificeren. De volledige
unie van een boog is de verzameling van indexen {1, . . . , n} dat deze boog bevat. Als twee
toppen a en b verbonden zijn door een boog dan zijn de conditioned set en de conditioning
set van de boog respectievelijk het symmetrisch verschil en de doorsnede van de volledige
unies van a en b. Formeel definieert men deze verzamelingen als volgt.
Definitie 3.5 Voor e ∈ Ei , i ∈ {1, . . . , n − 1} geldt dat e1 een element is van e, met e1 ∈
Ei−1 = Ni , indien ∃e2 ∈ Ni : e = {e1 , e2 } of met andere woorden indien de top e1 verbonden
is met een andere top e2 door middel van boog e.
Definitie 3.6 Voor elke boog e = ei ∈ Ei , i ≤ n − 1, is de volledige unie van e de deelverzameling van {1, . . . , n} dat bereikbaar is vanuit e:
Ue∗ = {j ∈ N1 = E0 |∃1 ≤ i1 ≤ i2 ≤ . . . ≤ ir = i, eik ∈ Eik , k ∈ {1, . . . , r} ,
met j ∈ ei1 en eik ∈ eik+1 , k ∈ {1, . . . , r − 1}
Er geldt voor e ∈ Ei , i ≤ n − 1, e = {e1 , e2 } dat Ue∗ = Ue∗1 ∪ Ue∗2 .
Definitie 3.7 Voor i ∈ {1, . . . , n − 1} , e ∈ Ei , als e = {e1 , e2 } dan is de conditioning set
geassocieerd met e gelijk aan
De = Ue∗1 ∩ Ue∗2 .
HOOFDSTUK 3. VINE EN PAAR-COPULA ONTBINDING
20
Definitie 3.8 Voor i ∈ {1, . . . , n − 1} , e ∈ Ei , als e = {e1 , e2 } dan is de conditioned set
geassocieerd met e gelijk aan
{Ce,e1 , Ce,e2 } = Ue∗1 \ De , Ue∗2 \ De .
De constraint set van een reguliere vine bevat alle nodige informatie om het te onderscheiden
van andere reguliere vines.
Definitie 3.9 Voor e ∈ Ei , i ≤ n − 1, is de constraint set geassocieerd met e de volledige
unie van e. De constraint set voor V is dan
CV = {(Ce,e1 , Ce,e2 , De ) |i ∈ {1, . . . , n − 1} , e ∈ Ei , e = {e1 , e2 }}
Merk op dat voor e = {e1 , e2 } , e ∈ Ei :
Ue∗ = Ce,e1 ∪ Ce,e2 ∪ De .
De conditioning set is leeg voor e ∈ E1 en de cardinaliteit van de conditioning set komt
overeen met de graad van de boog. De conditioning set De wordt rechts weergegeven van
| en de conditioned set {i1 , i2 } links ervan, voor i1 , i2 ∈ {1, . . . , n} worden de bogen van de
reguliere vine opgeschreven als ”i1 i2 |De ” met i1 < i2 .
De notatie van de boog e in Ti hangt af van de twee bogen in Ti−1 die wegens de proximiteitsvoorwaarde een gemeenschappelijke top hebben. Men beschouwt de bogen a = a1 , a2 |Da
en b = b1 , b2 |Db met respectievelijk Ua∗ = {a1 , a2 , Da } en Ub∗ = {b1 , b2 , Db }. De toppen a en
b in de boom Ti worden dus verbonden door de boog e = e1 , e2 |De met
e1
e2
De
= min {i : i ∈ Ua∗ ∪ Ub∗ \De },
= max {i : i ∈ Ua∗ ∪ Ub∗ \De },
= Ua∗ ∩ Ub∗ .
Om deze begrippen beter te begrijpen gaat men deze verzamelingen bepalen voor een concreet voorbeeld. Zij een D-vine1 voor 5 elementen, die er uit ziet zoals in Figuur 3.1.
1
dit is speciaal geval van de reguliere vine dat later in dit hoofdstuk zal worden gedefinieerd
HOOFDSTUK 3. VINE EN PAAR-COPULA ONTBINDING
21
Figuur 3.1: D-vine voor 5 variabelen
Men neemt als boog e = 14|23 in T3 . Dan geldt e = {13|2, 24|3} en we vinden dat
• de volledige unie van e overeenkomt met
Ue∗
= {j ∈ N1 |1 ∈ 12, 2 ∈ 12, 3 ∈ 23, 4 ∈ 34, 12 ∈ 13|2, 23 ∈ 13|2, 34 ∈ 24|3,
13|2 ∈ 14|23, 24|3 ∈ 14|23}
= {1, 2, 3, 4}
• de conditioning set
∗
∗
De = U13|2
∩ U24|3
= {1, 2, 3} ∩ {2, 3, 4} = {2, 3}
• de conditioned sets
∗
Ce,13|2 = U13|2
\ D14|23 = {1, 2, 3} \ {2, 3} = {1}
∗
Ce,24|3 = U24|3
\ D14|23 = {2, 3, 4} \ {2, 3} = {4}
Men wenst te bewijzen hoeveel elementen elke verzameling telt, hiervoor moet men eerst een
nieuwe verzameling bogen invoeren met een bijhorend lemma alsook een relatie tussen de
bogen defini¨eren.
Definitie 3.10 Zij V een reguliere vine en boog e ∈ Ei , de j-fold union van e, 0 < j ≤ i − 1,
is de deelverzameling
Ue (j)
= {e ∈ Ei−j |∃ bogen ek ∈ Ek , k ∈ {i − j + 1, . . . , i − 1}
met ek ∈ ek+1 , k ∈ {i − j, . . . , i − 1}}
Voor j = 0 geldt Ue (0) = e en voor j = i geldt Ue (i) = Ue∗ .
HOOFDSTUK 3. VINE EN PAAR-COPULA ONTBINDING
22
Als men opnieuw kijkt naar het voorbeeld van voordien, vindt men dat
Ue (2) = {e ∈ E1 : 12 ∈ 13|2, 23 ∈ 13|2, 34 ∈ 24|3, 13|2 ∈ 14|23, 24|3 ∈ 14|23} = {12, 23, 34}
Ue (1) = {e ∈ E2 : 13|2 ∈ 14|23, 24|3 ∈ 14|23} = {13|2, 24|3}
Definitie 3.11 Indien een top e een element is van een boog f , zegt men dat e een m-kind
is van f . Indien e bereikbaar is vanuit f via de elements-relatie, e ∈ ei1 ∈ . . . ∈ f , zegt men
dat e een m-afstammeling is van f .
Lemma 3.1 Zij V een reguliere vine voor n elementen, e ∈ Ei dan geldt dat #Ue (j) = j + 1
voor j ∈ {0, 1, . . . , i} .
Bewijs: Uit de definitie van de j-fold union en de boog-constructie, geldt het lemma duidelijk voor j = 0 en j = 1. Wegens de proximiteitseigenschap volgt dat het ook geldt voor
j = 2. Men beweert nu algemeen dat
#Ue (j) = 2#Ue (j − 1) − #Ue (j − 2),
j ∈ {2, . . . , i} .
Om dit aan te tonen gaat men de j-fold union weergeven aan de hand van een volledige
binaire boom met als toppen de toppen uit de reguliere vine die bereikbaar zijn vanuit e.
Om beter te begrijpen wat er wordt gedaan in de rest van het bewijs zal men opnieuw
verwijzen naar het voorbeeld van voordien, met boog e = 14|23. De binaire boom kan dan
worden weergegeven zoals in Figuur 3.2.
Figuur 3.2: j-fold union voor e met j ∈ (0, 1, 2, 3)
De toppen die meer dan ´e´en keer voorkomen in de boom worden onderlijnd en de kinderen
van onderlijnde toppen worden eveneens onderlijnd (in het voorbeeld is dit 23, 1, 2 en 3).
Wegens de proximiteitseigenschap geldt dat toppen met een gemeenschappelijke ouder ook
een gemeenschappelijk kind hebben (zoals 13|2 en 24|3 hebben als gemeenschappelijk ouder
14|23 en als gemeenschappelijk kind 23, idem voor 12 en 23 die 2 als gemeenschappelijk
kind hebben). Men noemt een top onlangs onderlijnd indien de top geen kind is van een
HOOFDSTUK 3. VINE EN PAAR-COPULA ONTBINDING
23
onderlijnde top, het aantal onlangs onderlijnde toppen op niveau k is dan gelijk aan het aantal
niet-onderlijnde toppen op niveau k − 2 ( voor k = 3 zijn dat respectievelijk de toppen {2, 3}
en {13|2, 24|3}, voor k = 2 is dit {23} en {14|23} ). Zodat het aantal niet-onderlijnde toppen
op niveau k, #Ue (k), gelijk is aan 2#Ue (k − 1) − #Ue (k − 2). Om het uiteindelijke resultaat
te bewijzen volstaat het om inductie toe te passen op j. De basisstap heeft men al, men
veronderstelt dat het geldt voor 0 ≤ k < j, dan geldt volgens de inductiestap
#Ue (j) = 2#Ue (j − 1) − #Ue (j − 2) = 2j − (j − 1) = j + 1.
Lemma 3.2 Zij V een reguliere vine voor n elementen dan geldt voor alle i ∈ {1, . . . , n − 1}
en e ∈ Ei dat de conditioned sets geassocieerd met e singletons zijn: #Ce,e1 = 1. Verder
geldt ook #Ue∗ = i + 1 en #De = i − 1.
Bewijs: Aangezien Ue∗ = Ue (i), volgt uit Lemma 3.1 dat #Ue∗ = i + 1. De andere beweringen worden bewezen via inductie op i ∈ {1, . . . , n − 1}. Aangezien voor bogen in T1 de
conditioning sets leeg zijn gelden de beweringen voor i = 1: #De = 0 en #Ce,e1 = #Ue∗1 = 1
met e1 ∈ N1 = E0 . Men veronderstelt nu dat de beweringen gelden voor 1 ≤ m < i.
Zij e = {e1 , e2 } met e1 = {j1 , j2 } en e2 = {k1 , k2 } ∈ Ei−1 . Wegens de proximiteitseigenschap geldt dat #e1 ∩ e2 = 1 en dus moet ´e´en van de j1 , j2 gelijk zijn aan ´e´en van de
k1 , k2 , men neemt j1 = k1 . Er geldt dat
Ue∗ = Ue∗1 ∪ Ue∗2 = Uj∗1 ∪ Uj∗2 ∪ Uk∗1 ∪ Uk∗2 .
Uit de definitie van de conditioning set en de inductieveronderstelling volgt er dat
#De1 = # Uj∗1 ∩ Uj∗2 = i − 2. Nog wegens de inductieveronderstelling geldt #Uj∗1 = #Uj∗2 =
i − 1 en #Ue∗1 = # Uj∗1 ∪ Uj∗2 = i. Hieruit volgt dat Uj∗2 \ Uj∗1 juist ´e´en element bevat en
hetzelfde geldt voor Uj∗1 \ Uj∗2 . Deze twee elementen moeten bovendien verschillend zijn,
anders zou Ue∗1 = Ue∗2 en bijgevolg #Ue∗ = i wat in contradictie is met Lemma 3.1. Omdat
#Ue∗ = # Ue∗1 ∪ Ue∗2 = i + 1 en hiervan twee elementen zijn met ´e´en niet in Ue∗1 en ´e´en
niet in Ue∗2 , volgt dat #De = # Ue∗1 ∩ Ue∗2 = i − 1. Tenslotte krijgt men voor #Ce,e1 =
# Ue∗1 \ De = 1, waarmee alle beweringen zijn bewezen.
Voor een reguliere vine geldt ook nog zonder bewijs,
Eigenschap 3.1 Zij V = {T1 , . . . , Tn−1 } een reguliere vine, dan
• is het aantal bogen gelijk aan n(n − 1)/2,
• bestaat elke conditioned set uit 2 elementen, elk paar toppen uit T1 komt juist ´e´en keer
voor als conditioned set,
HOOFDSTUK 3. VINE EN PAAR-COPULA ONTBINDING
3.2
24
Paar-copula ontbinding
In dit hoofdstuk wenst men te komen tot de stelling waarbij de n-dimensionale dichtheidsfunctie wordt herschreven als een product van univariate dichtheidsfuncties en van paarcopula’s toegepast op de verdelingsfuncties en de conditionele verdelingsfuncties van de
variabelen. Dit doet men aan de hand van een reguliere vine. Elke boog van een reguliere vine is geassocieerd met een beperking op de bivariate of conditionele bivariate verdeling, weergegeven aan de hand van een paar-copula. Men veronderstelt dat voor elke boog
e ∈ Tk , k ∈ {1, . . . , n − 1} en elke mogelijke waarde van de variabelen in de conditioning
set De , een copula is gegeven. Voor de boog i1 i2 |De wordt de overeenkomstige copula genoteerd als Ci1 i2 |De en de copula-dichtheid als ci1 i2 |De . De toppen uit de eerste boom komen
overeen met de variabelen en indien een boog getrokken wordt tussen twee variabelen wordt
aan de hand van de paar-copula de afhankelijkheid gemodelleerd tussen die twee variabelen.
Voor alle j ∈ N1 is ook de marginale verdeling Fj gegeven. Eerst worden een paar lemma’s
bewezen om uiteindelijk tot de hoofdstelling te komen van dit hoofdstuk, de paar-copula
ontbinding van multivariate afhankelijkheid.
Definitie 3.12 Een boog e ∈ Ek+1 is rond een top j ∈ Nk indien e de toppen e1 en e2 ∈ Nk+1
verbindt, deze komen overeen met de bogen in Ek verbonden met j.
Figuur 3.3: boog e rond top j
Aangezien boog e rond top j is geldt:
De = Ue∗1 ∩ Ue∗2 = Ui∗ ∪ Uj∗ ∩ Uj∗ ∪ Uk∗ = Uj∗
(3.1)
Lemma 3.3 Zij V een reguliere vine voor n elementen en k een geheel getal 1 ≤ k < n − 1.
Gegeven een top i in boom Tk , er zijn precies graad(i) − 1 bogen in Tk+1 rond i.
Bewijs: Men mag zonder verlies van algemeenheid veronderstellen dat k = 1.
(i) Eerst wordt aangetoond dat graad(i) − 1 het maximum aantal bogen is in T2 rond i.
Volgens de definitie van de graad van een top, zijn er graad(i) bogen die i verbinden
met andere toppen. Deze bogen vormen de toppen ,N2 = E1 , in T2 zodat indien
HOOFDSTUK 3. VINE EN PAAR-COPULA ONTBINDING
25
ze worden verbonden door bogen, ze rond i zullen zijn. Omdat T2 een boom moet
zijn, kunnen er geen omlopen in voorkomen. Daarom zijn er hoogstens graad(i) − 1
verschillende bogen in T2 rond i.
(ii) Vervolgens wordt aangetoond dat er juist graad(i) − 1 bogen in T2 rond i zijn. Elke
boog in T2 kan enkel rond ´e´en top van T1 zijn, anders zou er een omloop voorkomen
in T1 , dit volgt uit de proximiteitsvoorwaarde van reguliere vines.
Veronderstel dat er een top i in T1 is dat minder dan graad(i) − 1 bogen rond zich
heeft in T2 , dan kan men het totaal aantal bogen in T2 opsommen als
P
j∈N1
P
(graad(j) − 1)
# (bogen rond j) <
Pj∈N1
=
j∈N1 (graad(j)) − n
Aangezien er n − 1 bogen zijn in T1 en dat elke boog twee toppen verbindt, geldt er
P
dat j∈N1 (graad(j)) = 2(n − 1) en bijgevolg is het aantal bogen in T2 gelijk aan
2(n − 1) − n = n − 2. Wat in tegenstelling is met het feit dat T2 n − 1 bogen heeft.
Om de gezamenlijke verdelingsfunctie te specificeren wordt de reguliere vine-structuur gedefinieerd voor een bepaalde verdeling.
Definitie 3.13 (F, V, B) is een reguliere vine specificatie als
• F = (F1 , . . . , Fn ) een vector is van continue inverteerbare verdelingsfuncties,
• V een reguliere vine is voor n elementen,
• B = {Be (d)|e ∈ Ei , i ∈ {1, . . . , n − 1}} met Be (d) een verzameling van copula’s en d
een vector met de waardes van de variabelen in De .
Een gezamenlijke verdeling F1...n voor de variabelen X1 , . . . , Xn heeft reguliere vine-afhankelijkheid
als voor elke e ∈ Ei , de copula van XCe,e1 en XCe,e2 gegeven XDe een lid is van Be (XDe ) en
de marginale verdeling van Xi is Fi , i ∈ {1, . . . , n}.
In volgend lemma wordt de bivariate copula-dichtheid geschreven aan de hand van de bivariate dichtheidsfunctie en de marginale dichtheidsfuncties.
Lemma 3.4 Zij F12 (x1 , x2 ) een verdelingsfunctie met drager B1 × B2 ⊂ R2 en dichtheid f12 .
Veronderstel dat de marginale dichtheden f1 en f2 strikt positief zijn op respectievelijk B1 en
B2 . Zij C12 de copula van F12 en c12 haar dichtheid, dan geldt
c12 (F1 (x1 ), F2 (x2 )) =
f12 (x1 , y1 )
.
f1 (x1 )f2 (x2 )
HOOFDSTUK 3. VINE EN PAAR-COPULA ONTBINDING
26
Bewijs: Om dit te bewijzen wordt er gebruikt gemaakt van de dichtheidstransformatieformule. Deze zegt dat voor de transformaties U = U (X, Y ) en V = V (X, Y ) er geldt
dat
fU V (u, v) =
fXY (x, y)
.
|∂(u, v)/∂(x, y)|
Onder de transformatie
(x1 , x2 ) 7→ (F1 (x1 ), F2 (x2 ))
en met fXY = f12 en fU V = c12 geeft deze formule
c12 (F1 (x1 ), F2 (x2 )) =
f12 (x1 , y1 )
|∂(F1 (x1 ), F2 (x2 ))/∂(x1 , x2 )|
waarbij de Jacobiaan
∂F1 (x1 )
1
|∂(F1 (x1 ), F2 (x2 ))/∂(x1 , x2 )| = ∂F∂x
2 (x2 )
∂x
1
∂F1 (x1 ) ∂x2 ∂F2 (x2 ) ∂x2
= f1 (x1 )f2 (x2 ).
Wat de gewenste formule geeft voor de copuladichtheid.
Om de notaties te vereenvoudigen in de komende bewijzen, zal men de dichtheidsfuncties
fi (xi ), f1...n (x1 , . . . , xn ) en (conditionele) verdelingsfuncties Fi|De (xie ) schrijven als respectievelijk fi , f1...n en Fi|De .
Stelling 3.2 Zij V = {T1 , . . . , Tn−1 } een reguliere vine voor n elementen, gegeven Fi en
Cij|De zoals voordien, er is een unieke vine-afhankelijke verdeling met dichtheidsfunctie gegeven door
!
Q
n−1
Y Y
f
1 ij
Q (i,j)∈E
f1...n =
cij|De Fi|De , Fj|De
.
graad(i)−1
i∈N1 (fi )
m=2 e∈E
m
Bewijs: Het bewijs wordt geleverd aan de hand van de omgekeerde inductie dat wordt
toegepast op het niveau van de bomen in de vine. Men beweert dat voor alle 2 ≤ M ≤ n − 1
geldt,
f1...n =
n−1
Y
Y
m=M e∈Em
cij|De Fi|De , Fj|De
!
Q
Q
e∈EM −1
k∈NM −1 (fUk )
∗
fUe∗
graad(k)−1
.
(3.2)
(i) Basisstap: De bewering geldt voor M = n − 1. Zij e = {e1 , e2 } de enige boog in Tn−1
met Ue∗1 = {i} ∪ De en Ue∗2 = {j} ∪ De , met {i, j} ∈
/ De , dan geldt wegens de definitie
van de conditionele dichtheidsfunctie:
f1...n = fij|De fDe .
Gebruikmakende van Lemma 3.4 kan dit worden herschreven als
HOOFDSTUK 3. VINE EN PAAR-COPULA ONTBINDING
27
= cij|De Fi|De , Fj|De fi|De fj|De fDe
f1...n
= cij|De Fi|De , Fj|De
fUe∗1 fUe∗2
fDe
De boom Tn−2 heeft 3 toppen en 2 bogen, bijgevolg moet ´e´en van de toppen, zij k,
graad 2 hebben en is de boog e van Tn−1 rond k, zoals weergegeven in Figuur 3.4.
Bijgevolg is volgens (3.1), De = Uk∗ en de bewering (3.2) is bewezen voor M = n − 1.
Figuur 3.4: Tn−1 en Tn−2
(ii) Inductiestap: Men veronderstelt dat de formule (3.2) geldt voor M , men wenst nu aan
te tonen dat dit ook het geval is voor M − 1. Men past dus de ontbinding toe voor
alle bogen van TM ,
!
Q
n−1
Y Y
e∈EM −1 fUe∗
Q
f1...n =
cij|De Fi|De , Fj|De
.
graad(k)−1
(f
Uk∗ )
k∈N
M
−1
m=M e∈E
m
Voor elke boog e ∈ EM −1 zijn er toppen in NM −1 , of equivalent bogen in EM −2 , dat
men e1 en e2 noemt zodat e = {e1 , e2 }. Bijgevolg geldt
Ue∗
= Ue∗1 ∪ Ue∗2
= Ce,e1 ∪ Ce,e2 ∪ De
= {i, j} ∪ De
met Ce,e1 = {i} en Ce,e2 = {j}. Dus kan fUe∗ verder worden ontbonden zoals in (i),
fUe∗
= fij|De fDe
= cij|De Fi|De , Fj|De
fUe∗
1
fUe∗
2
fDe
Als men dit laatste substitueert in (3.2) krijgt men
!
n−1
Y Y
Y fUe∗ fUe∗
1
1
2
Q
cij|De Fi|De , Fj|De
f1...n =
∗ graad(k)−1
fDe
k∈NM −1 (fUk )
e∈EM −1
m=M −1 e∈Em
{z
}
|
(∗)
HOOFDSTUK 3. VINE EN PAAR-COPULA ONTBINDING
28
Men heeft dus de gewenste paar-copula’s in de ontbinding voor M − 1, er rest dus nog
te bewijzen dat (∗) gelijk is aan
Q
Q
e∈EM −2
k∈NM −2 (fUk )
∗
fUe∗
graad(k)−1
.
Dit doet men door het product in (∗) op te splitsen in twee delen en te herschrijven:
(1) Eerst kijkt men naar
Q
Q
e∈EM −1
fUe∗1 fUe∗2
∗ graad(k)−1
k∈NM −1 (fUk )
.
(3.3)
Elke boog e ∈ EM −1 brengt twee toppen e1 , e2 ∈ NM −1 = EM −2 met zich mee.
Dus bij het nemen van het product over de bogen van EM −1 geldt voor elke
k ∈ NM −1 dat de multipliciteit van fUk∗ overeenkomt met het aantal keer dat de
top k voorkomt in een boog e ∈ EM −1 , of anders gezegd met de graad van top k.
Bijgevolg geldt dat
Y
Y
fUe∗1 fUe∗2 =
graad(k)
fU ∗
k
e∈EM −1
.
k∈NM −1
Als men nu in (3.3) dit laatste substitueert, krijgt men de breuk
Q
Q
graad(k)
k∈NM −1
fU ∗
k
∗ graad(k)−1
k∈NM −1 (fUk )
,
dat simpelweg vereenvoudigd kan worden tot
Y
fUk∗ =
k∈NM −1
Y
fUe∗ .
e∈EM −2
Q
(2) Tenslotte wenst men e∈EM −1 fDe te herschrijven. Voor elke boog e ∈ EM −1 is
er een top k ∈ NM −2 waarvoor gedt dat e rond k is en dus is De = Uk∗ . Het
bovenstaande product kan worden uitgewerkt gebruikmakend van Lemma 3.3,
dat zegt dat voor elke k ∈ NM −2 er graad(k) − 1 bogen zijn in TM −1 rond k,
Y
e∈EM −1
Y
fDe =
e∈EM −1
fUk∗ =
Y
graad(k)−1
fU ∗
k
.
k∈NM −2
Door (1) en (2) toe te passen in (∗) krijgt men de gewenste formule (3.2) voor M − 1,
waarmee de inductiestap is bewezen.
HOOFDSTUK 3. VINE EN PAAR-COPULA ONTBINDING
29
Stelling 3.3 (Paar-copula ontbinding) Zij V = {T1 , . . . , Tn−1 } een reguliere vine voor n
elementen, gegeven Fi en Cij|De zoals voordien, er is een unieke vine-afhankelijke verdeling
met dichtheidsfunctie gegeven door
f1...n = f1 . . . fn
n−1
Y
Y
cij|De Fi|De , Fj|De .
m=1 e∈Em
Bewijs: Vertrekkende van de ontbinding bekomen in Stelling 3.2:
!
Q
n−1
Y Y
f
1 ij
Q (i,j)∈E
f1...n =
cij|De Fi|De , Fj|De
,
graad(i)−1
(f
)
i
i∈N
1
m=2 e∈E
m
kan men de bivariate dichtheidsfuncties fij herschrijven aan de hand van Lemma 3.4,
fij = cij (Fi , Fj ) fi fj .
Mits enige vereenvoudiging en dezelfde redenering als bij (ii)(1) van het bewijs van Stelling
3.2 verkrijgt men de gewenste paar-copula ontbinding voor de n-dimensionale dichtheidsfunctie.
Bij de paar-copula ontbinding wordt verondersteld dat de conditionele copula-dichtheid cij|De
niet afhangt van de waarden van de variabelen in De . De conditionele waarden hebben enkel
invloed op de conditionele verdelingsfuncties Fi|De en Fj|De . In de praktijk geven deze vine
copula’s een grote flexibiliteit voor het beschrijven van de afhankelijkheid daar de verschillende paar-copula’s onafhankelijk van elkaar kunnen gekozen worden, het is niet nodig dat
de bivariate copula’s van dezelfde familie zijn.
Nu dat men de paar-copula ontbinding heeft gevonden op basis van een reguliere vine, gaat
men tonen hoe men deze bekomt vertrekkende van de multidimensionale dichtheidsfunctie.
Om de paar-copula ontbinding te verkrijgen van een multivariate dichtheidsfunctie, wordt
deze recursief ontbonden als een product van conditionele dichtheden. Voor de variabelen
(X1 , . . . , Xn ) geldt dan:
f (x1 , . . . , xn )
=
=
=
=
f (x2 , . . . xn |x1 )f (x1 )
f (x3 , . . . xn |x1 , x2 )f (x2 |x1 )f (x1 )
...
f (xn |x1 , . . . , xn−1 ) . . . f (x3 |x1 , x2 )f (x2 |x1 )f (x1 )
Voor elke term geldt, met Fi|1...j = Fi|1...j (xi |x1 , . . . , xj ),
HOOFDSTUK 3. VINE EN PAAR-COPULA ONTBINDING
f (xi |x1 , . . . , xi−1 )
=
f (xi ,xi−1 |x1 ,...,xi−2 )
f (xi−1 )
=
ci,i−1|1...i−2 (Fi|1...i−2 ,Fi−1|1...i−2 )f (xi−1 )f (xi )
f (xi−1 )
30
= ci,i−1|1...i−2 Fi|1...i−2 , Fi−1|1...i−2 f (xi )
Meer algemeen kan de n-dimensionale dichtheidsfunctie herschreven worden als een product
van f (x|v) met v een d-dimensionale vector, d < n. De conditionele dichtheidsfunctie
wordt dan herschreven als een product van een paar-copula-dichtheid en een conditionele
dichtheidsfunctie,
f (x|v) = cxvj |v−j (F (x|v−j ), F (vj |v−j )) f (x|v−j ),
waarbij vj de j-de component component van v en v−j de vector v zonder deze component.
In Joe (1996) werd bewezen dat de conditionele verdelingsfunctie kan geschreven worden als
F (x|v) =
∂Cx,vj |v−j (F (x|v−j ), F (vj |v−j ))
,
∂F (vj |v−j )
(3.4)
met Cx,vj |v−j een bivariate copula. Een multivariate dichtheid kan dus uitgedrukt worden
als een product van paar-copula’s, toegepast op verschillende conditionele verdelingen. Deze
opbouw gebeurt op een iteratieve manier. Gegeven een bepaalde ontbinding, bestaan er veel
verschillende her-parametrisaties.
Voorbeeld: Voor drie willekeurige variabelen X1 , X2 en X3 zijn er drie verschillende reguliere vines mogelijk, telkens met een andere variabele waarop wordt geconditioneerd in de
tweede boom. Men veronderstelt dat de reguliere vine eruit ziet zoals in Figuur 3.5.
Figuur 3.5: Reguliere vine voor 3 variabelen
Aangezien men maar met drie variabelen werkt is deze reguliere vine zowel een C-vine als
een D-vine2 . Men wenst nu de paar-copula ontbinding te bekomen voor f (x1 , x2 , x3 ). Er
wordt eerst geconditioneerd op de variabele X2 en vervolgens op de variabele X3 :
f (x1 , x2 , x3 ) = f (x1 , x3 |x2 )f2 (x2 ) = f (x1 |x2 , x3 )f (x3 |x2 )f2 (x2 ).
2
zie hoofdstuk 3.3
HOOFDSTUK 3. VINE EN PAAR-COPULA ONTBINDING
31
De conditionele dichtheidsfuncties worden verder uitgewerkt met behulp van Lemma 3.4,
f (x3 |x2 )
=
f (x2 ,x3 )
f2 (x2 )
=
c23 (F2 (x2 ),F3 (x3 ))
f2 (x2 )f3 (x3 )
f2 (x2 )
= c23 (F2 (x2 ), F3 (x3 ))f3 (x3 )
en
f (x1 |x2 , x3 )
=
f (x1 ,x3 |x2 )
f (x3 |x2 )
=
c13|2 (F (x1 |x2 ),F (x3 |x2 ))f (x1 |x2 )f (x3 |x2 )
f (x3 |x2 )
= c13|2 (F (x1 |x2 ), F (x3 |x2 ))f (x1 |x2 )
= c13|2 (F (x1 |x2 ), F (x3 |x2 ))c12 (F1 (x1 ), F2 (x2 ))f1 (x1 )
En bijgevolg kan f (x1 , x2 , x3 ) herschreven worden als
c13|2 (F (x1 |x2 ), F (x3 |x2 ))c12 (F1 (x1 ), F2 (x2 ))c23 (F2 (x2 ), F3 (x3 ))f1 (x1 )f2 (x2 )f3 (x3 ).
In Morales N´apoles et al. (2008) wordt bewezen dat voor de verdeling van n variabelen
er n2 2(n−2)(n−3)/2 (n − 2)! mogelijke reguliere vines zijn. Hierbij kan men twee speciefieke
gevallen onderscheiden met een eenvoudigere vine-structuur, namelijk de D-vine en de Cvine. Elk met een eigen specifieke ontbinding van de afhankelijkheid. Bij een D-vine geldt
dat in elke boom, een top hoogstens met twee bogen is verbonden. Voor een C-vine geldt
voor elke boom Ti , dat er een unieke top is dat met de andere n − i toppen verbonden is.
3.3
D-vine en C-vine
Naargelang het om een D-vine, C-vine of een andere reguliere vine gaat, zullen de conditioned
set en conditioning set vari¨eren. In het geval van de D-vine en de C-vine hebben deze
verzamelingen een bepaalde vorm en kan de paar-copula ontbinding op een eenvoudige manier
worden samengevat.
Definitie 3.14 Een reguliere vine wordt een D-vine genoemd indien alle toppen in boom T1
een graad hebben die hoogstens twee is.
HOOFDSTUK 3. VINE EN PAAR-COPULA ONTBINDING
32
Voor een D-vine geldt dat elke boog een verschillende conditioning set heeft. In dit geval
kan de paar-copula ontbinding worden geschreven als
n
Y
f (xk )
n−1
Y
Y n−j
ci,i+j|i+1,...,i+j−1 Fi|i+1,...,i+j−1 , Fi+j|i+1,...,i+j−1 .
j=1 i=1
k=1
In Figuur 3.1 werd een mogelijke D-vine structuur weergegeven voor 5 variabelen. De gezamenlijke dichtheidsfunctie voor een vijf-dimensionale D-vine structuur zoals in Figuur 3.1
wordt dan gegeven door
f12345
= f1 f2 f3 f4 f5 c12 (F1 , F2 ) c23 (F2 , F3) c34 (F3 , F4 ) c45 (F4 , F5 )
×c13|2 F1|2 , F3|2 c24|3
F2|3 , F4|3 c35|4 F3|4 , F5|4 c14|23 F1|23 , F4|23
×c25|34 F2|34 , F5|34 c15|234 F1|234 , F5|234
Voor een n-dimensionale D-vine, zijn er n! mogelijke manieren om de variabelen te ordenen
in de eerste boom T1 . Aangezien de bogen ongeordend zijn, cij|D = cji|D , voor elk paar i, j
en een willekeurige conditioning set horende bij een D-vine, kan de volgorde in de boom
T1 achterstevoren worden genomen zonder dat de overeenkomstige vine-structuur wijzigt.
Er zijn dus n!/2 verschillende bomen op het eerste niveau. Omdat de boomstructuren in
T2 , . . . , Tn−1 volledig bepaald zijn door T1 , betekent dit dat er n!/2 verschillende D-vines zijn
voor n elementen.
Definitie 3.15 Een reguliere vine wordt een C-vine of canonische vine genoemd indien elke
boom Ti een unieke top heeft met graad n − i, i ∈ {1, . . . , n − 1}, met andere woorden indien
er juist ´e´en top is met de maximale graad in elke boom.
De top met de hoogste graad wordt zo gekozen dat de conditioning sets dezelfde zijn per
boom. Deze verzameling wordt als maar groter naarmate men vordert in de bomen. Voor
dit soort vine geldt als paar-copula ontbinding
n
Y
k=1
f (xk )
n−1
Y n−j
Y
cj,j+i|1,...,j−1 Fj|1,...,j−1 , Fj+i|1,...,j−1 .
j=1 i=1
Figuur 3.6 geeft een mogelijke C-vine structuur weer voor 5 variabelen.
HOOFDSTUK 3. VINE EN PAAR-COPULA ONTBINDING
33
Figuur 3.6: C-vine voor 5 variabelen
Voor de vijf-dimensionale C-vine zoals in Figuur 3.6 wordt de gezamenlijke dichtheidsfunctie gegeven door
f12345
= f1 f2 f3 f4 f5 c12 (F1 , F2 ) c13 (F1 , F3) c14 (F1 , F4 ) c15 (F1 , F5 )
×c23|1 F2|1 , F3|1 c24|1
F
,
F
c
F
,
F
c
F
,
F
2|1
4|1
25|1
2|1
5|1
34|12
3|12
4|12
×c35|12 F3|12 , F5|12 c45|123 F4|123 , F5|123
Voor een n-dimensionale C-vine zijn op elk boomniveau de conditioning sets van de bogen
dezelfde. Dit betekent dat gegeven de conditioning set in Tj−1 , er n − j + 2 keuzes zijn
voor de conditioning set in de boom Tj , j ∈ {3, . . . , n − 1}. Voor de boom T2 kunnen er n
mogelijke conditioning sets worden gekozen. Samen betekent dit dat er n(n − 1) . . . 3 = n!/2
verschillende C-vines bestaan voor n elementen.
Hoofdstuk 4
Toepassing van vines in finance
Men heeft aangetoond dat aan de hand van de vine copula een n-dimensionale verdeling kan
ontbonden worden naar een product van paar-copula’s. In dit hoofdstuk wordt beschreven
hoe deze vine copula kan worden bekomen voor een financi¨ele toepassing. Vooraleer een vine
copula wordt bepaald voor een bepaalde portefeuille moeten eerst de nodige transformaties
worden toegepast op de log-rendementen van de aandelenkoersen. Zodat men tijdreeksen
krijgt die mooiere eigenschappen bezitten en gemakkelijker zijn om mee te werken, dit wordt
gedaan in sectie 4.1. De rendementen worden beschreven aan de hand van een stochastisch
proces, dit is een verzameling van willekeurige variabelen {Xt |t ∈ T } gedefinieerd op een
gemeenschappelijke kansruimte (Ω, F, P). De geobserveerde waarden worden genoteerd als
{xt |t ∈ T }.
Bij het modelleren van de afhankelijkheid van de verschillende aandelen moet men de juiste
vine-structuur vinden die het beste fit met de realiteit. Dit kan een C-vine, D-vine of andere
reguliere vine zijn, naargelang welke variabelen de sterkste onderlinge afhankelijkheden hebben. Hiervoor zal in sectie 4.2 voor elk boom-niveau de Maximum Spanning Tree worden
gezocht. Vervolgens moet voor elke boog in de vine een passende paar-copula worden gekozen en de juiste copula parameter(s) worden geschat. In sectie 4.3 wordt beschreven hoe een
vine copula kan worden samengevat in matrices. Dit zal nodig zijn wanneer men in R een
bepaalde vine copula wilt specifieren.
Ondanks de grote flexibiliteit die de vine copula met zich meebrengt zijn er ook hier bepaalde
werkpunten, in dit hoofdstuk worden er hiervan twee besproken. Het aantal te schatten parameters stijgt exponentieel met de dimensie van de te onderzoeken portefeuille. Aangezien
de sterkste afhankelijkheden worden gemodelleerd in de eerste bomen is het interessant om
te gaan kijken of de vine kan vereenvoudigd of gesnoeid worden. Hiervoor wordt in sectie
4.4 onderzocht of men na een bepaald boomniveau kan veronderstellen dat de paar-copula’s
34
HOOFDSTUK 4. TOEPASSING VAN VINES IN FINANCE
35
respectievelijk Gaussiaans of onafhankelijk zijn. In beide gevallen brengt dit een grote vereenvoudiging mee van het vine model. Een tweede werkpunt dat men in sectie 4.5 bespreekt
is dat de afhankelijkheid tussen variabelen kan vari¨eren met de tijd maar wordt samengevat aan de hand van ´e´en constante afhankelijkheidsgrootheid of copula-parameter. Om dit
te verhelpen wordt overgegaan naar tijdsvari¨erende copula’s. Het Dynamisch Conditioneel
Correlatie model wordt toegepast om de copula-parameter en Kendall’s tau waarde van een
paar variabelen tijdsvari¨erend te maken. Tenslotte wordt in sectie 4.6 getoond hoe een model
kan ge¨evalueerd worden door het rendement te voorspellen en de Value-at-Risk te berekenen.
De methodes die zullen worden besproken worden in volgend hoofdstuk toegepast op de
log-rendementen van een bepaalde portefeuille. Deze worden hier gedefinieerd voor een bepaald actief samen met enkele eigenschappen die eigen zijn aan de log-rendementen. Zij Xt de
prijs van een actief op tijdstip t, dan wordt het bruto rendement gegeven door 1 + Yt =
Xt
Xt−1
en vervolgens het log-rendement gedefinieerd als
Rt = log (1 + Yt ) = log
Xt
Xt−1
.
In financi¨ele analyse wordt er eerder gewerkt met de log-rendementen dan met de prijskoers
omdat ze bepaalde aantrekkelijke eigenschappen bevat, zoals stationariteit.
Definitie 4.1 Een tijdreeks {Xt } is stationair indien:
(i) E[Xt2 ] < ∞, ∀t,
(ii) E[Xt ] = µ, ∀t en
(iii) voor de autocovariantie functie geldt
γX (r, s) = Cov(Xr , Xs ) = γX (r + t, s + t), ∀r, s, t ∈ Z.
De autocovariantiefunctie beschrijft de afhankelijkheid van oneindig veel verzamelingen variabelen. Het is de tegenhanger van de covariantiematrix in het oneindig geval. Een andere
eigenschap die voorkomt is volatiliteits-clustering. Dit wil zeggen dat men in de data te
maken heeft met periodes van hoge variantie en lage variantie. Of met andere woorden grote
veranderingen worden meestal gevolgd door grote veranderingen en kleine veranderingen
worden meestal gevolgd door kleine veranderingen. Ook het leverage effect wordt waargenomen, dit wil zeggen dat de volatiliteit anders gaat zijn voor een grote prijsstijging dan voor
een grote prijsdaling. Negatieve waarden zorgen voor een grotere volatiliteitsverandering
dan positieve waarden van dezelfde grootte. De verdeling van de log-rendementen is ook
leptokurtic, omdat ze meestal zware staarten heeft en de verdeling piekt in nul.
HOOFDSTUK 4. TOEPASSING VAN VINES IN FINANCE
36
Er wordt nu eerst nagegaan hoe deze tijdreeksen kunnen worden gemodelleerd aan de
hand van een ARMA-GARCH proces. Bovenstaande eigenschappen, het ARMA proces en
GARCH proces werden uitvoerig besproken in de cursussen H¨ormann (2011) en H¨ormann
(2013).
4.1
Tijdreeksen
Er worden n variabelen geobserveerd op T tijdstippen. Alvorens de paarsgewijze afhankelijkheden te onderzoeken en de paar-copula’s te schatten worden de univariate tijdreeksen
geanalyseerd door een gepast model erop toe te passen. Er zal dan verder worden gewerkt
met de residuen van het model eerder dan met de oorspronkelijke log-rendementen. Men
wenst dat voor elke variabele de T observaties onafhankelijk zijn met de tijd. Om dit te
bekomen wordt er een ARMA(p,q)-GARCH(1,1) model toegepast op de observaties om zo
tijdelijke afhankelijkheden uit te schakelen en een tijdsvari¨erende volatiliteit te bekomen.
Het proces {Rt } wordt een Auto Regressive Moving Average proces genoemd indien
Rt = µ +
p
X
φk Rt−k + Zt +
k=1
q
X
θk Zt−k
k=1
met φi , θj ∈ R, i ∈ {1, . . . , p} , j ∈ {1, . . . , q} en {Zt } white noise met gemiddelde 0 en
variantie 1.
Definitie 4.2 Een proces {Zt } wordt white noise genoemd als er geldt dat
• V ar(Zt ) = σ 2 < ∞, ∀t,
• E(Zt ) = µ, ∀t en
• Cov(Zt , Zt+h ) = 0, ∀t en |h| ≥ 1.
Het ARMA(p,q) model is niet geschikt voor de log-rendement-data, aangezien in zulk model
de volatiliteit constant is, wat niet overeenstemt met de eigenschappen die het log-rendement
bezit, zoals besproken voordien. Daarom wordt er op de variabelen {Zt } een General Autoregressive Conditionally Heteroscedastic (1, 1) model toegepast, zodat
Zt = t σt
met
• de residuen t onafhankelijk en gelijk verdeeld met gemiddelde 0 en variantie 1,
HOOFDSTUK 4. TOEPASSING VAN VINES IN FINANCE
37
• t onafhankelijk van het σ-algebra Ft−1 = σ (Zt−1 , Zt−2 , . . .),
• volatiliteit σt is Ft−1 -meetbaar en
• σt > 0.
De volatiliteit van Zt wordt dan beschreven door
2
2
σt2 = ω + αZt−1
+ βσt−1
met α, β, ω > 0. Indien dus voor elke marginale tijdreeks een ARMA(p,q)-GARCH(1,1)
model wordt gespecifieerd, kan men voor het modelleren van de afhankelijkheid verder werken
met de residuen van de tijdreeks, namelijk de {t }. Om de eigenschappen van de logrendementen, zoals zware staarten of skewness, correct weer te geven wordt hier, net zoals
in Mendes et al. (2010), gekozen om voor de verdeling van de residuen te werken met een
skewed sudent t verdeling,
t ∼ skewed student t (ν, λ).
Deze verdeling bevat twee parameters (λ, ν), de skewness parameter is λ en zal voor de
log-rendementen meestal negatief zijn zoals eerder besproken. Indien λ = 0 verkrijgt men
de gewone student t verdeling. De skew-t verdeling met gemiddelde 0 en variantie 1 wordt
gegeven door

q
ν

(1
−
λ)F

t
ν−2

(1 − λ)/2 q
F (y; ν, λ) =


ν
 (1 + λ)Ft
ν−2
by+a
1−λ
;ν
voor y < −a/b
voor y = −a/b
by+a
1+λ
;ν − λ
voor y > −a/b
met Ft (y; ν) de verdelingsfunctie van de symmetrische student t verdeling met ν vrijheidsgraden en
Γ
ν+1
2
p
,
Γ(ν/2) π(ν − 2)
√
b = 1 + 3λ2 − a2 ,
ν−2
a = 4λc
.
ν−1
c=
De skewed student t-dichtheidsfuntie is gegeven door,
 −(ν+1)/2

 bc 1 + 1 by+a 2
ν−2 1−λ
f (y; ν, λ) =
−(ν+1)/2

 bc 1 + 1 by+a 2
ν−2 1+λ
voor y < −a/b
voor y ≤ −a/b
De maximum likelihood schatting van de skew-t verdelingen kan dus toegepast worden voor
elke tijdreeks apart.
HOOFDSTUK 4. TOEPASSING VAN VINES IN FINANCE
38
Vervolgens wenst men ook dat de variabelen uniform verdeeld zijn aangezien dat gemakkelijker is om mee te werken en de bewerkingen/berekeningen eenvoudiger maakt. Om dit te
bekomen wordt de Probability Integral Transform toegepast op de residuen, gebruikmakende
van de empirische verdelingsfunctie. Hierdoor krijgt men de pseudo-observaties
T
Rt ≡ Fˆn (t ) =
1 X
I{ ≤ } .
T + 1 i=1 i t
Deze komen eigenlijk overeen met de rangen van de residuen.
4.2
Vine-structuur
Nu de marginale tijdreeksen correct gemodelleerd zijn, wenst men de juiste afhankelijkheidsstructuur te bepalen voor de n variabelen. Hiervoor zal een reguliere vine moeten
worden geconstrueerd die de afhankelijkheden het best beschrijft. Om een gepaste reguliere vine-specificatie te vinden voor een bepaalde dataset, moeten volgende stappen worden
uitgevoerd:
(i) Selecteer de reguliere vine-structuur, dit wil zeggen nagaan welke ongeconditioneerde
of geconditioneerde paren van variabelen worden gekoppeld.
(ii) Voor elk paar variabelen dat werd geselecteerd in (i) een passende bivariate copulafamilie kiezen.
(iii) Voor elke copula de bijhorende parameter(s) schatten.
Voor n variabelen zijn er
n
2
2(n−2)(n−3)/2 (n − 2)! verschillende mogelijke reguliere vines. Om
de gepaste vine-structuur te bekomen moet op elk boomniveau een geschikte boom-structuur
worden geconstrueerd. Hiervoor moet worden beslist voor welke paren van variabelen men
copula’s wenst te specifi¨eren of anders gezegd tussen welk paar toppen moet een boog getrokken worden. De belangrijkste afhankelijkheden die op een accurate manier moet worden
gemodelleerd zijn die in de eerste boom T1 . In deze boom komen de toppen overeen met
de uniform verdeelde pseudo-observaties van de residuen van de log-rendementen van de
verschillende variabelen uit de portefeuille zoals bepaald in sectie 4.1. Door de sterkste
afhankelijkheden te modelleren in de eerste boom worden numerieke afrondingsfouten vermeden in hogere bomen.
HOOFDSTUK 4. TOEPASSING VAN VINES IN FINANCE
4.2.1
39
Maximum Spanning Tree
Men moet beslissen aan welke paren van variabelen men wenst copula’s te specifi¨eren. De
copula-families die hier worden gekozen hebben een grote invloed op de globale model-fit.
Het Maximum Spanning Tree-algoritme , zoals beschreven in Brechmann (2013) en Diβmann
et al. (2013), wordt hiervoor toegepast. Hierbij worden per boom de sterkste paarsgewijze
afhankelijkheden gekozen. Voor het bepalen van de paarsgewijze afhankelijkheid kunnen
verschillende afhankelijkheidsgrootheden worden gebruikt zoals de tail dependence of het
aantal vrijheidsgraden van een gefitte student t copula. Hier wordt, net zoals in Brechmann
(2013), verkozen om te werken met de Kendall’s tau waarde. De Kenall’s tau meet de afhankelijkheid onafhankelijk van de marginale verdelingen en is dus zeker nuttig wanneer
verschillende copula-families worden gebruikt. Door de copula’s te kiezen voor de sterkste
afhankelijkheden in de eerste boom zullen de getransformeerde variabelen in hogere bomen
sneller onafhankelijk zijn van elkaar. Dit maakt het model eenvoudiger aangezien er minder
parameters moet worden geschat en dit zal toelaten om eventueel in de laatste k bomen al
de paren van variabelen onafhankelijk te veronderstellen1 . Voor de reguliere vine wordt in
de eerste boom T1 = (N1 , E1 ) voor elk paar variabelen {j, k} de empirische Kendall’s tau τˆjk
berekend, 1 ≤ j < k ≤ n.
De empirische versie van de Kendall’s tau wordt gegeven door
τˆjk =
c−d
c−d
= T ,
c+d
2
waarbij c het aantal concordante paren en d het aantal discordante paren weergeeft in de
observaties. Vervolgens wordt de spanning boom geconstrueerd zodat de som van de absolute
waarden van de empirische Kendall’s tau maximaal is,
X
max
|ˆ
τjk | .
bogen e={j,k} in spanning boom
De bogen-selectie gebeurt aan de hand van het Prim’s algoritme , beschreven in Brechmann
(2010). Om dit te kunnen oplossen wordt het maximalisatie-probleem omgezet naar een
minimalisatie-probleem,
X
min
|1 − τˆjk | .
bogen e={j,k} in spanning boom
Het algoritme gaat dan als volgt: Vertrekkende van een volledige graaf G = (N, E), dan is
elk paar toppen is verbonden door een boog. Er wordt een willekeurige top i1 gekozen en men
1
Dit wordt uitgewerkt in sectie 4.4.1
HOOFDSTUK 4. TOEPASSING VAN VINES IN FINANCE
40
definieert NT = {i1 } en ET = ∅. Zolang dat NT 6= N wordt een boog e = {ij , ik } gekozen
met 1 − τˆij ik minimaal en zodat de top ij ∈ NT en ik ∈
/ NT . NT wordt gelijkgesteld aan
NT ∪{ik } en ET = ET ∪{e}. Zo wordt de maximum spanning boom GT = (NT , ET ) bekomen.
Voor de C-vine wordt de hoofd-top zodanig gekozen dat de som van de paarsgewijze afhankelijkheden aan die top maximaal is,
max
i∈N1
X
|ˆ
τik | .
bogen e={i,k}
Bij de D-vine gaat men anders te werk, hier worden de paren gerangschikt volgens hun absolute Kendall’s tau waarde gaande van groot naar klein. De paren met de grootste Kendall’s
tau waarde zijn het sterkst afhankelijk. De eerste boom wordt dan geconstrueerd zodat de
paren toppen met de grootste Kendall’s tau waarde verbonden worden met elkaar en waarbij
elke top hoogstens twee maal verbonden is met een andere top. Bij een D-vine volgt de hele
vine-structuur uit de boom-structuur van de eerste boom. Om de eerste boom te construeren wordt er gezocht naar het Hamiltoniaans pad met minimale gewichten voor de gekozen
bogen (het gewicht van een boog e = {j, k} komt opnieuw overeen met |1 − τˆjk |). Een pad
wordt Hamiltoniaans genoemd, indien het pad alle toppen doorloopt en verbonden is. Om
dit minimalisatie-probleem te kunnen oplossen wordt er, zoals beschreven in Brechmann
(2010), gebruik gemaakt van het Traveling Salesman Problem, waarvoor binaire variabelen
xjk worden ingevoerd, die aangeven of de boog {j, k} al dan niet wordt opgenomen in het
Hamiltoniaans pad. De boomstructuur voor de D-vine wordt gevonden door het oplossen
van het minimalisatie probleem,
min
n X
n
X
|1 − τˆjk | xjk ,
j=1 k=1
onderworpen aan de voorwaarden,
n
X
j=1
xjk = 1, k ∈ {1, . . . , n} en
n
X
xjk = 1, j ∈ {1, . . . , n} .
k=1
Voor het construeren van de vine-structuur kunnen ook andere maten van afhankelijkheid
worden gebruikt. Een mogelijk alternatief is voor elk paar variabelen een student t copula te
fitten, waarbij een laag aantal vrijheidsgraden overeenkomt met een sterke afhankelijkheid.
Ook de tail dependence of de Spearmans rang correlatie zijn mogelijke afhankelijkheidsgrootheden.
HOOFDSTUK 4. TOEPASSING VAN VINES IN FINANCE
4.2.2
41
Paar-copula fit
Nu men weet voor welke paren in de eerste boom een copula moet worden bepaald, moeten de
juiste paar-copula’s worden gekozen uit de verschillende copula-families die werden besproken in Hoofdstuk 2. Dit kan op verschillende manieren gebeuren: op basis van een grafische
Goodness-of-Fit, een Goodness-of-Fit-test dat gebruik maakt van de empirsche copula of
ook nog aan de hand van het Akaike Information Criterium. Een grafische Goodness-of-Fit
wordt hier niet behandeld omdat dit niet handig is om mee te werken in hogere dimensies. De
overige selectiecriteria zullen in dit deel besproken worden. Alvorens te onderzoeken welke
copula het beste fit wordt eerst een onafhankelijkheidstest toegepast voor elk geselecteerd
paar variabelen.
Onafhankelijkheidstest: Er wordt een onafhankelijkheidstest toegepast voor elke boog
in de boom gebaseerd op de Kendall’s tau. Onder de nulhypothese dat Cjk de product copula is, moet de empirische Kendall’s tau voor T observaties ongeveer een normale verdeling
volgen met gemiddelde 0 en variantie 2(2T + 5)/9T (T − 1). De nulhypothese H0 wordt dus
verworpen met significatieniveau α = 0.05 indien
s
9T (T − 1)
|ˆ
τjk | > 1.96.
2(2T + 5)
Verwerpt men de nulhypothese niet, kan in de paar-copula ontbinding de copula-dichtheid
overeenkomstig met de boog {j, k} vervangen worden door 1. Dat zou de paar-copula ontbinding aanzienlijk vereenvoudigen. Indien de product copula verworpen wordt, wordt nagegaan
welke copula familie dan wel de beste copula fit geeft. Hiervoor vergelijkt men de drie verschillende Goodness-of-Fit-tests.
Blanket test: Een andere GoF is gebaseerd op de afstand tussen de geschatte copula
en de empirische copula. Deze test wordt in Genest et al. (2009) vergeleken met andere
Goodness-of-Fit-tests en blijkt consistent2 te zijn en beter te presteren dan de andere voorgestelde GoF-tests. Voor de Blanket test werkt men met de pseudo-observaties bekomen op
het einde van sectie 4.1. Men gaat de nulhypothese na voor een bepaalde copula-familie C0 ,
H0 : Cjk ∈ C0 .
De informatie van de pseudo-observaties (Ri1 , . . . , Rin ), i ∈ {1, . . . , T } , zit samengevat in de
empirsiche verdeling, wat overeenkomt met de niet-parametrische empirische copula,
T
1X
ˆ
C(u) =
I(Ri1 ≤u1 ,...,Rin ≤un ) ,
T i=1
2
een test-statistiek is consistent indien dat op basis van deze statistiek C ∈
/ C0 , dat dan H0 wordt
verworpen met kans ´e´en
HOOFDSTUK 4. TOEPASSING VAN VINES IN FINANCE
42
met u = (u1 , . . . , un ) ∈ [0, 1]n . In het bivariaat geval geeft dit dan
T
1X
ˆ
I(Rij ≤u1 ,Rik ≤un ) .
Cjk (u1 , u2 ) =
T i=1
Zij θˆ de maximum pseudo likelihood schatter van de copula-parameter(s) θ afgeleid uit de
psuedo-observaties Rij en Rik , i ∈ {1, . . . , T }, dan wordt een empirisch proces geconstrueerd
die de afstand vergelijkt tussen de empirische copula Cˆjk en de schatting C ˆ van Cjk onder
θ
H0 ,
CT =
√ T Cˆjk − Cθˆ .
Om na te gaan of de nulhypothese al dan niet moet worden verworpen wordt een test
statistiek gedefinieerd,
Z
S=
2
ˆ 1 , u2 ) =
(CT (u1 , u2 )) dC(u
T
X
[0,1]2
[Cˆjk (Rij , Rik ) − Cθˆ(Rij , Rik )]2 .
i=1
Indien deze statistiek grote waarden aanneemt wordt de nulhypothese verworpen. De copulafamilie met de hoogste p-waarde, indien deze natuurlijk groter is dan het gekozen significantieniveau, wordt dan gekozen als copula overeenkomstig met de boog e = {j, k}. De Blanket
test kan ook gebruikt worden om na te gaan of de vine copula een goede fit geeft.
AIC: Ten slotte is er ook het Akaike Information Criterium dat wordt gegeven door
AIC = −2
n
X
log f + 2k
i=1
met f een zekere dichtheidsfunctie en k het aantal te schatten parameters. Voor de paarcopula selectie geeft dit dan
AIC = −2
T
X
log cjk
ˆ
uij , uik |θ + 2k
i=1
met θˆ de maximum pseudo likelihood schatter van de copula parameter θ en k het aantal
elementen dat θ bevat. Zo wordt bijvoorbeeld de student t copula afgestraft ten opzichte
van de Clayton copula aangezien voor de student t copula twee parameters moeten worden
geschat ten opzichte van ´e´en parameter voor de Clayton copula. Men kiest de copula familie
met de laagste AIC waarde. Deze GoF test is een goed selectiecriterium, zeker als er veel
parameters zijn en er sterke afankelijkheid is tussen de variabelen. Indien de afhankelijkheid
zwakker is, werkt de AIC minder goed.
Nadat voor elk boog een een copula-familie is geselecteerd wordt op basis van de data,
HOOFDSTUK 4. TOEPASSING VAN VINES IN FINANCE
43
de copula-parameters geschat. Hiervoor moet de bivariate log-pseudo-likelihood worden gemaximaliseerd.
Maximum Pseudo Likelihood: Stel dat men de parameter θ wenst te schatten voor
de paar-copula geassocieerd met de boog e = {j, k}, dan wordt
l(θ) =
T
X
log (cθ (Rij , Rik ))
i=1
gemaximaliseerd. De pseudo-observaties werden gedefinieerd in sectie 4.1. Deze schatter
komt overeen met de klassieke likelihood schatter, behalve dat het hier wordt toegepast op
de empirische versies van de verdelingsfuncties.
4.2.3
Getransformeerde observaties
Nu de eerste boom volledig bepaald is moet men hetzelfde doen voor de hogere bomen.
Telkens de boomstructuur en paar-copula’s bepaald zijn, moeten de observaties worden geconstrueerd voor de volgende boom. Voor elke boog e = {j, k} in T1 worden de observaties
voor T2 , Fj|k (Rij |Rik ) en/of3 Fk|j (Rik |Rij ), i ∈ {1, . . . , T } berekend gebruikmakend van de
gekozen copula Cjk voor de boog e in boom T1 . Met de formule (3.4) kan de conditionele
verdelingsfunctie berekend worden als
Fj|k (Rij |Rik ) =
∂Cjk (Rij , Rik )
∂Cjk (F (Rij ), F (Rik ))
=
.
∂F (Rik )
∂Rik
De laatste gelijkheid volgt uit het feit dat de pseudo-observaties uniform verdeeld zijn.
Men gaat nu iteratief te werk in elke boom Tl , l ∈ {2, . . . , n − 1}. Elk paar toppen j|D
en k|D dat een gemeenschappelijke conditioning set D bevatten, wordt verbonden door
de boog {j, k|D} en de overeenstemmende empirische Kendall’s tau τˆj,k|D wordt berekend.
Opnieuw wordt het maximum spanning tree-algoritme toegepast,
max
X
τˆjk|D .
bogen e={j,k|D} in spanning boom
Hieruit wordt de overeenkomstige boomstructuur voor boom Tl gevonden. Vervolgens worden
op de getransformeerde observaties de (conditionele) copula-selectie methode en de copulaparameter schatting, zoals besproken in secties 4.2.2 en 4.2.3, toegepast.
3
naargelang met welke andere toppen e kan worden verbonden in T2
HOOFDSTUK 4. TOEPASSING VAN VINES IN FINANCE
44
Voor elke boog {j, k|D} in de geconstrueerde boom Tl , worden de getransformeerde observaties voor boom Tl+1 berekend Fj|k∪D en/of Fk|j∪D aan de hand van de conditionele
copula Cjk|D die werd gebruikt in boom Tl . Dit gebeurt opnieuw via de formule (3.4),
Fj|k∪D (xij |xik , xiD ) =
∂Cjk|D (F (xij |xiD ), F (xik |xiD ))
,
∂F (xik |xiD )
waar xiD overeenkomt met de pseudo-observaties uit de conditioning set op tijdstip i.
4.3
Matrix representatie van een reguliere vine
Als men de geconstrueerde vine structuur voor n elementen wil specifi¨eren in R zal een
geschikte manier nodig zijn om deze structuur, alsook de copula families en parameters
samen te vatten. Hiervoor wordt een benedendriehoeksmatrix gebruikt, zoals besproken
in Diβmann (2013). De constraint set CV van een reguliere vine wordt samengevat in de
kolommen van een n-dimensionale matrix.
Definitie 4.3 Zij M = (mi,j )i,j∈{1,...,n} een benedendriehoeksmatrix, de i-de constraint set
voor M is
CM (i) = {({mi,i , mk,i } , D) |k ∈ {i + 1, . . . , n} , D = {mk+1,i , . . . , mn,i }} ,
voor i ∈ {1, . . . , n − 1}. Als k = n dan is D = ∅. De constraint set voor matrix M is de unie
CM = CM (1) ∪ . . . ∪ CM (n − 1). De verzameling {mi,i , mk,i } komt overeen met de conditioned
set en D met de conditioning set.
Elk element uit de constraint set bestaat uit een element op de diagonaal mi,i en een element
mk,i uit dezelfde kolom onder mi,i en alle elementen die daaronder staan {mk+1,i , . . . , mn,i },
k ∈ {i + 1, . . . , n} en i ∈ {1, . . . , n}. Als men alle kolommen afgaat met j vast,
{({mi,i , mj,i } , D) |i ∈ {1, . . . , n} , D = {mj+1,i , . . . , mn,i }} ,
krijgt men alle constraint sets geassocieerd met de bogen uit boom Tn+1−j .
Als voorbeeld wordt de matrix M geconstrueerd die overeenkomt met de constraint set
voor de reguliere vine weergegeven in Figuur 4.1. Men vindt hiervoor matrix

5
1

M =
2
4
3


1

.
4 4

3 2 2 
2 3 3 3
HOOFDSTUK 4. TOEPASSING VAN VINES IN FINANCE
45
Figuur 4.1: 5-dimensionale reguliere vine
Als men bijvoorbeeld in de eerste kolom de elementen m11 (= 5) en m31 (= 2) neemt bekomt
men ({5, 2} , {4, 3}) ∈ CM wat overeenkomt met de constraint set van de boog 25|34 in boom
T3 . Alvorens de R-vine matrix te defini¨eren moet men eerst nog twee andere verzamelingen
van matrixelementen bepalen, dit zijn voor M = (mi,j )i,j∈{1,...,n} ,
BM (i) = {(mi,i , D)|k ∈ {i + 1, . . . , n} , D = {mk,i , . . . , mn,i }}
en
˜M (i) = {(mk,i , D)|k ∈ {i + 1, . . . , n} , D = {mi,i } ∪ {mk+1,i , . . . , mn,i }} .
B
Definitie 4.4 Een benedendriehoeksmatrix M = (mi,j )i,j∈{1,...,n} wordt een R-vine matrix
genoemd als voor i ∈ {1, . . . , n − 1} en voor alle k ∈ {i + 1, . . . , n − 1} er een
j ∈ {i + 1, . . . , n − 1} bestaat met
˜M (j).
(mk,i , {mk+1,i , . . . , mn,i }) ∈ BM (j) of B
Deze voorwaarde garandeert de proximiteitsvoorwaarde zoals in de definitie van de reguliere
vine. Uit de R-vine matrix definitie volgen verschillende eigenschappen.
• Elke kolom bevat alle elementen uit de kolom rechts van hem, {mi,i , . . . , mn,i } ⊂
{mj,j , . . . , mn,j } voor 1 ≤ j < i ≤ n.
• Voor elke kolom is het diagonaalelement verschillend, mi,i ∈
/ {mi+1,i+1 , . . . , mn,i+1 } voor
i ∈ {1, . . . , n − 1}.
• De matrix die overeenkomt met een reguliere vine is niet uniek.
HOOFDSTUK 4. TOEPASSING VAN VINES IN FINANCE
46
Om de reguliere vine volledig te bepalen, moet men ook nog twee andere benedendriehoeksmatrices defini¨eren geassocieerd met M . Deze bevatten de informatie over de copula-families
en -parameters die worden gebruikt voor de verschillende paar-copula’s. Dit gebeurt aan de
hand van matrices T = (ti,j )i,j∈{1,...,n} en P = (pi,j )i,j∈{1,...,n} . Sommige copula-families
hebben meer dan ´e´en parameter, dan moet er voor de parameter-matrix, twee matrices
gedefinieerd worden. In M komt het element mi,j , j ∈ {1, . . . , n − 1} , i ∈ {j + 1, . . . , n},
overeen met de copula Cmj,j ,mi,j |mi+1,j ,...,mn,j , voor de variabelen Xmj,j en Xmi,j conditioneel
op de variabelen met index {mi+1,j , . . . , mn,j }. Bijgevolg beschrijven ti,j het type copula
en pi,j de parameter voor deze copula. De paar-copula ontbinding voor de multivariate
dichtheidsfunctie f1...n kan dan worden geschreven op basis van van de R-vine matrix als
n
Y
j=1
fj
1
k+1
Y
Y
cmk,k ,mi,k |mi+1,k ,...,mn,k Fmk,k |mi+1,k ,...,mn,k , Fmi,k |mi+1,k ,...,mn,k .
k=n−1 i=n
Men heeft dus, net als voor de C-vine en de D-vine, een effici¨ente manier om de paar-copula
ontbinding te noteren voor een reguliere vine aan de hand van de R-vine matrix. Voor de
C-vine en D-vine heeft de R-vine matrix een speciale vorm. Voor de C-vine voor n elementen
is dit


n
n − 1 n − 1



n − 2 n − 2 n − 2



M =  ..
.
..
..
.
.
 .

.
.
.


 2
2
2
··· 2 
1
1
1
··· 1 1
Men ziet aan de hand van de matrix dat op een bepaald boomniveau, de paar-copula’s dezelfde conditioning set hebben. Een eigenschap dat men al eerder vermeldde in verband met
de C-vine. De vine matrix dat overeenkomt met de C-vine gegeven in Figuur 3.6 is

5
4

M =
3
2
1


4

.
3 3

2 2 2 
1 1 1 1
Voor de D-vine voor n elementen is de vine matrix van de vorm
HOOFDSTUK 4. TOEPASSING VAN VINES IN FINANCE

47

n
1
..
.

n−1

...
...


M =
..
n − 3
.
1
3

n − 2 n − 3 · · ·
1
n − 1 n − 2 n − 3 ···
2
1 1




.



Door in elke kolom telkens het diagonaal element te combineren met het element in de laatste rij vindt men de paar copula’s voor de eerste boom. Hierdoor vindt men, zoals gewenst,
voor de D-vine in de eerste boom de paren 1 − 2, 2 − 3, . . . , (n − 1) − n. De vine matrix dat
overeenkomt met de D-vine gegeven in Figuur 3.1 is

5
1

M =
2
3
4
4.4


4

.
1 3

2 1 2 
3 2 1 1
Gesnoeide en vereenvoudigde reguliere vines
De reguliere vine geeft een grote flexibiliteit om de afhankelijkheid tussen variabelen te
modelleren. Dit brengt veel werk met zich mee en de complexiteit van het model groeit
exponentieel met de dimensie van de dataset. Om dit te verhelpen wordt aan de hand van
statistische selectie-technieken onderzocht of het reguliere vine-model kan worden vereenvoudigd of gesnoeid, dit werd uitvoerig onderzocht in Brechmann (2010) en Brechmann (2012).
De paar-copula’s in de reguliere vine worden dan vanaf een bepaalde boom vervangen door
ofwel product copula’s ofwel Gaussiaanse copula’s.
4.4.1
Gesnoeide reguliere vine
Definitie 4.5 Een reguliere vine wordt gesnoeid op niveau K (truncated regular vine), tRV (K),
indien alle paar-copula’s in deze reguliere vine met conditioning set groter of gelijk aan K
vervangen worden door de product copula.
De gesnoeide reguliere vine copula voor K = 1, tRV (1), komt overeen met een Markov
boom verdeling. Men noteert θtRV (K) = θe1 ,e2 |De |e ∈ Ei , i ∈ {1, . . . , K} de parameters van
de gesnoeide reguliere vine met θe1 ,e2 |De de parameter(s) van de copula met copuladichtheid
ce1 ,e2 |De . In dit geval wordt de multivariate dichtheidsfunctie geschreven als
f1...n (u) = ctRV (K) (u|θtRV (K) ).
n
Y
j=1
fi (ui ).
HOOFDSTUK 4. TOEPASSING VAN VINES IN FINANCE
48
De copula-dichtheid voor de gesnoeide reguliere vine op niveau K kan dan geschreven worden
als
ctRV (K) (u|θtRV (K) ) =
K Y
Y
ce1 ,e2 |De (F (ue1 |uDe ), F (ue2 |uDe )) ,
i=1 e∈Ei
met u = (u1 , . . . , un ) ∈ [0, 1]n .
Voor het bepalen van het snoeiings-niveau moet een evenwicht gevonden worden tussen
een goede modellering van de afhankelijkheid en een verminderde complexiteit. Hiervoor
gaat men de log-likelihoods van de gesnoeide reguliere vines op verschillende niveaus vergelijken aan de hand van een statistische test, namelijk het Akaike Information Criterium. De
gesnoeide reguliere vine copula op niveau K, tRV (K), zit genesteld in die op niveau K + 1,
tRV (K + 1), aangezien voor de copula parameters geldt dat θtRV (K) ⊂ θtRV (K+1) . Gegeven
de T datapunten ui = (ui1 , . . . , uin ) ∈ [0, 1]n , is de log-likelihood voor tRV (K) gegeven door,
ltRV (K) θtRV (K) |u =
T X
K X
X
log ce1 ,e2 |De F (uie1 |uiDe ), F (uie2 |uiDe )|θe1 ,e2 |De ,
i=1 l=1 e∈El
waarbij El overeenkomt met de bogen in boom l. Voor het maximaliseren van de loglikelihood wordt de stapsgewijze maximum likelihood schatting toegepast:
(1) Eerst wordt per paar-copula de parameter(s) geschat aan de hand van de maximum
pseudo likelihood schatting, tot niveau K,
(2) vervolgens wordt full log likelihood gemaximaliseerd voor de hele vine met als startwaarde de parameters gevonden in (1).
Teneinde het juiste snoeiingsniveau te bepalen zulle de log-likelihoods van opeenvolgende
niveaus met elkaar worden vergeleken. Beginnend bij K = 1, fit men een gesnoeide reguliere vine copula tRV (1). Hierna wordt het niveau met ´e´en eenheid verhoogd en gaat men
kijken wat de winst is die wordt verkregen door een extra boom toe te laten. Indien de
winst niet significant is, stopt men hier en en heeft men het snoeiingsniveau K0 gevonden,
anders verhoogd men K opnieuw en gaat men zo iteratief verder tot dat een bevredigend
niveau is gevonden. Hoe wordt bepaald of de winst van een extra boom al dan niet significant
is? Hiervoor wordt gebruik gemaakt van een statistisch model-selectie-criterium dat geschikt
is voor het vergelijken van genestelde modellen zoals hier het geval is, tRV (K) ⊂ tRV (K +1).
Akaike Information Citerium: De AIC voor de gesnoeide reguliere vine op niveau K
wordt gegeven door
ˆ
AIC(tRV (K)) = −2ltRV (K) θtRV (K) |u + 2ntRV (K) ,
HOOFDSTUK 4. TOEPASSING VAN VINES IN FINANCE
49
waarbij ntRV (K) het aantal te schatten parameters is op niveau K (de dimensie van θˆtRV (K) ).
Indien de bijdrage van de boom TK+1 aan de AIC positief is, wordt er gesnoeid op niveau
K. Voor elke K ∈ {1 . . . , n − 2} wordt dus uit tRV (K) en tRV (K + 1) voor de gesnoeide
reguliere vine, diegene gekozen met de kleinste AIC waarde.
Bayesian Information Criterium: Indien men de afstraffing voor het aantal te schatten parameters sterker wilt doen doorwegen in het model-selectie-criterium, wordt op de
likelihood de Schwarz correctie toegepast. Hierdoor wordt het BIC verkregen voor het bepalen van het snoeiingsniveau,
BIC(tRV (K)) = −2ltRV (K) θˆtRV (K) |u + ln(n)ntRV (K) .
Bij het vergelijken van de verschillende modellen voor het optimale snoeiingsniveau wordt er
enkel gekeken naar de opeenvolgende modellen tRV (K) en tRV (K + 1). Dit betekent dat
als men een K0 heeft gevonden als optimaal, dat het model tRV (K0 ) niet werd vergeleken
met tRV (K0 + 2), . . . , tRV (n − 1). Dit is echter geen beperking daar men de reguliere vine
zo geconstrueerd heeft dat de sterkste afhankelijkheden in de eerste bomen zitten.
4.4.2
Vereenvoudigde reguliere vine
Definitie 4.6 Een reguliere vine wordt vereenvoudigd op niveau K (simplified regular vine),
sRV (K), indien alle paar-copula’s in deze reguliere vine met conditioning set groter of gelijk
aan K vervangen worden door de Gaussiaanse copula.
Het gebruik van de Gaussiaanse copula vereenvoudigt het model daar deze copula veel simpeler is om te schatten, het symmetrisch is en makkelijk te interpreteren aan de hand van de
correlatieco¨effici¨ent. De gesnoeide reguliere vine kan ook gezien worden als een vereenvoudigde reguliere vine waarbij alle gaussiaanse paar-copula’s correlatieco¨effici¨ent nul hebben.
Voor de vereenvoudigde reguliere vine kan hetzelfde worden gedaan als bij de gesnoeide, met
parameterverzameling
θsRV (K) = θe1 ,e2 |De |e ∈ Ei , i ∈ {1, . . . , K} ∪
ρe1 ,e2 |De |e ∈ Ei , i ∈ {K + 1, . . . , n − 1} ,
waarbij ρe1 ,e2 |De de correlatieco¨effici¨ent is voor de Gaussiaanse paar-copula met copuladichtheid cρe1 ,e2 |De . De paar-copula ontbinding voor de vereenvoudigde reguliere vine op
niveau K is dan
HOOFDSTUK 4. TOEPASSING VAN VINES IN FINANCE
csRV (K) (u|θsRV (K) )
=
hQ
50
i
c
(F
(u
|u
),
F
(u
|u
))
×
e
D
e
D
e
,e
|D
e
e
e
1
2
1 2
e∈Ei
hQ
i
Q
n−1
ρ
c
(F
(u
|u
),
F
(u
|u
))
,
e1 De
e2 De
i=K+1
e∈Ei e1 ,e2 |De
K
i=1
Q
met u = (u1 , . . . , un ) ∈ [0, 1]n .
Voor de selectie van het vereenvoudigingsniveau wordt gewerkt met een ander statistische
model-selectie-techniek omdat men hier niet te maken heeft met genestelde modellen.
Likelihood ratio test van Vuong: Hierbij worden twee modellen vergeleken waarbij aan
de beslissing een significantieniveau wordt meegegeven. Men definieert voor een observatie
ui , i ∈ (1, . . . , T )
QK Q
ˆ
ˆ
V (ui |θsRV (K) ) =
l=1
e∈El ce1 ,e2 |De F (uie1 |uiDe ), F (uie2 |uiDe )|θe1 ,e2 |De
Qn−1 Q
× l=K+1 e∈El cρe1 ,e2 |De (F (ue1 |uDe ), F (ue2 |uDe )) ,
met maximum likelihood schatter θˆsRV (K) . Vervolgens worden voor de observaties ui , i ∈
{1, . . . , T } de log-likelihood ratio’s geconstrueerd
"
#
V (ui |θˆsRV (K) )
mi = log
.
V (ui |θˆsRV (K+1) )
Op basis hiervan wordt de statistiek
LRT (θˆsRV (K) , θˆsRV (K+1) ) =
T
X
mi + nsRV (K) − nsRV (K+1)
i=1
geconstreerd, met variantie ω
ˆ2 =
1
T
PT
i=1
(mi − m)
¯ en nsRV (K) zoals bij de AIC. Bij deze
statistiek wordt weeral rekening gehouden met het aantal te schatten parameters in een
bepaalde vereenvoudigde reguliere vine. Net zoals bij het BIC, kan ook hier het aantal
te schatten parameters sterker doorwegen in de beslissing. Dit gebeurt door een Schwarz
correctie toe te passen in plaats van een AIC correctie op de statistiek. Analoog kan de AIC
correctie worden weggelaten indien het verschil in aantal te schatten parameters tussen de
twee modellen niet uitmaakt. In Vuong (1989) wordt aangetoond dat uit de wet van de grote
getallen volgt dat
ˆ
ˆ
LRT θsRV (K) , θsRV (K+1) d
√
ν=
→ N (0, 1),
Tω
ˆ2
voor T → ∞. Het model sRV (K) wordt dan verkozen boven sRV (K + 1) met significantie
niveau α indien ν > φ−1 1 − α2 en bijgevolg neemt men K als vereenvoudigingssniveau daar
het toevoegen van een boom TK+1 geen significante winst meegeeft. Indien ν < −φ−1 1 − α2
wordt het tweede model verkozen en wordt er verder onderzocht voor het volgend niveau
HOOFDSTUK 4. TOEPASSING VAN VINES IN FINANCE
K + 1. Tenslotte indien |ν| ≤ φ−1 1 −
α
2
51
kan er geen beslissing genomen worden tussen
beide modellen en wordt ook hier K genomen als vereenvoudigingssniveau aangezien geen
significant onderscheid kan worden gemaakt tussen beide modellen. De likelihood ratio test
van Vuong kan ook toegepast worden voor de selectie van het snoeiingsniveau. Moest de
AIC selectie-techniek toegepast worden voor vereenvoudigde reguliere vines zou dit een verhoogde variabiliteit met zich meebrengen aangezien de vergeleken modellen niet genesteld
zijn. Daar de modellen sRV (K) en sRV (K + 1) enkel verschillen ter hoogte van de boom
TK+1 , is deze verhoogde variabiliteit niet onoverkombaar.
4.5
Tijdsvari¨
erende copula’s
Bij het modelleren van de afhankelijkheid tussen financi¨ele rendementen wenst men rekening
te houden met het feit dat de afhankelijkheidsstructuur niet constant is in de tijd, zoals werd
aangetoond in Longin & Solnik (1995). In deze paper werden de maandelijkse returns van
zeven aandelenmarkten geanalyseerd over een periode van dertig jaar en wordt de hypothese
verworpen dat de conditionele correlatie constant is.
Door toe te staan dat de copula-parameters vari¨eren in functie van de tijd wordt het model
zodanig aangepast dat de paar-copula’s tijdsvari¨erend kunnen zijn. Om dit te modelleren
wordt er gewerkt met het Dynamisch Conditioneel Correlatie-model, dat werd geconstrueerd in Engle (2002). Dit model wordt geschat in twee stappen, eerst worden de univariate
GARCH tijdreeksen geschat en vervolgens bekomt men de tijdsvari¨erende correlatieco¨efficient. Het idee van het DCC model is om vertrekkende vanuit de residuen van de rendementen een correlatie-parameter te construeren die varieert met de tijd. Vervolgens zal uit de
correlatie-parameter de Kendall’s tau worden afgeleid en hieruit wordt dan de tijdsvari¨erende
parameter van de paar-copula gehaald. De reguliere vine die tot nu toe werd besproken wordt
dus dynamisch gemaakt, door toe te laten dat de paar-copula’s tijdsvari¨erend zijn. De inputs van een copula werden zodanig geconstrueerd dat ze uniform verdeeld zijn. Deze inputs
worden nu getransformeerd door de inverse normale cumulatieve verdelingsfunctie erop toe
te passen:
i,t = Φ−1 (ui,t ) en t = [1,t , 2,t ],
bijgevolg geldt i,t ∼ N (0, 1). Men wenst nu het DCC model hierop toe te passen, waarmee
de conditionele correlatie wordt geconstrueerd.
HOOFDSTUK 4. TOEPASSING VAN VINES IN FINANCE
4.5.1
52
Dynamisch Conditioneel Correlatie-model
Gegeven log-rendementen ri en rj die beiden gemiddelde 0 hebben. Men is ge¨ınteresseerd te
weten wat de conditionele correlatie is tussen beide rendementen,
Et−1 [ri,t rj,t ]
ρi,j,t = q
.
2
2
Et−1 [ri,t
]Et−1 [rj,t
]
De conditionele correlatie is gebaseerd op de informatie geweten op tijdstip t − 1. Deze
rendementen kunnen geschreven worden aan de hand van
ri,t = σi,t i,t
2
], Ft−1 meetbaar en i,t met gemiddelde 0 en variantie 1. Hierdoor kan de
met σi,t = Et−1 [ri,t
conditionele correlatie herschreven worden als ρi,j,t = Et−1 [i,t j,t ]. Met conditioneel bedoelt
men hier conditioneel op de vorige observaties en niet conditioneel op andere variabelelen.
Zij
Ht = Et−1 [rt r0t ] = Dt RDt ,
met Dt = diag(σt ) en R = Et−1 [t 0t ] de correlatie matrix van de gestandardiseerde residuen.
Men wenst nu R te schatten zodat R tijdsvari¨erend is, en bijgevolg Ht = Dt Rt Dt met Rt de
conditionele correlatie matrix. Engle stelde hier voor om te werken met het GARCH(1,1)
model toegepast op t , waardoor het proces
qi,j,t = ρi,j + α (i,t−1 j,t−1 − ρi,j ) + β (qi,j,t−1 − ρi,j )
wordt verkregen met ρi,j de onconditionele correlatie. Dit kan herschreven worden als
qi,j,t
=
(1 − α − β)ρi,j + αi,t−1 j,t−1 + βqi,j,t−1
=
1−α−β
1−β
ρi,j + α
P∞
k=1
β k i,t−k j,t−k .
Waarbij α en β de autoregressieve parameters zijn. De schatter voor de tijdsvari¨erende
correlatie parameter wordt dan gegeven als
ρˆi,j,t = √
qi,j,t
.
qi,i,t qj,j,t
De covariantie matrix Qt wordt dan geconstrueerd met als elementen [Qt ]i,j = qi,j,t . Voor
het DCC model in matrix vorm gelden dan de volgende dynamische vergelijkingen,
Qt = Σ(1 − α − β) + αt−1 0t−1 + βQt−1 en
Rt = diag(Qt )−1/2 Qt diag(Qt )−1/2 ,
HOOFDSTUK 4. TOEPASSING VAN VINES IN FINANCE
53
met Σ een 2 × 2 matrix met 1 op diagonaal en de niet-conditionele correlatie ρi,j op de niet
diagonaal elementen. Om de conditionele correlatiecoeffici¨ent te vinden moeten de parameters α, β en Σ worden geschat.
Nu men een schatter heeft gevonden voor de tijdreeks ρt , wordt hieruit de tijdsvari¨erende
copula-parameter afgeleid aan de hand van eigenschappen uit Kurowicka & Cooke (2006) die
hier worden uitgewerkt. Eerst wordt de dynamische Kendall’s tau berekend, door ervan uit
te gaan dat ρt de copula parameter is van de Gaussiaanse copula. Vooraleer deze transformatie te bewijzen gaat men eerst een lemma bewijzen in verband met de bivariate normale
dichtheidsfunctie.
Lemma 4.1 Zij (X, Y ) een willekeurige vector met een gezamenlijke normale verdelingsfunctie en met dichtheidsfunctie f (x, y), dan geldt
∂ 2 f (x, y)
∂f (x, y)
=
.
∂ρ
∂x∂y
Bewijs: De dichtheidsfunctie van de normale verdeling met parameter ρ is gegeven door
1
1
2
2
f (x, y) = p
exp −
x − 2ρxy + y
.
2(1 − ρ2 )
2π 1 − ρ2
1
2
2
Voor de eenvoud noteert men − 2(1−ρ
2 ) (x − 2ρxy + y ) als g(x, y, ρ). Dan geldt
1
∂g(x, y, ρ)
(x2 ρ − xy(1 + ρ2 ) + y 2 ρ)
∂g(x, y, ρ)
=−
(2x
−
2ρy)
en
=
−
.
∂y
2(1 − ρ)2
∂ρ
(1 − ρ2 )2
(i) Men begint met f (x, y) partieel af te leiden naar y,
∂f (x, y)
1
ρx − y
= p
exp (g(x, y, ρ))
.
∂y
1 − ρ2
2π 1 − ρ2
Vervolgens afleiden naar x geeft,
∂ 2 f (x,y)
∂y∂x
=
1
2π(1−ρ2 )3/2
∂ exp(g(x,y,ρ))
∂x
=
1
2π(1−ρ2 )3/2
exp (g(x, y, ρ)) (ρy−x)
(ρx − y) + exp (g(x, y, ρ)) ρ
(1−ρ2 )
(ρx − y) + exp (g(x, y, ρ)) ρ
1
= − 2π(1−ρ
2 )3/2 exp (g(x, y, ρ))
(ρy−x)(ρx−y)
(1−ρ2 )
+ρ .
(ii) De dichtheidsfunctie f (x, y) wordt partieel afgeleid naar ρ,
HOOFDSTUK 4. TOEPASSING VAN VINES IN FINANCE
∂f (x,y)
∂ρ
=
1 ∂(1−ρ2 )−1/2
2π
∂ρ
=
ρ
2π(1−ρ2 )3/2
=
exp (g(x, y, ρ)) +
√1
2π
1−ρ2
54
∂
exp (g(x, y, ρ)) ∂ρ
(−x2 +2ρxy−y2 )
2(1−ρ2 )
exp (g(x, y, ρ)) + √1 2 exp (g(x, y, ρ))
2π 1−ρ
2
2
2
2xy2(1−ρ )+4ρ(−x +2ρxy−y )
4(1−ρ2 )2
1
2π(1−ρ2 )3/2
exp (g(x, y, ρ)) ρ +
xy+xyρ2 −x2 ρ−y 2 ρ
(1−ρ2 )
.
Wat dus hetzelfde is als bij (i), waarmee het lemma is bewezen.
Door de definitie van de Kendall’s tau toe te passen voor de Gaussiaanse copula kan een
eenvoudige relatie bekomen worden tussen de correlatieco¨effici¨ent en de Kendall’s tau. Deze
wordt in Kurowicka & Cooke (2006) gegeven aan de hand van volgende eigenschap.
Eigenschap 4.1 Zij (X, Y ) een willekeurige vector met gezamenlijke normale verdelingsfunctie,dan is
2
τ (X, Y ) = arcsin ρ(X, Y ).
π
Bewijs: Gegeven de dichtheidsfunctie van de normale verdeling met parameter ρ, f (x, y),
Rx Ry
de cumulatieve verdeligsfunctie is dan F (x, y) = −∞ −∞ f (x, y)dxdy. De definitie van de
Kendall’s tau kan aan de hand van het theorema van Sklar herschreven worden als
Z
Z
τ (X, Y ) = 4
F (x, y)dF (x, y) − 1 = 4
F (x, y)f (x, y)dxdy − 1.
R2
R2
Door af te leiden naar ρ verkrijgt men,
Z
∂τ
∂F (x, y)
∂f (x, y)
=4
f (x, y) + F (x, y)
dxdy.
∂ρ
∂ρ
∂ρ
R2
Gebruikmakende van Lemma 4.1 kan dit herschreven worden als,
Z
∂ 2 f (x, y)
+ f 2 (x, y)dxdy.
4
F (x, y)
∂x∂y
2
R
Door partiele integratie toe te passen eerst op x en vervolgens op y, kan men
R
R
2 f (x,y)
F (x, y) ∂ ∂x∂y
dxdy uitwerken tot R2 f 2 (x, y)dxdy wat dan
R2
Z
∂τ
=8
f 2 (x, y)dxdy
∂ρ
R2
geeft. Door f (x, y) in te vullen krijgt men
Z
8
1
2
2
2
p
p
exp −
x − 2ρxy + y
dxdy.
2(1 − ρ2 )
2π 1 − ρ2 R2 2π 1 − ρ2
HOOFDSTUK 4. TOEPASSING VAN VINES IN FINANCE
In bovenstaande integraal x en y te transformeren naar s =
√x
2
55
en t =
√y
2
met Jacobiaan
1
2
wordt opnieuw de normale dichtheidsfunctie bekomen, en bijgevolg geeft dit
Z
∂τ
8
8
2
1
1
= p
= p
f (s, t) dsdt = p
.
∂ρ
2
2π 1 − ρ2 R2
2π 1 − ρ2 2
π 1 − ρ2
Beide leden integreren naar ρ geeft dan de gewenste formule,
Z
1
2
2
p
dρ = arcsin ρ.
τ=
π
π
1 − ρ2
Het is dus mogelijk om uit de correlatieco¨effici¨ent de Kendall’s tau waarde af te leiden. Voor
elke copula met parameter θ bestaat ook de relatie
Z
Cθ (u1 , u2 )dCθ (u1 , u2 ),
τ =4
[0,1]2
waaruit men na inversie van deze relatie de Kendall’s tau kan transformeren tot de copulaparameter θ voor elke paar-copula dat wordt geschat. Voor de Archimedische copula’s kan
deze worden berekend aan de hand van Eigenschap 2.2.
Gaussiaanse copula: Hier volgt de relatie uit de inversie van de formule uit Eigenschap
4.1,
ρ = sin(τ π/2).
Student t copula: De relatie tussen de Kendall’s tau en de student t copula-parameter
hangt niet af van het aantal vrijheidsgraden. De relatie is dezelfde als voor de Gaussiaanse
copula,
ρ = sin(τ π/2).
Frank copula: De transformatie van de Kendall’s tau naar de parameter van de Frank copula moet numeriek worden opgelost. Bijgevolg zal deze copula worden uitgesloten in 5.1.6
waar de dynamische copula-parameters gezocht zullen worden voor een dataset.
Gumbel copula: Gegeven de generator ϕ(t) = (− ln(t))θ , θ > 0, kan
worden berekend als volgt,
Z 1
Z 1
(− ln(t))θ
ln(t)t
τ =1+4
dt = 1 + 4
dt = 1 −
θ−1
θ
0 −θ/t(− ln(t))
0
Wat na inversie de volgende relatie geeft,
θ = 1/(1 − τ ).
de Kendall’s tau
1
.
θ
HOOFDSTUK 4. TOEPASSING VAN VINES IN FINANCE
Clayton copula: Gegeven de generator ϕ(t) =
1 −θ
(t
θ
56
− 1), θ ∈ [−1, ∞)\ {−1}, kan de
Kendall’s tau worden berekend als volgt,
Z 1
Z
Z
(t−θ − 1)
4 1
4 1 θ+1
θ
τ =1+4
dt = 1 −
.
tdt +
t dt =
−(θ+1)
)
θ 0
θ 0
θ+2
0 θ(−t
Na inversie wordt voor de copula parameter de relatie
θ = 2τ /(1 − τ )
gevonden.
Er moet worden opgemerkt dat het toepassen van het DCC model voor het vinden van
de tijdsvari¨erende copula-parameter een beperking met zich meebrengt. Aangezien bij de
constructie van de conditionele correlatieco¨effici¨ent er wordt verondersteld dat de afhankelijkheid wordt beschreven aan de hand van een Gaussiaanse copula en niet aan de hand van
de in de vine-constructie geselecteerde copula.
4.6
Model evaluatie aan de hand van Value-at-Risk
Tenslotte wenst men het geconstrueerde model te evalueren zoals beschreven in Berg & Aas
(2009) en Heinen & Valdesogo (2009). Om na te gaan of een model goed presteert wordt onderzocht of het goede Value-at-Risk-voorspellingen genereert. Hiervoor wordt een bepaalde
periode geslecteerd, T1 , voor het welk een vine copula wordt geconstrueerd. Vervolgens gaat
men voor een daarop volgende periode, T2 , de gerealiseerde rendementen vergelijken met de
VaR-voorspellingen, voor een bepaalde drempel α. De VaR is een goede risicomaat omdat
het rekening houdt met de staart van een verdeling. Het wordt vaak gebruikt in de praktijk
om te bepalen hoeveel reserves een financi¨ele instelling moet aangeleggen. De Value-at-Risk
gaat een antwoord geven op de vraag ”Hoeveel kunnen we verwachten te verliezen in ´e´en
dag/week/jaar met een bepaalde kans?”, het is gedefinieerd als volgt.
Definitie 4.7 Gegeven een bepaald risico X en een bepaalde drempel α ∈ (0, 1), de overeenkomstige VaR is
V aR1−α (X) = FX−1 (1 − α).
De VaR komt dus eigenlijk overeen met het (1 − α)-quantiel van X. Typisch wordt voor α
0.05 genomen.
Het idee is dus om dagelijks het waargenomen rendement van een bepaalde portefeuille
te gaan vergelijken met de (1 − α)-VaR van het voorspelde rendement op basis van de geconstrueerde vine-copula die de afhankelijkheid van de returns van de componenten van de
HOOFDSTUK 4. TOEPASSING VAN VINES IN FINANCE
57
portefeuille modelleert. In de periode T2 wordt het aantal keren dat de VaR-voorspellingen
groter was dan de waargenomen returns opgeteld en gedeeld door T2 . Indien dit getal ongeveer overeenkomt met de drempel α is het geconstrueerde model nauwkeurig.
Het berekenen van de VaR bestaat uit verschillende stappen:
(i) Gebruikmakende van de geschatte copula-parameters en geconstrueerde vine-structuur
(op basis van de observaties uit de periode T1 ) worden uit de geconstrueerde vine copula de observaties u1 , . . . , un gesimuleerd.
Simulatie procedure: Voor het simuleren van n afhankelijke, uniform verdeelde
observaties u1 , . . . , un voor een bepaalde vine copula, worden eerst n onafhankelijke,
uniform verdeelde observaties w1 , . . . , wn willekeurig gekozen. De observaties u1 , . . . , un
worden dan gevonden door volgende bewerkingen toe te passen op w1 , . . . , wn :
u1
u2
u3
= w1 ,
= F −1 (w2 |u1 )
= F −1 (w3 |u1 , u2 )
..
.
un
= F −1 (wn |u1 , . . . , un−1 )
Waarbij de conditionele verdelingsfunctie bepaald is zoals in (3.4),
F (x|v) =
∂Cx,vj |v−j (F (x|v−j ), F (vj |v−j ))
,
∂F (vj |v−j )
met de keuze van de observatie vj afhankelijk van de vine-structuur.
(ii) Hieruit worden de gestandaardiseerde residuen ˆT +1,1 , . . . , ˆT +1,n berekend. Hiervoor
wordt op elke observatie ui de inverse skewed student t verdeling toegepast overeenkomstig met het residu i , zoals bepaald in sectie 4.1.
(iii) Aan de hand van de schattingen voor het GARCH(1,1) model op basis van de eerste
T1 observaties wordt de ex-ante GARCH volatiliteit-voorspelling berekend voor elke
j ∈ {1, . . . , n},
2
σ
ˆT2 +1,j = ωˆj + α
ˆ ˆ2T,j + βˆσ
ˆT,j
.
(iv) Voor elke component uit de portefeuille wordt de ex-ante rendement-voorspelling berekend gebruikmakende van de voorspellingen uit (ii) en (iii) en de schattingen van de
ARMA-parameters voor de rendementen rj , j ∈ {1, . . . , n} uit sectie 4.1.
rˆT +1,j = µ
ˆj +
p
X
k=1
φˆk,j rT +1−k,j + σ
ˆT +1,j ˆT +1,j +
q
X
k=1
θˆk,j σ
ˆT +1−k,j ˆT +1−k,j ,
(4.1)
HOOFDSTUK 4. TOEPASSING VAN VINES IN FINANCE
58
waarbij µ
ˆj wordt berekend als het gemiddelde van de laatste 100 geobserveerde rendementen.
(v) Het rendement van de portefeuille wordt dan geconstrueerd aan de hand van de rendementen van de verschillende componenten met hun respectievelijk gewicht. De keuze
van de gewichten mag vrij gekozen worden, men construeert de portefeuille zodanig
dat elke component een even grote bijdrage heeft,
rˆTP +1
n
X
1
rˆT +1,j .
=
n
j=1
(vi) Tenslotte wordt de (1 − α)-VaR van het portfolio-rendement berekend, V aRT1−α
rTP +1 ).
+1 (ˆ
Dit gebeurd door het steekproef α-quantiel te nemen van de portfolio-rendementvoorspelling.
Er wordt een hit-variabele It geconstrueerd die gaat bepalen of op een bepaald tijdstip t de
(1 − α)-VaR van het portfolio-rendement, het waargenomen rendement overschrijdt.
It =
1
0
indien rtP < V aRt1−α (ˆ
rtP )
anders
Men gaat dit elke dag na voor t ∈ {T1 + 1, . . . , T1 + T2 } en bekomen dan een tijdreeks
1 +T2
{It }Tt=T
. Opdat het geconstrueerde vine copula-model correct zou zijn moet deze tijdreeks
1 +1
aan twee eigenschappen voldoen. Ten eerste moeten de overschrijdingen van V aRt1−α (ˆ
rtP ) op
een onafhankelijke manier plaatsvinden in de tijd, dit wil zeggen dat er geen clustervorming
mag zijn. Een tweede eigenschap is dat het relatief aantal overschrijdingen ongeveer overeen
moet komen met de drempelwaarde α,
TX
1 +T2
!
It /T2 ≈ α.
t=T1 +1
Om dit laatste na te gaan wordt er gebruik gemaakt van de likelihood ratio test of correct
unconditional coverage of Kupiec. Hierbij wordt als nulhypothese genomen dat het relatief
aantal overschrijdingen gelijk is aan α. Onder de nulhypothese geldt dat de likelihood ratio
statistiek,
" T −N #
N
h
i
N
N 2
1−
− 2 ln αN (1 − α)T2 −N ,
LR = 2 ln
T2
T2
P 1 +T2
asymptotisch een χ2 (1)-verdeling volgt, met N = Tt=T
I . Voor de drempelwaarde wordt
1 +1 t
dan de p-waarde berekend voor de nul hypothese en in functie daarvan wordt bepaald of
de geconstrueerde ARMA-GARCH-Skewed-student-t-paar-copula ontbinding de afhankelijkheid correct modelleert.
Hoofdstuk 5
Empirische toepassing
Men wenst de methodes beschreven in hoofdstuk 4 toe te passen op interessante datasets.
In sectie 5.1 wordt de afhankelijkheid voor de maandelijkse rendementen van 14 Europese
landen onderzocht voor een periode van 13 jaar. Voor deze dataset wordt een reguliere vine,
een C-vine en een D-vine geconstrueerd. Deze modellen worden met elkaar vergeleken en er
wordt onderzocht of de reguliere vine kan worden gesnoeid en vereenvoudigd. Er wordt ook
nagegaan of de afhankelijkheid varieert met de tijd.
De vine copula kent heel wat toepassingen binnen het vermogensbeheer. In Mendes (2010)
wordt voor een zesdimensionale dataset aan de hand van een D-vine een effci¨ente grens geconstrueerd die overeenkomt met optimale portfolio’s volgens de Markowitz Mean Variance
methodologie. In Heinen & Valdesogo (2009) wordt een niet lineaire versie van het Capital
Asset Pricing Model geconstrueerd door middel van een C-vine. De Canonical Vine Autoregressive (CAVA) wordt hierbij toegepast op de wekelijkse rendementen van 95 S&P500
aandelen. De assumpties die worden gemaakt in het het CAVA model zijn te beperkend en
daarom werd in Brechmann (2013) het model aangepast tot het Regular Vine Market Sector
model (RVMS). Aan de hand van een reguliere vine wordt de afhankelijkheid beschreven
van de Euro Stoxx 50, dit wordt dan gebruikt voor het opsplitsen van het systematisch en
specifiek risico van elk aandeel. Het model laat ook toe, zowel op een passieve als op een
actieve manier, een portfolio te beheren, hiervoor moet de dagelijkse Value-at-Risk worden
voorspeld.
In sectie 5.2 past men het Regular Vine Market Sector model toe op de BEL 20 index,
haar componenten en hun respectievelijke sectoren. Er wordt een soortgelijke analyse gedaan als voor de Euro Stoxx 50 in Brechmann (2013).
Tenslotte wordt in sectie 5.3 een reguliere vine geconstrueerd voor een portefeuille bestaande
59
HOOFDSTUK 5. EMPIRISCHE TOEPASSING
60
uit de componenten van de BEL 20 komende uit de financi¨ele sector. Aan de hand van de
Value-at-Risk-berekeningen voor de voorspelde portefeuille-rendementen wordt de reguliere
vine ge¨evalueerd.
Voor beide datsets heeft men gewerkt in R, er werd voornamelijk gebruik gemaakt van de
packages ’VineCopula’ (2013) en ’ccgarch’ (2014). Deze packages laten toe om de gepaste
copula-families en -parameters te schatten. Het bekomen van de vine-structuur werd wel
met de hand gedaan. Deze packages laten ook toe verschillende vines te vergelijken, te vereenvoudigen en de afhankelijkheden tijdsvari¨erend te maken. Doorheen het hoofdstuk zal
worden vermeld welke functies werden gebruikt in R om de resultaten te bekomen.
5.1
Case 1: Maandelijkse rendementen van 14 Europese landen, 1991-2014.
Voor Nederland, Belgi¨e, Frankrijk, Duitsland, Verenigd Koninkrijk, Itali¨e, Spanje, Oostenrijk, Ierland, Zweden, Zwitserland, Finland, Noorwegen en Denemarken construeerden E.
Fama en K. French waarde en groei portfolios. Dit deden ze aan de hand van vier ratio’s
die de waardering van een bedrijf bepalen. In elk land worden voor de bedrijven de book-tomarket, price-earnings, cash-earnings-to-price en dividend yield ratio’s berekend. Fama en
French hebben per land een portfolio opgesteld waarbij elk bedrijf naargelang zijn waarde
een bepaald gewicht toegekend krijgt. Voor deze portfolio’s werden de maandelijkse rendementen berekend. Deze data zijn beschikbaar op de website van K. French, professor aan
de Tuck School of Business, Dartmouth College. Men wenst een vine copula te construeren
die de afhankelijkheden tussen de maandelijkse rendementen vanaf januari 1991 tot en met
december 2013 correct beschrijft.
5.1.1
Marginale modellen
De dataset voor de Europese landen bestaat uit T = 276 observaties en n = 14 variabelen.
Deze observaties zijn samengevat in Tabel 5.1.
Men ziet dat de eigenschappen besproken in hoofdstuk 4 worden bevestigd in Tabel 5.1.
Voor bijna alle Europese landen wordt een negatieve skewness vastgesteld en ook een hoge
kurtosis. Aan de hand van de dichtheidsfunctie kan men ook duidelijk zien dat de verdeling
piekt in nul en dat de verdeling zware staarten heeft. De staart is zwaarder voor negatieve
rendementen dan voor positive rendementen, zoals kan gezien worden in Figuur 5.1. Hetzelfde patroon wordt ook waargenomen voor de andere Europese landen. Men kan aannemen
HOOFDSTUK 5. EMPIRISCHE TOEPASSING
mean
ned 1.01
bel 0.93
fra 0.93
dui 0.91
vk
0.82
ita 0.72
spa 0.96
oos 0.72
ier
0.99
zwe 1.25
zwi 1.05
fin
1.34
noo 1.05
den 1.03
sd
5.88
5.41
5.83
6.15
4.71
7.23
6.72
6.5
6.69
7.33
4.78
8.91
7.37
5.68
min
-29.19
-30.37
-21.9
-23.30
-19.91
-23.72
-22.86
-34.63
-23.44
-27.56
-15.09
-28.99
-30.82
-25.06
max
16.71
16.68
15.04
21.99
14.12
21.22
21.14
19.43
35.76
25.17
13.21
30.83
19.34
18.11
61
skew kurtosis
-0.98
3.13
-1.05
4.30
-0.45
0.73
-0.51
1.51
-0.35
1.36
0.05
0.28
-0.18
0.73
-0.84
3.64
0.07
3.28
-0.21
1.07
-0.56
0.81
0.09
0.9
-0.69
2.08
-0.62
1.72
Tabel 5.1: Beschrijvende statistieken van de rendementen van de 14 Europese landen
dat dezelfde eigenschappen worden waargenomen voor de residuen van elk land.
Figuur 5.1: Geschatte dichtheidsfunctie voor de rendementen van Belgi¨e
Alvorens een reguliere vine te gaan construeren moeten eerst de marginale tijdreeksen
correct worden gemodelleerd. Voor elke land wordt een ARMA(p,q)-GARCH(1,1) proces
HOOFDSTUK 5. EMPIRISCHE TOEPASSING
62
toegepast op de tijdreeks. De parameters van het ARMA-GARCH proces voor elk land
worden gegeven in Bijlage A.1. Het ARMA proces laat toe om seri¨ele correlatie te verwijderen uit de observaties. Aan de hand van het GARCH(1,1) model wordt voor het land een
volatiliteit geconstrueerd dat varieert met de tijd. In Figuur 5.2 wordt de geschatte {σt }t∈T
weergegeven voor Belgi¨e, hier is de financi¨ele crisis die begon in 2007 duidelijk te merken.
Figuur 5.2: Tijdsvari¨erende volatiliteit voor de rendementen van Belgi¨e
Tenslotte worden op de gestandardiseerde residuen van het ARMA-GARCH proces de
rangen toegepast om de gewenste stationaire en uniform verdeelde observaties te bekomen
voor elk land. Er wordt nu een reguliere vine geconstrueerd op basis van deze pseudoobservaties volgens de methodologie besproken in sectie 4.2.
HOOFDSTUK 5. EMPIRISCHE TOEPASSING
63
Figuur 5.3: Transformatie naar uniform verdeelde tijdreeks
Voor het schatten van de juiste ARMA-GARCH tijdreeksmodellen en het construeren van
de residuen en volatiliteit wordt gebruik gemaakt van de packages timeseries, forecast
en fGarch. Aan de hand van de functie auto.arima wordt de graad van het ARMA proces
bepaald en vervolgens door garchFit toe te passen op de tijdreeks krijgt men de geschatte
parameters, de residuen en de volatiliteit. Op de residuen wordt dan de empirische cumulatieve verdelingsfunctie toegepast ecdf om de pseudo observaties te bekomen.
5.1.2
Vine constructie
Voor elk paar variabelen wordt de Kendall’s tau bepaald om na te gaan welke landen de sterkste afhankelijkheid hebben. In R gebruikt men hiervoor de functies Kendall of TauMatrix
en wordt de Maximum Spanning Tree met de hand geconstrueerd. Het idee is om de sterkste afhankelijkheden te beschrijven in de eerste boom omdat deze meestal de belangrijkste
afhankelijkheden zijn om accuraat te modelleren. Er wordt nu sequentieel te werk gegaan;
per boom wordt aan de hand van het Prim’s algoritme nagegaan welke boomstructuur een
maximale som van paarsgewijze afhankelijkheden met zich meebrengt. Voor elke boog in
de geconstrueerde boom wordt een selectie en een maximum likelihood schatting van de bivariate copula-families gedaan. In R gebeurt dit aan de hand van de functie BiCopSelect.
Als mogelijke copula-families worden enkel de paar-copula’s besproken in secties 2.2 en 2.3
toegelaten. Vervolgens worden de observaties voor de volgende boom berekend aan de hand
van (3.4). Aangezien de observaties in de vorige boom uniform verdeeld zijn kan voor elke
familie een expliciete formule gevonden worden voor deze observaties, dit wordt de h-functie
genoemd,
h(u1 , u2 , θ) = F (u1 |u2 ) =
∂Cθ (u1 , u2 )
∂u2
HOOFDSTUK 5. EMPIRISCHE TOEPASSING
64
Deze h-functies worden in R berekend met de functie BiCopHfunc en de copula wordt zowel
afgeleid naar de eerste variabele als naar de tweede variabele, op basis van de vorige boom
wordt dan onderzocht welke men nodig heeft. In Heinen & Valdesogo (2009) wordt voor de
verschillende copula families de h-functie gegeven als volgt :
Gaussiaanse copula:
−1
h(u1 , u2 , ρ) = Φ(2)
ρ
−1
Φ (u1 ) − ρΦ (u2 )
p
1 − ρ2
!
student t copula:

(2)
t−1
ν (u1 )
h(u1 , u2 , ρ, ν) = tν+1  q
−
ρt−1
ν (u2 )
2
2
(ν+(t−1
ν (u2 )) )(1−ρ )


ν+1
Clayton copula:
−1− θ1
−θ
h(u1 , u2 , θ) = u−θ−1
u−θ
2
1 + u2 − 1
Gumbel copula:
h(u1 , u2 , θ) = Cθ (u1 , u2 )
1 −1
1
(− log(u2 ))θ−1 (− log(u1 ))θ + (− log(u2 ))θ θ
u2
Frank copula:
(e−θu1 − 1)(θe−θu2 )
h(u1 , u2 , θ) =
θ((e− − 1) + (e−θu1 − 1)(e−θu2 − 1))
Naargelang met welke andere bogen een bepaalde top verbonden was in de vorige boom, zal
de paar-copula C(u1 , u2 ) afgeleid worden naar u1 en/of u2 . Aan de hand van de bekomen
observaties worden opnieuw voor elk paar toppen waartussen een boog kan getrokken worden de Kendall’s tau berekend en een Maximum Spannig boom geconstrueerd. Dit wordt
herhaald voor de hele vine.
Het schatten van de copula parameters gebeurt aan de hand van een twee-staps maximum
likelihood. Voor elke paar-copula wordt een bivariate maximum likelihood schatting gedaan
voor het vinden van de juiste copula familie en de copula parameters. Nadat dit is gebeurd
voor elke copula in de vine worden deze schatters genomen als startwaarde voor het uitvoeren van een full maximum likelihood van de paar-copula parameters voor de volledige
paar-copula ontbinding. Dit gebeurt in R aan de hand van RVineMLE. De eerste boom van
de reguliere vine wordt weergegeven in Figuur 5.4 met voor elke boog de bijhorende paarcopula-familie. Nederland is het sterkst afhankelijk met de andere landen, alsook Frankrijk.
De figuren voor de tweede, derde en vierde boom in de reguliere vine worden gegeven in
HOOFDSTUK 5. EMPIRISCHE TOEPASSING
65
Bijlage A.1 alsook de scatterplots overeenstemmende met de bogen in de eerste boom. De
copula-familie en -parameters voor elke boog in de vine worden samengevat in matrices en
weergegeven in de bijlage.
Figuur 5.4: Structuur van de eerste boom in de reguliere vine
Ter verduideling van de boom constructie wordt het Maximum Spanning Tree-algoritme
uitgewerkt voor boom 3. Elke top in boom 3 komt overeen met een boog uit boom 2, die
op zijn beurt een paar-copula bepaalt. Twee toppen in boom 3 kunnen met elkaar verbonden worden indien de overeenstemmende bogen in boom 2 een top delen. In Figuur 5.5
(a) worden alle mogelijke bogen (op basis van de boomstructuur van boom 2) weergegeven
in stippelijnen. Er wordt een volle lijn getrokken indien uit een bepaalde top geen enkele
andere boog kan vertrekken (dit is het geval voor ”dui,fin|zwe”). Voor elk paar toppen dat
wordt verbonden door een boog, wordt de Kendall’s tau berekend voor de overeenkomstige
observaties. De observaties worden zo berekend dat toppen die worden verbonden door een
boog, dezelfde conditioning set hebben.
Bijvoorbeeld voor de boog die de toppen ”oos,ned|bel” en ”bel,dui|ned” verbindt, worden
de observaties gegeven door
F (uoos |ubel , uned ) =
∂Coos,ned|bel (F (uoos |ubel ), F (uned |ubel ))
∂F (uned |ubel )
F (udui |uned , ubel ) =
∂Cbel,dui|ned (F (ubel |uned ), F (udui |uned ))
,
∂F (ubel |uned )
en
HOOFDSTUK 5. EMPIRISCHE TOEPASSING
66
waarbij Coos,ned|bel en Cbel,dui|ned copula’s zijn uit boom 2. Voor het vinden van de juiste
boomstructuur wordt het Prim’s algoritme toegepast; de boog met de grootste Kendall’s tau
in absolute waarde wordt toegevoegd aan de graaf, vervolgens wordt uit ´e´en van de bereikte
toppen opnieuw de boog gekozen met de grootste Kendall’s tau waarde zonder dat hierdoor
een cyclus wordt gevormd. Dit wordt herhaald totdat elke top verbonden is met minstens
´e´en andere top. De boomstructuur die wordt bekomen voor boom 3 wordt weergegeven in
Figuur 5.5 (b).
Figuur 5.5: (a) Alle mogelijke bogen in boom 3 met overeenkomstige Kendall’s tau, (b) de
bekomen boomstructuur door het toepassen van het Prim’s algoritme.
De bekomen reguliere vine-structuur wordt gegeven in onderstaande matrix,

8
12

6

7

13

5

3

9

10

14

11

4

1
2

12
11
9
2
7
13
5
14
6
3
1
4
10



11


6 6


7 9 9


13 2 7 7


5 7 13 2 2
,

3 13 5 14 13 13


9 5 3 10 5 14 14


10 14 10 4 3 10 5 5


14 10 14 1 10 4 3 10 10


2 4 4 13 14 1 10 4 3 3

4 1 2 5 4 3 4 1 1 4 4 
1 3 1 3 1 5 1 3 4 1 1 1
waarbij de landen overeenkomen met een nummer van 1 tot 14:
HOOFDSTUK 5. EMPIRISCHE TOEPASSING
1
2
3
4
5
Nederland 6
Belgi¨e
7
8
Frankrijk
Duitsland 9
10
VK
67
Itali¨e
Spanje
Oostenrijk
Ierland
Zweden
11
12
13
14
Zwitserland
Finland
Noorwegen
Denemarken
Als men kijkt naar het aantal paar-copula’s van een copula-familie binnen een bepaalde
boom, zoals weergegeven in Tabel 5.2, ziet men dat na de eerste bomen het aantal onafhankelijke copula’s toeneemt en bijgevolg de complexiteit daalt in hogere-orde bomen. Hiermee
wordt bevestigd dat de sterkste afhankelijkheden zich bevinden in de eerste bomen van de
reguliere vine.
T1
T2
T3
T4
T5
T6
T7
onafh.
0
2
4
7
4
6
6
gauss.
0
0
2
1
1
0
0
student t
8
1
3
0
0
1
0
clayton
3
3
0
1
2
0
1
gumbel
0
0
0
0
1
0
0
frank
2
6
2
1
1
1
0
Tabel 5.2: Per boom het aantal paar-copula’s binnen een bepaalde familie
Hetzelfde wordt gedaan voor het bekomen van een C-vine, een D-vine en een reguliere vine
zonder voorafgaande onafhankelijkheidstest. Dit gebeurt aan de hand van hun respectievelijke vine-constructie-algoritmes die werden besproken in sectie 4.2.1. Voor de C-vine heeft in
de eerst boom Nederland de grootste som van Kendall’s tau waarden (8.29) en wordt het dus
gekozen als hoofd-top. Het verschil met Frankrijk (8.22) of Duitsland (8.06) als hoofd-top
zijn niet groot waardoor kan worden besloten dat de data geen duidelijke factor ontbinding heeft. De opeenvolgende hoofd-toppen in de C-vine zijn ”ned,spa”, ”spa,zwe|ned”,
”bel,zwe|ned,spa”, ”bel,vk|ned,spa,zwe”, ”fra,vk|ned,spa,zwe,bel”,
”fra,den|ned,spa,zwe,bel,vk”, ”oos,den|ned,spa,zwe,bel,vk,fra”,
”oos,fin|ned,spa,zwe,bel,vk,fra,den”, ”zwi,fin|ned,spa,zwe,bel,vk,fra,den,oos”,
”dui,zwi|ned,spa,zwe,bel,vk,fra,den,oos,fin” en ”dui,ita|ned,spa,zwe,bel,vk,fra,den,oos,zwi”.
Voor de D-vine volgt de hele vine structuur uit de structuur van de eerste boom. Met
de sterkste afhankelijkheid tussen Nederland en Frankrijk. De D-vine wordt gegeven in Figuur 5.6. Voor de C-vine en de D-vine worden de matrices met de copula-structuur, -families
HOOFDSTUK 5. EMPIRISCHE TOEPASSING
68
en -parameters gegeven in Bijlage A.1.
Figuur 5.6: Structuur van de eerste boom van de D-vine
5.1.3
Vergelijken van de reguliere vines, de C-vine en de D-vine
Gebruikmakend van de functies RVineGofTest, RVineVuongTest, RVineAIC, RVineLogLik
en rowSums(abs(RVinePar2Tau(Rvine)),n,n) kunnen de verschillende vines met elkaar
worden vergeleken in R.
De Blanket Goodness-of-Fit test wordt toegepast op de vier vines die werden geconstrueerd en voor geen enkele van de vines wordt de nulhypothese verworpen. Zodat elke vine een
goede beschrijving geeft van de afhankelijkheid, maar welke geeft de beste fit? De verschillende vines worden vergeleken in tabel 5.3, waarbij ’R-vine F’ staat voor de reguliere vine
zonder product copula’s. Dit wil zeggen dat er geen onafhankelijkheidstest wordt toegepast
alvorens een paar-copula-familie wordt geselecteerd.
Men merkt op dat het aantal copula’s dat voorkomt in de vine het laagst is voor de reguliere
vine. Omdat de reguliere vine zo geconstrueerd is dat de afhankelijkheden in de eerste boom
het sterkst zijn, zullen in hogere bomen de toppen sneller onafhankelijk zijn en bijgevolg
meer product copula’s opleveren. De reguliere vine heeft enkel in de eerste, de vijfde, de
achtste en de tiende boom een superieure Kendall’s tau-som ten opzichte van de C-vine. Dit
verklaart ook waarom zowel de AIC-waarde als de BIC-waarde kleiner zijn voor de C-vine als
voor de reguliere vine. Hetzelfde wordt vastgesteld voor de likelihood. Wat de reguliere vine
HOOFDSTUK 5. EMPIRISCHE TOEPASSING
69
R-vine
C-vine
D-vine R-vine F
# paar-copula’s
44
51
54
91
P
|τ | boom 1
7.32
6.92
6.72
7.32
AIC
-3988.85 -4039.51 -3924.99 -4028.79
BIC
-3782.49 -3825.91 -3707.77 -3641.41
likelihood
2051.53 2085.02 2035.86 2129.22
Tabel 5.3: Vergelijking van de verschillende vines
zonder product copula’s betreft, bezit deze een betere AIC-waarde en likelihood maar op
basis van de BIC-waarde wordt deze afgestraft voor het groter aantal te schatten parameters
(dubbel zoveel als voor de gewone reguliere vine).
De Vuong test wordt uitgevoerd voor het vergelijken van de niet genestelde modellen. De
bekomen statistieken worden vergeleken met het quantiel Φ−1 (0.975) = 1.96. Zodat een
bepaalde vine kan verkozen worden boven de andere met beslissingsniveau α = 0.05. De
resultaten worden samengevat in Tabel 5.4.
test statistiek
test statistiek - AIC
test statistiek - Schwarz
p-waarde
p-waarde - AIC
p-waarde - Schwarz
R- en C-vine
-1.045
-0.969
-0.83
0.29
0.33
0.41
D- en C-vine
-2.152
-2.191
-2.26
0.03
0.03
0.02
R- en D-vine
1.013
1.118
1.308
0.31
0.26
0.19
R- en R-vine F
-3.808
-1.086
3.839
0.00
0.27
0.00
Tabel 5.4: Vuong test tussen de verschillende vines
Enkel bij het vergelijken van de D-vine en de C-vine wordt de nulhypothese verworpen. De
C-vine is beter dan de D-vine aangezien de test statistiek kleiner is dan −Φ(0.975). Tussen
de reguliere vine en de C-vine kan geen significant onderscheid worden gemaakt, al geeft de
negatieve waarde van de test statistiek aan dat de C-vine lichtjes beter is dan de reguliere
vine. Hiermee wordt bevestigd wat werd afgeleid uit tabel 5.3. Hetzelfde kan gezegd worden
voor de reguliere vine en de D-vine, waar ditmaal de positieve waarde van de test statitiek
aangeeft dat de reguliere vine lichtjes beter is. Bij het vergelijken van de reguliere vine met
zijn tegenhanger in het geval geen product copula’s worden toegelaten, zal de beslissing afhangen van hoe sterk het aantal te schatten parameters wordt afgestraft. Indien de Vuong
HOOFDSTUK 5. EMPIRISCHE TOEPASSING
70
test statistiek wordt geconstrueerd zonder correctie voor het aantal te schatten parameters,
wordt duidelijk de reguliere vine zonder voorafgaande onafhankelijkheidstest verkozen boven de reguliere vine met voorafgaande onafhankelijkheidstest. Indien de Schwarz correctie
wordt doorgevoerd op de test statistiek geldt het tegenovergestelde. De keuze tussen de
reguliere vine met product copula’s en deze zonder product copula’s zal afhangen van de
afweging die wordt gemaakt door de beslissingsnemer tussen de likelihood en het aantal te
schatten parameters.
5.1.4
Snoeiing en vereenvoudiging van de reguliere vine
Er wordt onderzocht of vanaf een bepaald boomniveau kan worden gesnoeid. Dit wil zeggen
dat vanaf een bepaalde boom voor alle bogen een product copula wordt genomen. Er wordt
dus verondersteld dat de toppen in de hogere bomen onafhankelijk zijn. In R gebeurt dit
door in de geconstrueerde vine een trunclevel te kiezen in de funtcie RVineCopSelect.
Aangezien men voor het bepalen van het snoeiingsniveau genestelde modellen gaat vergelijken, wordt beslist op basis van de AIC- en BIC-waarde van de gesnoeide reguliere vine. Voor
elk boomniveau wordt een gesnoeide reguliere vine geconstrueerd en vervolgens worden de
AIC- en BIC-waarden van opeenvolgende snoeiingsniveau’s met elkaar vergeleken. Voor de
reguliere vine die werd geconstrueerd in sectie 5.1.2 wordt noch op basis van de AIC-waarde
noch op basis van de BIC-waarde gesnoeid vanaf een bepaald niveau. Voor elke boom die
wordt toegevoegd in de reguliere vine geldt dat de winst aan likelihood superieur is aan de
kost voor het schatten van de copula-parameters in die boom. Dit is geen verrassing aangezien in de eerste bomen de sterkste afhankelijkheden zijn beschreven en vanaf de vierde
boom voor meer dan de helft van de paar-copula’s de product copula wordt gebruikt.
Daarom wordt hetzelfde gedaan maar ditmaal voor de reguliere vine zonder product copula’s. De BIC-waarden van de opeenvolgende modellen worden weergegeven in Tabel 5.5.
Men ziet dat het toevoegen van de vierde boom geen significante meerwaarde geeft aan de
gesnoeide reguliere vine (het verschil tussen de BIC-waarden van tRV(4) en tRV(3) is positief). Hetzelfde geldt voor het toevoegen van de zesde boom. Aangezien snoeiing vanaf
boom 6 een beter resultaat geeft dan snoeiing vanaf boom 4, wordt de gesnoeide reguliere
vine tRV(5) verkozen.
Op basis van de Vuong test met Schwarz correctie wordt de volledige reguliere vine verworpen
ten voordele van de gesnoeide reguliere vine tRV(5). Voor de Vuong test met AIC-correctie
of de gewone Vuong test geldt het tegenovergestelde en wordt de volledige reguliere vine
HOOFDSTUK 5. EMPIRISCHE TOEPASSING
snoeiingsniveau
tRV(1)
tRV(2)
tRV(3)
tRV(4)
tRV(5)
tRV(6)
71
BIC-waarde
-3339.40
-3598.43
-3687.79
-3673.09
-3697.98
-3683.36
Tabel 5.5: BIC-waardes voor de verschillende snoeiingsniveau’s
verkozen. Dit betekent dat op basis van de test statistiek met AIC correctie er nog significante afhankelijkheden zijn waar te nemen na de vijfde boom. Als men gaat kijken naar
de Kendall’s tau waarden van de verschillende bogen in hogere bomen worden er nog sterke
afhankelijkheden waargenomen tussen onder meer VK en Ierland conditioneel op Nederland,
Belgi¨e, Frankrijk, Duitsland, Zweden en Denemarken in boom 7 en ook nog tussen Spanje en
Itali¨e conditioneel op Nederland, VK, Frankrijk, Duitsland, Zweden, Denemarken en Noorwegen in boom 8.
Een soortgelijke analyse wordt herhaald voor het vinden van een gepast vereenvoudigingsniveau. In dit geval worden niet-genestelde modellen met elkaar vergeleken, waardoor er wordt
gewerkt met de Vuong test voor het vergelijken van de verschillende vereenvoudigde reguliere vines. Bij een vereenvoudigde vine worden alle paar-copula’s vanaf een bepaalde boom
vervangen door Gaussiaanse copula’s. Bij het vergelijken van de modellen wordt gewerkt
met de test statistiek met AIC correctie. Vanaf het ogenblik dat de absolute waarde van
de test statistiek voor opeenvolgende vereenvoudigingsniveau’s kleiner is dan 1.96, betekent
dit dat de nulhypothese niet kan worden verworpen. Het toevoegen van een extra boom
met paar-copula’s verschillend van de Gaussiaanse copula heeft in dat geval geen significante
meerwaarde. De test statistieken met overeenstemmende p-waarden worden gegeven in Tabel 5.6.
snoeiingsniveau
sRV(1) en sRV(2)
sRV(2) en sRV(3)
sRV(3) en sRV(4)
test statistiek - AIC
-3.799
-2.144
-1.235
p-waarde verkozen model
0.00
sRV(2)
0.03
sRV(3)
0.22
sRV(3)
Tabel 5.6: Vuong test statistieken voor het bepalen van het vereenvoudigingsniveau
HOOFDSTUK 5. EMPIRISCHE TOEPASSING
72
Er kan geen significante keuze gemaakt worden tussen sRV(3) en sRV(4), waardoor het
toevoegen van een vierde boom geen significante meerwaarde geeft aan de vereenvoudigde
reguliere vine op niveau 3. De vine wordt dus vereenvoudigd vanaf boom 4.
5.1.5
Multivariate student t copula
Voor elk boog in de eerste boom van de D-vine worden de parameters voor een bivariate
student t copula geschat aan de hand van een bivariate Maximum likelihood schatting. Het
aantal vrijheidsgraden voor elk paar variabelen worden weergegeven in onderstaande tabel.
ν
Cier,den
8.19
Cden,noo
7.7
Cnoo,f in
13.9
Cf in,zwe
6.7
Czwe,dui
6.9
Cdui,ned
6.6
ν
Cf ra,vk
4.4
Cvk,spa
5.8
Cspa,ita
4.3
Cita,bel
5.2
Cbel,zwi
10.3
Czwi,oos
12
Cned,f ra
6.3
Men stelt vast dat het aantal vrijheidsgraden sterk varieert voor de verschillende paren
in de D-vine. Dit doet vermoeden dat een gemeenschappelijk aantal vrijheidsgraden die de
afhankelijkheid correct beschrijft voor elk mogelijk paar variabelen, zoals wordt verondersteld
in de multivariate student t copula, geen goede benadering zou zijn. Dit geeft aan dat een
multivariate student t copula met ´e´en enkele parameter voor het aantal vrijheidsgraden geen
gepast model zou zijn voor het modelleren van de afhankelijkheid tussen de 14 Europese
landen. De vine-copula is hiervoor een goed alternatief, daar deze die flexibiliteit wel correct
kan modelleren. Tenslotte wenst men na te gaan of de paar-copula’s in de paar-copula
ontbinding vari¨eren met de tijd.
5.1.6
Dynamische paar-copula’s
Zoals vermeld in Heinen & Valdesogo (2011) kunnen de parameters van de copula vari¨eren
met de tijd en wordt dit vooral waargenomen in de eerste boom. Daarom wordt voor de paarcopula’s van de eerste boom van onze reguliere vine onderzocht of de copula-parameters varieren met de tijd. Aangezien er geen expliciete uitdrukking is voor de Frank copula-parameter
in functie van de Kendall’s tau, wordt voor de bogen ”zwi-ned” en ”fra-spa” opnieuw een
paar-copula geschat waarbij de Frank copula wordt uitgesloten. Voor beide paren wordt dan
een student t copula geslecteerd. De eerste boom van de reguliere vine bestaat dan enkel uit
student t en Clayton copula’s.
De huidige uniform verdeelde pseudo-observaties worden getransformeerd naar standaard
normaal verdeelde observaties door het toepassen van de normaal quantiel functie, qnorm.
HOOFDSTUK 5. EMPIRISCHE TOEPASSING
73
Voor deze wordt, aan de hand van het DCC model besproken in sectie 4.5.1, een tijdsvari¨erende correlatie parameter geconstrueerd gebruikmakend van de functies garchFit en
dcc.estimation. Voor elk paar variabelen in de eerste boom van de reguliere vine wordt
de tijdsvari¨erende Kendall’s tau bekomen gebruikmakend van Eigenschap 4.1. Ze worden
weergegeven in Figuur 5.7.
Voor de meeste plots is een gezamenlijk patroon te merken in de paarsgewijze afhankelijkheid. Voor de periode rond 1997 is voor de meeste paren een daling waar te nemen in de
Kendall’s tau waarde. Dit is te wijten aan de sterke economische groei die er dat jaar was.
De Stoxx Europa 600 zette in dat jaar de langste rij plusmaanden neer tot op heden. In
De Nederlandse economie - 1997 wordt de economsiche situatie beschreven voor Nederland
in het jaar 1997. De sterke stijging van de consumptie door huishoudens, een algemeen
proces van internationalisering, investeringen en beleggingen in het buitenland met een hoog
rendement en een sterk groeiende werkgelegenheid zorgde ervoor dat Nederland in 1997 een
sterke economische groei kende. Ook Wall Street kende toen zijn beste jaar tot op heden.
Doordat de economie in Europa het in dat jaar zo goed deed zorgde dit ervoor dat de afhankelijkheid tussen de verschillende landen laag was. Een tweede merkbare trend is het
tegengestelde effect. Door de stagnerende huizenmarkt in de Verenigde Staten kwamen in
2007 veel financi¨ele instellingen in de problemen, hierdoor ontstond een financi¨ele crisis.
Deze kredietcrisis waaide over naar Europa en de economie deed het in de periode vanaf
2007 heel slecht. Verschillende banken werden genationaliseerd of overgenomen en in 2010
kwamen ook een aantal overheden in de problemen. In slechte economische tijden gaat de
afhankelijkheid tussen de aandelen altijd stijgen. Ook hier ziet men dat de afhankelijkheid
tussen de Europese landen dan het sterkst is en de hoge Kendall’s tau waarden na 2007
bevestigen dit fenomeen. De schommelingen van de Kendall’s tau doorheen de jaren geven
aan dat het gebruik van dynamische paar-copula’s in de eerste boom nodig zijn.
5.2
Case 2: Dagelijkse rendementen BEL 20 componenten met respectievelijke sectoren, 2006-2014.
Aan de hand van een reguliere vine kan een factor model worden geconstrueerd voor de
rendementen van aandelen in een bepaalde markt. Het Regular Vine Market Sector model
wordt hier toegepast voor de Belgische markt-index en haar componenten.
De BEL20 is de nationale index van Belgi¨e en is de leidende index voor Euronext Brussel. Ze is van start gegaan in 1991 en wordt elk jaar in maart aangepast naargelang de
HOOFDSTUK 5. EMPIRISCHE TOEPASSING
Figuur 5.7: Tijdsvari¨erende Kendall tau voor de paren variabelen in boom 1
74
HOOFDSTUK 5. EMPIRISCHE TOEPASSING
75
liquiditeit, verhandelbaarheid en vrije marktkapitalisatie van haar componenten. Voor de
analyse die men in dit hoofdstuk zal doen, wordt de samenstellingen van de BEL 20 index
genomen zoals deze is sinds maart 2014, waarbij de aandelen die nog niet op de Brusselse
beurs waren in 2006 worden weggelaten. Dit zijn de aandelen van Ageas, Delta Lloyd en
BPost. De overblijvende aandelen worden samengevat in Tabel 5.7 met hun respectievelijke
sector en gewicht. De componenten van de BEL20 worden ook kort toegelicht in Bijlage A.2.
aandeel
sector
Gewicht
AB Inbev
Consumenten goederen 12.26 %
Ackermans & van Haaren Financi¨en
2.36 %
Befimmo
Financi¨en
0.95 %
Bekaert
Indistriueel
1.26 %
Belgacom
Telecommunicaties
3.84 %
Cofinimmo
Financi¨en
1.62 %
Colruyt
Consumenten diensten 3.34 %
Delhaize
Consumenten diensten 5.82 %
d’Ieteren
Consumenten diensten 0.96 %
Elia
Nutsbedrijven
1.11 %
GBL
Financi¨en
6.43 %
GDF Suez
Nutsbedrijven
11.86 %
KBC
Financi¨en
11.66 %
Solvay
Basis materialen
7.47 %
Telenet
Consumenten diensten 2.65 %
UCB
Gezondheidszorg
8.26 %
Umicore
Basis Materialen
4.31 %
Tabel 5.7: Componenten BEL 20
De data voor de aandelenkoers van de BEL20-componenten werd gehaald van de site
wwww.euroinvestor.com, deze geeft ook voor elk aandeel mee tot welke sector het behoort.
Op de site wwww.stoxx.com kunnen voor de Eurozone sector indices gevonden worden, deze
zullen gebruikt worden voor het opstellen van het RVMS model, zie bijlage A.2 voor meer
informatie. De dataset bestaat dus uit n = 23 variabelen en T = 2030 observaties.
HOOFDSTUK 5. EMPIRISCHE TOEPASSING
5.2.1
76
Regulare Vine Market Sector model
Alvorens het model te bespreken, worden de modellen waarop het RVMS model verder bouwt
kort samengevat en de veronderstellingen aangehaald die het RVMS model wilt versoepelen.
Capital Asset Pricing Model: Het CAPM is een factor model dat werd ingevoerd in
de jaren 60 door Sharpe en Lintner voor het weergeven van het verwachte rendement van
een aandeel in een markt. Het CAPM zegt dat de rendementen kunnen verklaard worden aan
de hand van ´e´en factor, namelijk het markt-rendement. Deze lineaire relatie wordt gegeven
door,
ri,t = βi rM,t + i,t ,
waarbij i,t de specifieke error-term op tijdstip t is en βi de sensitiviteit van het aandeel i
ten opzichte van de markt. Er wordt verondersteld dat de rendementen van de aandelen,
het markt-rendement en de specifieke error-termen gezamenlijk normaal verdeeld zijn. De
specifieke error-term voor een aandeel is onafhankelijk van de error-termen van de andere
aandelen en zijn onafhankelijk met de tijd. De afhankelijkheid tussen de rendementen wordt
gemeten aan de hand van de correlatieco¨effici¨ent. In het CAPM hangt de verwachte opbrengst niet af van het totale risico maar enkel van het risico dat samenhangt met de markt.
In dit model wordt het specifieke risico van een aandeel niet vergoed.
Canonical Vine Autoregressive: In Heinen & Valdesogo (2009) wordt een niet-normaal
en niet-lineair alternatief gegeven voor het CAPM. Aan de hand van een C-vine wordt de
afhankelijkheid tussen de rendementen van de aandelen, de sectoren en de markt beschreven. In dit model wordt verondersteld dat elk aandeel-rendement afhangt van de markt en
de sector tot hetwelke het behoort. De verschillende paar-copula’s laten toe dat de afhankelijkheid niet-lineair en assymetrisch kan zijn. Er wordt verondersteld dat conditioneel op
de markt, de aandelen onafhankelijk zijn van de rendementen van de andere sectoren buiten
hun eigen sector en ook dat de sectoren onafhankelijk zijn conditioneel op de markt. Voor de
overige afhankelijkheid conditioneel op de markt en de sectoren wordt er verondersteld dat
de rendementen gezamenlijk normaal verdeeld zijn en dus worden beschreven aan de hand
van een multi-dimensionale Gaussiaanse copula. Voor de constructie van de vine wordt er
in de eerste boom de markt als hoofd-top genomen, vervolgens worden achtereenvolgend de
verschillende sectoren genomen als hoofd-top.
Ter verduidelijking van het CAVA model wordt, zoals in Brechmann (2013), de paar-copula
ontbinding van de gezamenlijke dichtheidsfunctie, f (r11 , r21 , r12 , r22 , rS1 , rS2 , rM ), gegeven
voor de rendementen van vier aandelen r11 , r21 , r12 en r22 behorende tot twee sectoren, S1 en
HOOFDSTUK 5. EMPIRISCHE TOEPASSING
77
S2 , en een markt M . Wegens de onafhankelijkheidsveronderstellingen geldt dat c2i ,S2 |M,S1 =
c2i ,S2 |M voor i ∈ {1, 2}. De paar-copula dichtheden, c11 ,S2 |M , c12 ,S2 |M , c21 ,S1 |M , c22 ,S1 |M , c11 ,S1 |M
en cS1 ,S2 |M zijn allemaal gelijk aan 1. Dit geeft dan de volgende paar-copula ontbinding:
f
= f (r11 )f (r21 )f (r12 )f (r22 )f (rS1 )f (rS2 )f (rM )
×c11 ,M (F (r11 ), F (rM ))c12 ,M (F (r12 ), F (rM ))
×c21 ,M (F (r21 ), F (rM ))c22 ,M (F (r22 ), F (rM ))
×cS1 ,M (F (rS1 ), F (rM ))cS2 ,M (F (rS2 ), F (rM ))
×c11 ,S1 |M (F (r11 |rM ), F (rS1 |rM ))c12 ,S1 |M (F (r12 |rM ), F (rS1 |rM ))
×c21 ,S2 |M (F (r21 |rM ), F (rS2 |rM ))c22 ,S2 |M (F (r22 |rM ), F (rS2 |rM ))
×c11 ,12 ,21 ,22 |M,S1 ,S2 (F (r11 |rM , rS1 ), . . . , F (r22 |rM , rS2 ))
Regular Vine Market Sector: Het CAVA model wordt in Brechmann (2013) verder
uitgewerkt. Door te werken met een reguliere vine met minder strenge veronderstellingen
wordt het RVMS model bekomen. Het RVMS model is natuurlijk minder flexibel dan een
gewone reguliere vine maar vergemakkelijkt wel de interpretatie van de afhankelijkheden en
vereenvoudigt het model ook door de aandelen te verzamelen per sector. In dit model wordt
verwacht dat er sterke afhankelijkheden bestaan tussen de rendementen van de aandelen en
hun respectievelijke sectoren. In tegenstelling tot het CAVA model worden deze afhankelijkheden eerst gemodelleerd. In de tweede boom worden de afhankelijkheden van de aandelen
met de markt gemodelleerd, conditioneel op de respectievelijke sectoren. Voor de hogere
bomen worden de overige paar-copula’s gemodelleerd aan de hand van Gaussiaanse copula’s
waar de boomstructuur bepaald wordt door het vinden van de Maximum Spanning Tree in
elke boom. Het RVMS model komt dus overeen met een reguliere vine dat vereenvoudigd
wordt vanaf de derde boom. Net zoals in het CAVA model wordt verondersteld dat de de
sectoren onafhankelijk zijn conditioneel op de markt. In Brechmann (2013) wordt aangetoond dat dit model goed werkt en superieur is aan het CAVA model.
Voor de paar-copula ontbinding in het RVMS model geldt zoals bij het CAVA model dat
cS1 ,S2 |M = 1. Voor de eerste twee bomen wordt in Brechmann (2013) de paar-copula ontbinding gegeven als:
HOOFDSTUK 5. EMPIRISCHE TOEPASSING
78
c11 ,S1 (F (r11 ), F (rS1 ))c12 ,S1 (F (r12 ), F (rS1 ))
×c21 ,S2 (F (r21 ), F (rS2 ))c22 ,S2 (F (r22 ), F (rS2 ))
×cM,S1 (F (rM ), F (rS1 ))cM,S2 (F (rM ), F (rS2 ))
×c11 ,M |S1 (F (r11 |rS1 ), F (rM |rS1 ))c12 ,M |S1 (F (r12 |rS1 ), F (rM |rS1 ))
×c21 ,M |S2 (F (r21 |rS2 ), F (rM |rS2 ))c22 ,M |S2 (F (r22 |rS2 ), F (rM |rS2 ))
Men wenst nu het RVMS model toe te passen op de BEL20 index en haar componenten. De
koers en rendementen van de BEL20 index, de sectoren en de aandelen worden weergegeven
in Bijlage A.2. Hiervoor gaat men vijf sectoren onderscheiden. De sectoren die maar ´e´en keer
voorkomen in de BEL20 vormen samen de sector ”overige” door het gemiddelde te nemen
van de rendementen van de telecommunicatie sector, de consumenten goederen sector, de
industriele sector en de gezondheidszorgsector. De sectoren voor elk aandeel komen voor in
Tabel 5.7. De eerste twee bomen van het RVMS worden weergegeven in Figuur 5.8. In R
worden de eerste twee bomen geconstrueerd comform met het RVMS model en vanaf boom
3 wordt dan opnieuw het Maximum Spanning Tree-algoritme toegepast zoals besproken in
sectie 5.1. De scatterplots overeenstemmende met de bogen uit boom 1 worden gegeven
in Bijlage A.2. Wegens de onafhankelijkheidsassumpties maakt het niet uit welke sectoren
conditioneel op de BEL20 met elkaar worden verbonden in boom 2.
Figuur 5.8: (a) Boom 1 en (b) boom 2 van RVMS-model voor de BEL20
De ’F’ staat voor de financi¨ele sector, ’C’ voor de consumenten diensten sector, ’N’ voor de
nutssector, ’B’ voor de basis materialen sector en ’O’ voor de overige sectoren die werden
HOOFDSTUK 5. EMPIRISCHE TOEPASSING
79
samengevoegd. In de eerste twee bomen wordt elke boog beschreven aan de hand van een
student t copula, behalve natuurlijk de bogen tussen de sectoren . De afhankelijkheid tussen
de financi¨ele sector en de BEL20 is het sterkst, ook voor de andere sectoren is het aantal
vrijheidsgraden van de student t copula relatief klein. Conditioneel op hun respectievelijke
sectoren hebben KBC, GBL, AB Inbev en UCB de sterkste afhankelijkheid met de BEL20,
dit is niet verrassend aangezien deze aandelen het sterkste doorwegen in de BEL20 index.
Vanaf de derde boom worden er nog beduidende afhankelijkheden waargenomen tussen de
aandelen en de andere sectoren. In de derde boom wordt voor elke boog, buiten deze tussen
Elia en de overige sectoren, de nulhypothese van de onafhankelijkheidstest verworpen. Dit
bevestigt dat de onafhankelijkheidsassumpties gemaakt in het CAVA model te streng zijn.
Aan de hand van het RVMS model kan nu voor elk aandeel het specifiek en systematisch
risico worden bepaald.
5.2.2
Systematisch en specifiek risico
Het risico van een aandeel kan opgesplitst worden in twee bijdragen. Een eerste bijdrage
is het specifiek risico , dit risico is eigen aan het aandeel en kan weggewerkt worden in een
portfolio door middel van diversificatie. Een tweede bijdrage is het systematisch risico , dit
komt overeen met het risico van een aandeel in de markt. Binnen de markt kan dit risico
niet worden verminderd aan de hand van diversificatie. Bij het al dan niet opnemen van
een aandeel in een portefeuille is men ge¨ınteresseerd in de meerwaarde risico - verwachte
rendement dat het aandeel zal hebben op de portefeuille. Daarvoor zal worden gekeken naar
het systematisch risico, het risico dat wordt toegevoegd aan de portefeuille bij het toevoegen
van het aandeel.
Figuur 5.9: Speciek en systematisch risico bij diversificatie
In het CAPM kan het specifiek en systematisch risico voor het rendement van een aandeel
HOOFDSTUK 5. EMPIRISCHE TOEPASSING
80
eenvoudig van elkaar worden gescheiden. Het risico van een aandeel i, σi2 , komt overeen met
de variantie van het rendement van het aandeel en wordt gegeven door
2
2
σi2 = βi2 σM
+ σi,
,
2
2
het specifiek risico. De simpliciteit
waarbij σM
de variantie is van het markt rendement en σi,
van deze formule is te danken aan de veronderstellingen die worden gemaakt betreffende de
rendementen zoals besproken in 5.2.1. Deze komen echter niet overeen met de realiteit. Het
CAPM veronderstelt een gezamenlijke normale verdeling voor de rendementen, een lineaire
relatie met het markt-rendement en dat de afhankelijkheid tussen het aandeel en de markt
kan samengevat worden in ´e´en parameter, namelijk de sensibiliteit βi .
In het RVMS model werden deze beperkingen weggewerkt en wenst men nu het specifiek
risico en systematisch risico voor elk aandeel te berekenen waarbij rekening wordt gehouden
met de complexe afhankelijkheid die er bestaat tussen de aandelen, de sectoren en de markt.
Voor het bepalen van de afhankelijkheid voor een aandeel i ten opzichte van zijn sector S,
de conditionele afhankelijkheid ten opzichte van de markt M en ten opzichte van de andere aandelen en sectoren ki1 , . . . , kim , wordt in Brechmann (2013) voor elke paar-copula,
Ci,kil |S,M,ki1 ,...,kil−1 , waarbij het aandeel i voorkomt in de conditioned set de overeenstemmende Kendall’s tau waarde, τi,kil |S,M,ki1 ,...,kil−1 , berekend. Het sector risico voor een aandeel
i wordt gegeven door
Ri,S =
|τi,S |
.
|τi,S | + τi,M |S + τi,ki1 |S,M + . . . + τi,kim |S,M,ki1 ,...,kim−1 De paren i, kil |S, M, ki1 , . . . , kil−1 , l ∈ {1, . . . , m}, worden bepaald door middel van de geconstrueerde vine structuur. De andere sectoren en aandelen waarmee het aandeel i voorkomt
in de conditioned set van een paar-copula in de paar-copula ontbinding worden weergegeven
door middel van kil , l ∈ {1, . . . , m}. De mate waarin het risico van een aandeel i wordt
bepaald door haar sector wordt gegeven door Ri,S . Indien dat Ri,S = 1 wordt het gedrag
van het aandeel volledig bepaald door de sector. Voor het bepalen van de risicomaat kan
ook gewerkt worden met een andere afhankelijkheidsgrootheid dan de Kendall’s tau maar in
deze toepassing wordt er gewerkt met τ . Hetzelfde kan gedaan worden voor het markt risico
conditioneel op de sector. Dit wil zeggen de mate waarin het risico van het aandeel wordt
bepaald door de markt maar waarbij alle afhankelijkheid ten opzichte van de sector wordt
verwijderd. Deze risicomaat wordt gegeven door de breuk
τi,M |S .
Ri,M |S =
|τi,S | + τi,M |S + τi,ki1 |S,M + . . . + τi,kim |S,M,ki1 ,...,kim−1 HOOFDSTUK 5. EMPIRISCHE TOEPASSING
81
Het systematisch risico wordt dan bepaald door de som te nemen van deze twee risicomaten,
Ri,Sj + Ri,M |Sj . Het specifiek risico voor het aandeel i is het overblijvende risico dat niet
wordt bepaald door de markt of de sector,
Ri, = 1 − Ri,S − Ri,M |S .
Dit wordt nu toegepast voor de BEL20 en haar componenten met hun sectoren. Voor elk
aandeel in de BEL20 wordt het risico berekend dat is bepaald door haar sector en door de
BEL20 index. Dit betekent dat in R voor elke boog waarbij het aandeel voorkomt in de
conditioned set de Kendall’s tau waarde wordt berekend. Hieruit wordt dan het specifiek
risico voor het aandeel berekend, de risico’s zijn samengevat in Tabel 5.8.
aandeel
Ri,S Ri,M |S
Ackermans & van Haaren 0.305 0.128
Befimmo
0.279 0.112
Cofinimmo
0.248 0.101
GBL
0.328 0.212
KBC
0.358 0.124
d’Ieteren
0.283 0.119
Colruyt
0.306 0.092
Delhaize
0.333 0.092
Telenet
0.35 0.134
Elia
0.192 0.114
GDF Suez
0.481 0.069
Umicore
0.369 0.135
Solvay
0.337 0.145
AB Inbev
0.283 0.186
Bekaert
0.307 0.135
Belgacom
0.323 0.086
UCB
0.4
0.136
systematisch risico
0.433
0.391
0.349
0.54
0.482
0.402
0.398
0.425
0.484
0.306
0.55
0.504
0.482
0.469
0.442
0.409
0.536
specifiek risico
0.567
0.609
0.651
0.46
0.518
0.598
0.602
0.575
0.516
0.694
0.45
0.496
0.518
0.531
0.558
0.591
0.464
Tabel 5.8: Systematisch en specifiek risico voor de componenten van de BEL20
Het systematisch risico is over het algemeen lager dan het specifiek risico. Dit wordt verklaard door de sterke afhankelijkheden die er bestaan tussen de verschillende aandelen zoals
bijvoorbeeld Cofinimmo en Befimmo of nog Colruyt en Delhaize. Voor GDF Suez ziet men
dat het risico in grote mate wordt bepaald door de nutssector en voor AB Inbev en GBL
heeft de BEL20 een relatief grote bijdrage in hun risico.
HOOFDSTUK 5. EMPIRISCHE TOEPASSING
5.3
82
Case 3: Value-at-Risk model evaluatie
Men beschouwt een portefeuille bestaande uit de componenten van de BEL20 die komen uit
de financi¨ele sector. Dit zijn KBC, GBL, Ackermans & van Haaren, Befimmo en Cofinimmo.
Hiervoor wordt op basis van de data van 2006 tot en met 2011 een reguliere vine geconstrueerd door opnieuw voor elke boom de Maximum Spanning Tree te construeren. Dezelfde
methode wordt toegepast als in 5.1. Men krijgt dat voor elke paar-copula in de ontbinding
de student t copula wordt geselecteerd. De eerste boom wordt gegeven in Figuur 5.10. De
scatterplots voor de hele vine worden gegeven in Bijlage A.3. Men wenst het geconstrueerd
vine copula-model te evalueren door op basis van de reguliere vine dagelijks een Value-atRisk-voorspelling te maken van het portfolio-rendement. Deze waarde wordt vergeleken met
het gerealiseerde portfolio-rendement zoals beschreven in sectie 4.6.
Figuur 5.10: Boom 1 van reguliere vine voor portefeuille
Op basis van de vorige 1515 observaties wordt voor elk aandeel-rendement een ARMA(p,q)GARCH(1,1) model toegepast en voor de bekomen residuen wordt vervolgens de bijhorende
skewed student t verdeling bepaald. Nadat deze residuen worden getransformeerd tot uniform verdeelde observaties worden voor de copula’s in de paar-copula ontbinding behorende
bij de geconstrueerde vine de parameters geschat.
Uit de reguliere vine wordt volgens sectie 4.6 (i) voor elk aandeel een observatie gesimuleerd. Door de inverse skewed student t verdeling toe te passen op deze observatie krijgt
men een simulatie voor de residuen van dit aandeel. Ook de volatiliteit wordt voorspeld
en aan de hand van de geschatte ARMA parameters wordt gebruikmakend van (4.1) het
log-rendement voorspeld voor de volgende dag. Deze voorspelling wordt toegevoegd aan de
HOOFDSTUK 5. EMPIRISCHE TOEPASSING
83
dataset en hetzelfde wordt elke dag herhaald rekeninghoudende met de bekomen voorspelling. Dit wordt 257 keer gedaan zodat voor elk aandeel in de portefeuille de rendementen
worden voorspeld voor het jaar 2012. Voor zowel de gerealiseerde als voor de voorspelde logrendementen wordt het portfolio-rendement berekend. Dit doet men door het gemiddelde te
nemen van de rendementen van de vijf aandelen.
Net zoals in Brechmann (2013) wordt op basis van de 900 vorige observaties voor elke verhandeldag in 2012 de 0.95 - VaR berekend voor de voorspelde portfolio rendementen. Deze
worden vervolgens vergeleken met de gerealiseerde rendementen zoals weergegeven in Figuur
5.11. De R-code overeenstemmende met deze sectie wordt gegeven in Bijlage A.3.
Figuur 5.11: VaR berekeningen en gerealiseerde log-rendementen
Over het hele jaar 2012 (257 observaties) worden er 14 hits waargenomen, dit wil zeggen dat
in 5.44 % van de gevallen de gerealiseerde rendementen de VaR voorspelling overschrijden
voor die dag. Dit komt ongeveer overeen met de gewenste α = 0.05. De likelihood ratio
test geeft een p-waarde van 0.7454388, waardoor kan besloten worden dat de nulhypothese,
die zegt dat er een correct aantal overschrijdingen hebben plaatsgevonden, niet kan worden
verworpen. Dit bevestigt dat de reguliere vine een goed model is voor het beschrijven van
de afhankelijkheid van de aandelen in de portefeuille en overeenkomt met de realiteit.
Bibliografie
[1] AAS K. en BERG D. Modeling dependence between financial returns using pair-copula
constructions. Dependence Modeling - Vine Copula Handbook, World Scientific Publishing Co., 305-328, 2011.
[2] AAS K., CZADO C., FRIGESSI A. en BAKKEN H. Pair-copula constructions of multiple dependence. Insurance: Mathematics and Economics 44, 182-198, 2009.
[3] BEDFORD T. en COOKE R.M. Probability density decomposition for conditionally
dependent random variables modeled by vines. Annals of Mathematics and Artificial
Intelligence 32, 245-268, 2001.
[4] BEDFORD T. en COOKE R.M. Vines - A new graphical model for dependent random
variables. The Annals of Statistics 30(4), 1031-1068, 2002.
[5] BERG D. en AAS K. Models for construction of multivariate dependence: A comparison
study. European Journal of Finance 15, 639-659, 2009.
[6] BRECHMANN C. Truncated and simplified regular vines and their applications. Diploma Thesis, Faculty of Mathematics, Technische Universit¨at M¨
unchen, Germany,
2010.
[7] BRECHMANN C., CZADO C. en AAS K. Truncated regular vines in high dimensions
with application to financial data. Canadian Journal of Statistics 40(1), 68-85, 2012.
[8] BRECHMANN C. en CZADO C. Risk management with high-dimensional vine copulas:
An analysis of the Euro Stoxx 50. Statistics & Risk Modeling 30(4), 307342, 2013.
[9] COOKE R.M., JOE H. en AAS K. Vines Arise. Dependence Modeling - Vine Copula
Handbook, World Scientific Publishing Co., 37-72, 2011.
[10] CZADO C. Pair-copula constructions of multivariate copulas. Copula Theory and Its
Applications, Springer-Verlag, 2010.
84
BIBLIOGRAFIE
85
[11] CZADO C., MIN A., BAUMANN T. en DAKOVIC R. Pair-copula constructions for
modeling exchange rate dependence. Technical report, Technische Universit¨at M¨
unchen,
2009.
[12] DENUIT M., DHAENE J., GOOVAERTS M. en KAAS R. Actuarial theory for dependent risks: measures, orders and models. Wiley Series, 2005.
[13] De Nederlandse economie - 1997. Centraal Bureau voor de statistiek, 1998.
[14] DIβMANN J., BRECHMANN C., CZADO C. en KUROWICKA D. Selecting and estimating regular copulae and application to financial returns. Computational Statistics
and Data Analysis 59, 52-69, 2013.
[15] ENGLE R. Dynamic conditional correlation - A simple class of multivariate GARCH
models. Journal of Business and Economic Statistics, 2002.
[16] GENEST C. en FAVRE A. Everything you always wanted to know about copula modeling
but were afraid to ask. Journal of hydrologic engineering, july/august, 347-368, 2007.
´
[17] GENEST C., REMILLARD
B. en BEAUDOIN D. Goodness-of-fit tests for copulas: A
review and power study. Insurance: Mathematics and Economics 44, 199-213, 2009.
[18] GRONNEBERG S. The Copula Information Criterion and its implications for the Maximum Pseudo-Likelihood Estimator. Dependence Modeling - Vine Copula Handbook,
World Scientific Publishing Co., 113-138, 2011.
[19] HEINEN A. en VALDESOGO A. Asymmetric CAPM dependence for large dimensions:
the Canonical Vine Autoregressive Model. CORE Discussion Papers 2009069, Universit´e
catholique de Louvain, Center for Operations Research and Econometrics, 2009.
[20] HEINEN A. en VALDESOGO A. Dynamic D-vine model. Dependence Modeling - Vine
Copula Handbook, World Scientific Publishing Co., 329-353, 2011.
[21] HORMANN S. Time series analysis I. URL
http://homepages.ulb.ac.be/shormann/teaching.html, Cursusnota’s academiejaar
2010-2011.
[22] HORMANN S. Time series analysis II. URL
http://homepages.ulb.ac.be/shormann/teaching.html, 2013.
[23] JOE H. Families of m-variate distributions with given margins and m(m-1)/2 bivariate
dependence parameters. Distributions with Fixed Marginals and Related Topics 28,
120-141, 1996.
BIBLIOGRAFIE
86
[24] KADANKOVA T. Satistics for actuarial sciences - Copulas. Cursusnota’s academiejaar
2012-2013.
[25] KUROWICKA D. en COOKE R. Uncertainty analysis with high dimensional dependence modelling. Wiley Series in Probability and Statistics, 2006.
[26] LONGIN F. en SOLNIK B. Is the correlation in international equity returns constant:
1960-1990? Journal of International Money and Finance 14(1), 3-26, 1995.
[27] MEEUWISSEN A.M.H. en COOKE R.M. Tree dependent random variables. Reports of
the Faculty of Technical Mathematics and Informatics 94-28, 1994.
´
[28] MORALES-NAPOLES,
COOKE R.M. en KUROWICKA D. About the number of vines
and regular vines on n nodes. Technical report, Delft Institute of Applied Mathematics,
Delft University of Technology, 2008.
[29] NAKATANI T. Conditional Correlation GARCH models - Package ’ccgarch’. URL
http://cran.r-project.org/web/packages/ccgarch/index.html, 2014.
[30] NELSEN R.B. An introduction to copulas. Springer Series in Satisctics, 2006.
[31] SALMON F. Recipe for Disaster: The Formula That Killed Wall Street. Wired Magazine: 17.03, 2009.
[32] SCHEPSMEIER
B.
Statistical
U.,
STOEBER
inference
of
vine
J.,
BRECHMANN
copulas
-
Package
C.
en
GRAELER
’VineCopula’.
URL
http://cran.r-project.org/web/packages/VineCopula/index.html, 2013.
[33] VAZ DE MELO MENDES B., MENDES SEMARARO M. en CAMARA LEAL R.P.
Pair-copulas modeling in finance. Financial Markets and Portfolio Management 24(2),
193-213, 2010.
[34] VAN DER SPIEGEL F. Asset management. Cursusnota’s academiejaar 2013-2014.
[35] VUONG Q.H. Likelihood ratio tests for model selection and non-nested hypotheses. Econometrica 57(2), 307-333, 1989.
Index
Akaike Information Criterium, 42
Log-rendement, 35
Archimedische copula, 12
Auto Regressive Moving Average proces, 36
m-kind, 22
Bayesian Information Criterium, 49
Maximum Spanning Tree-algoritme, 39
Maximum Pseudo Likelihood schatting, 43
Blanket test, 41
Paar-copula ontbinding, 29
C-vine, 32
Pearson’s correlatie, 7
Canonical Vine Autoregressive, 76
Prim’s algoritme, 39
Product copula, 10
Capital Asset Pricing Model, 76
Clayton copula, 15
R-vine matrix, 45
Comonotoon, 11
Regular Vine Market Sector, 77
Reguliere vine, 18
Concordantie, 7
Conditioned set, 20
Conditioning set, 19
Spearman’s correlatie, 8
Constraint set, 20
specifiek risico, 79
Stationariteit, 35
Copula, 4
Student t copula, 12
D-vine, 32
Dynamisch Conditioneel Correlatie - model,
52
Elliptische copula, 11
Frank copula, 16
systematisch risico, 79
Tail dependence, 7
Theorema van Sklar, 5
Value-at-Risk, 56
Vereenvoudigde reguliere vine, 49
General Autoregressive Conditionally Hete- Vine, 18
roscedastic model, 36
Gesnoeide reguliere vine copula, 47
Volledige unie, 19
Vuong test, 50
Gumbel copula, 15
j-fold union, 21
Kendall’s tau, 8
87
Bijlage A
Appendix
A.1
Case 1
De dataset gebruikt in 5.1 wordt hier verder toegelicht aan de hand van scatterplots, matrices, enzovoort. Eerst wordt voor de bogen in de eerste boom van de reguliere vine de
overeenstemmende scatterplots weergegeven in Figuur A.1.
Voor elk land wordt het ARMA(p,q)-GARCH(1,1) proces toegepast op de maandelijkse rendementen, de gevonden processen worden gegeven in Tabel A.1.
Voor elk geconstrueerde vine worden zoals werd uitgelegd in sectie 4.3 matrices geconstrueerd die de vine-structuur, de copula-families en -parameters samenvatten. Deze worden
gegeven in onderstaande matrices. Voor de reguliere vine werd de structuur al gegeven in
sectie 5.1.2.
88
BIJLAGE A. APPENDIX
Figuur A.1: Scatterplots boom 1 van reguliere vine
89
BIJLAGE A. APPENDIX
90
Land
p
q
µ
φ1
ω
α
β
Nederland
0
1
1.30
-0.08
2.22
0.11
0.81
Belgi¨e
2
1
1.38
-0.33
0.11
0.48
1.06
0.11
0.86
Frankrijk
2
2
2.52
-0.66
-0.43
0.72
2.35
0.14
0.79
Duitsland
0
0
1.07
2.21
0.12
0.82
VK
3
3
1.93
-0.97
-0.12
1.42
0.17
0.77
Itali¨e
2
2
2.27
-0.83
-0.59
1.81
0.12
0.86
Spanje
0
0
1.2
8.19
0.29
0.56
Oostenrijk
3
0
0.72
0.05
0.06
2.7
0.1
0.83
Ierland
2
0
1.32
0.05
-0.01
1.56
0.14
0.84
Zweden
3
0
1.47
0
-0.06
8.6
0.2
0.64
Zwitserland
0
1
1.18
0.04
8.18
0.18
0.45
Finland
1
1
2.59
0.61
3.25
0.16
0.81
Noorwegen
0
0
1.26
4.02
0.08
0.84
Denemarken
0
0
1.3
2.28
0.12
0.81
-0.42
φ2
φ3
0.39
θ1
θ2
θ3
0.40
1
0.08
0.86
0.53
-0.5
0.02
0.13
Tabel A.1: Geschatte ARMA-GARCH parameters voor de rendementen van de Europese
landen
In de matrix komen de nummers overeen met een copula-familie:
1
2
3
Gaussiaanse copula 4 Gumbel copula
student t copula
5 Frank copula
Clayton copula
BIJLAGE A. APPENDIX
91
Elk element in de matrix komt overeen met de copula-familie of -parameter van de overeenstemmende boog in de vine zoals werd uitgelegd in 4.3.
Reguliere vine:
Copula-families:

0
0

0

0

5

0

0

0

0

0

0

2

5
2

0
0
0
0
0
0
0
0
4
0
0
5
5
0
0
0
0
5
0
0
0
5
1
0
3
0
0
0
5
0
0
0
0
0
3
2
0
0
0
3
0
5
1
5
5
2
0
0
0
5
0
0
0
5
5
0
0
0
1
0
1
0
3
0
2
3
0
2
5
2
0
3
0
2
3
3
0
3
0
2
2
0
5
3
2





















0

5 0 
2 2 0
Parameters:


0
 0

0


 0

0
0


 0

0
0
0


1.17 0

0
0
0


 0

0
0
0
0
0


 0

0 1.11 2.47 0
0
0


 0

0
0
0
0.29
0
0
0


 0

0
0
0
0 0.72 0 0.25 0


 0 1.05 0

0
0.93
0
0.25
0.3
0.26
0


 0

0 0.87 0 0.12 0
0
0
0 0.21 0


0.12 0 0.27 0 0.82 0 0.26 0.21 0.26 0 1.77 0



 2.3 1.41 0 0.25 1.19 1.4

0
1.5 0.26 0.39 0.47 3.17 0
0.71 6.65 2.14 0.8 0.71 8.01 2.6 0.74 1.94 0.82 0.76 0.86 0.86 0
BIJLAGE A. APPENDIX
92
Aantal vrijheidsgraden:

0
 0

 0

 0

 0

 0

 0

 0

 0

 0

 0

13.6

 0
9.25

0
0
0
0
0
0
0
0
0
0
0
0
0
0
0 0
0 0
0
0 0
0
0 0
0
0 0
0
0 0
0
0 0
0
0 0
0
0 0
0
0 0
0
0 3.87 5.99
0
0
0
0
0
0
0
0
0
0
0
0
0 9.76
0
0
0
0
0
0
0
0
0
0
0 3.42 6.24 0
0
0
0
0
0 4.26 0
0
0
0 11.09 0 4.71 8.85 5.99 6.89 0
C-vine:
vine-structuur:

13
9

6

4

11

12

8

14

3

5

2

10

7
1

9
6
4
11
12
8
14
3
5
2
10
7
1
6
4
11
12
8
14
3
5
2
10
7
1
4
11
12
8
14
3
5
2
10
7
1
11
12 12
8 8 8
14 14 14 14
3 3 3 3 3
5 5 5 5 5 5
2 2 2 2 2 2 2
10 10 10 10 10 10 10 10
7 7 7 7 7 7 7 7 7
1 1 1 1 1 1 1 1 1 1














































BIJLAGE A. APPENDIX
93
Copula-families:

0
0

0

0

0

0

0

1

0

3

0

5

3
2

0
0
0
0
0
0
0
0
3
5
5
3
2
0
0
1
0
3
3
5
0
0
5
5
5
0
0
0
0
0
3
0
0
2
5
2
0
0
0
0
0
1
5
0
1
3
0
0
0
0
0
0
5
5
5
0
5
0
0
5
0
5
3
0
5
0
5
2
5
3
0
5
1
3
5
2
0
3
5
5
2
0
0
5
3





















0

3 0 
2 5 0
Parameters:


0
 0

0


 0

0
0


 0

0
0
0


 0

0
−0.15
0
0



 0
0
0
0
0
0


 0

0
0.17
0
0
0
0


0.26 0

0.19
0
0
0 1.16
0



 0
0
1.71
0.53
0
0
0
−1.02
0


0.31 0.29

0
0 0.16 0
0
0
1.34 0


 0

1
0
0
1.89
0
1.77
1.49
0.18
0.17
0


1.92 0.98 0.88 0.33 0 3.21 0

0.28
0.42
1.4
0
0


0.35 0.39 3.98 2.19 0.18 1.95 1.33 1.76 3.33 2.39 1.32 0.57 0

0.71 0.7 6.35 0.85 2.07 4.86 1.85 1.78 0.86 0.81 2.52 0.72 6.07 0
BIJLAGE A. APPENDIX
94
Aantal vrijheidsgraden:

0
 0
0

 0
0

 0
0

 0
0

 0
0

 0
0

 0
0

 0
0

 0
0

 0
0

 0
0

 0
0
4.03 5.93

0
0
0
0
0
0
0
0
0 0
0
0
0 0
0
0
0 0
0
0
0 0
0
0
0 0
0
0
0 0
0 15.86 0 0
0
0
0 0
0 8.44 0 0
0
0 0
0 0
0
0 0
0
0
0 0
0
0
0 4.9 0
0
0 0
0
0
0 0 7.65 3.89
0
0
0
0





















0

0
0 
10.57 0 0
D-vine:
vine-structuur:

8
9

14

13

12

10

4

1

3

5

7

6

2
11

11
9
14
13
12
10
4
1
3
5
7
6
2
2
9
14
13
12
10
4
1
3
5
7
6
6
9
14
13
12
10
4
1
3
5
7
7
9
14
13
12
10
4
1
3
5
5
9
14
13
12
10
4
1
3
3
9
14
13
12
10
4
1
1
9
14
13
12
10
4















4


9 10


14 9 12


13 14 9 13

12 13 14 9 14 
10 12 13 14 9 9
BIJLAGE A. APPENDIX
95
Copula-families:

0
0

0

5

0

0

0

0

0

0

0

3

5
3

0
0
0
0
0
0
0
5
0
5
1
3
3
0
5
5
5
0
0
0
3
1
1
2
5
0
0
1
0
0
0
0
5
5
5
3
0
0
3
0
0
0
0
0
5
3
0
3
3
3
0
3
0
2
2
0
0
0
0
0
5
5
2
0
5
4
4
0
3
2
0
5
3
5
5
2
0
5
4
3
5
0
5
3
5





















0

1 0 
3 3 0
Parameters:

0
 0

 0

1.05

 0

 0

 0

 0

 0

 0

 0

 0.3

3.41
1.36

0
0
0
0
0
0
0
1.34
0
2.42
0.18
0.26
1.62
0
0.94
1.15
1.07
0
0
0
0.59
0.35
0.41
0.31
5.12
0
0
0
0.19 0
0
0 0.15 0.25 0
0
0 0.26 0
0
0
0 0.29 0 1.68 0
0
0
0
0 1.11 1.37 0
0.79 0 0.29 0 1.22 0.41 0.99 0
2.29 0
0 1.72 0 1.52 1.29 1.71 0
2.36 3.19 0.41 3.52 0.45 1.41 0.9 0.26 0.3
0
1.94 1.62 0.8 0.85 0.85 0.76 5.93 4.03 1.65 1.27 0























BIJLAGE A. APPENDIX
96
Aantal vrijheidsgraden:

0
0

0

0

0

0

0

0

0

0

0

0

0
0

0
0 0
0 0 0
0 0 0
0 0 0
0 0 0
0 0 0
0 0 0
0 0 0
0 0 0
0 0 0
0 8.52 0
0 0 0
0
0 0
0 0
0
0 0
0
0
0 0
0
0
0
0 0
0
0
0
0 0
0
0
0
0 0
0
0
0
0 6.81 0
0
0
0 4.85 8.07 7.18 8.94
0
0
0
0
0
0
0
0
0





















0

0 0 
0 0 0
Reguliere vine zonder product copula’s:
Copula-families:

0
5

3

5

5

3

5

5

1

5

3

2

5
2

0
5
5
2
5
1
1
5
4
5
3
5
5
0
1
1
5
5
1
5
1
5
5
2
3
0
5
1
5
5
1
3
4
3
3
2
0
3
1
3
3
5
1
1
5
2
0
3
3
5
3
4
3
5
5
0
5
5
1
1
4
4
3
0
2
3
3
2
5
2
0
3
2
2
3
3
0
3
5
2
2
0
5
3
2





















0

5 0 
2 2 0
BIJLAGE A. APPENDIX
97
Parameters:


0
 −0.4

0



 0.2 −0.21
0


 0.27

0.67
−0.13
0


 1.19 −0.06 0.04

0.18
0


 0.09

0.61
−0.33
−0.03
0.17
0


 0.23

0.03
1.15
2.24
0.05
0.09
0


 0.7

0.11
0.04
0.41 0.3 0.14 0.2
0


−0.09 0.23

0.35
−0.07
0.08
0.83
0.38
0.25
0


 0.37

1.05
0.09
0.15 0.88 0.18 0.24 0.29 0.28
0


 0.18

0.77
0.85
1.03
0.14
1.04
−0.85
0.06
−0.07
0.22
0


 0.13

0.12
1.99
0.09 0.12 0.16 1.21 0.22 0.26 0.12 1.44 0


 2.19

1.46
0.1
0.24 1.27 1.34 1.1 1.25 0.31 0.38 0.48 3.36 0
0.71
6.68
2.03
0.81 0.71 8.23 2.51 0.74 1.92 0.81 0.76 0.86 0.86 0
Aantal vrijheidsgraden:

0
 0
0

 0
0
0

 0
0
0
0

 0
10.22
0
0 0

 0
0
0
0 0

 0
0
0
0 0

 0
0
0
0 0

 0
0
0
0 0

 0
0
0
0 0

 0
0
0
0 0

12.05
0
0
0
0

 0
0
20.71 0 0
6.3
0
0
4 6.92

0
0
0
0
0
0
0
0
0
0
0 0
0 9.33 0
0 0
0
0
0 0 15.5 0
0
0 3.33 6.12 0
0
0
0 0
0 4.68 0
0
0
0 9.42 0 4.65 8.8 7.14 6.81 0























Voor de reguliere vine en de D-vine wordt geen negatieve afhankelijkheid waargenomen. Voor
de C-vine en de reguliere vine zonder product copula’s wordt er wel negatieve afhankelijkheid
gemodelleerd. Voor de reguliere vine zonder product copula’s is dat al vanaf de vierde boom.
Voor de C-vine is dit enkel eens in de zesde en tiende boom.
BIJLAGE A. APPENDIX
98
Voor de reguliere vine, worden de tweede, derde en vierde bomen weergegeven in onderstaande figuren.
Figuur A.2: Boom 2 reguliere vine
Figuur A.3: Boom 3 reguliere vine
BIJLAGE A. APPENDIX
99
Figuur A.4: Boom 1 reguliere vine
A.2
Case 2
In de tweede dataset wordt gewerkt met de componenten van de BEL20, deze worden hier
kort beschreven:
• AB Inbev (ABI) is een brouwerijketen dat onstond in 2004 en is gevestigd in Leuven.
AB Inbev is de grootste brouwer van de wereld en het is het eerste Belgisch bedrijf dat
een beurswaarde van boven de 100 miljard euro heeft gehaald.
• Ackermans & van Haaren (ACKB) is een holding en ontsond in 1876. De hoofdzetel is
gevestigt in Antwerpen en het aandeel maakt sinds maart 2007 deel uit van de BEL20.
• Befimmo (BEFB) is een vastgoedbedrijf dat werd opgericht in 1995. In maart 2009
deed het haar intrede in de BEL20.
• Bekaert (BEKB) werd opgericht in 1880 en is de wereldwijde marktleider in staal en
andere geavenceerde materialen. Dit aandeel maakt sinds het begin deel uit van de
BEL20.
• Belgacom (BELG) is het grootste telecommunicatiebedrijf van Belgi¨e. Sinds maart
2004 maakt het deel uit van de BEL20.
• Cofinimmo (COFB) is sinds maart 2003 in de BEL20. Het werd opgericht in 1983
en is de belangrijkste investeringsmaatschappij van Belgi¨e in vastgoed bestemd voor
verhuring.
• Colruyt (COLR) werd opgericht in 1965 en haar hoofdkantoor is gevestigd in Halle.
Sinds 1977 is deze supermarktketen beursgenoteerd.
BIJLAGE A. APPENDIX
100
• Delhaize (DELB) is eveneens een supermarktketen en bestaat al sinds 1867. Het maakt
ook deel uit van de Euronext 100. Delhaize is sinds de oprichting van de BEL20 een
component van deze index.
• d’Ieteren (DIE) is een bedrijf dat auto’s importeert en verdeelt, het werd opgericht in
1805. Het autodienstenbedrijf maakte haar intrede in 1998 in de BEL20 maar werd al
eens verwijderd en opnieuw opgenomen in de Euronext Brussel index.
• Elia (ELIA) treedde in maart 2012 toe tot de BEL20 index, het houdt zich bezig met
het netbeheer van het Belgische hoogspanningsnet.
• Ook GBL (GBL) is eveneens een holding en maakt sinds de start deel uit van de BEL20
index. Het maakt deel uit van de 10 grootste Belgische bedrijven.
• GDF Suez (GSZ) maakt deel uit van vele Europese indices. Het is een Frans energiebedrijf en het grootste nutsbedrijf van de hele wereld. Het werd opgericht in 2008 en
maakt sinds haar oprichting deel uit van de BEL20 index.
• KBC (KBC) is een bankverzekering bedrijf opgericht in 1998.
• Solvay (SOLB) maakt sinds het begin deel uit van de BEL20 index, deze multinational
werd opgericht in 1865 en is actief in chemie en plastics. Ze maakt eveneens deel uit
van de Euronext 100 index.
• Telenet (TNET) is een telecommunicatiebedrijf dat sinds 2006 deel uitmaakt van de
BEL20 index. Het bedrijf werd opgericht in 1996 en heeft haar hoofdkantoor in Mechelen.
• Union Chimique Belge (UCB) is sinds de start opgenomen in de BEL20. Dit farmaceutisch bedrijf werd opgericht in 1928 en heeft vetsigingen over de hele wereld.
• Umicore (UMI) is een bedrijf gespecialiseerd in metalen, het werd opgericht in 1906 en
was vooral actief in de mijnen. Dit bedrijf zit eveneens sinds het begin in de BEL20.
Elk aandeel wordt aan de hand van de Industry Classification Benchmarkt onderverdeeld in
´e´en van de 10 industri¨en, 41 sectoren en 114 subsectoren. Een overzicht van deze onderverdeling kan terug gevonden worden op de site www.STOXX.com/indices/ICB.html.
De koers van de BEL20 index, de verschillende sectoren en de 17 aandelen worden weergegeven in onderstaande figuren.
BIJLAGE A. APPENDIX
Figuur A.5: Aandelenkoers van BEL 20 en sectoren
Figuur A.6: Aandelenkoers van BEL 20 - componenten (1)
101
BIJLAGE A. APPENDIX
102
Figuur A.7: Aandelenkoers van BEL 20 - componenten (2)
De forse waarde-vermindering van de koerswaarde van Bekaerts, Colruyt, d’Ieteren en
Umicore is te wijten aan de splitsing van de aandelen voor deze bedrijven. Dit gebeurde op
respectievelijk 10 november 2010, 15 oktover 2010, 24 december 2010 en 29 februari 2008.
Opdat dit geen invloed zou hebben op de log-rendementen, werd voor deze aandelen het logrendement gelijk gesteld aan 0 op de desbetreffende data. In onderstaande figuren worden
de log-rendementen voor de BEL20 index, de sectoren en de aandelen weergegeven.
Figuur A.8: Log-rendementen van BEL 20 en sectoren
BIJLAGE A. APPENDIX
103
Figuur A.9: Log-rendementen van BEL 20 - componenten (1)
Figuur A.10: Log-rendementen van BEL 20 - componenten (2)
Voor de bogen in de eerste boom worden de respectievelijke scatterplots weergegeven in
onderstaande figuren. De resultaten bekomen in sectie 5.2.2 worden aan de hand van deze
grafieken bevestigd. Bijvoorbeeld aan de hand van de scatterplot tussen de nutssector en
GDF Suez wordt een sterke afhankelijkheid waargenomen, dit vertaalt zich in een hoog sectorrisico zoals te zien is in Tabel 5.8. Voor Elia en de nutssector daarintegen wordt weinig
afhankelijkheid waargenomen en dit wordt weeral bevestigd in Tabel 5.8.
BIJLAGE A. APPENDIX
104
Figuur A.11: Scatterplots tussen de pseudo-observaties van de BEL20 en de sectoren
BIJLAGE A. APPENDIX
105
Figuur A.12: Scatterplots tussen de pseudo-observaties van de finanici¨ele sector en haar
aandelen
BIJLAGE A. APPENDIX
106
Figuur A.13: Scatterplots tussen de pseudo-observaties van de consumenten diensten sector
en haar aandelen
BIJLAGE A. APPENDIX
107
Figuur A.14: Scatterplots tussen de pseudo-observaties van de nutssector en haar aandelen
en tussen de basis materialen sector en haar aandelen
BIJLAGE A. APPENDIX
108
Figuur A.15: Scatterplots tussen de pseudo-observaties van de overige sectoren en haar
aandelen
A.3
Case 3
Tenslotte worden in Figuur A.16 de scatterplots weergegeven die overeenkomen met de bogen uit de reguliere vine voor de geconstrueerde portefeuille in 5.2.3. Men ziet hier hoe de
tail dependence alsmaar afneemt naarmate men vordert in de bomen.
BIJLAGE A. APPENDIX
109
Figuur A.16: Scatterplots van de pseudo-observaties voor de reguliere vine
In onderstaande R-code wordt elke stap van sectie 4.6 toegepast voor case 3. Waarbij i
gaat van 1 tot en met 257.
x=i
y=1516+i
U$kbc[y]<-kbc.U[1516]
BIJLAGE A. APPENDIX
110
U$gbl[y]<-gbl.U[1516]
U$avh[y]<-avh.U[1516]
U$cof[y]<-cof.U[1516]
U$bef[y]<-bef.U[1516]
V<-U[x:y,]
Rvine<-RVineSeqEst(V,Rvine$RVM)
sim<-RVineSim(1, Rvine$RVM)
P[y,]<-T[1517,]
T<-P[x:y,]
dim(T)
fit.KBC<-garchFit( arma(0,1)+garch(1,1), data=T$kbc[1:1516,],
cond.dist="sstd")
kbc.R<-fit.KBC@residuals
kbc.sigma.t<[email protected]
kbc.sigma.t[1516]<-predict(fit.KBC, n.ahead = 1)[3]
sstdFit(kbc.R)
kbc.R[1516]<-qsstd(sim[1],mean=sstdFit(kbc.R)$estimate[1],
sd=sstdFit(kbc.R)$estimate[2],nu=sstdFit(kbc.R)$estimate[3],
xi=sstdFit(kbc.R)$estimate[4])
T$kbc[1517]<- as.numeric(coef(fit.KBC)[1]) + as.numeric(kbc.sigma.t[1516])
*kbc.R[1516] + as.numeric(coef(fit.KBC)[2])*as.numeric(kbc.sigma.t[1515])
*kbc.R[1515]
fit.GBL<-garchFit( arma(4,3)+garch(1,1), data=T$gbl[1:1516,],
cond.dist="sstd")
gbl.R<-fit.GBL@residuals
gbl.sigma.t<[email protected]
gbl.sigma.t[1516]<-predict(fit.GBL, n.ahead = 1)[3]
sstdFit(gbl.R)
gbl.R[1516]<-qsstd(sim[2],mean=sstdFit(gbl.R)$estimate[1],
sd=sstdFit(gbl.R)$estimate[2],nu=sstdFit(gbl.R)$estimate[3],
xi=sstdFit(gbl.R)$estimate[4])
BIJLAGE A. APPENDIX
111
T$gbl[1517]<- (as.numeric(coef(fit.GBL)[1]) + as.numeric(gbl.sigma.t[1516])
gbl.R[1516] + as.numeric(coef(fit.GBL)[2])*P$gbl[1515] +
as.numeric(coef(fit.GBL)[3])*P$gbl[1514] +
as.numeric(coef(fit.GBL)[4])*P$gbl[1513] + as.numeric(coef(fit.GBL)[5])
*P$gbl[1512] + as.numeric(coef(fit.GBL)[6])*as.numeric(gbl.sigma.t[1515])
*gbl.R[1515] + as.numeric(coef(fit.GBL)[7])*as.numeric(gbl.sigma.t[1514])
*gbl.R[1514] + as.numeric(coef(fit.GBL)[8])*as.numeric(gbl.sigma.t[1513])
*gbl.R[1513])
fit.ackvh<-garchFit( arma(3,2)+garch(1,1), data=T$avh[1:1516,],
cond.dist="sstd")
avh.R<-fit.ackvh@residuals
avh.sigma.t<[email protected]
avh.sigma.t[1516]<-predict(fit.ackvh, n.ahead = 1)[3]
sstdFit(avh.R)
avh.R[1516]<-qsstd(sim[3],mean=sstdFit(avh.R)$estimate[1],
sd=sstdFit(avh.R)$estimate[2],nu=sstdFit(avh.R)$estimate[3],
xi=sstdFit(avh.R)$estimate[4])
T$avh[1517]<- (as.numeric(coef(fit.ackvh)[1]) + as.numeric(avh.sigma.t[1516])
*avh.R[1516] + as.numeric(coef(fit.ackvh)[2])*P$avh[1515]
+ as.numeric(coef(fit.ackvh)[3])*P$avh[1514] + as.numeric(coef(fit.ackvh)[4])
*P$avh[1513] + as.numeric(coef(fit.ackvh)[5])*as.numeric(avh.sigma.t[1515])
*avh.R[1515] + as.numeric(coef(fit.ackvh)[6])*as.numeric(avh.sigma.t[1514])
*avh.R[1514])
fit.Cofi<-garchFit( arma(2,2)+garch(1,1), data=T$cof[1:1516,],
cond.dist="sstd")
cof.R<-fit.Cofi@residuals
cof.sigma.t<[email protected]
cof.sigma.t[1516]<-predict(fit.Cofi, n.ahead = 1)[3]
sstdFit(cof.R)
cof.R[1516]<-qsstd(sim[4],mean=sstdFit(cof.R)$estimate[1],
sd=sstdFit(cof.R)$estimate[2],nu=sstdFit(cof.R)$estimate[3],
xi=sstdFit(cof.R)$estimate[4])
T$cof[1517]<- (as.numeric(coef(fit.Cofi)[1]) + as.numeric(cof.sigma.t[1516])
*cof.R[1516] + as.numeric(coef(fit.Cofi)[2])*P$cof[1515]
BIJLAGE A. APPENDIX
112
+ as.numeric(coef(fit.Cofi)[3])*P$cof[1514] +
as.numeric(coef(fit.Cofi)[4])*as.numeric(cof.sigma.t[1515])*cof.R[1515] +
as.numeric(coef(fit.Cofi)[5])*as.numeric(cof.sigma.t[1514])*cof.R[1514])
fit.Befi<-garchFit( arma(1,1)+garch(1,1), data=T$bef[1:1516,],
cond.dist="sstd")
bef.R<-fit.Befi@residuals
bef.sigma.t<[email protected]
bef.sigma.t[1516]<-predict(fit.Befi, n.ahead = 1)[3]
sstdFit(bef.R)
bef.R[1516]<-qsstd(sim[5],mean=sstdFit(bef.R)$estimate[1],
sd=sstdFit(bef.R)$estimate[2],nu=sstdFit(bef.R)$estimate[3],
xi=sstdFit(bef.R)$estimate[4])
T$bef[1517]<- (as.numeric(coef(fit.Befi)[1]) + as.numeric(bef.sigma.t[1516])
*bef.R[1516] + as.numeric(coef(fit.Befi)[2])*P$bef[1515]
+ as.numeric(coef(fit.Befi)[3])*as.numeric(bef.sigma.t[1515])*bef.R[1515])
kbc.R.edf<-ecdf(kbc.R)
kbc.U<-kbc.R.edf(kbc.R)
gbl.R.edf<-ecdf(gbl.R)
gbl.U<-gbl.R.edf(gbl.R)
avh.R.edf<-ecdf(avh.R)
avh.U<-avh.R.edf(avh.R)
cof.R.edf<-ecdf(cof.R)
cof.U<-cof.R.edf(cof.R)
bef.R.edf<-ecdf(bef.R)
bef.U<-bef.R.edf(bef.R)
Y<-P$kbc[1:1772]/5+P$gbl[1:1772]/5+P$avh[1:1772]/5+P$cof[1:1772]/5
+P$bef[1:1772]/5
X<-P.Re$gbl[1:1772]/5+P.Re$kbc[1:1772]/5+P.Re$avh[1:1772]/5
+P.Re$cof[1:1772]/5+P.Re$bef[1:1772]/5
VAR<-matrix(NA,257,1)
for(i in 1:257)
BIJLAGE A. APPENDIX
VAR[i]<-VaR(Y[600+i:1515+i],0.95)
VaRTest(alpha = 0.05, X[1516:1772], VAR, conf.level = 0.95)
113