Faculteit Wetenschappen Departement Wiskunde Multivariate afhankelijkheid: De vine copula en toepassingen op financi¨ele rendementen Proefschrift ingediend met het oog op het behalen van de graad van Master in de Wiskunde Hering Maxime Promotor: MEI 2014 Prof. dr. Christophe Croux i Though the road’s been rocky it sure feels good to me - B. Marley Samenvatting Het meten van afhankelijkheden tussen meerdere variabelen is een complexe taak. De klassieke correlatieco¨effici¨ent is vaak ontoereikend, omdat deze enkel lineaire verbanden nagaat, en ge¨ınspireerd is op de bivariate normale verdeling. Vaak zijn bivariate verdelingen echter niet normaal, en we hebben nood aan een flexibele klasse van verdelingen; Copula’s helpen ons hier. De verdelingen van de aparte variabelen worden eerst gekozen, en daarna wordt een copula geselecteerd om de afhankelijkheidsstructuur te modelleren. In deze meesterproef behandelen we een multivariate versie van copula’s, die toelaat afhankelijkheden tussen meerdere, zelfs tientallen variabelen, te modelleren. Hiervoor gebruiken we vines, die de afhankelijkheid tussen meerdere variabelen op een accurate en flexibele manier beschrijft, zonder een te groot aantal parameters te moeten schatten. Het idee is om de multivariate copula-dichtheid te herschrijven als een product van bivariate (conditionele) copula’s. Een vine is een verzameling van bomen, waar elke boom een grafische weergave is van de (conditionele) afhankelijkheden tussen variabelen. Deze technieken worden toegepast op rendementen van financi¨ele instrumenten, waar er complexe afhankelijkheden kunnen bestaan. De dynamiek van de aparte tijdreeksen, die hier dus de rendementen zijn, wordt eerst gemodelleerd met univariate ARMA-GARCH tijdreeksmodellen. De afhankelijkheden tussen de tijdreeksen worden dan gecapteerd door een vine copula-verdeling tussen de residuen van de univariate modellen. We leggen uit hoe de verschillende bouwstenen van de vine worden bekomen, en hoe de paar-copula ontbinding van een multivariate dichtheidsfunctie kan worden bewezen. Ook wordt gekeken naar twee mogelijke manieren om het model te verbeteren. In eerste instantie wordt er gestreefd naar een vereenvoudiging van het model, die het rekenwerk moet verminderen. Vervolgens wordt gekeken hoe de tijdsvari¨erende afhankelijkheid kan worden ge¨ımplementeerd in het model. Ter evaluatie van de vine copula wordt op basis van het model de Value-at-Risk dagelijks berekend en vergeleken met de gerealiseerde rendementen. ii iii Met de recente financi¨ele crisis en de nieuwe Solvency- en Baselregels is het duidelijk geworden dat de klassieke statistische modellen die toegepast werden hun beperkingen hebben. Het is uitermate belangrijk om de afhankelijkheden tussen verschillende financi¨ele instrumenten mee in rekening te brengen. We illustreren in 3 case-studies hoe de vine copula modellen hiervoor gebruikt kunnen worden. In een eerste case worden verschillende vine copulas geconstrueerd voor de maandelijkse rendementen van 14 Europese landen over een periode van 13 jaar en worden deze met elkaar vergeleken. Een tweede dataset bevat de dagelijkse rendementen van de BEL20 index en haar componenten samen met hun sectoren en dit over een periode van 8 jaar. Hierop wordt het Regular Vine Market Sector model toegepast om voor elk aandeel het specifiek en systematisch risico te bepalen. Ook wordt aan de hand van de Value-at-Risk bevestigd dat de vine copula een goed model is. Inhoudsopgave Samenvatting ii Lijst van figuren vii Lijst van tabellen viii 1 Inleiding 1 2 Copula’s 4 2.1 2.2 Fundamentele copula’s . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Elliptische copula’s . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 11 2.3 Archimedische copula’s . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 3 Vine en paar-copula ontbinding 17 3.1 3.2 Reguliere vine . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Paar-copula ontbinding . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 24 3.3 D-vine en C-vine . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 4 Toepassing van vines in finance 34 4.1 Tijdreeksen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 4.2 Vine-structuur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2.1 Maximum Spanning Tree . . . . . . . . . . . . . . . . . . . . . . . . . 38 39 4.2.2 Paar-copula fit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 4.2.3 Getransformeerde observaties . . . . . . . . . . . . . . . . . . . . . . 43 Matrix representatie van een reguliere vine . . . . . . . . . . . . . . . . . . . Gesnoeide en vereenvoudigde reguliere vines . . . . . . . . . . . . . . . . . . 44 47 4.4.1 Gesnoeide reguliere vine . . . . . . . . . . . . . . . . . . . . . . . . . 47 4.4.2 Vereenvoudigde reguliere vine . . . . . . . . . . . . . . . . . . . . . . 49 4.5 Tijdsvari¨erende copula’s . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.5.1 Dynamisch Conditioneel Correlatie-model . . . . . . . . . . . . . . . 51 52 4.6 Model evaluatie aan de hand van Value-at-Risk . . . . . . . . . . . . . . . . 56 4.3 4.4 iv INHOUDSOPGAVE v 5 Empirische toepassing 5.1 5.2 5.3 59 Case 1: Maandelijkse rendementen van 14 Europese landen, 1991-2014. . . . 60 5.1.1 5.1.2 Marginale modellen . . . . . . . . . . . . . . . . . . . . . . . . . . . . Vine constructie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 63 5.1.3 Vergelijken van de reguliere vines, de C-vine en de D-vine . . . . . . . 68 5.1.4 Snoeiing en vereenvoudiging van de reguliere vine . . . . . . . . . . . 70 5.1.5 5.1.6 Multivariate student t copula . . . . . . . . . . . . . . . . . . . . . . Dynamische paar-copula’s . . . . . . . . . . . . . . . . . . . . . . . . 72 72 Case 2: Dagelijkse rendementen BEL 20 componenten met respectievelijke sectoren, 2006-2014. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 5.2.1 5.2.2 76 79 Regulare Vine Market Sector model . . . . . . . . . . . . . . . . . . . Systematisch en specifiek risico . . . . . . . . . . . . . . . . . . . . . Case 3: Value-at-Risk model evaluatie . . . . . . . . . . . . . . . . . . . . . 82 Bibliografie 84 Index 87 A Appendix 88 A.1 Case 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.2 Case 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88 99 A.3 Case 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108 Lijst van figuren 2.1 (a) concordante en (b) discordante paren . . . . . . . . . . . . . . . . . . . . 8 3.1 D-vine voor 5 variabelen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 3.2 3.3 j-fold union voor e met j ∈ (0, 1, 2, 3) . . . . . . . . . . . . . . . . . . . . . . boog e rond top j . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 24 3.4 Tn−1 en Tn−2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 3.5 Reguliere vine voor 3 variabelen . . . . . . . . . . . . . . . . . . . . . . . . . 30 3.6 C-vine voor 5 variabelen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 4.1 5-dimensionale reguliere vine . . . . . . . . . . . . . . . . . . . . . . . . . . 45 5.1 Geschatte dichtheidsfunctie voor de rendementen van Belgi¨e . . . . . . . . . 61 5.2 Tijdsvari¨erende volatiliteit voor de rendementen van Belgi¨e . . . . . . . . . 62 5.3 Transformatie naar uniform verdeelde tijdreeks . . . . . . . . . . . . . . . . 63 5.4 5.5 Structuur van de eerste boom in de reguliere vine . . . . . . . . . . . . . . . (a) Alle mogelijke bogen in boom 3 met overeenkomstige Kendall’s tau, (b) 65 de bekomen boomstructuur door het toepassen van het Prim’s algoritme. . 66 5.6 Structuur van de eerste boom van de D-vine . . . . . . . . . . . . . . . . . . 68 5.7 5.8 Tijdsvari¨erende Kendall tau voor de paren variabelen in boom 1 . . . . . . . (a) Boom 1 en (b) boom 2 van RVMS-model voor de BEL20 . . . . . . . . . 74 78 5.9 Speciek en systematisch risico bij diversificatie . . . . . . . . . . . . . . . . 79 5.10 Boom 1 van reguliere vine voor portefeuille . . . . . . . . . . . . . . . . . . . 82 5.11 VaR berekeningen en gerealiseerde log-rendementen . . . . . . . . . . . . . . 83 A.1 Scatterplots boom 1 van reguliere vine . . . . . . . . . . . . . . . . . . . . . 89 A.2 Boom 2 reguliere vine . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 A.3 Boom 3 reguliere vine . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.4 Boom 1 reguliere vine . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 99 A.5 Aandelenkoers van BEL 20 en sectoren . . . . . . . . . . . . . . . . . . . . . 101 A.6 Aandelenkoers van BEL 20 - componenten (1) . . . . . . . . . . . . . . . . . 101 vi LIJST VAN FIGUREN vii A.7 Aandelenkoers van BEL 20 - componenten (2) . . . . . . . . . . . . . . . . . 102 A.8 Log-rendementen van BEL 20 en sectoren . . . . . . . . . . . . . . . . . . . 102 A.9 Log-rendementen van BEL 20 - componenten (1) . . . . . . . . . . . . . . . 103 A.10 Log-rendementen van BEL 20 - componenten (2) . . . . . . . . . . . . . . . 103 A.11 Scatterplots tussen de pseudo-observaties van de BEL20 en de sectoren . . . 104 A.12 Scatterplots tussen de pseudo-observaties van de finanici¨ele sector en haar aandelen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 A.13 Scatterplots tussen de pseudo-observaties van de consumenten diensten sector en haar aandelen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106 A.14 Scatterplots tussen de pseudo-observaties van de nutssector en haar aandelen en tussen de basis materialen sector en haar aandelen . . . . . . . . . . . . . 107 A.15 Scatterplots tussen de pseudo-observaties van de overige sectoren en haar aandelen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108 A.16 Scatterplots van de pseudo-observaties voor de reguliere vine . . . . . . . . . 109 Lijst van tabellen 5.1 5.2 Beschrijvende statistieken van de rendementen van de 14 Europese landen . . Per boom het aantal paar-copula’s binnen een bepaalde familie . . . . . . . . 61 67 5.3 Vergelijking van de verschillende vines . . . . . . . . . . . . . . . . . . . . . 69 5.4 Vuong test tussen de verschillende vines . . . . . . . . . . . . . . . . . . . . 69 5.5 5.6 BIC-waardes voor de verschillende snoeiingsniveau’s . . . . . . . . . . . . . . Vuong test statistieken voor het bepalen van het vereenvoudigingsniveau . . 71 71 5.7 Componenten BEL 20 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75 5.8 Systematisch en specifiek risico voor de componenten van de BEL20 . . . . . 81 A.1 Geschatte ARMA-GARCH parameters voor de rendementen van de Europese landen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . viii 90 Hoofdstuk 1 Inleiding Een van de redenen voor de financi¨ele crisis die begon in 2007 was het niet accuraat vastleggen van de afhankelijkheid tussen verschillende activa. Voor een goed financieel risicobeheer is er nood aan een goed model die niet enkel de prijs bepaalt voor een groot aantal financi¨ele instrumenten maar eveneens de afhankelijkheid modelleert tussen de financi¨ele rendementen. Vroeger werd hiervoor gebruik gemaakt van de correlatieco¨effici¨ent, deze beschrijft goed de afhankelijkheid voor elliptische verdelingen. Maar deze komen in de praktijk zelden voor daar men vaak te maken heeft met zware staarten van de verdeling en asymmetrie, die niet correct worden gemodelleerd aan de hand van elliptische verdelingen. Ook met het oog op de Basel en Solvency regels in de bank- en verzekeringssector, wordt er steeds meer aangedrongen op een geschikt intern model dat het re¨ele risico correct weergeeft. Een zeer nuttige functie in dit opzicht is de copula-functie. Aan de hand van deze functie kan de gezamenlijke verdeling van meerdere toevalsvariabelen onderverdeeld worden in twee bijdragen: de marginale verdeling van iedere variabele en de afhankelijkheid tussen de verschillende variabelen, beschreven aan de hand van de copula functie. Een ander voordeel van de copula-functie is dat verschillende afhankelijkheidgrootheden kunnen geschreven worden in functie van de onderliggende copula, dit is onder meer het geval voor de Kendall’s Tau, de Spearman’s rang correlatie alsook voor de staart-afhankelijkheid. In hoofdstuk 2 wordt een inleiding gegeven over de copula-functie en worden verschillende bivariate copulafamilies beschreven met bijhorende eigenschappen die in de financi¨ele toepassingen gebruikt zullen worden. Wanneer men gaat kijken naar multivariate copula’s brengt dit verschillende beperkingen met zich mee voor het juist modelleren van de afhankelijkheid. Zo zijn er tegenover de bivariate copula’s maar een beperkt aantal multivariate copula-klassen. De flexibiliteit in de staarten van de verdeling kan beperkt gemodelleerd worden aan de hand van elliptische copula’s. De Gaussiaanse copula heeft geen tail dependence en bij de student t copula is de tail dependence symmetrisch is en hangt die af van ´e´en enkele parameter voor 1 HOOFDSTUK 1. INLEIDING 2 alle paren variabelen, namelijk het aantal vrijheidsgraden. Voor elliptische copula’s moeten ook veel parameters worden geschat. Bij de multivariate Archimedische copula’s zijn er ook parameter beperkingen die een gelijke afhankelijkheid voor elk paar variabelen veronderstellen. Dit brengt opnieuw een beperkte flexibiliteit met zich mee. Om deze flexibiliteit bij het modelleren van de multivariate afhankelijkheid te verbeteren wordt er verkozen te werken met vine copula’s eerder dan met multivariate copula’s. Bij een vine copula wordt de multivariate dichtheid ontbonden in een product van univariate dichtheidsfuncties en bivariate copula-dichtheidsfuncties toegepast op de variabelen, hun verdelingsfuncties en conditionele verdelingsfuncties. De bivariate copula’s die worden gebruikt in de vine copula zullen verder paar-copula’s worden genoemd. Deze vine copula’s kennen vele toepassingen binnen de financi¨ele wereld. Daar is er nood aan een flexibele multivariate afhankelijkheidsstructuur dat het best overeenkomt met de realiteit. Zowel in het centrum als in de staart van de verdeling (Value-at-Risk). Logrendementen hebben bekende karakteristieken, ze bezitten een zekere graad van asymmetrie en hoge kurtosis. De afhankelijkheidsstructuur tussen paren variabelen zullen sterk vari¨eren gaande van onafhankelijke tot complexe vormen van niet-lineaire afhankelijkheid; de meest gekende multivariate verdelingen kunnen dit niet allemaal correct weergeven. In dit werk zal men de vine copula’s toepassen om de afhankelijkheid tussen log-rendementen van verschillende variabelen zo goed mogelijk te modelleren. In hoofdstuk 3 wordt aangetoond hoe de vine copula wordt geconstrueerd. Hiervoor wordt eerst een korte introductie gegeven rond grafentheorie. De reguliere vine wordt ingevoerd als grafisch model voor het beschrijven van een bepaalde afhankelijkheidsstructuur. Met de bijhorende elementenverzamelingen die de reguliere vine karakteriseren en een aantal eigenschappen. Gebruikmakende van lemma’s wordt er toegewerkt naar de stelling die de paar-copula ontbinding geeft voor de multivariate verdeling. Tenslotte worden in het hoofdstuk twee speciale reguliere vines gedefinieerd, namelijk de C-vine en de D-vine. In hoofdstuk 4 vervolgens wordt stap-per-stap beschreven hoe de vine copula in theorie kan worden toegepast op financi¨ele rendementen. Dit gebeurt door eerst een correct model te vinden voor de verschillende univariate tijdreeksen en vervolgens een geschikte vine-structuur te construeren. Er wordt ook getoond hoe een vine-copula kan worden beschreven aan de hand van een matrices. Bij het construeren van een vine copula moeten heel wat schattingen en modelvergelijkingen worden uitgevoerd. De hoeveelheid werk gaat stijgen met de dimensie van de dataset; daarom wordt er onderzocht of het mogelijk is van een vine te gaan vereenvoudigen of snoeien. Er wordt eveneens rekening gehouden met het feit dat de afhankelijkheid tussen financi¨ele variabelen varieert met de tijd, daarom wordt gekeken naar dynamische copula’s. HOOFDSTUK 1. INLEIDING 3 Eens het volledige model geconstrueerd is moet tenslotte kunnen worden nagegaan of de vine copula de afhankelijkheid van de gekozen portefeuille op een correcte manier beschrijft. Deze evaluatie gebeurd op basis van de Value-at-Risk voorspellingen die worden vergeleken met de gerealiseerde rendementen. Hiermee wordt onderzocht of het model een goede benadering is van de realiteit. In hoofdstuk 5 tenslotte wordt alles wat in theorie werd beschreven toegepast op twee interessante datasets. Een eerste beschrijft de maandelijkse rendementen van 14 Europese landen. De andere dataset bevat de dagelijkse rendementen van de componenten van de BEL20 index. De implementatie gebeurt in R en men onderschijdt hiervoor drie cases. In de eerste case wordt voor de Europese landen vier verschillende vines geconstrueerd en worden ze met elkaar vergeleken. Ook wordt onderzocht of kan worden vereenvoudigd en gesnoeid en of de afhankelijkheid varieert met de tijd. Op de BEL20 wordt het Regular Vine Market Sector model toegepast die zal toelaten voor elk aandeel van de BEL20 speciefieke risico-factoren te bepalen. In een derde case wordt voor een portefeuille van vijf aandelen een reguliere vine geconstrueerd en worden de rendementen voorspeld gedurende een jaar. Op basis van de Value-at-Risk wordt dan tenslotte de vine ge¨evalueerd. Hoofdstuk 2 Copula’s In dit hoofdstuk worden de concepten rond copula’s ingeleid aan de hand van Kadankova (2013), Kurowicka & Cooke (2006) en Nelsen (2006) met de nodige definities. Het is dankzij het theorema van Sklar dat de copula-functie zo interessant is. Deze laat toe de multivariate verdelingsfunctie te beschrijven aan de hand van de marginale verdelingsfuncties en de afhankelijkheidsstructuur gegeven door de copulafunctie. Vervolgens worden enkele interessante afhankelijkheidsgrootheden gegeven die afgeleid kunnen worden uit de copula en die later gebruikt zullen worden om de vine-structuur te, zoals de tail dependence, de Kendall’s tau en de Spearman’s rang correlatie. Tenslotte worden verschillende bivariate copula families beschreven samen met hun respectievelijke karakteristieken. Deze paar-copula’s zal men gebruiken voor het bekomen van de paar copula ontbinding van de multivariate afhankelijkheid. Doorheen dit werk beschouwt men continue en inverteerbare verdelingsfuncties. Zij X = (X1 , . . . , Xn ) ∈ Rn een vector van willekeurige variabelen met continue en inverteerbare marginale verdelingsfuncties Fi (x) = P[Xi ≤ x], i ∈ {1, . . . , n} en gezamenlijke verdelingsfunctie F op Rn met Borel sigma algebra B. Beschouw de vector U = (F1 (X1 ), . . . , Fn (Xn )), waarbij de componenten Ui = Fi (Xi ) wegens de probability integral transform uniform verdeeld zijn. Dan hebben we ook Xi = F −1 (Ui ) voor i ∈ {1, . . . , n}. De copula-functie wordt dan gedefinieerd als volgt. Definitie 2.1 Een n-dimensionale copula is een functie C : [0, 1]n → [0, 1], dat de verdelingsfunctie is van een willekeurige vector (U1 , . . . , Un ) met uniforme marginale verdelingen op [0, 1] De n-dimensionale copula bezit volgende eigenschappen: • C is stijgend in iedere component, • C(1, 1, . . . , ui , . . . , 1) = ui , i ∈ (1, . . . , n), 4 HOOFDSTUK 2. COPULA’S 5 • C(u1 , . . . , un ) = 0 als een van de argumenten 0 is, • rechthoek eigenschap: VC (B) ≥ 0 voor alle rechthoeken B = Qn i=1 [ai , bi ], waarbij het C-volume van B gedefinieerd is als VC (B) = 2 X i1 =1 ... 2 X (−1)i1 +...+in C (xi1 , . . . , xin ) in =1 met xj1 = aj en xj2 = bj . Vertrekkende van een multivariate kansverdeling, kan de copula functie worden geschreven als, P (X1 ≤ F −1 (u1 ), . . . , Xn ≤ F −1 (un )) = P (U1 ≤ u1 , . . . , Un ≤ un ) = C(u1 , . . . , un ) Of ook nog P (X1 ≤ x1 , . . . , Xn ≤ xn ) = P (F1 (X1 ) ≤ F1 (x1 ), . . . , Fn (Xn ) ≤ Fn (xn )) = C (F1 (x1 ), . . . , Fn (xn )) In het bivariaat geval geeft dit dan, Definitie 2.2 Een bivariate copula is een functie C : [0, 1]2 → [0, 1] met de volgende eigenschappen voor u1 , u2 ∈ [0, 1]: • C(u1 , 1) = u1 en C(1, u2 ) = u2 , • C(u1 , 0) = C(0, u2 ) = 0, • C is 2-stijgend, dus voor elke u11 , u12 , u21 , u22 ∈ [0, 1] zodat voor u11 ≤ u21 en u12 ≤ u22 geldt, C(u21 , u22 ) − C(u21 , u12 ) − C(u11 , u22 ) + C(u11 , u12 ) ≥ 0. De populariteit van de copula-functie is te danken aan het theorema van Sklar (1959) die de relatie weergeeft tussen de copula C en de verdeling van X = (X1 , . . . , Xn ) en aantoont hoe de afhankelijkheid tussen de variabelen kan gescheiden worden van de marginale verdelingen. Stelling 2.1 (Sklar) Gegeven willekeurige variabelen X1 , . . . , Xn met continue verdelingsfuncties F1 , . . . , Fn en gezamenlijke verdelingsfunctie F , dan bestaat er een unieke copula C zodat voor alle x = (x1 , . . . , xn ) ∈ Rn : F (x1 , . . . , xn ) = C(F1 (x1 ), . . . , Fn (xn )) (2.1) Anderzijds, gegeven verdelingsfuncties F1 , . . . , Fn en een copula C, F gedefinieerd aan de hand van (2.1) is een n-variate verdelingsfunctie met marginale verdelingen F1 , . . . , Fn . HOOFDSTUK 2. COPULA’S 6 De copula koppelt dus de marginale verdelingen aan de gezamenlijke verdeling. Uit (2.1) volgt dat de gezamenlijke verdelingsfunctie kan geconstrueerd worden door eerst de marginale verdelingen te bepalen, en vervolgens het onderliggende copula-model te selecteren. Indien de marginale verdelingsfuncties niet continu zijn dan is de copula in (2.1) niet uniek. Het theorema kan ook worden herschreven als F F1−1 (u1 ) . . . , Fn−1 (un ) = C (u1 , . . . , un ) (2.2) Bovenstaande formule geeft weer hoe men de copula kan afleiden uit een bepaalde multivariate verdeling met de marginale verdelingen, Fi (xi ) = F (∞, . . . , xi , ∞, . . . , ∞) . Aangezien de copula-functie een verdelingsfunctie is kan hiervoor ook een copula dichtheid worden afgeleid indien alle afgeleiden bestaan. Dit gebeurt als volgt. f (x1 , . . . , xn ) = ∂ n F (x1 ,...,xn ) ∂x1 ...∂xn = ∂ n C(F1 (x1 ),...,Fn (xn )) ∂x1 ...∂xn = ∂ n C(F1 (x1 ),...,Fn (xn )) f1 (x1 ) . . . fn (xn ) ∂F1 (x1 )...∂Fn (xn ) = c(F1 (x1 ), . . . , Fn (xn ))f1 (x1 ) . . . fn (xn ) In de praktijk zal vaak ook de survival copula worden gebruikt. Zij F¯ (x1 , x2 ) = P[X1 > x1 , X2 > x2 ] een gezamenlijke survival verdelingsfunctie en F¯1 (x1 ) = F¯ (x1 , ∞) en F¯2 (x2 ) = F¯ (∞, x2 ). Dan geldt F¯ (x1 , x2 ) = 1 − F1 (x1 ) − F2 (x2 ) + F (x1 , x2 ) = F¯1 (x1 ) + F¯2 (x2 ) − 1 + C(1 − F¯1 (x1 ), 1 − F¯2 (x2 )). Definitie 2.3 De copula geassocieerd met de gezamenlijke verdeling F¯ is de survival copula Cˆ en wordt gedefinieerd als Cˆ : [0, 1]2 → [0, 1], ˆ 1 , u2 ) = u1 + u2 − 1 + C(1 − u1 , 1 − u2 ). C(u Men heeft dan ook, ˆ F¯1 (x1 ), F¯2 (x2 )) = 1 − F1 (x1 ) − F2 (x2 ) + C(F1 (x1 ), F2 (x2 )). F¯ (x1 , x2 ) = C( Zoals eerder vermeld heeft de copula als voordeel dat afhankelijkheidsgrootheden in functie van de copula-functie kunnen worden geschreven. Een van deze afhankelijkheidsgrootheden die heel belangrijk is in de financi¨ele wereld is de tail dependence. Ze beschrijft de afhankelijkheid van verschillende variabelen in de staart van hun verdeling (zware staarten). De tail HOOFDSTUK 2. COPULA’S 7 dependence in het bivariaat geval is de kans dat een gebeurtenis met kans kleiner/groter dan v gebeurt in de eerste variabele gegeven dat een gebeurtenis met kans kleiner/groter dan v gebeurt in de tweede variabele. Men onderscheidt hierbij de lower tail index en de upper tail index. Definitie 2.4 Zij X1 en X2 twee willekeurige variabelen met marginale verdelingsfuncties F1 en F2 dan wordt de lower tail dependence coefficient gedefineerd als C(v, v) λL = lim+ P X1 ≤ F1−1 (v)|X2 ≤ F2−1 (v) = lim+ v→0 v→0 v en de upper tail dependence coefficient wordt gedefineerd als 1 − 2v + C(v, v) λU = lim− P X1 ≥ F1−1 (v)|X2 ≥ F1−1 (v) = lim− . v→1 v→1 1−v Indien λL 6= 0 en λU 6= 0 dan zijn de variabelen X1 en X2 respectievelijk lower en upper tail dependent. Bij het bepalen van de vine-structuur zal het van belang zijn de variabelen met de sterkste afhankelijkheid met elkander te verbinden. Voor het bepalen van de bivariate afhankelijkheid zal men de Kendall’s tau gebruiken, daar deze de algemene afhankelijkheid het best beschrijft. Andere afhankelijkheidsgrootheden zijn de Pearson’s en de Spearmann’s rang correlatiecoeffici¨ent. Voor twee willekeurige variabelen X1 en X2 wordt de Pearson’s correlatie gegeven door ρ = Corr(X1 , X2 ) = p Cov(X1 , X2 ) Var(X1 )Var(X2 ) . In de praktijk wordt de Pearson’s correlatie als maar minder gebruikt daar deze enkel lineaire afhankelijkheid correct meet en niet invariant is voor niet-lineaire stijgende transformaties. Hierdoor wordt er meer gewerkt met de Spearmann’s rang correlatie en de Kendall’s tau die enkel afhangen van de onderliggende copula en bijgevolg onafhankelijk zijn van de marginale verdelingen van X1 en X2 . Ze zijn ook invariant onder monotone stijgende transformaties van de variabelen X1 en X2 . Beide grootheden zijn gebaseerd op het concept van concordantie . Definitie 2.5 Twee observaties (x1 , y1 ) en (x2 , y2 ) van een paar continue variabelen (X, Y ) zijn concordant indien beide waarden van het ene paar groter zijn dan de overeenkomstige waarden van het andere paar, dit is als x1 < x2 , y1 < y2 of x1 > x2 , y1 > y2 . Ze zijn discordant als voor het ene paar een waarde groter en de ander waarde kleiner is dan het andere paar, dit is als x1 > x2 , y1 < y2 of x1 < x2 , y1 > y2 . HOOFDSTUK 2. COPULA’S 8 Figuur 2.1: (a) concordante en (b) discordante paren In Figuur 2.1 wordt een voorbeeld gegeven van een concordant en discordant paar. Zij (X11 , X12 ), (X21 , X22 ) en (X31 , X32 ) onafhankelijk en identiek verdeelde kopies van (X1 , X2 ). De Spearmann’s correlatieco¨effici¨ent is proportioneel met de kans van concordantie min de kans van discordantie van (X11 , X12 ) en (X21 , X32 ), ρS (X1 , X2 ) = 3 (P [(X11 − X21 ) (X12 − X32 ) > 0] − P [(X11 − X21 ) (X12 − X32 ) < 0]) . Als X1 en X2 respectievelijk verdelingsfunctie F1 en F2 hebben komt de Spearmann’s correlatie overeen met de Pearson’s correlatie toegpast op de rangen van de variabelen X1 en X2 , ρS = ρ(F1 (X1 ), F2 (X2 )). De Kendall’s tau wordt op een gelijkaardige manier gedefinieerd, deze wordt gegeven als de kans van concordantie min de kans van discordantie van twee willekeurige variabelen X1 en X2 , τ (X1 , X2 ) = P [(X11 − X21 ) (X12 − X22 ) > 0] − P [(X11 − X21 ) (X12 − X22 ) < 0] . In Kurowicka & Cooke (2006) wordt aangetoond hoe deze twee afhankelijkheidsgrootheden kunnen worden beschreven in functie van de copula-functie. Stelling 2.2 Zij X1 en X2 continue willekeurige variablen met copula C dan wordt de Kendall’s tau gegeven door Z 1Z 1 τ =4 C(u1 , u2 )dC(u1 , u2 ) − 1 0 0 en de Spearman’s correlatie gegeven door Z 1Z ρS = 12 0 1 C(u1 , u2 )du1 du2 − 3. 0 Bewijs: Zij (X11 , X12 ) en (X21 , X22 ) gedefinieerd zoals voordien. Aangezien de variabelen continu zijn geldt P [(X11 − X21 ) (X12 − X22 ) < 0] = 1 − P [(X11 − X21 ) (X12 − X22 ) > 0] . HOOFDSTUK 2. COPULA’S 9 Uit de definitie van de Kendall’s tau op basis van concordantie geldt dan τ (X1 , X2 ) = 2P [(X11 − X21 ) (X12 − X22 ) > 0] − 1. Men heeft ook dat P [(X11 − X21 ) (X12 − X22 ) > 0] kan herschreven worden als P [X11 > X21 , X12 > X22 ] + P [X11 < X21 , X12 < X22 ] en deze kansen kunnen uitgerekend worden door te integreren over de verdeling van (X11 , X12 ). P [X11 > X21 , X12 > X22 ] = P [X21 < X11 , X22 < X12 ] = R = R R2 R2 P [X21 < x1 , X22 < x2 ] dF (x1 , x2 ) C(F1 (x1 ), F2 (x2 ))dC(F1 (x1 ), F2 (x2 )). De transformaties u1 = F1 (x1 ) en u2 = F2 (x2 ) geven dan Z P [X11 > X21 , X12 > X22 ] = C(u1 , u2 )dC(u1 , u2 ). [0,1]2 Op dezelfde manier werkt men P [X11 < X21 , X12 < X22 ] uit gebruikmakend van de survival copula, P [X11 < X21 , X12 < X22 ] = P [X21 > X11 , X22 > X12 ] = R = R = R R2 R2 R2 P [X21 > x1 , X22 > x2 ] dF (x1 , x2 ) ˆ F¯1 (x1 ), F¯2 (x2 ))dC(F1 (x1 ), F2 (x2 )) C( 1 − F1 (x1 ) − F2 (x2 ) + C(F1 (x1 ), F2 (x2 ))dC(F1 (x1 ), F2 (x2 )). Opnieuw de transformaties naar u1 en u2 geven dan Z P [X11 < X21 , X12 < X22 ] = 1 − u1 − u2 + C(u1 , u2 )dC(u1 , u2 ). [0,1]2 Aangezien C de bivariate verdelingsfunctie is van een paar uniform verdeelde variabelen (U1 , U2 ), geldt E[U1 ] = E[U2 ] = 1/2 en dus R P [X11 < X21 , X12 < X22 ] = 1 − 21 − 12 + [0,1]2 C(u1 , u2 )dC(u1 , u2 ) = R [0,1]2 C(u1 , u2 )dC(u1 , u2 ) HOOFDSTUK 2. COPULA’S 10 Men verkrijgt dan Z P [(X11 − X21 ) (X12 − X22 ) > 0] = 2 C(u1 , u2 )dC(u1 , u2 ) [0,1]2 wat de gewenst formule geeft voor de Kendall’s tau, Z τ (X1 , X2 ) = 2P [(X11 − X21 ) (X12 − X22 ) > 0] − 1 = 4 C(u1 , u2 )dC(u1 , u2 ) − 1. [0,1]2 Voor de Spearmann’s correlatie volgt de formule uit de verwachting en de variantie van een uniform verdeelde variabele, ρS (X1 , X2 ) = ρ(F1 (X1 ), F2 (X2 )) = ρ(U1 , U2 ) = E(U1 U2 ) − 1/4 = 12E(U1 U2 ) − 3. 1/12 Door opnieuw te integreren over de gezamenlijke verdelingsfunctie van (U1 , U2 ) krijgt men, Z ρS (X1 , X2 ) = 12 u1 u2 dC(u1 , u2 ) − 3. [0,1]2 Naargelang de afhankelijkheidsstruuctuur van twee variabelen kan men verschillende bivariate copula’s defini¨eren. Hierbij wordt steeds gewerkt met u1 , u2 ∈ [0, 1]. 2.1 Fundamentele copula’s De fundamentele copula-klasse bevat de copula’s die overeenkomen met onafhankelijkheid en maximale en minimale afhankelijkheid. Product copula: C(u1 , u2 ) = Π(u1 , u2 ) = u1 u2 Deze copula komt overeen met de onafhankelijkheid en heeft als copula dichtheid c(u1 , u2 ) = ∂ 2 C(u1 , u2 ) ∂ 2 u1 u2 = = 1. ∂u1 ∂u2 ∂u1 ∂u2 Comonotoniciteits copula: C(u1 , u2 ) = M (u1 , u2 ) = min(u1 , u2 ) Deze copula wordt ook de Frechet upper bound genoemd en komt overeen met maximale afhankelijkheid, de perfecte positieve afhankelijkheid. HOOFDSTUK 2. COPULA’S 11 Tegencomonotoniciteits copula: C(u1 , u2 ) = W (u1 , u2 ) = max(u1 + u2 − 1, 0) Deze copula wordt ook de Frechet lower bound genoemd en komt overeen met de minimale afhankelijkheid, de perfecte negatieve afhankelijkheid. Definitie 2.6 Twee willekeurige variabelen X en Y worden comonotoon genoemd indien er een willekeurige variabele Z en twee niet-dalende functies f en g bestaan zodat X = f (Z) en Y = g(Z). Definitie 2.7 Twee willekeurige variabelen X en Y worden tegencomonotoon genoemd indien er een willekeurige variabele Z, een niet-dalende functie f en een niet-stijgende functie g bestaat zodat X = f (Z) en Y = g(Z). Voor elke copula geldt: W (u1 , u2 ) ≤ C(u1 , u2 ) ≤ M (u1 , u2 ). 2.2 Elliptische copula’s De elliptische copula-klasse bevat copula’s die geassocieerd worden met elliptische verdelingen, en zijn van de vorm (2.2). Ze kunnen makkelijk worden uitgebreid naar hogere dimensies n en hebben veel parameters (minstens n(n − 1)/2). Daarentegen kunnen asymmetrie en asymmetrische tail dependence niet worden weergegeven aan de hand van deze copula-klasse. Simulatie uit elliptische verdelingen is vrij eenvoudig maar de evaluatie van elliptische copula’s moet numeriek gebeuren door de vele integraalberekeningen die nodig zijn. Omwille van hun impliciete definitie is er ook geen eenvoudige expliciete uitdrukking voor de copula. Gaussiaanse (normale) copula: C(u1 , u2 , ρ) = Φ(2) Φ−1 (u1 ), Φ−1 (u2 ) , ρ (2) met Φρ de bivariate normale verdeling met correlatie parameter ρ, en Φ−1 de quantielfunctie van een univariate standaard normaal verdeling. De Gaussiaanse copula heeft noch upper noch lower tail dependence. De hiermee gepaard gaande copula dichtheidsfunctie kan geschreven worden als ρ2 (Φ−1 (u1 )2 + Φ−1 (u2 )2 ) − 2ρΦ−1 (u1 )Φ−1 (u2 ) exp − . c(u1 , u2 ) = p 2(1 − ρ2 ) 1 − ρ2 1 HOOFDSTUK 2. COPULA’S 12 In het artikel Recipe for Disaster: The Formula That Killed Wall Street (2009), legt Felix Salmon uit hoe de Gaussiaanse copula mee aan de basis ligt van de financi¨ele crisis die begon in 2007. De copula functie was een grote doorbraak in de financi¨ele wereld die toeliet complexe risico’s op een veel eenvoudigere en accurate manier te modelleren. Er was zodanig veel geld mee te verdienen dat in Wall Street de beperkingen van de Gaussianse copula vaak werden genegeerd. De slechte risico-beoordeling aan de hand van deze copula, samen met de daling van de huisprijzen in de Verenigde Staten, zorgden ervoor dat vele tripel A of zogezegde risico-vrije obligaties op springen stonden. Het gevolg was de grootste financi¨ele crisis sinds de Grote Depressie. Student t copula: −1 −1 Ct (u1 , u2 , ν, ρ) = t(2) ν,ρ tν (u1 ), tν (u2 ) , (2) met tν,ρ de bivariate t-verdelingsfunctie met correlatie parameter ρ en ν vrijheidsgraden. is de inverse functie van de univariate t-verdeling. De t-copula geeft vaak een betere t−1 ν empirische fit dan de Gaussiaanse copula daar het extreme waarden beter kan beschrijven. De student t copula heeft dezelfde tail dependence in beide staarten. De tail dependence co¨effici¨ent wordt in Heinen & Valdesogo (2009) gegeven als √ √ ν+1 1−ρ λ = λU = λL = 2tν+1 − . 1−ρ De copula dichtheidsfunctie wordt gegeven door − ν+2 −1 2 −1 2 −1 2 (u ) (u )t t−1 (u ) + t (u ) − 2t Γ(ν + 2/2)/Γ(ν/2) 2 1 2 1 ν ν ν p 1+ ν , 2 ν(1 − ρ2 ) νπftν (tν−1 (u1 ))ftν (t−1 ν (u2 )) 1 − ρ met ftν de dichtheidsfunctie van de univariate standaard t verdeling. 2.3 Archimedische copula’s De Archimedische copula-klasse laat in het bivariaat geval toe een groot aantal copulafamilies te construeren met verschillende karakteristieken zoals de tail dependence, de positieve en negatieve afhankelijkheid, enzovoort. Als men deze klasse wenst uit te breiden naar meer-dimensionale copula’s worden er echter strenge beperkingen opgelegd voor de variabelen. De hele afhankelijkheidsstructuur hangt namelijk maar van ´e´en of twee parameters af. In tegenstelling tot de elliptische copula-klasse, is het in de Archimedische copula-klasse wel mogelijk een expliciete uitdrukking te hebben voor de copula-functie. De Archimedische copula’s worden geconstrueerd aan de hand van een generator ϕ, waarvan men de pseudo inverse moet nemen. HOOFDSTUK 2. COPULA’S 13 Definitie 2.8 De pseudo inverse van f is gedefinieerd als: ( f −1 (x) 0 ≤ x ≤ f (0) f [−1] (x) = 0 f (0) ≤ x ≤ ∞ Definitie 2.9 De generator van een copula is een re¨eelwaardige functie ϕ : [0, 1] → [0, ∞] dat continu, strikt dalend en convex is met ϕ(1) = 0, ϕ(0) ≤ ∞ en ϕ[−1] de pseudo-inverse van ϕ. De Archimedische copula met generator ϕ is gedefinieerd als C (u1 , u2 ) = ϕ[−1] (ϕ(u1 ) + ϕ(u2 )) . Enkele eigenschappen in verband met de copula dichtheidsfunctie en de afhankelijkheidsgrootheden voor de Archimedische copula worden hier bewezen. Eigenschap 2.1 De copula-dichtheid van een Archimedische copula met generator ϕ is c(u1 , u2 ) = − ϕ00 (C)ϕ0 (u1 )ϕ0 (u2 ) ϕ0 (C)3 Bewijs: Men herschrijft de definitie van een Archimedische copula met generator ϕ als ϕ(C(u1 , u2 )) = ϕ(u1 ) + ϕ(u2 ). Men gaat deze formule afleiden naar u1 , u2 en u1 en u2 : (i) ∂ϕ(C(u1 , u2 )) ∂C(u1 , u2 ) ∂ϕ(u1 ) = , ∂u1 ∂u1 ∂u1 (ii) ∂ϕ(C(u1 , u2 )) ∂C(u1 , u2 ) ∂ϕ(u2 ) = , ∂u2 ∂u2 ∂u2 (iii) ∂ 2 ϕ(C(u1 , u2 )) ∂C(u1 , u2 ) ∂C(u1 , u2 ) ∂ϕ(C(u1 , u2 )) ∂ 2 C(u1 , u2 ) + =0 ∂u1 ∂u2 ∂u1 ∂u2 ∂u1 ∂u1 ∂u2 Voor een Archimedische copula heeft men dat C(u1 , u2 ) = C(u2 , u1 ) zodat ∂ϕ(C(u1 , u2 )) ∂ϕ(C(u1 , u2 )) = = ϕ0 (C) ∂u1 ∂u2 Uit (iii) kan men c(u, v) afleiden, 1 ,u2 ) ∂C(u1 ,u2 ) ϕ00 (C) ∂C(u ∂ 2 C(u1 , u2 ) ∂u1 ∂u2 =− , 0 ∂u1 ∂u2 ϕ (C) (2.3) HOOFDSTUK 2. COPULA’S met ϕ00 (C) = 14 ∂ 2 ϕ(C(u1 ,u2 )) . ∂u1 ∂u2 Uit (i) en (ii) haalt men respectievelijk ∂C(u1 , u2 ) ϕ0 (u1 ) ∂C(u1 , u2 ) ϕ0 (u2 ) = 0 en = 0 . ∂u1 ϕ (C) ∂u2 ϕ (C) Dit substitueren in (2.3) geeft de gewenste formule voor de copula-dichtheid van een Archimedische copula. In Kurowicka & Cooke (2006) wordt voor een Archimedische copula de Kendall’s tau bewezen in functie van de generator ϕ. Eigenschap 2.2 Zij X en Y willekeurige variabelen met een Archimedische copula C met generator-functie ϕ. Dan is de Kendall’s tau voor X en Y gegeven door Z 1 ϕ(t) τ (X, Y ) = 1 + 4 dt 0 0 ϕ (t) Bewijs: De definitie van de Kendall’s tau kan herschreven worden als Z 1Z 1 Z τ =4 C(u1 , u2 )dC(u1 , u2 ) − 1 = 4 C(u1 , u2 )c(u1 , u2 )du1 du2 − 1. 0 0 [0,1]2 Aan de hand van Eigenschap 2.1 kan men dit herschrijven als Z ϕ00 (C)ϕ0 (u1 )ϕ0 (u2 ) C(u1 , u2 ) τ =− du1 du2 − 1. ϕ0 (C)3 [0,1]2 (2.4) Aangezien uit de definitie van de pseudo-inverse van de generator, C(u1 , u2 ) = 0 voor alle (u1 , u2 ) met ϕ(u1 ) + ϕ(u2 ) = ϕ(0), kan het domein waarover wordt ge¨ıntegreerd, [0, 1]2 , geschreven worden als ϕ(u1 ) + ϕ(u2 ) < ϕ(0). Men wenst nu Z ϕ00 (C)ϕ0 (u1 )ϕ0 (u2 ) du1 du2 − C(u1 , u2 ) ϕ0 (C)3 ϕ(u1 )+ϕ(u2 )<ϕ(0) verder uit te werken. Dit doet men door de transformaties s = C(u1 , u2 ) = ϕ−1 [ϕ(u1 ) + ϕ(u2 )] en t = u2 toe te passen. Voor de berekening van de Jacobiaan past men de eigenschap −1 ∂(u1 , u2 ) ∂(s, t) = ∂(s, t) ∂(u1 , u2 ) HOOFDSTUK 2. COPULA’S toe, met ∂(s,t) ∂(u1 ,u2 ) = ϕ0 (u1 ) . ϕ0 (C) 15 Men krijgt dan Z 1 Z − 1 s 0 s ϕ00 (s) 0 ϕ0 (s) 0 dtds. ϕ (u )ϕ (t) 1 ϕ0 (s)3 ϕ0 (u1 ) Vervolgens integreren naar t geeft Z 1 s 0 ϕ00 (s) ϕ(s)ds. ϕ0 (s)2 Na partiele integratie met u = sϕ(s) en dv = dϕ0 (s) ϕ0 (s)2 (2.5) en gebruikmakende van de eigenschappen van de generator krijgt men voor (2.5), Z 1 Z 1 Z 1 ϕ(s) ϕ(s) 1 sds = ds + ds + . 0 0 2 0 ϕ (s) 0 0 ϕ (s) Wat de gewenste formule geeft na substitutie in (2.4), Z 1 ϕ(t) τ =4 dt + 1. 0 0 ϕ (t) Net zoals bij elliptische copula’s kunnen ze gemakkelijk uitgebreid worden naar n-dimensionale Archimedische copula’s als en slechts als ϕ[−1] ∈ L∞ met Lm = f : R+ → [0, 1]|f (0) = 1, f (∞) = 0, (−1)k f (k) (x) ≥ 0, k ≤ m . Of met andere woorden, indien de pseudo-inverse van de generator volledig monotoon is. In dat geval komt de pseudo-inverse overeen met de inverse van de generator. Zoals eerder vermeldt beschrijven de multivariate Archimedische copula’s de afhankelijkheid niet goed in de praktijk aangezien de beschreven afhankelijkheid niet afhangt van de nummering van de variabelen. Men vermelt hier drie bivariate Archimedische copula’s waarmee in de toepassingen zal worden gewerkt. Ze bezitten elk hun eigen specifieke karakteristieken en dit zal toelaten in de paar-copula ontbinding om complexe afhankelijkheidsstructuren op een correcte manier te beschrijven. Gumbel copula: met generator ϕ(t) = (− ln(t))θ , θ > 0, C (u1 , u2 , θ) = exp [(− ln(u1 ))θ + (− ln(u2 ))θ ]1/θ . De Gumbel copula is upper tail dependent, maar niet lower tail dependent. Clayton copula: met generator ϕ(t) = 1θ (t−θ − 1), θ ∈ [−1, ∞) {−1}, −1/θ −θ . C (u1 , u2 , θ) = [max u−θ 1 + u2 − 1, 0 ] HOOFDSTUK 2. COPULA’S 16 De Clayton copula is lower tail dependent, maar niet upper tail dependent. Voor θ → 0, wordt onafhankelijkheid beschreven en voor θ → ∞ bekomt men perfecte positieve afhankelijheid. Voor geen enkele θ-waarde wordt negatieve afhankelijkheid beschreven. De Frank copula: met generator ϕ(t) = ln C (u1 , u2 , θ) = −θ −1 e−θt −1 e−θ −1 , θ ∈] − ∞, ∞[\ {0}, (e−θu1 − 1)(e−θu2 − 1) ln 1 + . e−θ − 1 De Frank copula is symmetrisch in beide staarten en laat negatieve afhankelijkheid tussen de variabelen toe, dit is voor een negatieve θ. Voor θ → 0 en θ → ∞ wordt opnieuw respectievelijk onafhankelijkheid en postieve perfecte onafhankelijkheid bekomen. De sterkste afhankelijkheid is in het midden van de verdeling en de Frank copula heeft zwakke tail dependence. Hoofdstuk 3 Vine en paar-copula ontbinding In dit hoofdstuk wordt het concept van vines ingevoerd, en meer specifiek de reguliere vine. Hiervoor worden hoofdstukken uit Bedford & Cooke (2001) en Bedford & Cooke (2002) uitgewerkt met behulp van Cooke et al. (2011) en Kurowicka & Cooke (2006). Er wordt eerst een kleine introductie gegeven over grafentheorie aangezien het vine-concept daarop gebaseerd is. Definitie 3.1 Een graaf is een paar verzamelingen, G = (N, E), zodat de bogen E een deelverzameling zijn van {{x, y} : x, y ∈ N }. De elementen van N worden de toppen genoemd. Een graaf is ongericht indien de orde van de toppen overeenkomstig met een boog willekeurig is. Indien elke boog een gewicht meekrijgt, w : E → R, wordt de graaf gewogen genoemd. Indien E = {{x, y} : x, y ∈ N } dan wordt de graaf volledig genoemd. Belangrijke subgrafen zijn het pad en de omloop. Definitie 3.2 Een pad is een graaf P = (N, E) met N = {v0 , v1 , . . . , vk } en E = {{v0 , v1 } , {v1 , v2 } , . . . , {vk−1 , vk }}. Een omloop is een pad met v0 = vk . Een graaf wordt verbonden genoemd indien tussen elke paar knopen een pad bestaat. De belangrijkste klasse van grafen dat men in dit hoofdstuk zal nodig hebben zijn de bomen. Een boom is een verbonden graaf zonder omlopen. De boom wordt gekarakteriseerd door volgende stelling waarbij G ± e betekent dat bij het graaf G de boog e wordt toegevoegd/verwijderd. Stelling 3.1 De volgende eigenschappen zijn equivalent voor een graaf T = (N, E): • T is een boom. • Elk paar toppen van T zijn verbonden aan de hand van een uniek pad in T . • Voor elke boog e ∈ E geldt dat T verbonden is maar T − e is niet verbonden. 17 HOOFDSTUK 3. VINE EN PAAR-COPULA ONTBINDING 18 • Voor niet-aangrenzende toppen x, y ∈ N geldt dat T geen omloop bevat maar T +{x, y} wel. Een spanning tree van een graaf G = (N, E) is een subgraaf T = (NT , ET ), dat een boom is met NT = N . Later in dit hoofdstuk zal aan de hand van elementenverzamelingen, eigenschappen en stellingen worden toegewerkt naar de paar-copula ontbinding van de multi-dimensionale dichtheidsfunctie, deze ontbinding is niet uniek. De mogelijke ontbindingen nemen exponentieel toe met het aantal variabelen waarvan men de afhankelijkheid wenst te bepalen. Om weer te geven op welke manier de ontbinding gebeurt en op welke variabelen er wordt geconditioneerd wordt er gewerkt met vines. Een vine is een grafisch model waarmee multi-dimensionale verdelingen worden opgebouwd met gegeven marginale verdelingen. Het is een speciaal geval van de Cantor bomen en een veralgemening van de Markov bomen. Markov bomen hebben de strenge voorwaarde dat de variabelen conditioneel onafhankelijk zijn. Een vine V voor n elementen is een verzameling bomen V = {T1 , . . . , Tn−1 } waarbij de bogen van boom j de toppen van boom j + 1 zijn, j ∈ {1, . . . , n − 2}. Een reguliere vine is een speciaal geval waarbij alle beperkingen twee-dimensionaal of conditioneel twee-dimensionaal zijn, hierbij geldt dat twee bogen in boom j samen een boog in boom j + 1 vormen enkel indien deze bogen een gezamenlijke top delen, j ∈ {1, . . . , n + 2}. Definitie 3.3 V is een vine voor n elementen als • V = {T1 , . . . , Tm }, • T1 is een verbonden boom met toppen N1 = {1, . . . , n}, en bogen E1 ; voor i ∈ {2, . . . , m}, Ti is een boom met toppen Ni ⊂ N1 ∪E1 ∪. . .∪Ei−1 en bogen Ei ⊂ {{e1 , e2 } : e1 , e2 ∈ Ni }. Nadat de paar-copula ontbinding wordt toegepast in drie dimensies worden tenslotte de Dvine en C-vine gedefinieerd als speciale gevallen van de reguliere vine met een eenvoudigere vine-structuur en paar-copula ontbinding. Men veronderstelt doorheen dit hoofstuk dat alle gezamenlijke, marginale en conditionele verdelingen absoluut continu zijn met overeenkomstige dichtheidsfuncties. 3.1 Reguliere vine Op basis van de definitie van de vine, wordt de reguliere vine als volgt gedefinieerd. Definitie 3.4 V is een reguliere vine voor n elementen met E(V) = E1 ∪ . . . ∪ En−1 de verzameling bogen van V als HOOFDSTUK 3. VINE EN PAAR-COPULA ONTBINDING 19 • m = n − 1, • Ti is een verbonden boom met bogen Ei en toppen Ni = Ei−1 voor i ∈ {2, . . . , n} en card(Ni ) = n − (i − 1), • de proximiteitsvoorwaarde: voor i ∈ {2, . . . , n − 1}, indien a = {a1 , a2 } en b = {b1 , b2 } twee toppen zijn in Ni verbonden door een boog e ∈ Ei dan geldt card(a ∩ b) = 1. Een reguliere vine voor n elementen heeft n − 1 bomen, waarbij elke boom Tj bestaat uit n + 1 − j toppen en n − j bogen. De toppen in de boom Tj zijn nodig om de bogen te bepalen. Twee toppen in Tj+1 en dus twee bogen in Tj , zijn verbonden via een boog in Tj+1 als de twee bogen in Tj een gemeenschappelijke top delen. Een boog e in boom Tj is een ongeordend paar toppen van Tj . Omdat Nj ⊂ E0 ∪ E1 ∪ . . . ∪ Ej−1 , met E0 = N1 , bestaan er bogen e1 ∈ Ei en e2 ∈ Ek , i, k < j zodat e = {e1 , e2 }. De rang van een boog in boom Tj is j − 1, j ∈ {1, . . . , n − 1}. De graad van een top is het aantal buren die het heeft in de boom. De proximiteitsvoorwaarde vereist dat twee bogen in boom Ti verenigd worden in boom Ti+1 enkel en alleen als ze een gemeenschappelijke top delen in Ti . Er worden nu verschillende verzamelingen toppen en bogen gedefinieerd die handig zullen zijn bij de vine uitwerking en die zullen toelaten de beperkingen te specificeren. De volledige unie van een boog is de verzameling van indexen {1, . . . , n} dat deze boog bevat. Als twee toppen a en b verbonden zijn door een boog dan zijn de conditioned set en de conditioning set van de boog respectievelijk het symmetrisch verschil en de doorsnede van de volledige unies van a en b. Formeel definieert men deze verzamelingen als volgt. Definitie 3.5 Voor e ∈ Ei , i ∈ {1, . . . , n − 1} geldt dat e1 een element is van e, met e1 ∈ Ei−1 = Ni , indien ∃e2 ∈ Ni : e = {e1 , e2 } of met andere woorden indien de top e1 verbonden is met een andere top e2 door middel van boog e. Definitie 3.6 Voor elke boog e = ei ∈ Ei , i ≤ n − 1, is de volledige unie van e de deelverzameling van {1, . . . , n} dat bereikbaar is vanuit e: Ue∗ = {j ∈ N1 = E0 |∃1 ≤ i1 ≤ i2 ≤ . . . ≤ ir = i, eik ∈ Eik , k ∈ {1, . . . , r} , met j ∈ ei1 en eik ∈ eik+1 , k ∈ {1, . . . , r − 1} Er geldt voor e ∈ Ei , i ≤ n − 1, e = {e1 , e2 } dat Ue∗ = Ue∗1 ∪ Ue∗2 . Definitie 3.7 Voor i ∈ {1, . . . , n − 1} , e ∈ Ei , als e = {e1 , e2 } dan is de conditioning set geassocieerd met e gelijk aan De = Ue∗1 ∩ Ue∗2 . HOOFDSTUK 3. VINE EN PAAR-COPULA ONTBINDING 20 Definitie 3.8 Voor i ∈ {1, . . . , n − 1} , e ∈ Ei , als e = {e1 , e2 } dan is de conditioned set geassocieerd met e gelijk aan {Ce,e1 , Ce,e2 } = Ue∗1 \ De , Ue∗2 \ De . De constraint set van een reguliere vine bevat alle nodige informatie om het te onderscheiden van andere reguliere vines. Definitie 3.9 Voor e ∈ Ei , i ≤ n − 1, is de constraint set geassocieerd met e de volledige unie van e. De constraint set voor V is dan CV = {(Ce,e1 , Ce,e2 , De ) |i ∈ {1, . . . , n − 1} , e ∈ Ei , e = {e1 , e2 }} Merk op dat voor e = {e1 , e2 } , e ∈ Ei : Ue∗ = Ce,e1 ∪ Ce,e2 ∪ De . De conditioning set is leeg voor e ∈ E1 en de cardinaliteit van de conditioning set komt overeen met de graad van de boog. De conditioning set De wordt rechts weergegeven van | en de conditioned set {i1 , i2 } links ervan, voor i1 , i2 ∈ {1, . . . , n} worden de bogen van de reguliere vine opgeschreven als ”i1 i2 |De ” met i1 < i2 . De notatie van de boog e in Ti hangt af van de twee bogen in Ti−1 die wegens de proximiteitsvoorwaarde een gemeenschappelijke top hebben. Men beschouwt de bogen a = a1 , a2 |Da en b = b1 , b2 |Db met respectievelijk Ua∗ = {a1 , a2 , Da } en Ub∗ = {b1 , b2 , Db }. De toppen a en b in de boom Ti worden dus verbonden door de boog e = e1 , e2 |De met e1 e2 De = min {i : i ∈ Ua∗ ∪ Ub∗ \De }, = max {i : i ∈ Ua∗ ∪ Ub∗ \De }, = Ua∗ ∩ Ub∗ . Om deze begrippen beter te begrijpen gaat men deze verzamelingen bepalen voor een concreet voorbeeld. Zij een D-vine1 voor 5 elementen, die er uit ziet zoals in Figuur 3.1. 1 dit is speciaal geval van de reguliere vine dat later in dit hoofdstuk zal worden gedefinieerd HOOFDSTUK 3. VINE EN PAAR-COPULA ONTBINDING 21 Figuur 3.1: D-vine voor 5 variabelen Men neemt als boog e = 14|23 in T3 . Dan geldt e = {13|2, 24|3} en we vinden dat • de volledige unie van e overeenkomt met Ue∗ = {j ∈ N1 |1 ∈ 12, 2 ∈ 12, 3 ∈ 23, 4 ∈ 34, 12 ∈ 13|2, 23 ∈ 13|2, 34 ∈ 24|3, 13|2 ∈ 14|23, 24|3 ∈ 14|23} = {1, 2, 3, 4} • de conditioning set ∗ ∗ De = U13|2 ∩ U24|3 = {1, 2, 3} ∩ {2, 3, 4} = {2, 3} • de conditioned sets ∗ Ce,13|2 = U13|2 \ D14|23 = {1, 2, 3} \ {2, 3} = {1} ∗ Ce,24|3 = U24|3 \ D14|23 = {2, 3, 4} \ {2, 3} = {4} Men wenst te bewijzen hoeveel elementen elke verzameling telt, hiervoor moet men eerst een nieuwe verzameling bogen invoeren met een bijhorend lemma alsook een relatie tussen de bogen defini¨eren. Definitie 3.10 Zij V een reguliere vine en boog e ∈ Ei , de j-fold union van e, 0 < j ≤ i − 1, is de deelverzameling Ue (j) = {e ∈ Ei−j |∃ bogen ek ∈ Ek , k ∈ {i − j + 1, . . . , i − 1} met ek ∈ ek+1 , k ∈ {i − j, . . . , i − 1}} Voor j = 0 geldt Ue (0) = e en voor j = i geldt Ue (i) = Ue∗ . HOOFDSTUK 3. VINE EN PAAR-COPULA ONTBINDING 22 Als men opnieuw kijkt naar het voorbeeld van voordien, vindt men dat Ue (2) = {e ∈ E1 : 12 ∈ 13|2, 23 ∈ 13|2, 34 ∈ 24|3, 13|2 ∈ 14|23, 24|3 ∈ 14|23} = {12, 23, 34} Ue (1) = {e ∈ E2 : 13|2 ∈ 14|23, 24|3 ∈ 14|23} = {13|2, 24|3} Definitie 3.11 Indien een top e een element is van een boog f , zegt men dat e een m-kind is van f . Indien e bereikbaar is vanuit f via de elements-relatie, e ∈ ei1 ∈ . . . ∈ f , zegt men dat e een m-afstammeling is van f . Lemma 3.1 Zij V een reguliere vine voor n elementen, e ∈ Ei dan geldt dat #Ue (j) = j + 1 voor j ∈ {0, 1, . . . , i} . Bewijs: Uit de definitie van de j-fold union en de boog-constructie, geldt het lemma duidelijk voor j = 0 en j = 1. Wegens de proximiteitseigenschap volgt dat het ook geldt voor j = 2. Men beweert nu algemeen dat #Ue (j) = 2#Ue (j − 1) − #Ue (j − 2), j ∈ {2, . . . , i} . Om dit aan te tonen gaat men de j-fold union weergeven aan de hand van een volledige binaire boom met als toppen de toppen uit de reguliere vine die bereikbaar zijn vanuit e. Om beter te begrijpen wat er wordt gedaan in de rest van het bewijs zal men opnieuw verwijzen naar het voorbeeld van voordien, met boog e = 14|23. De binaire boom kan dan worden weergegeven zoals in Figuur 3.2. Figuur 3.2: j-fold union voor e met j ∈ (0, 1, 2, 3) De toppen die meer dan ´e´en keer voorkomen in de boom worden onderlijnd en de kinderen van onderlijnde toppen worden eveneens onderlijnd (in het voorbeeld is dit 23, 1, 2 en 3). Wegens de proximiteitseigenschap geldt dat toppen met een gemeenschappelijke ouder ook een gemeenschappelijk kind hebben (zoals 13|2 en 24|3 hebben als gemeenschappelijk ouder 14|23 en als gemeenschappelijk kind 23, idem voor 12 en 23 die 2 als gemeenschappelijk kind hebben). Men noemt een top onlangs onderlijnd indien de top geen kind is van een HOOFDSTUK 3. VINE EN PAAR-COPULA ONTBINDING 23 onderlijnde top, het aantal onlangs onderlijnde toppen op niveau k is dan gelijk aan het aantal niet-onderlijnde toppen op niveau k − 2 ( voor k = 3 zijn dat respectievelijk de toppen {2, 3} en {13|2, 24|3}, voor k = 2 is dit {23} en {14|23} ). Zodat het aantal niet-onderlijnde toppen op niveau k, #Ue (k), gelijk is aan 2#Ue (k − 1) − #Ue (k − 2). Om het uiteindelijke resultaat te bewijzen volstaat het om inductie toe te passen op j. De basisstap heeft men al, men veronderstelt dat het geldt voor 0 ≤ k < j, dan geldt volgens de inductiestap #Ue (j) = 2#Ue (j − 1) − #Ue (j − 2) = 2j − (j − 1) = j + 1. Lemma 3.2 Zij V een reguliere vine voor n elementen dan geldt voor alle i ∈ {1, . . . , n − 1} en e ∈ Ei dat de conditioned sets geassocieerd met e singletons zijn: #Ce,e1 = 1. Verder geldt ook #Ue∗ = i + 1 en #De = i − 1. Bewijs: Aangezien Ue∗ = Ue (i), volgt uit Lemma 3.1 dat #Ue∗ = i + 1. De andere beweringen worden bewezen via inductie op i ∈ {1, . . . , n − 1}. Aangezien voor bogen in T1 de conditioning sets leeg zijn gelden de beweringen voor i = 1: #De = 0 en #Ce,e1 = #Ue∗1 = 1 met e1 ∈ N1 = E0 . Men veronderstelt nu dat de beweringen gelden voor 1 ≤ m < i. Zij e = {e1 , e2 } met e1 = {j1 , j2 } en e2 = {k1 , k2 } ∈ Ei−1 . Wegens de proximiteitseigenschap geldt dat #e1 ∩ e2 = 1 en dus moet ´e´en van de j1 , j2 gelijk zijn aan ´e´en van de k1 , k2 , men neemt j1 = k1 . Er geldt dat Ue∗ = Ue∗1 ∪ Ue∗2 = Uj∗1 ∪ Uj∗2 ∪ Uk∗1 ∪ Uk∗2 . Uit de definitie van de conditioning set en de inductieveronderstelling volgt er dat #De1 = # Uj∗1 ∩ Uj∗2 = i − 2. Nog wegens de inductieveronderstelling geldt #Uj∗1 = #Uj∗2 = i − 1 en #Ue∗1 = # Uj∗1 ∪ Uj∗2 = i. Hieruit volgt dat Uj∗2 \ Uj∗1 juist ´e´en element bevat en hetzelfde geldt voor Uj∗1 \ Uj∗2 . Deze twee elementen moeten bovendien verschillend zijn, anders zou Ue∗1 = Ue∗2 en bijgevolg #Ue∗ = i wat in contradictie is met Lemma 3.1. Omdat #Ue∗ = # Ue∗1 ∪ Ue∗2 = i + 1 en hiervan twee elementen zijn met ´e´en niet in Ue∗1 en ´e´en niet in Ue∗2 , volgt dat #De = # Ue∗1 ∩ Ue∗2 = i − 1. Tenslotte krijgt men voor #Ce,e1 = # Ue∗1 \ De = 1, waarmee alle beweringen zijn bewezen. Voor een reguliere vine geldt ook nog zonder bewijs, Eigenschap 3.1 Zij V = {T1 , . . . , Tn−1 } een reguliere vine, dan • is het aantal bogen gelijk aan n(n − 1)/2, • bestaat elke conditioned set uit 2 elementen, elk paar toppen uit T1 komt juist ´e´en keer voor als conditioned set, HOOFDSTUK 3. VINE EN PAAR-COPULA ONTBINDING 3.2 24 Paar-copula ontbinding In dit hoofdstuk wenst men te komen tot de stelling waarbij de n-dimensionale dichtheidsfunctie wordt herschreven als een product van univariate dichtheidsfuncties en van paarcopula’s toegepast op de verdelingsfuncties en de conditionele verdelingsfuncties van de variabelen. Dit doet men aan de hand van een reguliere vine. Elke boog van een reguliere vine is geassocieerd met een beperking op de bivariate of conditionele bivariate verdeling, weergegeven aan de hand van een paar-copula. Men veronderstelt dat voor elke boog e ∈ Tk , k ∈ {1, . . . , n − 1} en elke mogelijke waarde van de variabelen in de conditioning set De , een copula is gegeven. Voor de boog i1 i2 |De wordt de overeenkomstige copula genoteerd als Ci1 i2 |De en de copula-dichtheid als ci1 i2 |De . De toppen uit de eerste boom komen overeen met de variabelen en indien een boog getrokken wordt tussen twee variabelen wordt aan de hand van de paar-copula de afhankelijkheid gemodelleerd tussen die twee variabelen. Voor alle j ∈ N1 is ook de marginale verdeling Fj gegeven. Eerst worden een paar lemma’s bewezen om uiteindelijk tot de hoofdstelling te komen van dit hoofdstuk, de paar-copula ontbinding van multivariate afhankelijkheid. Definitie 3.12 Een boog e ∈ Ek+1 is rond een top j ∈ Nk indien e de toppen e1 en e2 ∈ Nk+1 verbindt, deze komen overeen met de bogen in Ek verbonden met j. Figuur 3.3: boog e rond top j Aangezien boog e rond top j is geldt: De = Ue∗1 ∩ Ue∗2 = Ui∗ ∪ Uj∗ ∩ Uj∗ ∪ Uk∗ = Uj∗ (3.1) Lemma 3.3 Zij V een reguliere vine voor n elementen en k een geheel getal 1 ≤ k < n − 1. Gegeven een top i in boom Tk , er zijn precies graad(i) − 1 bogen in Tk+1 rond i. Bewijs: Men mag zonder verlies van algemeenheid veronderstellen dat k = 1. (i) Eerst wordt aangetoond dat graad(i) − 1 het maximum aantal bogen is in T2 rond i. Volgens de definitie van de graad van een top, zijn er graad(i) bogen die i verbinden met andere toppen. Deze bogen vormen de toppen ,N2 = E1 , in T2 zodat indien HOOFDSTUK 3. VINE EN PAAR-COPULA ONTBINDING 25 ze worden verbonden door bogen, ze rond i zullen zijn. Omdat T2 een boom moet zijn, kunnen er geen omlopen in voorkomen. Daarom zijn er hoogstens graad(i) − 1 verschillende bogen in T2 rond i. (ii) Vervolgens wordt aangetoond dat er juist graad(i) − 1 bogen in T2 rond i zijn. Elke boog in T2 kan enkel rond ´e´en top van T1 zijn, anders zou er een omloop voorkomen in T1 , dit volgt uit de proximiteitsvoorwaarde van reguliere vines. Veronderstel dat er een top i in T1 is dat minder dan graad(i) − 1 bogen rond zich heeft in T2 , dan kan men het totaal aantal bogen in T2 opsommen als P j∈N1 P (graad(j) − 1) # (bogen rond j) < Pj∈N1 = j∈N1 (graad(j)) − n Aangezien er n − 1 bogen zijn in T1 en dat elke boog twee toppen verbindt, geldt er P dat j∈N1 (graad(j)) = 2(n − 1) en bijgevolg is het aantal bogen in T2 gelijk aan 2(n − 1) − n = n − 2. Wat in tegenstelling is met het feit dat T2 n − 1 bogen heeft. Om de gezamenlijke verdelingsfunctie te specificeren wordt de reguliere vine-structuur gedefinieerd voor een bepaalde verdeling. Definitie 3.13 (F, V, B) is een reguliere vine specificatie als • F = (F1 , . . . , Fn ) een vector is van continue inverteerbare verdelingsfuncties, • V een reguliere vine is voor n elementen, • B = {Be (d)|e ∈ Ei , i ∈ {1, . . . , n − 1}} met Be (d) een verzameling van copula’s en d een vector met de waardes van de variabelen in De . Een gezamenlijke verdeling F1...n voor de variabelen X1 , . . . , Xn heeft reguliere vine-afhankelijkheid als voor elke e ∈ Ei , de copula van XCe,e1 en XCe,e2 gegeven XDe een lid is van Be (XDe ) en de marginale verdeling van Xi is Fi , i ∈ {1, . . . , n}. In volgend lemma wordt de bivariate copula-dichtheid geschreven aan de hand van de bivariate dichtheidsfunctie en de marginale dichtheidsfuncties. Lemma 3.4 Zij F12 (x1 , x2 ) een verdelingsfunctie met drager B1 × B2 ⊂ R2 en dichtheid f12 . Veronderstel dat de marginale dichtheden f1 en f2 strikt positief zijn op respectievelijk B1 en B2 . Zij C12 de copula van F12 en c12 haar dichtheid, dan geldt c12 (F1 (x1 ), F2 (x2 )) = f12 (x1 , y1 ) . f1 (x1 )f2 (x2 ) HOOFDSTUK 3. VINE EN PAAR-COPULA ONTBINDING 26 Bewijs: Om dit te bewijzen wordt er gebruikt gemaakt van de dichtheidstransformatieformule. Deze zegt dat voor de transformaties U = U (X, Y ) en V = V (X, Y ) er geldt dat fU V (u, v) = fXY (x, y) . |∂(u, v)/∂(x, y)| Onder de transformatie (x1 , x2 ) 7→ (F1 (x1 ), F2 (x2 )) en met fXY = f12 en fU V = c12 geeft deze formule c12 (F1 (x1 ), F2 (x2 )) = f12 (x1 , y1 ) |∂(F1 (x1 ), F2 (x2 ))/∂(x1 , x2 )| waarbij de Jacobiaan ∂F1 (x1 ) 1 |∂(F1 (x1 ), F2 (x2 ))/∂(x1 , x2 )| = ∂F∂x 2 (x2 ) ∂x 1 ∂F1 (x1 ) ∂x2 ∂F2 (x2 ) ∂x2 = f1 (x1 )f2 (x2 ). Wat de gewenste formule geeft voor de copuladichtheid. Om de notaties te vereenvoudigen in de komende bewijzen, zal men de dichtheidsfuncties fi (xi ), f1...n (x1 , . . . , xn ) en (conditionele) verdelingsfuncties Fi|De (xie ) schrijven als respectievelijk fi , f1...n en Fi|De . Stelling 3.2 Zij V = {T1 , . . . , Tn−1 } een reguliere vine voor n elementen, gegeven Fi en Cij|De zoals voordien, er is een unieke vine-afhankelijke verdeling met dichtheidsfunctie gegeven door ! Q n−1 Y Y f 1 ij Q (i,j)∈E f1...n = cij|De Fi|De , Fj|De . graad(i)−1 i∈N1 (fi ) m=2 e∈E m Bewijs: Het bewijs wordt geleverd aan de hand van de omgekeerde inductie dat wordt toegepast op het niveau van de bomen in de vine. Men beweert dat voor alle 2 ≤ M ≤ n − 1 geldt, f1...n = n−1 Y Y m=M e∈Em cij|De Fi|De , Fj|De ! Q Q e∈EM −1 k∈NM −1 (fUk ) ∗ fUe∗ graad(k)−1 . (3.2) (i) Basisstap: De bewering geldt voor M = n − 1. Zij e = {e1 , e2 } de enige boog in Tn−1 met Ue∗1 = {i} ∪ De en Ue∗2 = {j} ∪ De , met {i, j} ∈ / De , dan geldt wegens de definitie van de conditionele dichtheidsfunctie: f1...n = fij|De fDe . Gebruikmakende van Lemma 3.4 kan dit worden herschreven als HOOFDSTUK 3. VINE EN PAAR-COPULA ONTBINDING 27 = cij|De Fi|De , Fj|De fi|De fj|De fDe f1...n = cij|De Fi|De , Fj|De fUe∗1 fUe∗2 fDe De boom Tn−2 heeft 3 toppen en 2 bogen, bijgevolg moet ´e´en van de toppen, zij k, graad 2 hebben en is de boog e van Tn−1 rond k, zoals weergegeven in Figuur 3.4. Bijgevolg is volgens (3.1), De = Uk∗ en de bewering (3.2) is bewezen voor M = n − 1. Figuur 3.4: Tn−1 en Tn−2 (ii) Inductiestap: Men veronderstelt dat de formule (3.2) geldt voor M , men wenst nu aan te tonen dat dit ook het geval is voor M − 1. Men past dus de ontbinding toe voor alle bogen van TM , ! Q n−1 Y Y e∈EM −1 fUe∗ Q f1...n = cij|De Fi|De , Fj|De . graad(k)−1 (f Uk∗ ) k∈N M −1 m=M e∈E m Voor elke boog e ∈ EM −1 zijn er toppen in NM −1 , of equivalent bogen in EM −2 , dat men e1 en e2 noemt zodat e = {e1 , e2 }. Bijgevolg geldt Ue∗ = Ue∗1 ∪ Ue∗2 = Ce,e1 ∪ Ce,e2 ∪ De = {i, j} ∪ De met Ce,e1 = {i} en Ce,e2 = {j}. Dus kan fUe∗ verder worden ontbonden zoals in (i), fUe∗ = fij|De fDe = cij|De Fi|De , Fj|De fUe∗ 1 fUe∗ 2 fDe Als men dit laatste substitueert in (3.2) krijgt men ! n−1 Y Y Y fUe∗ fUe∗ 1 1 2 Q cij|De Fi|De , Fj|De f1...n = ∗ graad(k)−1 fDe k∈NM −1 (fUk ) e∈EM −1 m=M −1 e∈Em {z } | (∗) HOOFDSTUK 3. VINE EN PAAR-COPULA ONTBINDING 28 Men heeft dus de gewenste paar-copula’s in de ontbinding voor M − 1, er rest dus nog te bewijzen dat (∗) gelijk is aan Q Q e∈EM −2 k∈NM −2 (fUk ) ∗ fUe∗ graad(k)−1 . Dit doet men door het product in (∗) op te splitsen in twee delen en te herschrijven: (1) Eerst kijkt men naar Q Q e∈EM −1 fUe∗1 fUe∗2 ∗ graad(k)−1 k∈NM −1 (fUk ) . (3.3) Elke boog e ∈ EM −1 brengt twee toppen e1 , e2 ∈ NM −1 = EM −2 met zich mee. Dus bij het nemen van het product over de bogen van EM −1 geldt voor elke k ∈ NM −1 dat de multipliciteit van fUk∗ overeenkomt met het aantal keer dat de top k voorkomt in een boog e ∈ EM −1 , of anders gezegd met de graad van top k. Bijgevolg geldt dat Y Y fUe∗1 fUe∗2 = graad(k) fU ∗ k e∈EM −1 . k∈NM −1 Als men nu in (3.3) dit laatste substitueert, krijgt men de breuk Q Q graad(k) k∈NM −1 fU ∗ k ∗ graad(k)−1 k∈NM −1 (fUk ) , dat simpelweg vereenvoudigd kan worden tot Y fUk∗ = k∈NM −1 Y fUe∗ . e∈EM −2 Q (2) Tenslotte wenst men e∈EM −1 fDe te herschrijven. Voor elke boog e ∈ EM −1 is er een top k ∈ NM −2 waarvoor gedt dat e rond k is en dus is De = Uk∗ . Het bovenstaande product kan worden uitgewerkt gebruikmakend van Lemma 3.3, dat zegt dat voor elke k ∈ NM −2 er graad(k) − 1 bogen zijn in TM −1 rond k, Y e∈EM −1 Y fDe = e∈EM −1 fUk∗ = Y graad(k)−1 fU ∗ k . k∈NM −2 Door (1) en (2) toe te passen in (∗) krijgt men de gewenste formule (3.2) voor M − 1, waarmee de inductiestap is bewezen. HOOFDSTUK 3. VINE EN PAAR-COPULA ONTBINDING 29 Stelling 3.3 (Paar-copula ontbinding) Zij V = {T1 , . . . , Tn−1 } een reguliere vine voor n elementen, gegeven Fi en Cij|De zoals voordien, er is een unieke vine-afhankelijke verdeling met dichtheidsfunctie gegeven door f1...n = f1 . . . fn n−1 Y Y cij|De Fi|De , Fj|De . m=1 e∈Em Bewijs: Vertrekkende van de ontbinding bekomen in Stelling 3.2: ! Q n−1 Y Y f 1 ij Q (i,j)∈E f1...n = cij|De Fi|De , Fj|De , graad(i)−1 (f ) i i∈N 1 m=2 e∈E m kan men de bivariate dichtheidsfuncties fij herschrijven aan de hand van Lemma 3.4, fij = cij (Fi , Fj ) fi fj . Mits enige vereenvoudiging en dezelfde redenering als bij (ii)(1) van het bewijs van Stelling 3.2 verkrijgt men de gewenste paar-copula ontbinding voor de n-dimensionale dichtheidsfunctie. Bij de paar-copula ontbinding wordt verondersteld dat de conditionele copula-dichtheid cij|De niet afhangt van de waarden van de variabelen in De . De conditionele waarden hebben enkel invloed op de conditionele verdelingsfuncties Fi|De en Fj|De . In de praktijk geven deze vine copula’s een grote flexibiliteit voor het beschrijven van de afhankelijkheid daar de verschillende paar-copula’s onafhankelijk van elkaar kunnen gekozen worden, het is niet nodig dat de bivariate copula’s van dezelfde familie zijn. Nu dat men de paar-copula ontbinding heeft gevonden op basis van een reguliere vine, gaat men tonen hoe men deze bekomt vertrekkende van de multidimensionale dichtheidsfunctie. Om de paar-copula ontbinding te verkrijgen van een multivariate dichtheidsfunctie, wordt deze recursief ontbonden als een product van conditionele dichtheden. Voor de variabelen (X1 , . . . , Xn ) geldt dan: f (x1 , . . . , xn ) = = = = f (x2 , . . . xn |x1 )f (x1 ) f (x3 , . . . xn |x1 , x2 )f (x2 |x1 )f (x1 ) ... f (xn |x1 , . . . , xn−1 ) . . . f (x3 |x1 , x2 )f (x2 |x1 )f (x1 ) Voor elke term geldt, met Fi|1...j = Fi|1...j (xi |x1 , . . . , xj ), HOOFDSTUK 3. VINE EN PAAR-COPULA ONTBINDING f (xi |x1 , . . . , xi−1 ) = f (xi ,xi−1 |x1 ,...,xi−2 ) f (xi−1 ) = ci,i−1|1...i−2 (Fi|1...i−2 ,Fi−1|1...i−2 )f (xi−1 )f (xi ) f (xi−1 ) 30 = ci,i−1|1...i−2 Fi|1...i−2 , Fi−1|1...i−2 f (xi ) Meer algemeen kan de n-dimensionale dichtheidsfunctie herschreven worden als een product van f (x|v) met v een d-dimensionale vector, d < n. De conditionele dichtheidsfunctie wordt dan herschreven als een product van een paar-copula-dichtheid en een conditionele dichtheidsfunctie, f (x|v) = cxvj |v−j (F (x|v−j ), F (vj |v−j )) f (x|v−j ), waarbij vj de j-de component component van v en v−j de vector v zonder deze component. In Joe (1996) werd bewezen dat de conditionele verdelingsfunctie kan geschreven worden als F (x|v) = ∂Cx,vj |v−j (F (x|v−j ), F (vj |v−j )) , ∂F (vj |v−j ) (3.4) met Cx,vj |v−j een bivariate copula. Een multivariate dichtheid kan dus uitgedrukt worden als een product van paar-copula’s, toegepast op verschillende conditionele verdelingen. Deze opbouw gebeurt op een iteratieve manier. Gegeven een bepaalde ontbinding, bestaan er veel verschillende her-parametrisaties. Voorbeeld: Voor drie willekeurige variabelen X1 , X2 en X3 zijn er drie verschillende reguliere vines mogelijk, telkens met een andere variabele waarop wordt geconditioneerd in de tweede boom. Men veronderstelt dat de reguliere vine eruit ziet zoals in Figuur 3.5. Figuur 3.5: Reguliere vine voor 3 variabelen Aangezien men maar met drie variabelen werkt is deze reguliere vine zowel een C-vine als een D-vine2 . Men wenst nu de paar-copula ontbinding te bekomen voor f (x1 , x2 , x3 ). Er wordt eerst geconditioneerd op de variabele X2 en vervolgens op de variabele X3 : f (x1 , x2 , x3 ) = f (x1 , x3 |x2 )f2 (x2 ) = f (x1 |x2 , x3 )f (x3 |x2 )f2 (x2 ). 2 zie hoofdstuk 3.3 HOOFDSTUK 3. VINE EN PAAR-COPULA ONTBINDING 31 De conditionele dichtheidsfuncties worden verder uitgewerkt met behulp van Lemma 3.4, f (x3 |x2 ) = f (x2 ,x3 ) f2 (x2 ) = c23 (F2 (x2 ),F3 (x3 )) f2 (x2 )f3 (x3 ) f2 (x2 ) = c23 (F2 (x2 ), F3 (x3 ))f3 (x3 ) en f (x1 |x2 , x3 ) = f (x1 ,x3 |x2 ) f (x3 |x2 ) = c13|2 (F (x1 |x2 ),F (x3 |x2 ))f (x1 |x2 )f (x3 |x2 ) f (x3 |x2 ) = c13|2 (F (x1 |x2 ), F (x3 |x2 ))f (x1 |x2 ) = c13|2 (F (x1 |x2 ), F (x3 |x2 ))c12 (F1 (x1 ), F2 (x2 ))f1 (x1 ) En bijgevolg kan f (x1 , x2 , x3 ) herschreven worden als c13|2 (F (x1 |x2 ), F (x3 |x2 ))c12 (F1 (x1 ), F2 (x2 ))c23 (F2 (x2 ), F3 (x3 ))f1 (x1 )f2 (x2 )f3 (x3 ). In Morales N´apoles et al. (2008) wordt bewezen dat voor de verdeling van n variabelen er n2 2(n−2)(n−3)/2 (n − 2)! mogelijke reguliere vines zijn. Hierbij kan men twee speciefieke gevallen onderscheiden met een eenvoudigere vine-structuur, namelijk de D-vine en de Cvine. Elk met een eigen specifieke ontbinding van de afhankelijkheid. Bij een D-vine geldt dat in elke boom, een top hoogstens met twee bogen is verbonden. Voor een C-vine geldt voor elke boom Ti , dat er een unieke top is dat met de andere n − i toppen verbonden is. 3.3 D-vine en C-vine Naargelang het om een D-vine, C-vine of een andere reguliere vine gaat, zullen de conditioned set en conditioning set vari¨eren. In het geval van de D-vine en de C-vine hebben deze verzamelingen een bepaalde vorm en kan de paar-copula ontbinding op een eenvoudige manier worden samengevat. Definitie 3.14 Een reguliere vine wordt een D-vine genoemd indien alle toppen in boom T1 een graad hebben die hoogstens twee is. HOOFDSTUK 3. VINE EN PAAR-COPULA ONTBINDING 32 Voor een D-vine geldt dat elke boog een verschillende conditioning set heeft. In dit geval kan de paar-copula ontbinding worden geschreven als n Y f (xk ) n−1 Y Y n−j ci,i+j|i+1,...,i+j−1 Fi|i+1,...,i+j−1 , Fi+j|i+1,...,i+j−1 . j=1 i=1 k=1 In Figuur 3.1 werd een mogelijke D-vine structuur weergegeven voor 5 variabelen. De gezamenlijke dichtheidsfunctie voor een vijf-dimensionale D-vine structuur zoals in Figuur 3.1 wordt dan gegeven door f12345 = f1 f2 f3 f4 f5 c12 (F1 , F2 ) c23 (F2 , F3) c34 (F3 , F4 ) c45 (F4 , F5 ) ×c13|2 F1|2 , F3|2 c24|3 F2|3 , F4|3 c35|4 F3|4 , F5|4 c14|23 F1|23 , F4|23 ×c25|34 F2|34 , F5|34 c15|234 F1|234 , F5|234 Voor een n-dimensionale D-vine, zijn er n! mogelijke manieren om de variabelen te ordenen in de eerste boom T1 . Aangezien de bogen ongeordend zijn, cij|D = cji|D , voor elk paar i, j en een willekeurige conditioning set horende bij een D-vine, kan de volgorde in de boom T1 achterstevoren worden genomen zonder dat de overeenkomstige vine-structuur wijzigt. Er zijn dus n!/2 verschillende bomen op het eerste niveau. Omdat de boomstructuren in T2 , . . . , Tn−1 volledig bepaald zijn door T1 , betekent dit dat er n!/2 verschillende D-vines zijn voor n elementen. Definitie 3.15 Een reguliere vine wordt een C-vine of canonische vine genoemd indien elke boom Ti een unieke top heeft met graad n − i, i ∈ {1, . . . , n − 1}, met andere woorden indien er juist ´e´en top is met de maximale graad in elke boom. De top met de hoogste graad wordt zo gekozen dat de conditioning sets dezelfde zijn per boom. Deze verzameling wordt als maar groter naarmate men vordert in de bomen. Voor dit soort vine geldt als paar-copula ontbinding n Y k=1 f (xk ) n−1 Y n−j Y cj,j+i|1,...,j−1 Fj|1,...,j−1 , Fj+i|1,...,j−1 . j=1 i=1 Figuur 3.6 geeft een mogelijke C-vine structuur weer voor 5 variabelen. HOOFDSTUK 3. VINE EN PAAR-COPULA ONTBINDING 33 Figuur 3.6: C-vine voor 5 variabelen Voor de vijf-dimensionale C-vine zoals in Figuur 3.6 wordt de gezamenlijke dichtheidsfunctie gegeven door f12345 = f1 f2 f3 f4 f5 c12 (F1 , F2 ) c13 (F1 , F3) c14 (F1 , F4 ) c15 (F1 , F5 ) ×c23|1 F2|1 , F3|1 c24|1 F , F c F , F c F , F 2|1 4|1 25|1 2|1 5|1 34|12 3|12 4|12 ×c35|12 F3|12 , F5|12 c45|123 F4|123 , F5|123 Voor een n-dimensionale C-vine zijn op elk boomniveau de conditioning sets van de bogen dezelfde. Dit betekent dat gegeven de conditioning set in Tj−1 , er n − j + 2 keuzes zijn voor de conditioning set in de boom Tj , j ∈ {3, . . . , n − 1}. Voor de boom T2 kunnen er n mogelijke conditioning sets worden gekozen. Samen betekent dit dat er n(n − 1) . . . 3 = n!/2 verschillende C-vines bestaan voor n elementen. Hoofdstuk 4 Toepassing van vines in finance Men heeft aangetoond dat aan de hand van de vine copula een n-dimensionale verdeling kan ontbonden worden naar een product van paar-copula’s. In dit hoofdstuk wordt beschreven hoe deze vine copula kan worden bekomen voor een financi¨ele toepassing. Vooraleer een vine copula wordt bepaald voor een bepaalde portefeuille moeten eerst de nodige transformaties worden toegepast op de log-rendementen van de aandelenkoersen. Zodat men tijdreeksen krijgt die mooiere eigenschappen bezitten en gemakkelijker zijn om mee te werken, dit wordt gedaan in sectie 4.1. De rendementen worden beschreven aan de hand van een stochastisch proces, dit is een verzameling van willekeurige variabelen {Xt |t ∈ T } gedefinieerd op een gemeenschappelijke kansruimte (Ω, F, P). De geobserveerde waarden worden genoteerd als {xt |t ∈ T }. Bij het modelleren van de afhankelijkheid van de verschillende aandelen moet men de juiste vine-structuur vinden die het beste fit met de realiteit. Dit kan een C-vine, D-vine of andere reguliere vine zijn, naargelang welke variabelen de sterkste onderlinge afhankelijkheden hebben. Hiervoor zal in sectie 4.2 voor elk boom-niveau de Maximum Spanning Tree worden gezocht. Vervolgens moet voor elke boog in de vine een passende paar-copula worden gekozen en de juiste copula parameter(s) worden geschat. In sectie 4.3 wordt beschreven hoe een vine copula kan worden samengevat in matrices. Dit zal nodig zijn wanneer men in R een bepaalde vine copula wilt specifieren. Ondanks de grote flexibiliteit die de vine copula met zich meebrengt zijn er ook hier bepaalde werkpunten, in dit hoofdstuk worden er hiervan twee besproken. Het aantal te schatten parameters stijgt exponentieel met de dimensie van de te onderzoeken portefeuille. Aangezien de sterkste afhankelijkheden worden gemodelleerd in de eerste bomen is het interessant om te gaan kijken of de vine kan vereenvoudigd of gesnoeid worden. Hiervoor wordt in sectie 4.4 onderzocht of men na een bepaald boomniveau kan veronderstellen dat de paar-copula’s 34 HOOFDSTUK 4. TOEPASSING VAN VINES IN FINANCE 35 respectievelijk Gaussiaans of onafhankelijk zijn. In beide gevallen brengt dit een grote vereenvoudiging mee van het vine model. Een tweede werkpunt dat men in sectie 4.5 bespreekt is dat de afhankelijkheid tussen variabelen kan vari¨eren met de tijd maar wordt samengevat aan de hand van ´e´en constante afhankelijkheidsgrootheid of copula-parameter. Om dit te verhelpen wordt overgegaan naar tijdsvari¨erende copula’s. Het Dynamisch Conditioneel Correlatie model wordt toegepast om de copula-parameter en Kendall’s tau waarde van een paar variabelen tijdsvari¨erend te maken. Tenslotte wordt in sectie 4.6 getoond hoe een model kan ge¨evalueerd worden door het rendement te voorspellen en de Value-at-Risk te berekenen. De methodes die zullen worden besproken worden in volgend hoofdstuk toegepast op de log-rendementen van een bepaalde portefeuille. Deze worden hier gedefinieerd voor een bepaald actief samen met enkele eigenschappen die eigen zijn aan de log-rendementen. Zij Xt de prijs van een actief op tijdstip t, dan wordt het bruto rendement gegeven door 1 + Yt = Xt Xt−1 en vervolgens het log-rendement gedefinieerd als Rt = log (1 + Yt ) = log Xt Xt−1 . In financi¨ele analyse wordt er eerder gewerkt met de log-rendementen dan met de prijskoers omdat ze bepaalde aantrekkelijke eigenschappen bevat, zoals stationariteit. Definitie 4.1 Een tijdreeks {Xt } is stationair indien: (i) E[Xt2 ] < ∞, ∀t, (ii) E[Xt ] = µ, ∀t en (iii) voor de autocovariantie functie geldt γX (r, s) = Cov(Xr , Xs ) = γX (r + t, s + t), ∀r, s, t ∈ Z. De autocovariantiefunctie beschrijft de afhankelijkheid van oneindig veel verzamelingen variabelen. Het is de tegenhanger van de covariantiematrix in het oneindig geval. Een andere eigenschap die voorkomt is volatiliteits-clustering. Dit wil zeggen dat men in de data te maken heeft met periodes van hoge variantie en lage variantie. Of met andere woorden grote veranderingen worden meestal gevolgd door grote veranderingen en kleine veranderingen worden meestal gevolgd door kleine veranderingen. Ook het leverage effect wordt waargenomen, dit wil zeggen dat de volatiliteit anders gaat zijn voor een grote prijsstijging dan voor een grote prijsdaling. Negatieve waarden zorgen voor een grotere volatiliteitsverandering dan positieve waarden van dezelfde grootte. De verdeling van de log-rendementen is ook leptokurtic, omdat ze meestal zware staarten heeft en de verdeling piekt in nul. HOOFDSTUK 4. TOEPASSING VAN VINES IN FINANCE 36 Er wordt nu eerst nagegaan hoe deze tijdreeksen kunnen worden gemodelleerd aan de hand van een ARMA-GARCH proces. Bovenstaande eigenschappen, het ARMA proces en GARCH proces werden uitvoerig besproken in de cursussen H¨ormann (2011) en H¨ormann (2013). 4.1 Tijdreeksen Er worden n variabelen geobserveerd op T tijdstippen. Alvorens de paarsgewijze afhankelijkheden te onderzoeken en de paar-copula’s te schatten worden de univariate tijdreeksen geanalyseerd door een gepast model erop toe te passen. Er zal dan verder worden gewerkt met de residuen van het model eerder dan met de oorspronkelijke log-rendementen. Men wenst dat voor elke variabele de T observaties onafhankelijk zijn met de tijd. Om dit te bekomen wordt er een ARMA(p,q)-GARCH(1,1) model toegepast op de observaties om zo tijdelijke afhankelijkheden uit te schakelen en een tijdsvari¨erende volatiliteit te bekomen. Het proces {Rt } wordt een Auto Regressive Moving Average proces genoemd indien Rt = µ + p X φk Rt−k + Zt + k=1 q X θk Zt−k k=1 met φi , θj ∈ R, i ∈ {1, . . . , p} , j ∈ {1, . . . , q} en {Zt } white noise met gemiddelde 0 en variantie 1. Definitie 4.2 Een proces {Zt } wordt white noise genoemd als er geldt dat • V ar(Zt ) = σ 2 < ∞, ∀t, • E(Zt ) = µ, ∀t en • Cov(Zt , Zt+h ) = 0, ∀t en |h| ≥ 1. Het ARMA(p,q) model is niet geschikt voor de log-rendement-data, aangezien in zulk model de volatiliteit constant is, wat niet overeenstemt met de eigenschappen die het log-rendement bezit, zoals besproken voordien. Daarom wordt er op de variabelen {Zt } een General Autoregressive Conditionally Heteroscedastic (1, 1) model toegepast, zodat Zt = t σt met • de residuen t onafhankelijk en gelijk verdeeld met gemiddelde 0 en variantie 1, HOOFDSTUK 4. TOEPASSING VAN VINES IN FINANCE 37 • t onafhankelijk van het σ-algebra Ft−1 = σ (Zt−1 , Zt−2 , . . .), • volatiliteit σt is Ft−1 -meetbaar en • σt > 0. De volatiliteit van Zt wordt dan beschreven door 2 2 σt2 = ω + αZt−1 + βσt−1 met α, β, ω > 0. Indien dus voor elke marginale tijdreeks een ARMA(p,q)-GARCH(1,1) model wordt gespecifieerd, kan men voor het modelleren van de afhankelijkheid verder werken met de residuen van de tijdreeks, namelijk de {t }. Om de eigenschappen van de logrendementen, zoals zware staarten of skewness, correct weer te geven wordt hier, net zoals in Mendes et al. (2010), gekozen om voor de verdeling van de residuen te werken met een skewed sudent t verdeling, t ∼ skewed student t (ν, λ). Deze verdeling bevat twee parameters (λ, ν), de skewness parameter is λ en zal voor de log-rendementen meestal negatief zijn zoals eerder besproken. Indien λ = 0 verkrijgt men de gewone student t verdeling. De skew-t verdeling met gemiddelde 0 en variantie 1 wordt gegeven door q ν (1 − λ)F t ν−2 (1 − λ)/2 q F (y; ν, λ) = ν (1 + λ)Ft ν−2 by+a 1−λ ;ν voor y < −a/b voor y = −a/b by+a 1+λ ;ν − λ voor y > −a/b met Ft (y; ν) de verdelingsfunctie van de symmetrische student t verdeling met ν vrijheidsgraden en Γ ν+1 2 p , Γ(ν/2) π(ν − 2) √ b = 1 + 3λ2 − a2 , ν−2 a = 4λc . ν−1 c= De skewed student t-dichtheidsfuntie is gegeven door, −(ν+1)/2 bc 1 + 1 by+a 2 ν−2 1−λ f (y; ν, λ) = −(ν+1)/2 bc 1 + 1 by+a 2 ν−2 1+λ voor y < −a/b voor y ≤ −a/b De maximum likelihood schatting van de skew-t verdelingen kan dus toegepast worden voor elke tijdreeks apart. HOOFDSTUK 4. TOEPASSING VAN VINES IN FINANCE 38 Vervolgens wenst men ook dat de variabelen uniform verdeeld zijn aangezien dat gemakkelijker is om mee te werken en de bewerkingen/berekeningen eenvoudiger maakt. Om dit te bekomen wordt de Probability Integral Transform toegepast op de residuen, gebruikmakende van de empirische verdelingsfunctie. Hierdoor krijgt men de pseudo-observaties T Rt ≡ Fˆn (t ) = 1 X I{ ≤ } . T + 1 i=1 i t Deze komen eigenlijk overeen met de rangen van de residuen. 4.2 Vine-structuur Nu de marginale tijdreeksen correct gemodelleerd zijn, wenst men de juiste afhankelijkheidsstructuur te bepalen voor de n variabelen. Hiervoor zal een reguliere vine moeten worden geconstrueerd die de afhankelijkheden het best beschrijft. Om een gepaste reguliere vine-specificatie te vinden voor een bepaalde dataset, moeten volgende stappen worden uitgevoerd: (i) Selecteer de reguliere vine-structuur, dit wil zeggen nagaan welke ongeconditioneerde of geconditioneerde paren van variabelen worden gekoppeld. (ii) Voor elk paar variabelen dat werd geselecteerd in (i) een passende bivariate copulafamilie kiezen. (iii) Voor elke copula de bijhorende parameter(s) schatten. Voor n variabelen zijn er n 2 2(n−2)(n−3)/2 (n − 2)! verschillende mogelijke reguliere vines. Om de gepaste vine-structuur te bekomen moet op elk boomniveau een geschikte boom-structuur worden geconstrueerd. Hiervoor moet worden beslist voor welke paren van variabelen men copula’s wenst te specifi¨eren of anders gezegd tussen welk paar toppen moet een boog getrokken worden. De belangrijkste afhankelijkheden die op een accurate manier moet worden gemodelleerd zijn die in de eerste boom T1 . In deze boom komen de toppen overeen met de uniform verdeelde pseudo-observaties van de residuen van de log-rendementen van de verschillende variabelen uit de portefeuille zoals bepaald in sectie 4.1. Door de sterkste afhankelijkheden te modelleren in de eerste boom worden numerieke afrondingsfouten vermeden in hogere bomen. HOOFDSTUK 4. TOEPASSING VAN VINES IN FINANCE 4.2.1 39 Maximum Spanning Tree Men moet beslissen aan welke paren van variabelen men wenst copula’s te specifi¨eren. De copula-families die hier worden gekozen hebben een grote invloed op de globale model-fit. Het Maximum Spanning Tree-algoritme , zoals beschreven in Brechmann (2013) en Diβmann et al. (2013), wordt hiervoor toegepast. Hierbij worden per boom de sterkste paarsgewijze afhankelijkheden gekozen. Voor het bepalen van de paarsgewijze afhankelijkheid kunnen verschillende afhankelijkheidsgrootheden worden gebruikt zoals de tail dependence of het aantal vrijheidsgraden van een gefitte student t copula. Hier wordt, net zoals in Brechmann (2013), verkozen om te werken met de Kendall’s tau waarde. De Kenall’s tau meet de afhankelijkheid onafhankelijk van de marginale verdelingen en is dus zeker nuttig wanneer verschillende copula-families worden gebruikt. Door de copula’s te kiezen voor de sterkste afhankelijkheden in de eerste boom zullen de getransformeerde variabelen in hogere bomen sneller onafhankelijk zijn van elkaar. Dit maakt het model eenvoudiger aangezien er minder parameters moet worden geschat en dit zal toelaten om eventueel in de laatste k bomen al de paren van variabelen onafhankelijk te veronderstellen1 . Voor de reguliere vine wordt in de eerste boom T1 = (N1 , E1 ) voor elk paar variabelen {j, k} de empirische Kendall’s tau τˆjk berekend, 1 ≤ j < k ≤ n. De empirische versie van de Kendall’s tau wordt gegeven door τˆjk = c−d c−d = T , c+d 2 waarbij c het aantal concordante paren en d het aantal discordante paren weergeeft in de observaties. Vervolgens wordt de spanning boom geconstrueerd zodat de som van de absolute waarden van de empirische Kendall’s tau maximaal is, X max |ˆ τjk | . bogen e={j,k} in spanning boom De bogen-selectie gebeurt aan de hand van het Prim’s algoritme , beschreven in Brechmann (2010). Om dit te kunnen oplossen wordt het maximalisatie-probleem omgezet naar een minimalisatie-probleem, X min |1 − τˆjk | . bogen e={j,k} in spanning boom Het algoritme gaat dan als volgt: Vertrekkende van een volledige graaf G = (N, E), dan is elk paar toppen is verbonden door een boog. Er wordt een willekeurige top i1 gekozen en men 1 Dit wordt uitgewerkt in sectie 4.4.1 HOOFDSTUK 4. TOEPASSING VAN VINES IN FINANCE 40 definieert NT = {i1 } en ET = ∅. Zolang dat NT 6= N wordt een boog e = {ij , ik } gekozen met 1 − τˆij ik minimaal en zodat de top ij ∈ NT en ik ∈ / NT . NT wordt gelijkgesteld aan NT ∪{ik } en ET = ET ∪{e}. Zo wordt de maximum spanning boom GT = (NT , ET ) bekomen. Voor de C-vine wordt de hoofd-top zodanig gekozen dat de som van de paarsgewijze afhankelijkheden aan die top maximaal is, max i∈N1 X |ˆ τik | . bogen e={i,k} Bij de D-vine gaat men anders te werk, hier worden de paren gerangschikt volgens hun absolute Kendall’s tau waarde gaande van groot naar klein. De paren met de grootste Kendall’s tau waarde zijn het sterkst afhankelijk. De eerste boom wordt dan geconstrueerd zodat de paren toppen met de grootste Kendall’s tau waarde verbonden worden met elkaar en waarbij elke top hoogstens twee maal verbonden is met een andere top. Bij een D-vine volgt de hele vine-structuur uit de boom-structuur van de eerste boom. Om de eerste boom te construeren wordt er gezocht naar het Hamiltoniaans pad met minimale gewichten voor de gekozen bogen (het gewicht van een boog e = {j, k} komt opnieuw overeen met |1 − τˆjk |). Een pad wordt Hamiltoniaans genoemd, indien het pad alle toppen doorloopt en verbonden is. Om dit minimalisatie-probleem te kunnen oplossen wordt er, zoals beschreven in Brechmann (2010), gebruik gemaakt van het Traveling Salesman Problem, waarvoor binaire variabelen xjk worden ingevoerd, die aangeven of de boog {j, k} al dan niet wordt opgenomen in het Hamiltoniaans pad. De boomstructuur voor de D-vine wordt gevonden door het oplossen van het minimalisatie probleem, min n X n X |1 − τˆjk | xjk , j=1 k=1 onderworpen aan de voorwaarden, n X j=1 xjk = 1, k ∈ {1, . . . , n} en n X xjk = 1, j ∈ {1, . . . , n} . k=1 Voor het construeren van de vine-structuur kunnen ook andere maten van afhankelijkheid worden gebruikt. Een mogelijk alternatief is voor elk paar variabelen een student t copula te fitten, waarbij een laag aantal vrijheidsgraden overeenkomt met een sterke afhankelijkheid. Ook de tail dependence of de Spearmans rang correlatie zijn mogelijke afhankelijkheidsgrootheden. HOOFDSTUK 4. TOEPASSING VAN VINES IN FINANCE 4.2.2 41 Paar-copula fit Nu men weet voor welke paren in de eerste boom een copula moet worden bepaald, moeten de juiste paar-copula’s worden gekozen uit de verschillende copula-families die werden besproken in Hoofdstuk 2. Dit kan op verschillende manieren gebeuren: op basis van een grafische Goodness-of-Fit, een Goodness-of-Fit-test dat gebruik maakt van de empirsche copula of ook nog aan de hand van het Akaike Information Criterium. Een grafische Goodness-of-Fit wordt hier niet behandeld omdat dit niet handig is om mee te werken in hogere dimensies. De overige selectiecriteria zullen in dit deel besproken worden. Alvorens te onderzoeken welke copula het beste fit wordt eerst een onafhankelijkheidstest toegepast voor elk geselecteerd paar variabelen. Onafhankelijkheidstest: Er wordt een onafhankelijkheidstest toegepast voor elke boog in de boom gebaseerd op de Kendall’s tau. Onder de nulhypothese dat Cjk de product copula is, moet de empirische Kendall’s tau voor T observaties ongeveer een normale verdeling volgen met gemiddelde 0 en variantie 2(2T + 5)/9T (T − 1). De nulhypothese H0 wordt dus verworpen met significatieniveau α = 0.05 indien s 9T (T − 1) |ˆ τjk | > 1.96. 2(2T + 5) Verwerpt men de nulhypothese niet, kan in de paar-copula ontbinding de copula-dichtheid overeenkomstig met de boog {j, k} vervangen worden door 1. Dat zou de paar-copula ontbinding aanzienlijk vereenvoudigen. Indien de product copula verworpen wordt, wordt nagegaan welke copula familie dan wel de beste copula fit geeft. Hiervoor vergelijkt men de drie verschillende Goodness-of-Fit-tests. Blanket test: Een andere GoF is gebaseerd op de afstand tussen de geschatte copula en de empirische copula. Deze test wordt in Genest et al. (2009) vergeleken met andere Goodness-of-Fit-tests en blijkt consistent2 te zijn en beter te presteren dan de andere voorgestelde GoF-tests. Voor de Blanket test werkt men met de pseudo-observaties bekomen op het einde van sectie 4.1. Men gaat de nulhypothese na voor een bepaalde copula-familie C0 , H0 : Cjk ∈ C0 . De informatie van de pseudo-observaties (Ri1 , . . . , Rin ), i ∈ {1, . . . , T } , zit samengevat in de empirsiche verdeling, wat overeenkomt met de niet-parametrische empirische copula, T 1X ˆ C(u) = I(Ri1 ≤u1 ,...,Rin ≤un ) , T i=1 2 een test-statistiek is consistent indien dat op basis van deze statistiek C ∈ / C0 , dat dan H0 wordt verworpen met kans ´e´en HOOFDSTUK 4. TOEPASSING VAN VINES IN FINANCE 42 met u = (u1 , . . . , un ) ∈ [0, 1]n . In het bivariaat geval geeft dit dan T 1X ˆ I(Rij ≤u1 ,Rik ≤un ) . Cjk (u1 , u2 ) = T i=1 Zij θˆ de maximum pseudo likelihood schatter van de copula-parameter(s) θ afgeleid uit de psuedo-observaties Rij en Rik , i ∈ {1, . . . , T }, dan wordt een empirisch proces geconstrueerd die de afstand vergelijkt tussen de empirische copula Cˆjk en de schatting C ˆ van Cjk onder θ H0 , CT = √ T Cˆjk − Cθˆ . Om na te gaan of de nulhypothese al dan niet moet worden verworpen wordt een test statistiek gedefinieerd, Z S= 2 ˆ 1 , u2 ) = (CT (u1 , u2 )) dC(u T X [0,1]2 [Cˆjk (Rij , Rik ) − Cθˆ(Rij , Rik )]2 . i=1 Indien deze statistiek grote waarden aanneemt wordt de nulhypothese verworpen. De copulafamilie met de hoogste p-waarde, indien deze natuurlijk groter is dan het gekozen significantieniveau, wordt dan gekozen als copula overeenkomstig met de boog e = {j, k}. De Blanket test kan ook gebruikt worden om na te gaan of de vine copula een goede fit geeft. AIC: Ten slotte is er ook het Akaike Information Criterium dat wordt gegeven door AIC = −2 n X log f + 2k i=1 met f een zekere dichtheidsfunctie en k het aantal te schatten parameters. Voor de paarcopula selectie geeft dit dan AIC = −2 T X log cjk ˆ uij , uik |θ + 2k i=1 met θˆ de maximum pseudo likelihood schatter van de copula parameter θ en k het aantal elementen dat θ bevat. Zo wordt bijvoorbeeld de student t copula afgestraft ten opzichte van de Clayton copula aangezien voor de student t copula twee parameters moeten worden geschat ten opzichte van ´e´en parameter voor de Clayton copula. Men kiest de copula familie met de laagste AIC waarde. Deze GoF test is een goed selectiecriterium, zeker als er veel parameters zijn en er sterke afankelijkheid is tussen de variabelen. Indien de afhankelijkheid zwakker is, werkt de AIC minder goed. Nadat voor elk boog een een copula-familie is geselecteerd wordt op basis van de data, HOOFDSTUK 4. TOEPASSING VAN VINES IN FINANCE 43 de copula-parameters geschat. Hiervoor moet de bivariate log-pseudo-likelihood worden gemaximaliseerd. Maximum Pseudo Likelihood: Stel dat men de parameter θ wenst te schatten voor de paar-copula geassocieerd met de boog e = {j, k}, dan wordt l(θ) = T X log (cθ (Rij , Rik )) i=1 gemaximaliseerd. De pseudo-observaties werden gedefinieerd in sectie 4.1. Deze schatter komt overeen met de klassieke likelihood schatter, behalve dat het hier wordt toegepast op de empirische versies van de verdelingsfuncties. 4.2.3 Getransformeerde observaties Nu de eerste boom volledig bepaald is moet men hetzelfde doen voor de hogere bomen. Telkens de boomstructuur en paar-copula’s bepaald zijn, moeten de observaties worden geconstrueerd voor de volgende boom. Voor elke boog e = {j, k} in T1 worden de observaties voor T2 , Fj|k (Rij |Rik ) en/of3 Fk|j (Rik |Rij ), i ∈ {1, . . . , T } berekend gebruikmakend van de gekozen copula Cjk voor de boog e in boom T1 . Met de formule (3.4) kan de conditionele verdelingsfunctie berekend worden als Fj|k (Rij |Rik ) = ∂Cjk (Rij , Rik ) ∂Cjk (F (Rij ), F (Rik )) = . ∂F (Rik ) ∂Rik De laatste gelijkheid volgt uit het feit dat de pseudo-observaties uniform verdeeld zijn. Men gaat nu iteratief te werk in elke boom Tl , l ∈ {2, . . . , n − 1}. Elk paar toppen j|D en k|D dat een gemeenschappelijke conditioning set D bevatten, wordt verbonden door de boog {j, k|D} en de overeenstemmende empirische Kendall’s tau τˆj,k|D wordt berekend. Opnieuw wordt het maximum spanning tree-algoritme toegepast, max X τˆjk|D . bogen e={j,k|D} in spanning boom Hieruit wordt de overeenkomstige boomstructuur voor boom Tl gevonden. Vervolgens worden op de getransformeerde observaties de (conditionele) copula-selectie methode en de copulaparameter schatting, zoals besproken in secties 4.2.2 en 4.2.3, toegepast. 3 naargelang met welke andere toppen e kan worden verbonden in T2 HOOFDSTUK 4. TOEPASSING VAN VINES IN FINANCE 44 Voor elke boog {j, k|D} in de geconstrueerde boom Tl , worden de getransformeerde observaties voor boom Tl+1 berekend Fj|k∪D en/of Fk|j∪D aan de hand van de conditionele copula Cjk|D die werd gebruikt in boom Tl . Dit gebeurt opnieuw via de formule (3.4), Fj|k∪D (xij |xik , xiD ) = ∂Cjk|D (F (xij |xiD ), F (xik |xiD )) , ∂F (xik |xiD ) waar xiD overeenkomt met de pseudo-observaties uit de conditioning set op tijdstip i. 4.3 Matrix representatie van een reguliere vine Als men de geconstrueerde vine structuur voor n elementen wil specifi¨eren in R zal een geschikte manier nodig zijn om deze structuur, alsook de copula families en parameters samen te vatten. Hiervoor wordt een benedendriehoeksmatrix gebruikt, zoals besproken in Diβmann (2013). De constraint set CV van een reguliere vine wordt samengevat in de kolommen van een n-dimensionale matrix. Definitie 4.3 Zij M = (mi,j )i,j∈{1,...,n} een benedendriehoeksmatrix, de i-de constraint set voor M is CM (i) = {({mi,i , mk,i } , D) |k ∈ {i + 1, . . . , n} , D = {mk+1,i , . . . , mn,i }} , voor i ∈ {1, . . . , n − 1}. Als k = n dan is D = ∅. De constraint set voor matrix M is de unie CM = CM (1) ∪ . . . ∪ CM (n − 1). De verzameling {mi,i , mk,i } komt overeen met de conditioned set en D met de conditioning set. Elk element uit de constraint set bestaat uit een element op de diagonaal mi,i en een element mk,i uit dezelfde kolom onder mi,i en alle elementen die daaronder staan {mk+1,i , . . . , mn,i }, k ∈ {i + 1, . . . , n} en i ∈ {1, . . . , n}. Als men alle kolommen afgaat met j vast, {({mi,i , mj,i } , D) |i ∈ {1, . . . , n} , D = {mj+1,i , . . . , mn,i }} , krijgt men alle constraint sets geassocieerd met de bogen uit boom Tn+1−j . Als voorbeeld wordt de matrix M geconstrueerd die overeenkomt met de constraint set voor de reguliere vine weergegeven in Figuur 4.1. Men vindt hiervoor matrix 5 1 M = 2 4 3 1 . 4 4 3 2 2 2 3 3 3 HOOFDSTUK 4. TOEPASSING VAN VINES IN FINANCE 45 Figuur 4.1: 5-dimensionale reguliere vine Als men bijvoorbeeld in de eerste kolom de elementen m11 (= 5) en m31 (= 2) neemt bekomt men ({5, 2} , {4, 3}) ∈ CM wat overeenkomt met de constraint set van de boog 25|34 in boom T3 . Alvorens de R-vine matrix te defini¨eren moet men eerst nog twee andere verzamelingen van matrixelementen bepalen, dit zijn voor M = (mi,j )i,j∈{1,...,n} , BM (i) = {(mi,i , D)|k ∈ {i + 1, . . . , n} , D = {mk,i , . . . , mn,i }} en ˜M (i) = {(mk,i , D)|k ∈ {i + 1, . . . , n} , D = {mi,i } ∪ {mk+1,i , . . . , mn,i }} . B Definitie 4.4 Een benedendriehoeksmatrix M = (mi,j )i,j∈{1,...,n} wordt een R-vine matrix genoemd als voor i ∈ {1, . . . , n − 1} en voor alle k ∈ {i + 1, . . . , n − 1} er een j ∈ {i + 1, . . . , n − 1} bestaat met ˜M (j). (mk,i , {mk+1,i , . . . , mn,i }) ∈ BM (j) of B Deze voorwaarde garandeert de proximiteitsvoorwaarde zoals in de definitie van de reguliere vine. Uit de R-vine matrix definitie volgen verschillende eigenschappen. • Elke kolom bevat alle elementen uit de kolom rechts van hem, {mi,i , . . . , mn,i } ⊂ {mj,j , . . . , mn,j } voor 1 ≤ j < i ≤ n. • Voor elke kolom is het diagonaalelement verschillend, mi,i ∈ / {mi+1,i+1 , . . . , mn,i+1 } voor i ∈ {1, . . . , n − 1}. • De matrix die overeenkomt met een reguliere vine is niet uniek. HOOFDSTUK 4. TOEPASSING VAN VINES IN FINANCE 46 Om de reguliere vine volledig te bepalen, moet men ook nog twee andere benedendriehoeksmatrices defini¨eren geassocieerd met M . Deze bevatten de informatie over de copula-families en -parameters die worden gebruikt voor de verschillende paar-copula’s. Dit gebeurt aan de hand van matrices T = (ti,j )i,j∈{1,...,n} en P = (pi,j )i,j∈{1,...,n} . Sommige copula-families hebben meer dan ´e´en parameter, dan moet er voor de parameter-matrix, twee matrices gedefinieerd worden. In M komt het element mi,j , j ∈ {1, . . . , n − 1} , i ∈ {j + 1, . . . , n}, overeen met de copula Cmj,j ,mi,j |mi+1,j ,...,mn,j , voor de variabelen Xmj,j en Xmi,j conditioneel op de variabelen met index {mi+1,j , . . . , mn,j }. Bijgevolg beschrijven ti,j het type copula en pi,j de parameter voor deze copula. De paar-copula ontbinding voor de multivariate dichtheidsfunctie f1...n kan dan worden geschreven op basis van van de R-vine matrix als n Y j=1 fj 1 k+1 Y Y cmk,k ,mi,k |mi+1,k ,...,mn,k Fmk,k |mi+1,k ,...,mn,k , Fmi,k |mi+1,k ,...,mn,k . k=n−1 i=n Men heeft dus, net als voor de C-vine en de D-vine, een effici¨ente manier om de paar-copula ontbinding te noteren voor een reguliere vine aan de hand van de R-vine matrix. Voor de C-vine en D-vine heeft de R-vine matrix een speciale vorm. Voor de C-vine voor n elementen is dit n n − 1 n − 1 n − 2 n − 2 n − 2 M = .. . .. .. . . . . . . 2 2 2 ··· 2 1 1 1 ··· 1 1 Men ziet aan de hand van de matrix dat op een bepaald boomniveau, de paar-copula’s dezelfde conditioning set hebben. Een eigenschap dat men al eerder vermeldde in verband met de C-vine. De vine matrix dat overeenkomt met de C-vine gegeven in Figuur 3.6 is 5 4 M = 3 2 1 4 . 3 3 2 2 2 1 1 1 1 Voor de D-vine voor n elementen is de vine matrix van de vorm HOOFDSTUK 4. TOEPASSING VAN VINES IN FINANCE 47 n 1 .. . n−1 ... ... M = .. n − 3 . 1 3 n − 2 n − 3 · · · 1 n − 1 n − 2 n − 3 ··· 2 1 1 . Door in elke kolom telkens het diagonaal element te combineren met het element in de laatste rij vindt men de paar copula’s voor de eerste boom. Hierdoor vindt men, zoals gewenst, voor de D-vine in de eerste boom de paren 1 − 2, 2 − 3, . . . , (n − 1) − n. De vine matrix dat overeenkomt met de D-vine gegeven in Figuur 3.1 is 5 1 M = 2 3 4 4.4 4 . 1 3 2 1 2 3 2 1 1 Gesnoeide en vereenvoudigde reguliere vines De reguliere vine geeft een grote flexibiliteit om de afhankelijkheid tussen variabelen te modelleren. Dit brengt veel werk met zich mee en de complexiteit van het model groeit exponentieel met de dimensie van de dataset. Om dit te verhelpen wordt aan de hand van statistische selectie-technieken onderzocht of het reguliere vine-model kan worden vereenvoudigd of gesnoeid, dit werd uitvoerig onderzocht in Brechmann (2010) en Brechmann (2012). De paar-copula’s in de reguliere vine worden dan vanaf een bepaalde boom vervangen door ofwel product copula’s ofwel Gaussiaanse copula’s. 4.4.1 Gesnoeide reguliere vine Definitie 4.5 Een reguliere vine wordt gesnoeid op niveau K (truncated regular vine), tRV (K), indien alle paar-copula’s in deze reguliere vine met conditioning set groter of gelijk aan K vervangen worden door de product copula. De gesnoeide reguliere vine copula voor K = 1, tRV (1), komt overeen met een Markov boom verdeling. Men noteert θtRV (K) = θe1 ,e2 |De |e ∈ Ei , i ∈ {1, . . . , K} de parameters van de gesnoeide reguliere vine met θe1 ,e2 |De de parameter(s) van de copula met copuladichtheid ce1 ,e2 |De . In dit geval wordt de multivariate dichtheidsfunctie geschreven als f1...n (u) = ctRV (K) (u|θtRV (K) ). n Y j=1 fi (ui ). HOOFDSTUK 4. TOEPASSING VAN VINES IN FINANCE 48 De copula-dichtheid voor de gesnoeide reguliere vine op niveau K kan dan geschreven worden als ctRV (K) (u|θtRV (K) ) = K Y Y ce1 ,e2 |De (F (ue1 |uDe ), F (ue2 |uDe )) , i=1 e∈Ei met u = (u1 , . . . , un ) ∈ [0, 1]n . Voor het bepalen van het snoeiings-niveau moet een evenwicht gevonden worden tussen een goede modellering van de afhankelijkheid en een verminderde complexiteit. Hiervoor gaat men de log-likelihoods van de gesnoeide reguliere vines op verschillende niveaus vergelijken aan de hand van een statistische test, namelijk het Akaike Information Criterium. De gesnoeide reguliere vine copula op niveau K, tRV (K), zit genesteld in die op niveau K + 1, tRV (K + 1), aangezien voor de copula parameters geldt dat θtRV (K) ⊂ θtRV (K+1) . Gegeven de T datapunten ui = (ui1 , . . . , uin ) ∈ [0, 1]n , is de log-likelihood voor tRV (K) gegeven door, ltRV (K) θtRV (K) |u = T X K X X log ce1 ,e2 |De F (uie1 |uiDe ), F (uie2 |uiDe )|θe1 ,e2 |De , i=1 l=1 e∈El waarbij El overeenkomt met de bogen in boom l. Voor het maximaliseren van de loglikelihood wordt de stapsgewijze maximum likelihood schatting toegepast: (1) Eerst wordt per paar-copula de parameter(s) geschat aan de hand van de maximum pseudo likelihood schatting, tot niveau K, (2) vervolgens wordt full log likelihood gemaximaliseerd voor de hele vine met als startwaarde de parameters gevonden in (1). Teneinde het juiste snoeiingsniveau te bepalen zulle de log-likelihoods van opeenvolgende niveaus met elkaar worden vergeleken. Beginnend bij K = 1, fit men een gesnoeide reguliere vine copula tRV (1). Hierna wordt het niveau met ´e´en eenheid verhoogd en gaat men kijken wat de winst is die wordt verkregen door een extra boom toe te laten. Indien de winst niet significant is, stopt men hier en en heeft men het snoeiingsniveau K0 gevonden, anders verhoogd men K opnieuw en gaat men zo iteratief verder tot dat een bevredigend niveau is gevonden. Hoe wordt bepaald of de winst van een extra boom al dan niet significant is? Hiervoor wordt gebruik gemaakt van een statistisch model-selectie-criterium dat geschikt is voor het vergelijken van genestelde modellen zoals hier het geval is, tRV (K) ⊂ tRV (K +1). Akaike Information Citerium: De AIC voor de gesnoeide reguliere vine op niveau K wordt gegeven door ˆ AIC(tRV (K)) = −2ltRV (K) θtRV (K) |u + 2ntRV (K) , HOOFDSTUK 4. TOEPASSING VAN VINES IN FINANCE 49 waarbij ntRV (K) het aantal te schatten parameters is op niveau K (de dimensie van θˆtRV (K) ). Indien de bijdrage van de boom TK+1 aan de AIC positief is, wordt er gesnoeid op niveau K. Voor elke K ∈ {1 . . . , n − 2} wordt dus uit tRV (K) en tRV (K + 1) voor de gesnoeide reguliere vine, diegene gekozen met de kleinste AIC waarde. Bayesian Information Criterium: Indien men de afstraffing voor het aantal te schatten parameters sterker wilt doen doorwegen in het model-selectie-criterium, wordt op de likelihood de Schwarz correctie toegepast. Hierdoor wordt het BIC verkregen voor het bepalen van het snoeiingsniveau, BIC(tRV (K)) = −2ltRV (K) θˆtRV (K) |u + ln(n)ntRV (K) . Bij het vergelijken van de verschillende modellen voor het optimale snoeiingsniveau wordt er enkel gekeken naar de opeenvolgende modellen tRV (K) en tRV (K + 1). Dit betekent dat als men een K0 heeft gevonden als optimaal, dat het model tRV (K0 ) niet werd vergeleken met tRV (K0 + 2), . . . , tRV (n − 1). Dit is echter geen beperking daar men de reguliere vine zo geconstrueerd heeft dat de sterkste afhankelijkheden in de eerste bomen zitten. 4.4.2 Vereenvoudigde reguliere vine Definitie 4.6 Een reguliere vine wordt vereenvoudigd op niveau K (simplified regular vine), sRV (K), indien alle paar-copula’s in deze reguliere vine met conditioning set groter of gelijk aan K vervangen worden door de Gaussiaanse copula. Het gebruik van de Gaussiaanse copula vereenvoudigt het model daar deze copula veel simpeler is om te schatten, het symmetrisch is en makkelijk te interpreteren aan de hand van de correlatieco¨effici¨ent. De gesnoeide reguliere vine kan ook gezien worden als een vereenvoudigde reguliere vine waarbij alle gaussiaanse paar-copula’s correlatieco¨effici¨ent nul hebben. Voor de vereenvoudigde reguliere vine kan hetzelfde worden gedaan als bij de gesnoeide, met parameterverzameling θsRV (K) = θe1 ,e2 |De |e ∈ Ei , i ∈ {1, . . . , K} ∪ ρe1 ,e2 |De |e ∈ Ei , i ∈ {K + 1, . . . , n − 1} , waarbij ρe1 ,e2 |De de correlatieco¨effici¨ent is voor de Gaussiaanse paar-copula met copuladichtheid cρe1 ,e2 |De . De paar-copula ontbinding voor de vereenvoudigde reguliere vine op niveau K is dan HOOFDSTUK 4. TOEPASSING VAN VINES IN FINANCE csRV (K) (u|θsRV (K) ) = hQ 50 i c (F (u |u ), F (u |u )) × e D e D e ,e |D e e e 1 2 1 2 e∈Ei hQ i Q n−1 ρ c (F (u |u ), F (u |u )) , e1 De e2 De i=K+1 e∈Ei e1 ,e2 |De K i=1 Q met u = (u1 , . . . , un ) ∈ [0, 1]n . Voor de selectie van het vereenvoudigingsniveau wordt gewerkt met een ander statistische model-selectie-techniek omdat men hier niet te maken heeft met genestelde modellen. Likelihood ratio test van Vuong: Hierbij worden twee modellen vergeleken waarbij aan de beslissing een significantieniveau wordt meegegeven. Men definieert voor een observatie ui , i ∈ (1, . . . , T ) QK Q ˆ ˆ V (ui |θsRV (K) ) = l=1 e∈El ce1 ,e2 |De F (uie1 |uiDe ), F (uie2 |uiDe )|θe1 ,e2 |De Qn−1 Q × l=K+1 e∈El cρe1 ,e2 |De (F (ue1 |uDe ), F (ue2 |uDe )) , met maximum likelihood schatter θˆsRV (K) . Vervolgens worden voor de observaties ui , i ∈ {1, . . . , T } de log-likelihood ratio’s geconstrueerd " # V (ui |θˆsRV (K) ) mi = log . V (ui |θˆsRV (K+1) ) Op basis hiervan wordt de statistiek LRT (θˆsRV (K) , θˆsRV (K+1) ) = T X mi + nsRV (K) − nsRV (K+1) i=1 geconstreerd, met variantie ω ˆ2 = 1 T PT i=1 (mi − m) ¯ en nsRV (K) zoals bij de AIC. Bij deze statistiek wordt weeral rekening gehouden met het aantal te schatten parameters in een bepaalde vereenvoudigde reguliere vine. Net zoals bij het BIC, kan ook hier het aantal te schatten parameters sterker doorwegen in de beslissing. Dit gebeurt door een Schwarz correctie toe te passen in plaats van een AIC correctie op de statistiek. Analoog kan de AIC correctie worden weggelaten indien het verschil in aantal te schatten parameters tussen de twee modellen niet uitmaakt. In Vuong (1989) wordt aangetoond dat uit de wet van de grote getallen volgt dat ˆ ˆ LRT θsRV (K) , θsRV (K+1) d √ ν= → N (0, 1), Tω ˆ2 voor T → ∞. Het model sRV (K) wordt dan verkozen boven sRV (K + 1) met significantie niveau α indien ν > φ−1 1 − α2 en bijgevolg neemt men K als vereenvoudigingssniveau daar het toevoegen van een boom TK+1 geen significante winst meegeeft. Indien ν < −φ−1 1 − α2 wordt het tweede model verkozen en wordt er verder onderzocht voor het volgend niveau HOOFDSTUK 4. TOEPASSING VAN VINES IN FINANCE K + 1. Tenslotte indien |ν| ≤ φ−1 1 − α 2 51 kan er geen beslissing genomen worden tussen beide modellen en wordt ook hier K genomen als vereenvoudigingssniveau aangezien geen significant onderscheid kan worden gemaakt tussen beide modellen. De likelihood ratio test van Vuong kan ook toegepast worden voor de selectie van het snoeiingsniveau. Moest de AIC selectie-techniek toegepast worden voor vereenvoudigde reguliere vines zou dit een verhoogde variabiliteit met zich meebrengen aangezien de vergeleken modellen niet genesteld zijn. Daar de modellen sRV (K) en sRV (K + 1) enkel verschillen ter hoogte van de boom TK+1 , is deze verhoogde variabiliteit niet onoverkombaar. 4.5 Tijdsvari¨ erende copula’s Bij het modelleren van de afhankelijkheid tussen financi¨ele rendementen wenst men rekening te houden met het feit dat de afhankelijkheidsstructuur niet constant is in de tijd, zoals werd aangetoond in Longin & Solnik (1995). In deze paper werden de maandelijkse returns van zeven aandelenmarkten geanalyseerd over een periode van dertig jaar en wordt de hypothese verworpen dat de conditionele correlatie constant is. Door toe te staan dat de copula-parameters vari¨eren in functie van de tijd wordt het model zodanig aangepast dat de paar-copula’s tijdsvari¨erend kunnen zijn. Om dit te modelleren wordt er gewerkt met het Dynamisch Conditioneel Correlatie-model, dat werd geconstrueerd in Engle (2002). Dit model wordt geschat in twee stappen, eerst worden de univariate GARCH tijdreeksen geschat en vervolgens bekomt men de tijdsvari¨erende correlatieco¨efficient. Het idee van het DCC model is om vertrekkende vanuit de residuen van de rendementen een correlatie-parameter te construeren die varieert met de tijd. Vervolgens zal uit de correlatie-parameter de Kendall’s tau worden afgeleid en hieruit wordt dan de tijdsvari¨erende parameter van de paar-copula gehaald. De reguliere vine die tot nu toe werd besproken wordt dus dynamisch gemaakt, door toe te laten dat de paar-copula’s tijdsvari¨erend zijn. De inputs van een copula werden zodanig geconstrueerd dat ze uniform verdeeld zijn. Deze inputs worden nu getransformeerd door de inverse normale cumulatieve verdelingsfunctie erop toe te passen: i,t = Φ−1 (ui,t ) en t = [1,t , 2,t ], bijgevolg geldt i,t ∼ N (0, 1). Men wenst nu het DCC model hierop toe te passen, waarmee de conditionele correlatie wordt geconstrueerd. HOOFDSTUK 4. TOEPASSING VAN VINES IN FINANCE 4.5.1 52 Dynamisch Conditioneel Correlatie-model Gegeven log-rendementen ri en rj die beiden gemiddelde 0 hebben. Men is ge¨ınteresseerd te weten wat de conditionele correlatie is tussen beide rendementen, Et−1 [ri,t rj,t ] ρi,j,t = q . 2 2 Et−1 [ri,t ]Et−1 [rj,t ] De conditionele correlatie is gebaseerd op de informatie geweten op tijdstip t − 1. Deze rendementen kunnen geschreven worden aan de hand van ri,t = σi,t i,t 2 ], Ft−1 meetbaar en i,t met gemiddelde 0 en variantie 1. Hierdoor kan de met σi,t = Et−1 [ri,t conditionele correlatie herschreven worden als ρi,j,t = Et−1 [i,t j,t ]. Met conditioneel bedoelt men hier conditioneel op de vorige observaties en niet conditioneel op andere variabelelen. Zij Ht = Et−1 [rt r0t ] = Dt RDt , met Dt = diag(σt ) en R = Et−1 [t 0t ] de correlatie matrix van de gestandardiseerde residuen. Men wenst nu R te schatten zodat R tijdsvari¨erend is, en bijgevolg Ht = Dt Rt Dt met Rt de conditionele correlatie matrix. Engle stelde hier voor om te werken met het GARCH(1,1) model toegepast op t , waardoor het proces qi,j,t = ρi,j + α (i,t−1 j,t−1 − ρi,j ) + β (qi,j,t−1 − ρi,j ) wordt verkregen met ρi,j de onconditionele correlatie. Dit kan herschreven worden als qi,j,t = (1 − α − β)ρi,j + αi,t−1 j,t−1 + βqi,j,t−1 = 1−α−β 1−β ρi,j + α P∞ k=1 β k i,t−k j,t−k . Waarbij α en β de autoregressieve parameters zijn. De schatter voor de tijdsvari¨erende correlatie parameter wordt dan gegeven als ρˆi,j,t = √ qi,j,t . qi,i,t qj,j,t De covariantie matrix Qt wordt dan geconstrueerd met als elementen [Qt ]i,j = qi,j,t . Voor het DCC model in matrix vorm gelden dan de volgende dynamische vergelijkingen, Qt = Σ(1 − α − β) + αt−1 0t−1 + βQt−1 en Rt = diag(Qt )−1/2 Qt diag(Qt )−1/2 , HOOFDSTUK 4. TOEPASSING VAN VINES IN FINANCE 53 met Σ een 2 × 2 matrix met 1 op diagonaal en de niet-conditionele correlatie ρi,j op de niet diagonaal elementen. Om de conditionele correlatiecoeffici¨ent te vinden moeten de parameters α, β en Σ worden geschat. Nu men een schatter heeft gevonden voor de tijdreeks ρt , wordt hieruit de tijdsvari¨erende copula-parameter afgeleid aan de hand van eigenschappen uit Kurowicka & Cooke (2006) die hier worden uitgewerkt. Eerst wordt de dynamische Kendall’s tau berekend, door ervan uit te gaan dat ρt de copula parameter is van de Gaussiaanse copula. Vooraleer deze transformatie te bewijzen gaat men eerst een lemma bewijzen in verband met de bivariate normale dichtheidsfunctie. Lemma 4.1 Zij (X, Y ) een willekeurige vector met een gezamenlijke normale verdelingsfunctie en met dichtheidsfunctie f (x, y), dan geldt ∂ 2 f (x, y) ∂f (x, y) = . ∂ρ ∂x∂y Bewijs: De dichtheidsfunctie van de normale verdeling met parameter ρ is gegeven door 1 1 2 2 f (x, y) = p exp − x − 2ρxy + y . 2(1 − ρ2 ) 2π 1 − ρ2 1 2 2 Voor de eenvoud noteert men − 2(1−ρ 2 ) (x − 2ρxy + y ) als g(x, y, ρ). Dan geldt 1 ∂g(x, y, ρ) (x2 ρ − xy(1 + ρ2 ) + y 2 ρ) ∂g(x, y, ρ) =− (2x − 2ρy) en = − . ∂y 2(1 − ρ)2 ∂ρ (1 − ρ2 )2 (i) Men begint met f (x, y) partieel af te leiden naar y, ∂f (x, y) 1 ρx − y = p exp (g(x, y, ρ)) . ∂y 1 − ρ2 2π 1 − ρ2 Vervolgens afleiden naar x geeft, ∂ 2 f (x,y) ∂y∂x = 1 2π(1−ρ2 )3/2 ∂ exp(g(x,y,ρ)) ∂x = 1 2π(1−ρ2 )3/2 exp (g(x, y, ρ)) (ρy−x) (ρx − y) + exp (g(x, y, ρ)) ρ (1−ρ2 ) (ρx − y) + exp (g(x, y, ρ)) ρ 1 = − 2π(1−ρ 2 )3/2 exp (g(x, y, ρ)) (ρy−x)(ρx−y) (1−ρ2 ) +ρ . (ii) De dichtheidsfunctie f (x, y) wordt partieel afgeleid naar ρ, HOOFDSTUK 4. TOEPASSING VAN VINES IN FINANCE ∂f (x,y) ∂ρ = 1 ∂(1−ρ2 )−1/2 2π ∂ρ = ρ 2π(1−ρ2 )3/2 = exp (g(x, y, ρ)) + √1 2π 1−ρ2 54 ∂ exp (g(x, y, ρ)) ∂ρ (−x2 +2ρxy−y2 ) 2(1−ρ2 ) exp (g(x, y, ρ)) + √1 2 exp (g(x, y, ρ)) 2π 1−ρ 2 2 2 2xy2(1−ρ )+4ρ(−x +2ρxy−y ) 4(1−ρ2 )2 1 2π(1−ρ2 )3/2 exp (g(x, y, ρ)) ρ + xy+xyρ2 −x2 ρ−y 2 ρ (1−ρ2 ) . Wat dus hetzelfde is als bij (i), waarmee het lemma is bewezen. Door de definitie van de Kendall’s tau toe te passen voor de Gaussiaanse copula kan een eenvoudige relatie bekomen worden tussen de correlatieco¨effici¨ent en de Kendall’s tau. Deze wordt in Kurowicka & Cooke (2006) gegeven aan de hand van volgende eigenschap. Eigenschap 4.1 Zij (X, Y ) een willekeurige vector met gezamenlijke normale verdelingsfunctie,dan is 2 τ (X, Y ) = arcsin ρ(X, Y ). π Bewijs: Gegeven de dichtheidsfunctie van de normale verdeling met parameter ρ, f (x, y), Rx Ry de cumulatieve verdeligsfunctie is dan F (x, y) = −∞ −∞ f (x, y)dxdy. De definitie van de Kendall’s tau kan aan de hand van het theorema van Sklar herschreven worden als Z Z τ (X, Y ) = 4 F (x, y)dF (x, y) − 1 = 4 F (x, y)f (x, y)dxdy − 1. R2 R2 Door af te leiden naar ρ verkrijgt men, Z ∂τ ∂F (x, y) ∂f (x, y) =4 f (x, y) + F (x, y) dxdy. ∂ρ ∂ρ ∂ρ R2 Gebruikmakende van Lemma 4.1 kan dit herschreven worden als, Z ∂ 2 f (x, y) + f 2 (x, y)dxdy. 4 F (x, y) ∂x∂y 2 R Door partiele integratie toe te passen eerst op x en vervolgens op y, kan men R R 2 f (x,y) F (x, y) ∂ ∂x∂y dxdy uitwerken tot R2 f 2 (x, y)dxdy wat dan R2 Z ∂τ =8 f 2 (x, y)dxdy ∂ρ R2 geeft. Door f (x, y) in te vullen krijgt men Z 8 1 2 2 2 p p exp − x − 2ρxy + y dxdy. 2(1 − ρ2 ) 2π 1 − ρ2 R2 2π 1 − ρ2 HOOFDSTUK 4. TOEPASSING VAN VINES IN FINANCE In bovenstaande integraal x en y te transformeren naar s = √x 2 55 en t = √y 2 met Jacobiaan 1 2 wordt opnieuw de normale dichtheidsfunctie bekomen, en bijgevolg geeft dit Z ∂τ 8 8 2 1 1 = p = p f (s, t) dsdt = p . ∂ρ 2 2π 1 − ρ2 R2 2π 1 − ρ2 2 π 1 − ρ2 Beide leden integreren naar ρ geeft dan de gewenste formule, Z 1 2 2 p dρ = arcsin ρ. τ= π π 1 − ρ2 Het is dus mogelijk om uit de correlatieco¨effici¨ent de Kendall’s tau waarde af te leiden. Voor elke copula met parameter θ bestaat ook de relatie Z Cθ (u1 , u2 )dCθ (u1 , u2 ), τ =4 [0,1]2 waaruit men na inversie van deze relatie de Kendall’s tau kan transformeren tot de copulaparameter θ voor elke paar-copula dat wordt geschat. Voor de Archimedische copula’s kan deze worden berekend aan de hand van Eigenschap 2.2. Gaussiaanse copula: Hier volgt de relatie uit de inversie van de formule uit Eigenschap 4.1, ρ = sin(τ π/2). Student t copula: De relatie tussen de Kendall’s tau en de student t copula-parameter hangt niet af van het aantal vrijheidsgraden. De relatie is dezelfde als voor de Gaussiaanse copula, ρ = sin(τ π/2). Frank copula: De transformatie van de Kendall’s tau naar de parameter van de Frank copula moet numeriek worden opgelost. Bijgevolg zal deze copula worden uitgesloten in 5.1.6 waar de dynamische copula-parameters gezocht zullen worden voor een dataset. Gumbel copula: Gegeven de generator ϕ(t) = (− ln(t))θ , θ > 0, kan worden berekend als volgt, Z 1 Z 1 (− ln(t))θ ln(t)t τ =1+4 dt = 1 + 4 dt = 1 − θ−1 θ 0 −θ/t(− ln(t)) 0 Wat na inversie de volgende relatie geeft, θ = 1/(1 − τ ). de Kendall’s tau 1 . θ HOOFDSTUK 4. TOEPASSING VAN VINES IN FINANCE Clayton copula: Gegeven de generator ϕ(t) = 1 −θ (t θ 56 − 1), θ ∈ [−1, ∞)\ {−1}, kan de Kendall’s tau worden berekend als volgt, Z 1 Z Z (t−θ − 1) 4 1 4 1 θ+1 θ τ =1+4 dt = 1 − . tdt + t dt = −(θ+1) ) θ 0 θ 0 θ+2 0 θ(−t Na inversie wordt voor de copula parameter de relatie θ = 2τ /(1 − τ ) gevonden. Er moet worden opgemerkt dat het toepassen van het DCC model voor het vinden van de tijdsvari¨erende copula-parameter een beperking met zich meebrengt. Aangezien bij de constructie van de conditionele correlatieco¨effici¨ent er wordt verondersteld dat de afhankelijkheid wordt beschreven aan de hand van een Gaussiaanse copula en niet aan de hand van de in de vine-constructie geselecteerde copula. 4.6 Model evaluatie aan de hand van Value-at-Risk Tenslotte wenst men het geconstrueerde model te evalueren zoals beschreven in Berg & Aas (2009) en Heinen & Valdesogo (2009). Om na te gaan of een model goed presteert wordt onderzocht of het goede Value-at-Risk-voorspellingen genereert. Hiervoor wordt een bepaalde periode geslecteerd, T1 , voor het welk een vine copula wordt geconstrueerd. Vervolgens gaat men voor een daarop volgende periode, T2 , de gerealiseerde rendementen vergelijken met de VaR-voorspellingen, voor een bepaalde drempel α. De VaR is een goede risicomaat omdat het rekening houdt met de staart van een verdeling. Het wordt vaak gebruikt in de praktijk om te bepalen hoeveel reserves een financi¨ele instelling moet aangeleggen. De Value-at-Risk gaat een antwoord geven op de vraag ”Hoeveel kunnen we verwachten te verliezen in ´e´en dag/week/jaar met een bepaalde kans?”, het is gedefinieerd als volgt. Definitie 4.7 Gegeven een bepaald risico X en een bepaalde drempel α ∈ (0, 1), de overeenkomstige VaR is V aR1−α (X) = FX−1 (1 − α). De VaR komt dus eigenlijk overeen met het (1 − α)-quantiel van X. Typisch wordt voor α 0.05 genomen. Het idee is dus om dagelijks het waargenomen rendement van een bepaalde portefeuille te gaan vergelijken met de (1 − α)-VaR van het voorspelde rendement op basis van de geconstrueerde vine-copula die de afhankelijkheid van de returns van de componenten van de HOOFDSTUK 4. TOEPASSING VAN VINES IN FINANCE 57 portefeuille modelleert. In de periode T2 wordt het aantal keren dat de VaR-voorspellingen groter was dan de waargenomen returns opgeteld en gedeeld door T2 . Indien dit getal ongeveer overeenkomt met de drempel α is het geconstrueerde model nauwkeurig. Het berekenen van de VaR bestaat uit verschillende stappen: (i) Gebruikmakende van de geschatte copula-parameters en geconstrueerde vine-structuur (op basis van de observaties uit de periode T1 ) worden uit de geconstrueerde vine copula de observaties u1 , . . . , un gesimuleerd. Simulatie procedure: Voor het simuleren van n afhankelijke, uniform verdeelde observaties u1 , . . . , un voor een bepaalde vine copula, worden eerst n onafhankelijke, uniform verdeelde observaties w1 , . . . , wn willekeurig gekozen. De observaties u1 , . . . , un worden dan gevonden door volgende bewerkingen toe te passen op w1 , . . . , wn : u1 u2 u3 = w1 , = F −1 (w2 |u1 ) = F −1 (w3 |u1 , u2 ) .. . un = F −1 (wn |u1 , . . . , un−1 ) Waarbij de conditionele verdelingsfunctie bepaald is zoals in (3.4), F (x|v) = ∂Cx,vj |v−j (F (x|v−j ), F (vj |v−j )) , ∂F (vj |v−j ) met de keuze van de observatie vj afhankelijk van de vine-structuur. (ii) Hieruit worden de gestandaardiseerde residuen ˆT +1,1 , . . . , ˆT +1,n berekend. Hiervoor wordt op elke observatie ui de inverse skewed student t verdeling toegepast overeenkomstig met het residu i , zoals bepaald in sectie 4.1. (iii) Aan de hand van de schattingen voor het GARCH(1,1) model op basis van de eerste T1 observaties wordt de ex-ante GARCH volatiliteit-voorspelling berekend voor elke j ∈ {1, . . . , n}, 2 σ ˆT2 +1,j = ωˆj + α ˆ ˆ2T,j + βˆσ ˆT,j . (iv) Voor elke component uit de portefeuille wordt de ex-ante rendement-voorspelling berekend gebruikmakende van de voorspellingen uit (ii) en (iii) en de schattingen van de ARMA-parameters voor de rendementen rj , j ∈ {1, . . . , n} uit sectie 4.1. rˆT +1,j = µ ˆj + p X k=1 φˆk,j rT +1−k,j + σ ˆT +1,j ˆT +1,j + q X k=1 θˆk,j σ ˆT +1−k,j ˆT +1−k,j , (4.1) HOOFDSTUK 4. TOEPASSING VAN VINES IN FINANCE 58 waarbij µ ˆj wordt berekend als het gemiddelde van de laatste 100 geobserveerde rendementen. (v) Het rendement van de portefeuille wordt dan geconstrueerd aan de hand van de rendementen van de verschillende componenten met hun respectievelijk gewicht. De keuze van de gewichten mag vrij gekozen worden, men construeert de portefeuille zodanig dat elke component een even grote bijdrage heeft, rˆTP +1 n X 1 rˆT +1,j . = n j=1 (vi) Tenslotte wordt de (1 − α)-VaR van het portfolio-rendement berekend, V aRT1−α rTP +1 ). +1 (ˆ Dit gebeurd door het steekproef α-quantiel te nemen van de portfolio-rendementvoorspelling. Er wordt een hit-variabele It geconstrueerd die gaat bepalen of op een bepaald tijdstip t de (1 − α)-VaR van het portfolio-rendement, het waargenomen rendement overschrijdt. It = 1 0 indien rtP < V aRt1−α (ˆ rtP ) anders Men gaat dit elke dag na voor t ∈ {T1 + 1, . . . , T1 + T2 } en bekomen dan een tijdreeks 1 +T2 {It }Tt=T . Opdat het geconstrueerde vine copula-model correct zou zijn moet deze tijdreeks 1 +1 aan twee eigenschappen voldoen. Ten eerste moeten de overschrijdingen van V aRt1−α (ˆ rtP ) op een onafhankelijke manier plaatsvinden in de tijd, dit wil zeggen dat er geen clustervorming mag zijn. Een tweede eigenschap is dat het relatief aantal overschrijdingen ongeveer overeen moet komen met de drempelwaarde α, TX 1 +T2 ! It /T2 ≈ α. t=T1 +1 Om dit laatste na te gaan wordt er gebruik gemaakt van de likelihood ratio test of correct unconditional coverage of Kupiec. Hierbij wordt als nulhypothese genomen dat het relatief aantal overschrijdingen gelijk is aan α. Onder de nulhypothese geldt dat de likelihood ratio statistiek, " T −N # N h i N N 2 1− − 2 ln αN (1 − α)T2 −N , LR = 2 ln T2 T2 P 1 +T2 asymptotisch een χ2 (1)-verdeling volgt, met N = Tt=T I . Voor de drempelwaarde wordt 1 +1 t dan de p-waarde berekend voor de nul hypothese en in functie daarvan wordt bepaald of de geconstrueerde ARMA-GARCH-Skewed-student-t-paar-copula ontbinding de afhankelijkheid correct modelleert. Hoofdstuk 5 Empirische toepassing Men wenst de methodes beschreven in hoofdstuk 4 toe te passen op interessante datasets. In sectie 5.1 wordt de afhankelijkheid voor de maandelijkse rendementen van 14 Europese landen onderzocht voor een periode van 13 jaar. Voor deze dataset wordt een reguliere vine, een C-vine en een D-vine geconstrueerd. Deze modellen worden met elkaar vergeleken en er wordt onderzocht of de reguliere vine kan worden gesnoeid en vereenvoudigd. Er wordt ook nagegaan of de afhankelijkheid varieert met de tijd. De vine copula kent heel wat toepassingen binnen het vermogensbeheer. In Mendes (2010) wordt voor een zesdimensionale dataset aan de hand van een D-vine een effci¨ente grens geconstrueerd die overeenkomt met optimale portfolio’s volgens de Markowitz Mean Variance methodologie. In Heinen & Valdesogo (2009) wordt een niet lineaire versie van het Capital Asset Pricing Model geconstrueerd door middel van een C-vine. De Canonical Vine Autoregressive (CAVA) wordt hierbij toegepast op de wekelijkse rendementen van 95 S&P500 aandelen. De assumpties die worden gemaakt in het het CAVA model zijn te beperkend en daarom werd in Brechmann (2013) het model aangepast tot het Regular Vine Market Sector model (RVMS). Aan de hand van een reguliere vine wordt de afhankelijkheid beschreven van de Euro Stoxx 50, dit wordt dan gebruikt voor het opsplitsen van het systematisch en specifiek risico van elk aandeel. Het model laat ook toe, zowel op een passieve als op een actieve manier, een portfolio te beheren, hiervoor moet de dagelijkse Value-at-Risk worden voorspeld. In sectie 5.2 past men het Regular Vine Market Sector model toe op de BEL 20 index, haar componenten en hun respectievelijke sectoren. Er wordt een soortgelijke analyse gedaan als voor de Euro Stoxx 50 in Brechmann (2013). Tenslotte wordt in sectie 5.3 een reguliere vine geconstrueerd voor een portefeuille bestaande 59 HOOFDSTUK 5. EMPIRISCHE TOEPASSING 60 uit de componenten van de BEL 20 komende uit de financi¨ele sector. Aan de hand van de Value-at-Risk-berekeningen voor de voorspelde portefeuille-rendementen wordt de reguliere vine ge¨evalueerd. Voor beide datsets heeft men gewerkt in R, er werd voornamelijk gebruik gemaakt van de packages ’VineCopula’ (2013) en ’ccgarch’ (2014). Deze packages laten toe om de gepaste copula-families en -parameters te schatten. Het bekomen van de vine-structuur werd wel met de hand gedaan. Deze packages laten ook toe verschillende vines te vergelijken, te vereenvoudigen en de afhankelijkheden tijdsvari¨erend te maken. Doorheen het hoofdstuk zal worden vermeld welke functies werden gebruikt in R om de resultaten te bekomen. 5.1 Case 1: Maandelijkse rendementen van 14 Europese landen, 1991-2014. Voor Nederland, Belgi¨e, Frankrijk, Duitsland, Verenigd Koninkrijk, Itali¨e, Spanje, Oostenrijk, Ierland, Zweden, Zwitserland, Finland, Noorwegen en Denemarken construeerden E. Fama en K. French waarde en groei portfolios. Dit deden ze aan de hand van vier ratio’s die de waardering van een bedrijf bepalen. In elk land worden voor de bedrijven de book-tomarket, price-earnings, cash-earnings-to-price en dividend yield ratio’s berekend. Fama en French hebben per land een portfolio opgesteld waarbij elk bedrijf naargelang zijn waarde een bepaald gewicht toegekend krijgt. Voor deze portfolio’s werden de maandelijkse rendementen berekend. Deze data zijn beschikbaar op de website van K. French, professor aan de Tuck School of Business, Dartmouth College. Men wenst een vine copula te construeren die de afhankelijkheden tussen de maandelijkse rendementen vanaf januari 1991 tot en met december 2013 correct beschrijft. 5.1.1 Marginale modellen De dataset voor de Europese landen bestaat uit T = 276 observaties en n = 14 variabelen. Deze observaties zijn samengevat in Tabel 5.1. Men ziet dat de eigenschappen besproken in hoofdstuk 4 worden bevestigd in Tabel 5.1. Voor bijna alle Europese landen wordt een negatieve skewness vastgesteld en ook een hoge kurtosis. Aan de hand van de dichtheidsfunctie kan men ook duidelijk zien dat de verdeling piekt in nul en dat de verdeling zware staarten heeft. De staart is zwaarder voor negatieve rendementen dan voor positive rendementen, zoals kan gezien worden in Figuur 5.1. Hetzelfde patroon wordt ook waargenomen voor de andere Europese landen. Men kan aannemen HOOFDSTUK 5. EMPIRISCHE TOEPASSING mean ned 1.01 bel 0.93 fra 0.93 dui 0.91 vk 0.82 ita 0.72 spa 0.96 oos 0.72 ier 0.99 zwe 1.25 zwi 1.05 fin 1.34 noo 1.05 den 1.03 sd 5.88 5.41 5.83 6.15 4.71 7.23 6.72 6.5 6.69 7.33 4.78 8.91 7.37 5.68 min -29.19 -30.37 -21.9 -23.30 -19.91 -23.72 -22.86 -34.63 -23.44 -27.56 -15.09 -28.99 -30.82 -25.06 max 16.71 16.68 15.04 21.99 14.12 21.22 21.14 19.43 35.76 25.17 13.21 30.83 19.34 18.11 61 skew kurtosis -0.98 3.13 -1.05 4.30 -0.45 0.73 -0.51 1.51 -0.35 1.36 0.05 0.28 -0.18 0.73 -0.84 3.64 0.07 3.28 -0.21 1.07 -0.56 0.81 0.09 0.9 -0.69 2.08 -0.62 1.72 Tabel 5.1: Beschrijvende statistieken van de rendementen van de 14 Europese landen dat dezelfde eigenschappen worden waargenomen voor de residuen van elk land. Figuur 5.1: Geschatte dichtheidsfunctie voor de rendementen van Belgi¨e Alvorens een reguliere vine te gaan construeren moeten eerst de marginale tijdreeksen correct worden gemodelleerd. Voor elke land wordt een ARMA(p,q)-GARCH(1,1) proces HOOFDSTUK 5. EMPIRISCHE TOEPASSING 62 toegepast op de tijdreeks. De parameters van het ARMA-GARCH proces voor elk land worden gegeven in Bijlage A.1. Het ARMA proces laat toe om seri¨ele correlatie te verwijderen uit de observaties. Aan de hand van het GARCH(1,1) model wordt voor het land een volatiliteit geconstrueerd dat varieert met de tijd. In Figuur 5.2 wordt de geschatte {σt }t∈T weergegeven voor Belgi¨e, hier is de financi¨ele crisis die begon in 2007 duidelijk te merken. Figuur 5.2: Tijdsvari¨erende volatiliteit voor de rendementen van Belgi¨e Tenslotte worden op de gestandardiseerde residuen van het ARMA-GARCH proces de rangen toegepast om de gewenste stationaire en uniform verdeelde observaties te bekomen voor elk land. Er wordt nu een reguliere vine geconstrueerd op basis van deze pseudoobservaties volgens de methodologie besproken in sectie 4.2. HOOFDSTUK 5. EMPIRISCHE TOEPASSING 63 Figuur 5.3: Transformatie naar uniform verdeelde tijdreeks Voor het schatten van de juiste ARMA-GARCH tijdreeksmodellen en het construeren van de residuen en volatiliteit wordt gebruik gemaakt van de packages timeseries, forecast en fGarch. Aan de hand van de functie auto.arima wordt de graad van het ARMA proces bepaald en vervolgens door garchFit toe te passen op de tijdreeks krijgt men de geschatte parameters, de residuen en de volatiliteit. Op de residuen wordt dan de empirische cumulatieve verdelingsfunctie toegepast ecdf om de pseudo observaties te bekomen. 5.1.2 Vine constructie Voor elk paar variabelen wordt de Kendall’s tau bepaald om na te gaan welke landen de sterkste afhankelijkheid hebben. In R gebruikt men hiervoor de functies Kendall of TauMatrix en wordt de Maximum Spanning Tree met de hand geconstrueerd. Het idee is om de sterkste afhankelijkheden te beschrijven in de eerste boom omdat deze meestal de belangrijkste afhankelijkheden zijn om accuraat te modelleren. Er wordt nu sequentieel te werk gegaan; per boom wordt aan de hand van het Prim’s algoritme nagegaan welke boomstructuur een maximale som van paarsgewijze afhankelijkheden met zich meebrengt. Voor elke boog in de geconstrueerde boom wordt een selectie en een maximum likelihood schatting van de bivariate copula-families gedaan. In R gebeurt dit aan de hand van de functie BiCopSelect. Als mogelijke copula-families worden enkel de paar-copula’s besproken in secties 2.2 en 2.3 toegelaten. Vervolgens worden de observaties voor de volgende boom berekend aan de hand van (3.4). Aangezien de observaties in de vorige boom uniform verdeeld zijn kan voor elke familie een expliciete formule gevonden worden voor deze observaties, dit wordt de h-functie genoemd, h(u1 , u2 , θ) = F (u1 |u2 ) = ∂Cθ (u1 , u2 ) ∂u2 HOOFDSTUK 5. EMPIRISCHE TOEPASSING 64 Deze h-functies worden in R berekend met de functie BiCopHfunc en de copula wordt zowel afgeleid naar de eerste variabele als naar de tweede variabele, op basis van de vorige boom wordt dan onderzocht welke men nodig heeft. In Heinen & Valdesogo (2009) wordt voor de verschillende copula families de h-functie gegeven als volgt : Gaussiaanse copula: −1 h(u1 , u2 , ρ) = Φ(2) ρ −1 Φ (u1 ) − ρΦ (u2 ) p 1 − ρ2 ! student t copula: (2) t−1 ν (u1 ) h(u1 , u2 , ρ, ν) = tν+1 q − ρt−1 ν (u2 ) 2 2 (ν+(t−1 ν (u2 )) )(1−ρ ) ν+1 Clayton copula: −1− θ1 −θ h(u1 , u2 , θ) = u−θ−1 u−θ 2 1 + u2 − 1 Gumbel copula: h(u1 , u2 , θ) = Cθ (u1 , u2 ) 1 −1 1 (− log(u2 ))θ−1 (− log(u1 ))θ + (− log(u2 ))θ θ u2 Frank copula: (e−θu1 − 1)(θe−θu2 ) h(u1 , u2 , θ) = θ((e− − 1) + (e−θu1 − 1)(e−θu2 − 1)) Naargelang met welke andere bogen een bepaalde top verbonden was in de vorige boom, zal de paar-copula C(u1 , u2 ) afgeleid worden naar u1 en/of u2 . Aan de hand van de bekomen observaties worden opnieuw voor elk paar toppen waartussen een boog kan getrokken worden de Kendall’s tau berekend en een Maximum Spannig boom geconstrueerd. Dit wordt herhaald voor de hele vine. Het schatten van de copula parameters gebeurt aan de hand van een twee-staps maximum likelihood. Voor elke paar-copula wordt een bivariate maximum likelihood schatting gedaan voor het vinden van de juiste copula familie en de copula parameters. Nadat dit is gebeurd voor elke copula in de vine worden deze schatters genomen als startwaarde voor het uitvoeren van een full maximum likelihood van de paar-copula parameters voor de volledige paar-copula ontbinding. Dit gebeurt in R aan de hand van RVineMLE. De eerste boom van de reguliere vine wordt weergegeven in Figuur 5.4 met voor elke boog de bijhorende paarcopula-familie. Nederland is het sterkst afhankelijk met de andere landen, alsook Frankrijk. De figuren voor de tweede, derde en vierde boom in de reguliere vine worden gegeven in HOOFDSTUK 5. EMPIRISCHE TOEPASSING 65 Bijlage A.1 alsook de scatterplots overeenstemmende met de bogen in de eerste boom. De copula-familie en -parameters voor elke boog in de vine worden samengevat in matrices en weergegeven in de bijlage. Figuur 5.4: Structuur van de eerste boom in de reguliere vine Ter verduideling van de boom constructie wordt het Maximum Spanning Tree-algoritme uitgewerkt voor boom 3. Elke top in boom 3 komt overeen met een boog uit boom 2, die op zijn beurt een paar-copula bepaalt. Twee toppen in boom 3 kunnen met elkaar verbonden worden indien de overeenstemmende bogen in boom 2 een top delen. In Figuur 5.5 (a) worden alle mogelijke bogen (op basis van de boomstructuur van boom 2) weergegeven in stippelijnen. Er wordt een volle lijn getrokken indien uit een bepaalde top geen enkele andere boog kan vertrekken (dit is het geval voor ”dui,fin|zwe”). Voor elk paar toppen dat wordt verbonden door een boog, wordt de Kendall’s tau berekend voor de overeenkomstige observaties. De observaties worden zo berekend dat toppen die worden verbonden door een boog, dezelfde conditioning set hebben. Bijvoorbeeld voor de boog die de toppen ”oos,ned|bel” en ”bel,dui|ned” verbindt, worden de observaties gegeven door F (uoos |ubel , uned ) = ∂Coos,ned|bel (F (uoos |ubel ), F (uned |ubel )) ∂F (uned |ubel ) F (udui |uned , ubel ) = ∂Cbel,dui|ned (F (ubel |uned ), F (udui |uned )) , ∂F (ubel |uned ) en HOOFDSTUK 5. EMPIRISCHE TOEPASSING 66 waarbij Coos,ned|bel en Cbel,dui|ned copula’s zijn uit boom 2. Voor het vinden van de juiste boomstructuur wordt het Prim’s algoritme toegepast; de boog met de grootste Kendall’s tau in absolute waarde wordt toegevoegd aan de graaf, vervolgens wordt uit ´e´en van de bereikte toppen opnieuw de boog gekozen met de grootste Kendall’s tau waarde zonder dat hierdoor een cyclus wordt gevormd. Dit wordt herhaald totdat elke top verbonden is met minstens ´e´en andere top. De boomstructuur die wordt bekomen voor boom 3 wordt weergegeven in Figuur 5.5 (b). Figuur 5.5: (a) Alle mogelijke bogen in boom 3 met overeenkomstige Kendall’s tau, (b) de bekomen boomstructuur door het toepassen van het Prim’s algoritme. De bekomen reguliere vine-structuur wordt gegeven in onderstaande matrix, 8 12 6 7 13 5 3 9 10 14 11 4 1 2 12 11 9 2 7 13 5 14 6 3 1 4 10 11 6 6 7 9 9 13 2 7 7 5 7 13 2 2 , 3 13 5 14 13 13 9 5 3 10 5 14 14 10 14 10 4 3 10 5 5 14 10 14 1 10 4 3 10 10 2 4 4 13 14 1 10 4 3 3 4 1 2 5 4 3 4 1 1 4 4 1 3 1 3 1 5 1 3 4 1 1 1 waarbij de landen overeenkomen met een nummer van 1 tot 14: HOOFDSTUK 5. EMPIRISCHE TOEPASSING 1 2 3 4 5 Nederland 6 Belgi¨e 7 8 Frankrijk Duitsland 9 10 VK 67 Itali¨e Spanje Oostenrijk Ierland Zweden 11 12 13 14 Zwitserland Finland Noorwegen Denemarken Als men kijkt naar het aantal paar-copula’s van een copula-familie binnen een bepaalde boom, zoals weergegeven in Tabel 5.2, ziet men dat na de eerste bomen het aantal onafhankelijke copula’s toeneemt en bijgevolg de complexiteit daalt in hogere-orde bomen. Hiermee wordt bevestigd dat de sterkste afhankelijkheden zich bevinden in de eerste bomen van de reguliere vine. T1 T2 T3 T4 T5 T6 T7 onafh. 0 2 4 7 4 6 6 gauss. 0 0 2 1 1 0 0 student t 8 1 3 0 0 1 0 clayton 3 3 0 1 2 0 1 gumbel 0 0 0 0 1 0 0 frank 2 6 2 1 1 1 0 Tabel 5.2: Per boom het aantal paar-copula’s binnen een bepaalde familie Hetzelfde wordt gedaan voor het bekomen van een C-vine, een D-vine en een reguliere vine zonder voorafgaande onafhankelijkheidstest. Dit gebeurt aan de hand van hun respectievelijke vine-constructie-algoritmes die werden besproken in sectie 4.2.1. Voor de C-vine heeft in de eerst boom Nederland de grootste som van Kendall’s tau waarden (8.29) en wordt het dus gekozen als hoofd-top. Het verschil met Frankrijk (8.22) of Duitsland (8.06) als hoofd-top zijn niet groot waardoor kan worden besloten dat de data geen duidelijke factor ontbinding heeft. De opeenvolgende hoofd-toppen in de C-vine zijn ”ned,spa”, ”spa,zwe|ned”, ”bel,zwe|ned,spa”, ”bel,vk|ned,spa,zwe”, ”fra,vk|ned,spa,zwe,bel”, ”fra,den|ned,spa,zwe,bel,vk”, ”oos,den|ned,spa,zwe,bel,vk,fra”, ”oos,fin|ned,spa,zwe,bel,vk,fra,den”, ”zwi,fin|ned,spa,zwe,bel,vk,fra,den,oos”, ”dui,zwi|ned,spa,zwe,bel,vk,fra,den,oos,fin” en ”dui,ita|ned,spa,zwe,bel,vk,fra,den,oos,zwi”. Voor de D-vine volgt de hele vine structuur uit de structuur van de eerste boom. Met de sterkste afhankelijkheid tussen Nederland en Frankrijk. De D-vine wordt gegeven in Figuur 5.6. Voor de C-vine en de D-vine worden de matrices met de copula-structuur, -families HOOFDSTUK 5. EMPIRISCHE TOEPASSING 68 en -parameters gegeven in Bijlage A.1. Figuur 5.6: Structuur van de eerste boom van de D-vine 5.1.3 Vergelijken van de reguliere vines, de C-vine en de D-vine Gebruikmakend van de functies RVineGofTest, RVineVuongTest, RVineAIC, RVineLogLik en rowSums(abs(RVinePar2Tau(Rvine)),n,n) kunnen de verschillende vines met elkaar worden vergeleken in R. De Blanket Goodness-of-Fit test wordt toegepast op de vier vines die werden geconstrueerd en voor geen enkele van de vines wordt de nulhypothese verworpen. Zodat elke vine een goede beschrijving geeft van de afhankelijkheid, maar welke geeft de beste fit? De verschillende vines worden vergeleken in tabel 5.3, waarbij ’R-vine F’ staat voor de reguliere vine zonder product copula’s. Dit wil zeggen dat er geen onafhankelijkheidstest wordt toegepast alvorens een paar-copula-familie wordt geselecteerd. Men merkt op dat het aantal copula’s dat voorkomt in de vine het laagst is voor de reguliere vine. Omdat de reguliere vine zo geconstrueerd is dat de afhankelijkheden in de eerste boom het sterkst zijn, zullen in hogere bomen de toppen sneller onafhankelijk zijn en bijgevolg meer product copula’s opleveren. De reguliere vine heeft enkel in de eerste, de vijfde, de achtste en de tiende boom een superieure Kendall’s tau-som ten opzichte van de C-vine. Dit verklaart ook waarom zowel de AIC-waarde als de BIC-waarde kleiner zijn voor de C-vine als voor de reguliere vine. Hetzelfde wordt vastgesteld voor de likelihood. Wat de reguliere vine HOOFDSTUK 5. EMPIRISCHE TOEPASSING 69 R-vine C-vine D-vine R-vine F # paar-copula’s 44 51 54 91 P |τ | boom 1 7.32 6.92 6.72 7.32 AIC -3988.85 -4039.51 -3924.99 -4028.79 BIC -3782.49 -3825.91 -3707.77 -3641.41 likelihood 2051.53 2085.02 2035.86 2129.22 Tabel 5.3: Vergelijking van de verschillende vines zonder product copula’s betreft, bezit deze een betere AIC-waarde en likelihood maar op basis van de BIC-waarde wordt deze afgestraft voor het groter aantal te schatten parameters (dubbel zoveel als voor de gewone reguliere vine). De Vuong test wordt uitgevoerd voor het vergelijken van de niet genestelde modellen. De bekomen statistieken worden vergeleken met het quantiel Φ−1 (0.975) = 1.96. Zodat een bepaalde vine kan verkozen worden boven de andere met beslissingsniveau α = 0.05. De resultaten worden samengevat in Tabel 5.4. test statistiek test statistiek - AIC test statistiek - Schwarz p-waarde p-waarde - AIC p-waarde - Schwarz R- en C-vine -1.045 -0.969 -0.83 0.29 0.33 0.41 D- en C-vine -2.152 -2.191 -2.26 0.03 0.03 0.02 R- en D-vine 1.013 1.118 1.308 0.31 0.26 0.19 R- en R-vine F -3.808 -1.086 3.839 0.00 0.27 0.00 Tabel 5.4: Vuong test tussen de verschillende vines Enkel bij het vergelijken van de D-vine en de C-vine wordt de nulhypothese verworpen. De C-vine is beter dan de D-vine aangezien de test statistiek kleiner is dan −Φ(0.975). Tussen de reguliere vine en de C-vine kan geen significant onderscheid worden gemaakt, al geeft de negatieve waarde van de test statistiek aan dat de C-vine lichtjes beter is dan de reguliere vine. Hiermee wordt bevestigd wat werd afgeleid uit tabel 5.3. Hetzelfde kan gezegd worden voor de reguliere vine en de D-vine, waar ditmaal de positieve waarde van de test statitiek aangeeft dat de reguliere vine lichtjes beter is. Bij het vergelijken van de reguliere vine met zijn tegenhanger in het geval geen product copula’s worden toegelaten, zal de beslissing afhangen van hoe sterk het aantal te schatten parameters wordt afgestraft. Indien de Vuong HOOFDSTUK 5. EMPIRISCHE TOEPASSING 70 test statistiek wordt geconstrueerd zonder correctie voor het aantal te schatten parameters, wordt duidelijk de reguliere vine zonder voorafgaande onafhankelijkheidstest verkozen boven de reguliere vine met voorafgaande onafhankelijkheidstest. Indien de Schwarz correctie wordt doorgevoerd op de test statistiek geldt het tegenovergestelde. De keuze tussen de reguliere vine met product copula’s en deze zonder product copula’s zal afhangen van de afweging die wordt gemaakt door de beslissingsnemer tussen de likelihood en het aantal te schatten parameters. 5.1.4 Snoeiing en vereenvoudiging van de reguliere vine Er wordt onderzocht of vanaf een bepaald boomniveau kan worden gesnoeid. Dit wil zeggen dat vanaf een bepaalde boom voor alle bogen een product copula wordt genomen. Er wordt dus verondersteld dat de toppen in de hogere bomen onafhankelijk zijn. In R gebeurt dit door in de geconstrueerde vine een trunclevel te kiezen in de funtcie RVineCopSelect. Aangezien men voor het bepalen van het snoeiingsniveau genestelde modellen gaat vergelijken, wordt beslist op basis van de AIC- en BIC-waarde van de gesnoeide reguliere vine. Voor elk boomniveau wordt een gesnoeide reguliere vine geconstrueerd en vervolgens worden de AIC- en BIC-waarden van opeenvolgende snoeiingsniveau’s met elkaar vergeleken. Voor de reguliere vine die werd geconstrueerd in sectie 5.1.2 wordt noch op basis van de AIC-waarde noch op basis van de BIC-waarde gesnoeid vanaf een bepaald niveau. Voor elke boom die wordt toegevoegd in de reguliere vine geldt dat de winst aan likelihood superieur is aan de kost voor het schatten van de copula-parameters in die boom. Dit is geen verrassing aangezien in de eerste bomen de sterkste afhankelijkheden zijn beschreven en vanaf de vierde boom voor meer dan de helft van de paar-copula’s de product copula wordt gebruikt. Daarom wordt hetzelfde gedaan maar ditmaal voor de reguliere vine zonder product copula’s. De BIC-waarden van de opeenvolgende modellen worden weergegeven in Tabel 5.5. Men ziet dat het toevoegen van de vierde boom geen significante meerwaarde geeft aan de gesnoeide reguliere vine (het verschil tussen de BIC-waarden van tRV(4) en tRV(3) is positief). Hetzelfde geldt voor het toevoegen van de zesde boom. Aangezien snoeiing vanaf boom 6 een beter resultaat geeft dan snoeiing vanaf boom 4, wordt de gesnoeide reguliere vine tRV(5) verkozen. Op basis van de Vuong test met Schwarz correctie wordt de volledige reguliere vine verworpen ten voordele van de gesnoeide reguliere vine tRV(5). Voor de Vuong test met AIC-correctie of de gewone Vuong test geldt het tegenovergestelde en wordt de volledige reguliere vine HOOFDSTUK 5. EMPIRISCHE TOEPASSING snoeiingsniveau tRV(1) tRV(2) tRV(3) tRV(4) tRV(5) tRV(6) 71 BIC-waarde -3339.40 -3598.43 -3687.79 -3673.09 -3697.98 -3683.36 Tabel 5.5: BIC-waardes voor de verschillende snoeiingsniveau’s verkozen. Dit betekent dat op basis van de test statistiek met AIC correctie er nog significante afhankelijkheden zijn waar te nemen na de vijfde boom. Als men gaat kijken naar de Kendall’s tau waarden van de verschillende bogen in hogere bomen worden er nog sterke afhankelijkheden waargenomen tussen onder meer VK en Ierland conditioneel op Nederland, Belgi¨e, Frankrijk, Duitsland, Zweden en Denemarken in boom 7 en ook nog tussen Spanje en Itali¨e conditioneel op Nederland, VK, Frankrijk, Duitsland, Zweden, Denemarken en Noorwegen in boom 8. Een soortgelijke analyse wordt herhaald voor het vinden van een gepast vereenvoudigingsniveau. In dit geval worden niet-genestelde modellen met elkaar vergeleken, waardoor er wordt gewerkt met de Vuong test voor het vergelijken van de verschillende vereenvoudigde reguliere vines. Bij een vereenvoudigde vine worden alle paar-copula’s vanaf een bepaalde boom vervangen door Gaussiaanse copula’s. Bij het vergelijken van de modellen wordt gewerkt met de test statistiek met AIC correctie. Vanaf het ogenblik dat de absolute waarde van de test statistiek voor opeenvolgende vereenvoudigingsniveau’s kleiner is dan 1.96, betekent dit dat de nulhypothese niet kan worden verworpen. Het toevoegen van een extra boom met paar-copula’s verschillend van de Gaussiaanse copula heeft in dat geval geen significante meerwaarde. De test statistieken met overeenstemmende p-waarden worden gegeven in Tabel 5.6. snoeiingsniveau sRV(1) en sRV(2) sRV(2) en sRV(3) sRV(3) en sRV(4) test statistiek - AIC -3.799 -2.144 -1.235 p-waarde verkozen model 0.00 sRV(2) 0.03 sRV(3) 0.22 sRV(3) Tabel 5.6: Vuong test statistieken voor het bepalen van het vereenvoudigingsniveau HOOFDSTUK 5. EMPIRISCHE TOEPASSING 72 Er kan geen significante keuze gemaakt worden tussen sRV(3) en sRV(4), waardoor het toevoegen van een vierde boom geen significante meerwaarde geeft aan de vereenvoudigde reguliere vine op niveau 3. De vine wordt dus vereenvoudigd vanaf boom 4. 5.1.5 Multivariate student t copula Voor elk boog in de eerste boom van de D-vine worden de parameters voor een bivariate student t copula geschat aan de hand van een bivariate Maximum likelihood schatting. Het aantal vrijheidsgraden voor elk paar variabelen worden weergegeven in onderstaande tabel. ν Cier,den 8.19 Cden,noo 7.7 Cnoo,f in 13.9 Cf in,zwe 6.7 Czwe,dui 6.9 Cdui,ned 6.6 ν Cf ra,vk 4.4 Cvk,spa 5.8 Cspa,ita 4.3 Cita,bel 5.2 Cbel,zwi 10.3 Czwi,oos 12 Cned,f ra 6.3 Men stelt vast dat het aantal vrijheidsgraden sterk varieert voor de verschillende paren in de D-vine. Dit doet vermoeden dat een gemeenschappelijk aantal vrijheidsgraden die de afhankelijkheid correct beschrijft voor elk mogelijk paar variabelen, zoals wordt verondersteld in de multivariate student t copula, geen goede benadering zou zijn. Dit geeft aan dat een multivariate student t copula met ´e´en enkele parameter voor het aantal vrijheidsgraden geen gepast model zou zijn voor het modelleren van de afhankelijkheid tussen de 14 Europese landen. De vine-copula is hiervoor een goed alternatief, daar deze die flexibiliteit wel correct kan modelleren. Tenslotte wenst men na te gaan of de paar-copula’s in de paar-copula ontbinding vari¨eren met de tijd. 5.1.6 Dynamische paar-copula’s Zoals vermeld in Heinen & Valdesogo (2011) kunnen de parameters van de copula vari¨eren met de tijd en wordt dit vooral waargenomen in de eerste boom. Daarom wordt voor de paarcopula’s van de eerste boom van onze reguliere vine onderzocht of de copula-parameters varieren met de tijd. Aangezien er geen expliciete uitdrukking is voor de Frank copula-parameter in functie van de Kendall’s tau, wordt voor de bogen ”zwi-ned” en ”fra-spa” opnieuw een paar-copula geschat waarbij de Frank copula wordt uitgesloten. Voor beide paren wordt dan een student t copula geslecteerd. De eerste boom van de reguliere vine bestaat dan enkel uit student t en Clayton copula’s. De huidige uniform verdeelde pseudo-observaties worden getransformeerd naar standaard normaal verdeelde observaties door het toepassen van de normaal quantiel functie, qnorm. HOOFDSTUK 5. EMPIRISCHE TOEPASSING 73 Voor deze wordt, aan de hand van het DCC model besproken in sectie 4.5.1, een tijdsvari¨erende correlatie parameter geconstrueerd gebruikmakend van de functies garchFit en dcc.estimation. Voor elk paar variabelen in de eerste boom van de reguliere vine wordt de tijdsvari¨erende Kendall’s tau bekomen gebruikmakend van Eigenschap 4.1. Ze worden weergegeven in Figuur 5.7. Voor de meeste plots is een gezamenlijk patroon te merken in de paarsgewijze afhankelijkheid. Voor de periode rond 1997 is voor de meeste paren een daling waar te nemen in de Kendall’s tau waarde. Dit is te wijten aan de sterke economische groei die er dat jaar was. De Stoxx Europa 600 zette in dat jaar de langste rij plusmaanden neer tot op heden. In De Nederlandse economie - 1997 wordt de economsiche situatie beschreven voor Nederland in het jaar 1997. De sterke stijging van de consumptie door huishoudens, een algemeen proces van internationalisering, investeringen en beleggingen in het buitenland met een hoog rendement en een sterk groeiende werkgelegenheid zorgde ervoor dat Nederland in 1997 een sterke economische groei kende. Ook Wall Street kende toen zijn beste jaar tot op heden. Doordat de economie in Europa het in dat jaar zo goed deed zorgde dit ervoor dat de afhankelijkheid tussen de verschillende landen laag was. Een tweede merkbare trend is het tegengestelde effect. Door de stagnerende huizenmarkt in de Verenigde Staten kwamen in 2007 veel financi¨ele instellingen in de problemen, hierdoor ontstond een financi¨ele crisis. Deze kredietcrisis waaide over naar Europa en de economie deed het in de periode vanaf 2007 heel slecht. Verschillende banken werden genationaliseerd of overgenomen en in 2010 kwamen ook een aantal overheden in de problemen. In slechte economische tijden gaat de afhankelijkheid tussen de aandelen altijd stijgen. Ook hier ziet men dat de afhankelijkheid tussen de Europese landen dan het sterkst is en de hoge Kendall’s tau waarden na 2007 bevestigen dit fenomeen. De schommelingen van de Kendall’s tau doorheen de jaren geven aan dat het gebruik van dynamische paar-copula’s in de eerste boom nodig zijn. 5.2 Case 2: Dagelijkse rendementen BEL 20 componenten met respectievelijke sectoren, 2006-2014. Aan de hand van een reguliere vine kan een factor model worden geconstrueerd voor de rendementen van aandelen in een bepaalde markt. Het Regular Vine Market Sector model wordt hier toegepast voor de Belgische markt-index en haar componenten. De BEL20 is de nationale index van Belgi¨e en is de leidende index voor Euronext Brussel. Ze is van start gegaan in 1991 en wordt elk jaar in maart aangepast naargelang de HOOFDSTUK 5. EMPIRISCHE TOEPASSING Figuur 5.7: Tijdsvari¨erende Kendall tau voor de paren variabelen in boom 1 74 HOOFDSTUK 5. EMPIRISCHE TOEPASSING 75 liquiditeit, verhandelbaarheid en vrije marktkapitalisatie van haar componenten. Voor de analyse die men in dit hoofdstuk zal doen, wordt de samenstellingen van de BEL 20 index genomen zoals deze is sinds maart 2014, waarbij de aandelen die nog niet op de Brusselse beurs waren in 2006 worden weggelaten. Dit zijn de aandelen van Ageas, Delta Lloyd en BPost. De overblijvende aandelen worden samengevat in Tabel 5.7 met hun respectievelijke sector en gewicht. De componenten van de BEL20 worden ook kort toegelicht in Bijlage A.2. aandeel sector Gewicht AB Inbev Consumenten goederen 12.26 % Ackermans & van Haaren Financi¨en 2.36 % Befimmo Financi¨en 0.95 % Bekaert Indistriueel 1.26 % Belgacom Telecommunicaties 3.84 % Cofinimmo Financi¨en 1.62 % Colruyt Consumenten diensten 3.34 % Delhaize Consumenten diensten 5.82 % d’Ieteren Consumenten diensten 0.96 % Elia Nutsbedrijven 1.11 % GBL Financi¨en 6.43 % GDF Suez Nutsbedrijven 11.86 % KBC Financi¨en 11.66 % Solvay Basis materialen 7.47 % Telenet Consumenten diensten 2.65 % UCB Gezondheidszorg 8.26 % Umicore Basis Materialen 4.31 % Tabel 5.7: Componenten BEL 20 De data voor de aandelenkoers van de BEL20-componenten werd gehaald van de site wwww.euroinvestor.com, deze geeft ook voor elk aandeel mee tot welke sector het behoort. Op de site wwww.stoxx.com kunnen voor de Eurozone sector indices gevonden worden, deze zullen gebruikt worden voor het opstellen van het RVMS model, zie bijlage A.2 voor meer informatie. De dataset bestaat dus uit n = 23 variabelen en T = 2030 observaties. HOOFDSTUK 5. EMPIRISCHE TOEPASSING 5.2.1 76 Regulare Vine Market Sector model Alvorens het model te bespreken, worden de modellen waarop het RVMS model verder bouwt kort samengevat en de veronderstellingen aangehaald die het RVMS model wilt versoepelen. Capital Asset Pricing Model: Het CAPM is een factor model dat werd ingevoerd in de jaren 60 door Sharpe en Lintner voor het weergeven van het verwachte rendement van een aandeel in een markt. Het CAPM zegt dat de rendementen kunnen verklaard worden aan de hand van ´e´en factor, namelijk het markt-rendement. Deze lineaire relatie wordt gegeven door, ri,t = βi rM,t + i,t , waarbij i,t de specifieke error-term op tijdstip t is en βi de sensitiviteit van het aandeel i ten opzichte van de markt. Er wordt verondersteld dat de rendementen van de aandelen, het markt-rendement en de specifieke error-termen gezamenlijk normaal verdeeld zijn. De specifieke error-term voor een aandeel is onafhankelijk van de error-termen van de andere aandelen en zijn onafhankelijk met de tijd. De afhankelijkheid tussen de rendementen wordt gemeten aan de hand van de correlatieco¨effici¨ent. In het CAPM hangt de verwachte opbrengst niet af van het totale risico maar enkel van het risico dat samenhangt met de markt. In dit model wordt het specifieke risico van een aandeel niet vergoed. Canonical Vine Autoregressive: In Heinen & Valdesogo (2009) wordt een niet-normaal en niet-lineair alternatief gegeven voor het CAPM. Aan de hand van een C-vine wordt de afhankelijkheid tussen de rendementen van de aandelen, de sectoren en de markt beschreven. In dit model wordt verondersteld dat elk aandeel-rendement afhangt van de markt en de sector tot hetwelke het behoort. De verschillende paar-copula’s laten toe dat de afhankelijkheid niet-lineair en assymetrisch kan zijn. Er wordt verondersteld dat conditioneel op de markt, de aandelen onafhankelijk zijn van de rendementen van de andere sectoren buiten hun eigen sector en ook dat de sectoren onafhankelijk zijn conditioneel op de markt. Voor de overige afhankelijkheid conditioneel op de markt en de sectoren wordt er verondersteld dat de rendementen gezamenlijk normaal verdeeld zijn en dus worden beschreven aan de hand van een multi-dimensionale Gaussiaanse copula. Voor de constructie van de vine wordt er in de eerste boom de markt als hoofd-top genomen, vervolgens worden achtereenvolgend de verschillende sectoren genomen als hoofd-top. Ter verduidelijking van het CAVA model wordt, zoals in Brechmann (2013), de paar-copula ontbinding van de gezamenlijke dichtheidsfunctie, f (r11 , r21 , r12 , r22 , rS1 , rS2 , rM ), gegeven voor de rendementen van vier aandelen r11 , r21 , r12 en r22 behorende tot twee sectoren, S1 en HOOFDSTUK 5. EMPIRISCHE TOEPASSING 77 S2 , en een markt M . Wegens de onafhankelijkheidsveronderstellingen geldt dat c2i ,S2 |M,S1 = c2i ,S2 |M voor i ∈ {1, 2}. De paar-copula dichtheden, c11 ,S2 |M , c12 ,S2 |M , c21 ,S1 |M , c22 ,S1 |M , c11 ,S1 |M en cS1 ,S2 |M zijn allemaal gelijk aan 1. Dit geeft dan de volgende paar-copula ontbinding: f = f (r11 )f (r21 )f (r12 )f (r22 )f (rS1 )f (rS2 )f (rM ) ×c11 ,M (F (r11 ), F (rM ))c12 ,M (F (r12 ), F (rM )) ×c21 ,M (F (r21 ), F (rM ))c22 ,M (F (r22 ), F (rM )) ×cS1 ,M (F (rS1 ), F (rM ))cS2 ,M (F (rS2 ), F (rM )) ×c11 ,S1 |M (F (r11 |rM ), F (rS1 |rM ))c12 ,S1 |M (F (r12 |rM ), F (rS1 |rM )) ×c21 ,S2 |M (F (r21 |rM ), F (rS2 |rM ))c22 ,S2 |M (F (r22 |rM ), F (rS2 |rM )) ×c11 ,12 ,21 ,22 |M,S1 ,S2 (F (r11 |rM , rS1 ), . . . , F (r22 |rM , rS2 )) Regular Vine Market Sector: Het CAVA model wordt in Brechmann (2013) verder uitgewerkt. Door te werken met een reguliere vine met minder strenge veronderstellingen wordt het RVMS model bekomen. Het RVMS model is natuurlijk minder flexibel dan een gewone reguliere vine maar vergemakkelijkt wel de interpretatie van de afhankelijkheden en vereenvoudigt het model ook door de aandelen te verzamelen per sector. In dit model wordt verwacht dat er sterke afhankelijkheden bestaan tussen de rendementen van de aandelen en hun respectievelijke sectoren. In tegenstelling tot het CAVA model worden deze afhankelijkheden eerst gemodelleerd. In de tweede boom worden de afhankelijkheden van de aandelen met de markt gemodelleerd, conditioneel op de respectievelijke sectoren. Voor de hogere bomen worden de overige paar-copula’s gemodelleerd aan de hand van Gaussiaanse copula’s waar de boomstructuur bepaald wordt door het vinden van de Maximum Spanning Tree in elke boom. Het RVMS model komt dus overeen met een reguliere vine dat vereenvoudigd wordt vanaf de derde boom. Net zoals in het CAVA model wordt verondersteld dat de de sectoren onafhankelijk zijn conditioneel op de markt. In Brechmann (2013) wordt aangetoond dat dit model goed werkt en superieur is aan het CAVA model. Voor de paar-copula ontbinding in het RVMS model geldt zoals bij het CAVA model dat cS1 ,S2 |M = 1. Voor de eerste twee bomen wordt in Brechmann (2013) de paar-copula ontbinding gegeven als: HOOFDSTUK 5. EMPIRISCHE TOEPASSING 78 c11 ,S1 (F (r11 ), F (rS1 ))c12 ,S1 (F (r12 ), F (rS1 )) ×c21 ,S2 (F (r21 ), F (rS2 ))c22 ,S2 (F (r22 ), F (rS2 )) ×cM,S1 (F (rM ), F (rS1 ))cM,S2 (F (rM ), F (rS2 )) ×c11 ,M |S1 (F (r11 |rS1 ), F (rM |rS1 ))c12 ,M |S1 (F (r12 |rS1 ), F (rM |rS1 )) ×c21 ,M |S2 (F (r21 |rS2 ), F (rM |rS2 ))c22 ,M |S2 (F (r22 |rS2 ), F (rM |rS2 )) Men wenst nu het RVMS model toe te passen op de BEL20 index en haar componenten. De koers en rendementen van de BEL20 index, de sectoren en de aandelen worden weergegeven in Bijlage A.2. Hiervoor gaat men vijf sectoren onderscheiden. De sectoren die maar ´e´en keer voorkomen in de BEL20 vormen samen de sector ”overige” door het gemiddelde te nemen van de rendementen van de telecommunicatie sector, de consumenten goederen sector, de industriele sector en de gezondheidszorgsector. De sectoren voor elk aandeel komen voor in Tabel 5.7. De eerste twee bomen van het RVMS worden weergegeven in Figuur 5.8. In R worden de eerste twee bomen geconstrueerd comform met het RVMS model en vanaf boom 3 wordt dan opnieuw het Maximum Spanning Tree-algoritme toegepast zoals besproken in sectie 5.1. De scatterplots overeenstemmende met de bogen uit boom 1 worden gegeven in Bijlage A.2. Wegens de onafhankelijkheidsassumpties maakt het niet uit welke sectoren conditioneel op de BEL20 met elkaar worden verbonden in boom 2. Figuur 5.8: (a) Boom 1 en (b) boom 2 van RVMS-model voor de BEL20 De ’F’ staat voor de financi¨ele sector, ’C’ voor de consumenten diensten sector, ’N’ voor de nutssector, ’B’ voor de basis materialen sector en ’O’ voor de overige sectoren die werden HOOFDSTUK 5. EMPIRISCHE TOEPASSING 79 samengevoegd. In de eerste twee bomen wordt elke boog beschreven aan de hand van een student t copula, behalve natuurlijk de bogen tussen de sectoren . De afhankelijkheid tussen de financi¨ele sector en de BEL20 is het sterkst, ook voor de andere sectoren is het aantal vrijheidsgraden van de student t copula relatief klein. Conditioneel op hun respectievelijke sectoren hebben KBC, GBL, AB Inbev en UCB de sterkste afhankelijkheid met de BEL20, dit is niet verrassend aangezien deze aandelen het sterkste doorwegen in de BEL20 index. Vanaf de derde boom worden er nog beduidende afhankelijkheden waargenomen tussen de aandelen en de andere sectoren. In de derde boom wordt voor elke boog, buiten deze tussen Elia en de overige sectoren, de nulhypothese van de onafhankelijkheidstest verworpen. Dit bevestigt dat de onafhankelijkheidsassumpties gemaakt in het CAVA model te streng zijn. Aan de hand van het RVMS model kan nu voor elk aandeel het specifiek en systematisch risico worden bepaald. 5.2.2 Systematisch en specifiek risico Het risico van een aandeel kan opgesplitst worden in twee bijdragen. Een eerste bijdrage is het specifiek risico , dit risico is eigen aan het aandeel en kan weggewerkt worden in een portfolio door middel van diversificatie. Een tweede bijdrage is het systematisch risico , dit komt overeen met het risico van een aandeel in de markt. Binnen de markt kan dit risico niet worden verminderd aan de hand van diversificatie. Bij het al dan niet opnemen van een aandeel in een portefeuille is men ge¨ınteresseerd in de meerwaarde risico - verwachte rendement dat het aandeel zal hebben op de portefeuille. Daarvoor zal worden gekeken naar het systematisch risico, het risico dat wordt toegevoegd aan de portefeuille bij het toevoegen van het aandeel. Figuur 5.9: Speciek en systematisch risico bij diversificatie In het CAPM kan het specifiek en systematisch risico voor het rendement van een aandeel HOOFDSTUK 5. EMPIRISCHE TOEPASSING 80 eenvoudig van elkaar worden gescheiden. Het risico van een aandeel i, σi2 , komt overeen met de variantie van het rendement van het aandeel en wordt gegeven door 2 2 σi2 = βi2 σM + σi, , 2 2 het specifiek risico. De simpliciteit waarbij σM de variantie is van het markt rendement en σi, van deze formule is te danken aan de veronderstellingen die worden gemaakt betreffende de rendementen zoals besproken in 5.2.1. Deze komen echter niet overeen met de realiteit. Het CAPM veronderstelt een gezamenlijke normale verdeling voor de rendementen, een lineaire relatie met het markt-rendement en dat de afhankelijkheid tussen het aandeel en de markt kan samengevat worden in ´e´en parameter, namelijk de sensibiliteit βi . In het RVMS model werden deze beperkingen weggewerkt en wenst men nu het specifiek risico en systematisch risico voor elk aandeel te berekenen waarbij rekening wordt gehouden met de complexe afhankelijkheid die er bestaat tussen de aandelen, de sectoren en de markt. Voor het bepalen van de afhankelijkheid voor een aandeel i ten opzichte van zijn sector S, de conditionele afhankelijkheid ten opzichte van de markt M en ten opzichte van de andere aandelen en sectoren ki1 , . . . , kim , wordt in Brechmann (2013) voor elke paar-copula, Ci,kil |S,M,ki1 ,...,kil−1 , waarbij het aandeel i voorkomt in de conditioned set de overeenstemmende Kendall’s tau waarde, τi,kil |S,M,ki1 ,...,kil−1 , berekend. Het sector risico voor een aandeel i wordt gegeven door Ri,S = |τi,S | . |τi,S | + τi,M |S + τi,ki1 |S,M + . . . + τi,kim |S,M,ki1 ,...,kim−1 De paren i, kil |S, M, ki1 , . . . , kil−1 , l ∈ {1, . . . , m}, worden bepaald door middel van de geconstrueerde vine structuur. De andere sectoren en aandelen waarmee het aandeel i voorkomt in de conditioned set van een paar-copula in de paar-copula ontbinding worden weergegeven door middel van kil , l ∈ {1, . . . , m}. De mate waarin het risico van een aandeel i wordt bepaald door haar sector wordt gegeven door Ri,S . Indien dat Ri,S = 1 wordt het gedrag van het aandeel volledig bepaald door de sector. Voor het bepalen van de risicomaat kan ook gewerkt worden met een andere afhankelijkheidsgrootheid dan de Kendall’s tau maar in deze toepassing wordt er gewerkt met τ . Hetzelfde kan gedaan worden voor het markt risico conditioneel op de sector. Dit wil zeggen de mate waarin het risico van het aandeel wordt bepaald door de markt maar waarbij alle afhankelijkheid ten opzichte van de sector wordt verwijderd. Deze risicomaat wordt gegeven door de breuk τi,M |S . Ri,M |S = |τi,S | + τi,M |S + τi,ki1 |S,M + . . . + τi,kim |S,M,ki1 ,...,kim−1 HOOFDSTUK 5. EMPIRISCHE TOEPASSING 81 Het systematisch risico wordt dan bepaald door de som te nemen van deze twee risicomaten, Ri,Sj + Ri,M |Sj . Het specifiek risico voor het aandeel i is het overblijvende risico dat niet wordt bepaald door de markt of de sector, Ri, = 1 − Ri,S − Ri,M |S . Dit wordt nu toegepast voor de BEL20 en haar componenten met hun sectoren. Voor elk aandeel in de BEL20 wordt het risico berekend dat is bepaald door haar sector en door de BEL20 index. Dit betekent dat in R voor elke boog waarbij het aandeel voorkomt in de conditioned set de Kendall’s tau waarde wordt berekend. Hieruit wordt dan het specifiek risico voor het aandeel berekend, de risico’s zijn samengevat in Tabel 5.8. aandeel Ri,S Ri,M |S Ackermans & van Haaren 0.305 0.128 Befimmo 0.279 0.112 Cofinimmo 0.248 0.101 GBL 0.328 0.212 KBC 0.358 0.124 d’Ieteren 0.283 0.119 Colruyt 0.306 0.092 Delhaize 0.333 0.092 Telenet 0.35 0.134 Elia 0.192 0.114 GDF Suez 0.481 0.069 Umicore 0.369 0.135 Solvay 0.337 0.145 AB Inbev 0.283 0.186 Bekaert 0.307 0.135 Belgacom 0.323 0.086 UCB 0.4 0.136 systematisch risico 0.433 0.391 0.349 0.54 0.482 0.402 0.398 0.425 0.484 0.306 0.55 0.504 0.482 0.469 0.442 0.409 0.536 specifiek risico 0.567 0.609 0.651 0.46 0.518 0.598 0.602 0.575 0.516 0.694 0.45 0.496 0.518 0.531 0.558 0.591 0.464 Tabel 5.8: Systematisch en specifiek risico voor de componenten van de BEL20 Het systematisch risico is over het algemeen lager dan het specifiek risico. Dit wordt verklaard door de sterke afhankelijkheden die er bestaan tussen de verschillende aandelen zoals bijvoorbeeld Cofinimmo en Befimmo of nog Colruyt en Delhaize. Voor GDF Suez ziet men dat het risico in grote mate wordt bepaald door de nutssector en voor AB Inbev en GBL heeft de BEL20 een relatief grote bijdrage in hun risico. HOOFDSTUK 5. EMPIRISCHE TOEPASSING 5.3 82 Case 3: Value-at-Risk model evaluatie Men beschouwt een portefeuille bestaande uit de componenten van de BEL20 die komen uit de financi¨ele sector. Dit zijn KBC, GBL, Ackermans & van Haaren, Befimmo en Cofinimmo. Hiervoor wordt op basis van de data van 2006 tot en met 2011 een reguliere vine geconstrueerd door opnieuw voor elke boom de Maximum Spanning Tree te construeren. Dezelfde methode wordt toegepast als in 5.1. Men krijgt dat voor elke paar-copula in de ontbinding de student t copula wordt geselecteerd. De eerste boom wordt gegeven in Figuur 5.10. De scatterplots voor de hele vine worden gegeven in Bijlage A.3. Men wenst het geconstrueerd vine copula-model te evalueren door op basis van de reguliere vine dagelijks een Value-atRisk-voorspelling te maken van het portfolio-rendement. Deze waarde wordt vergeleken met het gerealiseerde portfolio-rendement zoals beschreven in sectie 4.6. Figuur 5.10: Boom 1 van reguliere vine voor portefeuille Op basis van de vorige 1515 observaties wordt voor elk aandeel-rendement een ARMA(p,q)GARCH(1,1) model toegepast en voor de bekomen residuen wordt vervolgens de bijhorende skewed student t verdeling bepaald. Nadat deze residuen worden getransformeerd tot uniform verdeelde observaties worden voor de copula’s in de paar-copula ontbinding behorende bij de geconstrueerde vine de parameters geschat. Uit de reguliere vine wordt volgens sectie 4.6 (i) voor elk aandeel een observatie gesimuleerd. Door de inverse skewed student t verdeling toe te passen op deze observatie krijgt men een simulatie voor de residuen van dit aandeel. Ook de volatiliteit wordt voorspeld en aan de hand van de geschatte ARMA parameters wordt gebruikmakend van (4.1) het log-rendement voorspeld voor de volgende dag. Deze voorspelling wordt toegevoegd aan de HOOFDSTUK 5. EMPIRISCHE TOEPASSING 83 dataset en hetzelfde wordt elke dag herhaald rekeninghoudende met de bekomen voorspelling. Dit wordt 257 keer gedaan zodat voor elk aandeel in de portefeuille de rendementen worden voorspeld voor het jaar 2012. Voor zowel de gerealiseerde als voor de voorspelde logrendementen wordt het portfolio-rendement berekend. Dit doet men door het gemiddelde te nemen van de rendementen van de vijf aandelen. Net zoals in Brechmann (2013) wordt op basis van de 900 vorige observaties voor elke verhandeldag in 2012 de 0.95 - VaR berekend voor de voorspelde portfolio rendementen. Deze worden vervolgens vergeleken met de gerealiseerde rendementen zoals weergegeven in Figuur 5.11. De R-code overeenstemmende met deze sectie wordt gegeven in Bijlage A.3. Figuur 5.11: VaR berekeningen en gerealiseerde log-rendementen Over het hele jaar 2012 (257 observaties) worden er 14 hits waargenomen, dit wil zeggen dat in 5.44 % van de gevallen de gerealiseerde rendementen de VaR voorspelling overschrijden voor die dag. Dit komt ongeveer overeen met de gewenste α = 0.05. De likelihood ratio test geeft een p-waarde van 0.7454388, waardoor kan besloten worden dat de nulhypothese, die zegt dat er een correct aantal overschrijdingen hebben plaatsgevonden, niet kan worden verworpen. Dit bevestigt dat de reguliere vine een goed model is voor het beschrijven van de afhankelijkheid van de aandelen in de portefeuille en overeenkomt met de realiteit. Bibliografie [1] AAS K. en BERG D. Modeling dependence between financial returns using pair-copula constructions. Dependence Modeling - Vine Copula Handbook, World Scientific Publishing Co., 305-328, 2011. [2] AAS K., CZADO C., FRIGESSI A. en BAKKEN H. Pair-copula constructions of multiple dependence. Insurance: Mathematics and Economics 44, 182-198, 2009. [3] BEDFORD T. en COOKE R.M. Probability density decomposition for conditionally dependent random variables modeled by vines. Annals of Mathematics and Artificial Intelligence 32, 245-268, 2001. [4] BEDFORD T. en COOKE R.M. Vines - A new graphical model for dependent random variables. The Annals of Statistics 30(4), 1031-1068, 2002. [5] BERG D. en AAS K. Models for construction of multivariate dependence: A comparison study. European Journal of Finance 15, 639-659, 2009. [6] BRECHMANN C. Truncated and simplified regular vines and their applications. Diploma Thesis, Faculty of Mathematics, Technische Universit¨at M¨ unchen, Germany, 2010. [7] BRECHMANN C., CZADO C. en AAS K. Truncated regular vines in high dimensions with application to financial data. Canadian Journal of Statistics 40(1), 68-85, 2012. [8] BRECHMANN C. en CZADO C. Risk management with high-dimensional vine copulas: An analysis of the Euro Stoxx 50. Statistics & Risk Modeling 30(4), 307342, 2013. [9] COOKE R.M., JOE H. en AAS K. Vines Arise. Dependence Modeling - Vine Copula Handbook, World Scientific Publishing Co., 37-72, 2011. [10] CZADO C. Pair-copula constructions of multivariate copulas. Copula Theory and Its Applications, Springer-Verlag, 2010. 84 BIBLIOGRAFIE 85 [11] CZADO C., MIN A., BAUMANN T. en DAKOVIC R. Pair-copula constructions for modeling exchange rate dependence. Technical report, Technische Universit¨at M¨ unchen, 2009. [12] DENUIT M., DHAENE J., GOOVAERTS M. en KAAS R. Actuarial theory for dependent risks: measures, orders and models. Wiley Series, 2005. [13] De Nederlandse economie - 1997. Centraal Bureau voor de statistiek, 1998. [14] DIβMANN J., BRECHMANN C., CZADO C. en KUROWICKA D. Selecting and estimating regular copulae and application to financial returns. Computational Statistics and Data Analysis 59, 52-69, 2013. [15] ENGLE R. Dynamic conditional correlation - A simple class of multivariate GARCH models. Journal of Business and Economic Statistics, 2002. [16] GENEST C. en FAVRE A. Everything you always wanted to know about copula modeling but were afraid to ask. Journal of hydrologic engineering, july/august, 347-368, 2007. ´ [17] GENEST C., REMILLARD B. en BEAUDOIN D. Goodness-of-fit tests for copulas: A review and power study. Insurance: Mathematics and Economics 44, 199-213, 2009. [18] GRONNEBERG S. The Copula Information Criterion and its implications for the Maximum Pseudo-Likelihood Estimator. Dependence Modeling - Vine Copula Handbook, World Scientific Publishing Co., 113-138, 2011. [19] HEINEN A. en VALDESOGO A. Asymmetric CAPM dependence for large dimensions: the Canonical Vine Autoregressive Model. CORE Discussion Papers 2009069, Universit´e catholique de Louvain, Center for Operations Research and Econometrics, 2009. [20] HEINEN A. en VALDESOGO A. Dynamic D-vine model. Dependence Modeling - Vine Copula Handbook, World Scientific Publishing Co., 329-353, 2011. [21] HORMANN S. Time series analysis I. URL http://homepages.ulb.ac.be/shormann/teaching.html, Cursusnota’s academiejaar 2010-2011. [22] HORMANN S. Time series analysis II. URL http://homepages.ulb.ac.be/shormann/teaching.html, 2013. [23] JOE H. Families of m-variate distributions with given margins and m(m-1)/2 bivariate dependence parameters. Distributions with Fixed Marginals and Related Topics 28, 120-141, 1996. BIBLIOGRAFIE 86 [24] KADANKOVA T. Satistics for actuarial sciences - Copulas. Cursusnota’s academiejaar 2012-2013. [25] KUROWICKA D. en COOKE R. Uncertainty analysis with high dimensional dependence modelling. Wiley Series in Probability and Statistics, 2006. [26] LONGIN F. en SOLNIK B. Is the correlation in international equity returns constant: 1960-1990? Journal of International Money and Finance 14(1), 3-26, 1995. [27] MEEUWISSEN A.M.H. en COOKE R.M. Tree dependent random variables. Reports of the Faculty of Technical Mathematics and Informatics 94-28, 1994. ´ [28] MORALES-NAPOLES, COOKE R.M. en KUROWICKA D. About the number of vines and regular vines on n nodes. Technical report, Delft Institute of Applied Mathematics, Delft University of Technology, 2008. [29] NAKATANI T. Conditional Correlation GARCH models - Package ’ccgarch’. URL http://cran.r-project.org/web/packages/ccgarch/index.html, 2014. [30] NELSEN R.B. An introduction to copulas. Springer Series in Satisctics, 2006. [31] SALMON F. Recipe for Disaster: The Formula That Killed Wall Street. Wired Magazine: 17.03, 2009. [32] SCHEPSMEIER B. Statistical U., STOEBER inference of vine J., BRECHMANN copulas - Package C. en GRAELER ’VineCopula’. URL http://cran.r-project.org/web/packages/VineCopula/index.html, 2013. [33] VAZ DE MELO MENDES B., MENDES SEMARARO M. en CAMARA LEAL R.P. Pair-copulas modeling in finance. Financial Markets and Portfolio Management 24(2), 193-213, 2010. [34] VAN DER SPIEGEL F. Asset management. Cursusnota’s academiejaar 2013-2014. [35] VUONG Q.H. Likelihood ratio tests for model selection and non-nested hypotheses. Econometrica 57(2), 307-333, 1989. Index Akaike Information Criterium, 42 Log-rendement, 35 Archimedische copula, 12 Auto Regressive Moving Average proces, 36 m-kind, 22 Bayesian Information Criterium, 49 Maximum Spanning Tree-algoritme, 39 Maximum Pseudo Likelihood schatting, 43 Blanket test, 41 Paar-copula ontbinding, 29 C-vine, 32 Pearson’s correlatie, 7 Canonical Vine Autoregressive, 76 Prim’s algoritme, 39 Product copula, 10 Capital Asset Pricing Model, 76 Clayton copula, 15 R-vine matrix, 45 Comonotoon, 11 Regular Vine Market Sector, 77 Reguliere vine, 18 Concordantie, 7 Conditioned set, 20 Conditioning set, 19 Spearman’s correlatie, 8 Constraint set, 20 specifiek risico, 79 Stationariteit, 35 Copula, 4 Student t copula, 12 D-vine, 32 Dynamisch Conditioneel Correlatie - model, 52 Elliptische copula, 11 Frank copula, 16 systematisch risico, 79 Tail dependence, 7 Theorema van Sklar, 5 Value-at-Risk, 56 Vereenvoudigde reguliere vine, 49 General Autoregressive Conditionally Hete- Vine, 18 roscedastic model, 36 Gesnoeide reguliere vine copula, 47 Volledige unie, 19 Vuong test, 50 Gumbel copula, 15 j-fold union, 21 Kendall’s tau, 8 87 Bijlage A Appendix A.1 Case 1 De dataset gebruikt in 5.1 wordt hier verder toegelicht aan de hand van scatterplots, matrices, enzovoort. Eerst wordt voor de bogen in de eerste boom van de reguliere vine de overeenstemmende scatterplots weergegeven in Figuur A.1. Voor elk land wordt het ARMA(p,q)-GARCH(1,1) proces toegepast op de maandelijkse rendementen, de gevonden processen worden gegeven in Tabel A.1. Voor elk geconstrueerde vine worden zoals werd uitgelegd in sectie 4.3 matrices geconstrueerd die de vine-structuur, de copula-families en -parameters samenvatten. Deze worden gegeven in onderstaande matrices. Voor de reguliere vine werd de structuur al gegeven in sectie 5.1.2. 88 BIJLAGE A. APPENDIX Figuur A.1: Scatterplots boom 1 van reguliere vine 89 BIJLAGE A. APPENDIX 90 Land p q µ φ1 ω α β Nederland 0 1 1.30 -0.08 2.22 0.11 0.81 Belgi¨e 2 1 1.38 -0.33 0.11 0.48 1.06 0.11 0.86 Frankrijk 2 2 2.52 -0.66 -0.43 0.72 2.35 0.14 0.79 Duitsland 0 0 1.07 2.21 0.12 0.82 VK 3 3 1.93 -0.97 -0.12 1.42 0.17 0.77 Itali¨e 2 2 2.27 -0.83 -0.59 1.81 0.12 0.86 Spanje 0 0 1.2 8.19 0.29 0.56 Oostenrijk 3 0 0.72 0.05 0.06 2.7 0.1 0.83 Ierland 2 0 1.32 0.05 -0.01 1.56 0.14 0.84 Zweden 3 0 1.47 0 -0.06 8.6 0.2 0.64 Zwitserland 0 1 1.18 0.04 8.18 0.18 0.45 Finland 1 1 2.59 0.61 3.25 0.16 0.81 Noorwegen 0 0 1.26 4.02 0.08 0.84 Denemarken 0 0 1.3 2.28 0.12 0.81 -0.42 φ2 φ3 0.39 θ1 θ2 θ3 0.40 1 0.08 0.86 0.53 -0.5 0.02 0.13 Tabel A.1: Geschatte ARMA-GARCH parameters voor de rendementen van de Europese landen In de matrix komen de nummers overeen met een copula-familie: 1 2 3 Gaussiaanse copula 4 Gumbel copula student t copula 5 Frank copula Clayton copula BIJLAGE A. APPENDIX 91 Elk element in de matrix komt overeen met de copula-familie of -parameter van de overeenstemmende boog in de vine zoals werd uitgelegd in 4.3. Reguliere vine: Copula-families: 0 0 0 0 5 0 0 0 0 0 0 2 5 2 0 0 0 0 0 0 0 0 4 0 0 5 5 0 0 0 0 5 0 0 0 5 1 0 3 0 0 0 5 0 0 0 0 0 3 2 0 0 0 3 0 5 1 5 5 2 0 0 0 5 0 0 0 5 5 0 0 0 1 0 1 0 3 0 2 3 0 2 5 2 0 3 0 2 3 3 0 3 0 2 2 0 5 3 2 0 5 0 2 2 0 Parameters: 0 0 0 0 0 0 0 0 0 0 1.17 0 0 0 0 0 0 0 0 0 0 0 0 1.11 2.47 0 0 0 0 0 0 0 0.29 0 0 0 0 0 0 0 0 0.72 0 0.25 0 0 1.05 0 0 0.93 0 0.25 0.3 0.26 0 0 0 0.87 0 0.12 0 0 0 0 0.21 0 0.12 0 0.27 0 0.82 0 0.26 0.21 0.26 0 1.77 0 2.3 1.41 0 0.25 1.19 1.4 0 1.5 0.26 0.39 0.47 3.17 0 0.71 6.65 2.14 0.8 0.71 8.01 2.6 0.74 1.94 0.82 0.76 0.86 0.86 0 BIJLAGE A. APPENDIX 92 Aantal vrijheidsgraden: 0 0 0 0 0 0 0 0 0 0 0 13.6 0 9.25 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 3.87 5.99 0 0 0 0 0 0 0 0 0 0 0 0 0 9.76 0 0 0 0 0 0 0 0 0 0 0 3.42 6.24 0 0 0 0 0 0 4.26 0 0 0 0 11.09 0 4.71 8.85 5.99 6.89 0 C-vine: vine-structuur: 13 9 6 4 11 12 8 14 3 5 2 10 7 1 9 6 4 11 12 8 14 3 5 2 10 7 1 6 4 11 12 8 14 3 5 2 10 7 1 4 11 12 8 14 3 5 2 10 7 1 11 12 12 8 8 8 14 14 14 14 3 3 3 3 3 5 5 5 5 5 5 2 2 2 2 2 2 2 10 10 10 10 10 10 10 10 7 7 7 7 7 7 7 7 7 1 1 1 1 1 1 1 1 1 1 BIJLAGE A. APPENDIX 93 Copula-families: 0 0 0 0 0 0 0 1 0 3 0 5 3 2 0 0 0 0 0 0 0 0 3 5 5 3 2 0 0 1 0 3 3 5 0 0 5 5 5 0 0 0 0 0 3 0 0 2 5 2 0 0 0 0 0 1 5 0 1 3 0 0 0 0 0 0 5 5 5 0 5 0 0 5 0 5 3 0 5 0 5 2 5 3 0 5 1 3 5 2 0 3 5 5 2 0 0 5 3 0 3 0 2 5 0 Parameters: 0 0 0 0 0 0 0 0 0 0 0 0 −0.15 0 0 0 0 0 0 0 0 0 0 0.17 0 0 0 0 0.26 0 0.19 0 0 0 1.16 0 0 0 1.71 0.53 0 0 0 −1.02 0 0.31 0.29 0 0 0.16 0 0 0 1.34 0 0 1 0 0 1.89 0 1.77 1.49 0.18 0.17 0 1.92 0.98 0.88 0.33 0 3.21 0 0.28 0.42 1.4 0 0 0.35 0.39 3.98 2.19 0.18 1.95 1.33 1.76 3.33 2.39 1.32 0.57 0 0.71 0.7 6.35 0.85 2.07 4.86 1.85 1.78 0.86 0.81 2.52 0.72 6.07 0 BIJLAGE A. APPENDIX 94 Aantal vrijheidsgraden: 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 4.03 5.93 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 15.86 0 0 0 0 0 0 0 8.44 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 4.9 0 0 0 0 0 0 0 0 7.65 3.89 0 0 0 0 0 0 0 10.57 0 0 D-vine: vine-structuur: 8 9 14 13 12 10 4 1 3 5 7 6 2 11 11 9 14 13 12 10 4 1 3 5 7 6 2 2 9 14 13 12 10 4 1 3 5 7 6 6 9 14 13 12 10 4 1 3 5 7 7 9 14 13 12 10 4 1 3 5 5 9 14 13 12 10 4 1 3 3 9 14 13 12 10 4 1 1 9 14 13 12 10 4 4 9 10 14 9 12 13 14 9 13 12 13 14 9 14 10 12 13 14 9 9 BIJLAGE A. APPENDIX 95 Copula-families: 0 0 0 5 0 0 0 0 0 0 0 3 5 3 0 0 0 0 0 0 0 5 0 5 1 3 3 0 5 5 5 0 0 0 3 1 1 2 5 0 0 1 0 0 0 0 5 5 5 3 0 0 3 0 0 0 0 0 5 3 0 3 3 3 0 3 0 2 2 0 0 0 0 0 5 5 2 0 5 4 4 0 3 2 0 5 3 5 5 2 0 5 4 3 5 0 5 3 5 0 1 0 3 3 0 Parameters: 0 0 0 1.05 0 0 0 0 0 0 0 0.3 3.41 1.36 0 0 0 0 0 0 0 1.34 0 2.42 0.18 0.26 1.62 0 0.94 1.15 1.07 0 0 0 0.59 0.35 0.41 0.31 5.12 0 0 0 0.19 0 0 0 0.15 0.25 0 0 0 0.26 0 0 0 0 0.29 0 1.68 0 0 0 0 0 1.11 1.37 0 0.79 0 0.29 0 1.22 0.41 0.99 0 2.29 0 0 1.72 0 1.52 1.29 1.71 0 2.36 3.19 0.41 3.52 0.45 1.41 0.9 0.26 0.3 0 1.94 1.62 0.8 0.85 0.85 0.76 5.93 4.03 1.65 1.27 0 BIJLAGE A. APPENDIX 96 Aantal vrijheidsgraden: 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 8.52 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 6.81 0 0 0 0 4.85 8.07 7.18 8.94 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Reguliere vine zonder product copula’s: Copula-families: 0 5 3 5 5 3 5 5 1 5 3 2 5 2 0 5 5 2 5 1 1 5 4 5 3 5 5 0 1 1 5 5 1 5 1 5 5 2 3 0 5 1 5 5 1 3 4 3 3 2 0 3 1 3 3 5 1 1 5 2 0 3 3 5 3 4 3 5 5 0 5 5 1 1 4 4 3 0 2 3 3 2 5 2 0 3 2 2 3 3 0 3 5 2 2 0 5 3 2 0 5 0 2 2 0 BIJLAGE A. APPENDIX 97 Parameters: 0 −0.4 0 0.2 −0.21 0 0.27 0.67 −0.13 0 1.19 −0.06 0.04 0.18 0 0.09 0.61 −0.33 −0.03 0.17 0 0.23 0.03 1.15 2.24 0.05 0.09 0 0.7 0.11 0.04 0.41 0.3 0.14 0.2 0 −0.09 0.23 0.35 −0.07 0.08 0.83 0.38 0.25 0 0.37 1.05 0.09 0.15 0.88 0.18 0.24 0.29 0.28 0 0.18 0.77 0.85 1.03 0.14 1.04 −0.85 0.06 −0.07 0.22 0 0.13 0.12 1.99 0.09 0.12 0.16 1.21 0.22 0.26 0.12 1.44 0 2.19 1.46 0.1 0.24 1.27 1.34 1.1 1.25 0.31 0.38 0.48 3.36 0 0.71 6.68 2.03 0.81 0.71 8.23 2.51 0.74 1.92 0.81 0.76 0.86 0.86 0 Aantal vrijheidsgraden: 0 0 0 0 0 0 0 0 0 0 0 10.22 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 12.05 0 0 0 0 0 0 20.71 0 0 6.3 0 0 4 6.92 0 0 0 0 0 0 0 0 0 0 0 0 0 9.33 0 0 0 0 0 0 0 15.5 0 0 0 3.33 6.12 0 0 0 0 0 0 4.68 0 0 0 0 9.42 0 4.65 8.8 7.14 6.81 0 Voor de reguliere vine en de D-vine wordt geen negatieve afhankelijkheid waargenomen. Voor de C-vine en de reguliere vine zonder product copula’s wordt er wel negatieve afhankelijkheid gemodelleerd. Voor de reguliere vine zonder product copula’s is dat al vanaf de vierde boom. Voor de C-vine is dit enkel eens in de zesde en tiende boom. BIJLAGE A. APPENDIX 98 Voor de reguliere vine, worden de tweede, derde en vierde bomen weergegeven in onderstaande figuren. Figuur A.2: Boom 2 reguliere vine Figuur A.3: Boom 3 reguliere vine BIJLAGE A. APPENDIX 99 Figuur A.4: Boom 1 reguliere vine A.2 Case 2 In de tweede dataset wordt gewerkt met de componenten van de BEL20, deze worden hier kort beschreven: • AB Inbev (ABI) is een brouwerijketen dat onstond in 2004 en is gevestigd in Leuven. AB Inbev is de grootste brouwer van de wereld en het is het eerste Belgisch bedrijf dat een beurswaarde van boven de 100 miljard euro heeft gehaald. • Ackermans & van Haaren (ACKB) is een holding en ontsond in 1876. De hoofdzetel is gevestigt in Antwerpen en het aandeel maakt sinds maart 2007 deel uit van de BEL20. • Befimmo (BEFB) is een vastgoedbedrijf dat werd opgericht in 1995. In maart 2009 deed het haar intrede in de BEL20. • Bekaert (BEKB) werd opgericht in 1880 en is de wereldwijde marktleider in staal en andere geavenceerde materialen. Dit aandeel maakt sinds het begin deel uit van de BEL20. • Belgacom (BELG) is het grootste telecommunicatiebedrijf van Belgi¨e. Sinds maart 2004 maakt het deel uit van de BEL20. • Cofinimmo (COFB) is sinds maart 2003 in de BEL20. Het werd opgericht in 1983 en is de belangrijkste investeringsmaatschappij van Belgi¨e in vastgoed bestemd voor verhuring. • Colruyt (COLR) werd opgericht in 1965 en haar hoofdkantoor is gevestigd in Halle. Sinds 1977 is deze supermarktketen beursgenoteerd. BIJLAGE A. APPENDIX 100 • Delhaize (DELB) is eveneens een supermarktketen en bestaat al sinds 1867. Het maakt ook deel uit van de Euronext 100. Delhaize is sinds de oprichting van de BEL20 een component van deze index. • d’Ieteren (DIE) is een bedrijf dat auto’s importeert en verdeelt, het werd opgericht in 1805. Het autodienstenbedrijf maakte haar intrede in 1998 in de BEL20 maar werd al eens verwijderd en opnieuw opgenomen in de Euronext Brussel index. • Elia (ELIA) treedde in maart 2012 toe tot de BEL20 index, het houdt zich bezig met het netbeheer van het Belgische hoogspanningsnet. • Ook GBL (GBL) is eveneens een holding en maakt sinds de start deel uit van de BEL20 index. Het maakt deel uit van de 10 grootste Belgische bedrijven. • GDF Suez (GSZ) maakt deel uit van vele Europese indices. Het is een Frans energiebedrijf en het grootste nutsbedrijf van de hele wereld. Het werd opgericht in 2008 en maakt sinds haar oprichting deel uit van de BEL20 index. • KBC (KBC) is een bankverzekering bedrijf opgericht in 1998. • Solvay (SOLB) maakt sinds het begin deel uit van de BEL20 index, deze multinational werd opgericht in 1865 en is actief in chemie en plastics. Ze maakt eveneens deel uit van de Euronext 100 index. • Telenet (TNET) is een telecommunicatiebedrijf dat sinds 2006 deel uitmaakt van de BEL20 index. Het bedrijf werd opgericht in 1996 en heeft haar hoofdkantoor in Mechelen. • Union Chimique Belge (UCB) is sinds de start opgenomen in de BEL20. Dit farmaceutisch bedrijf werd opgericht in 1928 en heeft vetsigingen over de hele wereld. • Umicore (UMI) is een bedrijf gespecialiseerd in metalen, het werd opgericht in 1906 en was vooral actief in de mijnen. Dit bedrijf zit eveneens sinds het begin in de BEL20. Elk aandeel wordt aan de hand van de Industry Classification Benchmarkt onderverdeeld in ´e´en van de 10 industri¨en, 41 sectoren en 114 subsectoren. Een overzicht van deze onderverdeling kan terug gevonden worden op de site www.STOXX.com/indices/ICB.html. De koers van de BEL20 index, de verschillende sectoren en de 17 aandelen worden weergegeven in onderstaande figuren. BIJLAGE A. APPENDIX Figuur A.5: Aandelenkoers van BEL 20 en sectoren Figuur A.6: Aandelenkoers van BEL 20 - componenten (1) 101 BIJLAGE A. APPENDIX 102 Figuur A.7: Aandelenkoers van BEL 20 - componenten (2) De forse waarde-vermindering van de koerswaarde van Bekaerts, Colruyt, d’Ieteren en Umicore is te wijten aan de splitsing van de aandelen voor deze bedrijven. Dit gebeurde op respectievelijk 10 november 2010, 15 oktover 2010, 24 december 2010 en 29 februari 2008. Opdat dit geen invloed zou hebben op de log-rendementen, werd voor deze aandelen het logrendement gelijk gesteld aan 0 op de desbetreffende data. In onderstaande figuren worden de log-rendementen voor de BEL20 index, de sectoren en de aandelen weergegeven. Figuur A.8: Log-rendementen van BEL 20 en sectoren BIJLAGE A. APPENDIX 103 Figuur A.9: Log-rendementen van BEL 20 - componenten (1) Figuur A.10: Log-rendementen van BEL 20 - componenten (2) Voor de bogen in de eerste boom worden de respectievelijke scatterplots weergegeven in onderstaande figuren. De resultaten bekomen in sectie 5.2.2 worden aan de hand van deze grafieken bevestigd. Bijvoorbeeld aan de hand van de scatterplot tussen de nutssector en GDF Suez wordt een sterke afhankelijkheid waargenomen, dit vertaalt zich in een hoog sectorrisico zoals te zien is in Tabel 5.8. Voor Elia en de nutssector daarintegen wordt weinig afhankelijkheid waargenomen en dit wordt weeral bevestigd in Tabel 5.8. BIJLAGE A. APPENDIX 104 Figuur A.11: Scatterplots tussen de pseudo-observaties van de BEL20 en de sectoren BIJLAGE A. APPENDIX 105 Figuur A.12: Scatterplots tussen de pseudo-observaties van de finanici¨ele sector en haar aandelen BIJLAGE A. APPENDIX 106 Figuur A.13: Scatterplots tussen de pseudo-observaties van de consumenten diensten sector en haar aandelen BIJLAGE A. APPENDIX 107 Figuur A.14: Scatterplots tussen de pseudo-observaties van de nutssector en haar aandelen en tussen de basis materialen sector en haar aandelen BIJLAGE A. APPENDIX 108 Figuur A.15: Scatterplots tussen de pseudo-observaties van de overige sectoren en haar aandelen A.3 Case 3 Tenslotte worden in Figuur A.16 de scatterplots weergegeven die overeenkomen met de bogen uit de reguliere vine voor de geconstrueerde portefeuille in 5.2.3. Men ziet hier hoe de tail dependence alsmaar afneemt naarmate men vordert in de bomen. BIJLAGE A. APPENDIX 109 Figuur A.16: Scatterplots van de pseudo-observaties voor de reguliere vine In onderstaande R-code wordt elke stap van sectie 4.6 toegepast voor case 3. Waarbij i gaat van 1 tot en met 257. x=i y=1516+i U$kbc[y]<-kbc.U[1516] BIJLAGE A. APPENDIX 110 U$gbl[y]<-gbl.U[1516] U$avh[y]<-avh.U[1516] U$cof[y]<-cof.U[1516] U$bef[y]<-bef.U[1516] V<-U[x:y,] Rvine<-RVineSeqEst(V,Rvine$RVM) sim<-RVineSim(1, Rvine$RVM) P[y,]<-T[1517,] T<-P[x:y,] dim(T) fit.KBC<-garchFit( arma(0,1)+garch(1,1), data=T$kbc[1:1516,], cond.dist="sstd") kbc.R<-fit.KBC@residuals kbc.sigma.t<[email protected] kbc.sigma.t[1516]<-predict(fit.KBC, n.ahead = 1)[3] sstdFit(kbc.R) kbc.R[1516]<-qsstd(sim[1],mean=sstdFit(kbc.R)$estimate[1], sd=sstdFit(kbc.R)$estimate[2],nu=sstdFit(kbc.R)$estimate[3], xi=sstdFit(kbc.R)$estimate[4]) T$kbc[1517]<- as.numeric(coef(fit.KBC)[1]) + as.numeric(kbc.sigma.t[1516]) *kbc.R[1516] + as.numeric(coef(fit.KBC)[2])*as.numeric(kbc.sigma.t[1515]) *kbc.R[1515] fit.GBL<-garchFit( arma(4,3)+garch(1,1), data=T$gbl[1:1516,], cond.dist="sstd") gbl.R<-fit.GBL@residuals gbl.sigma.t<[email protected] gbl.sigma.t[1516]<-predict(fit.GBL, n.ahead = 1)[3] sstdFit(gbl.R) gbl.R[1516]<-qsstd(sim[2],mean=sstdFit(gbl.R)$estimate[1], sd=sstdFit(gbl.R)$estimate[2],nu=sstdFit(gbl.R)$estimate[3], xi=sstdFit(gbl.R)$estimate[4]) BIJLAGE A. APPENDIX 111 T$gbl[1517]<- (as.numeric(coef(fit.GBL)[1]) + as.numeric(gbl.sigma.t[1516]) gbl.R[1516] + as.numeric(coef(fit.GBL)[2])*P$gbl[1515] + as.numeric(coef(fit.GBL)[3])*P$gbl[1514] + as.numeric(coef(fit.GBL)[4])*P$gbl[1513] + as.numeric(coef(fit.GBL)[5]) *P$gbl[1512] + as.numeric(coef(fit.GBL)[6])*as.numeric(gbl.sigma.t[1515]) *gbl.R[1515] + as.numeric(coef(fit.GBL)[7])*as.numeric(gbl.sigma.t[1514]) *gbl.R[1514] + as.numeric(coef(fit.GBL)[8])*as.numeric(gbl.sigma.t[1513]) *gbl.R[1513]) fit.ackvh<-garchFit( arma(3,2)+garch(1,1), data=T$avh[1:1516,], cond.dist="sstd") avh.R<-fit.ackvh@residuals avh.sigma.t<[email protected] avh.sigma.t[1516]<-predict(fit.ackvh, n.ahead = 1)[3] sstdFit(avh.R) avh.R[1516]<-qsstd(sim[3],mean=sstdFit(avh.R)$estimate[1], sd=sstdFit(avh.R)$estimate[2],nu=sstdFit(avh.R)$estimate[3], xi=sstdFit(avh.R)$estimate[4]) T$avh[1517]<- (as.numeric(coef(fit.ackvh)[1]) + as.numeric(avh.sigma.t[1516]) *avh.R[1516] + as.numeric(coef(fit.ackvh)[2])*P$avh[1515] + as.numeric(coef(fit.ackvh)[3])*P$avh[1514] + as.numeric(coef(fit.ackvh)[4]) *P$avh[1513] + as.numeric(coef(fit.ackvh)[5])*as.numeric(avh.sigma.t[1515]) *avh.R[1515] + as.numeric(coef(fit.ackvh)[6])*as.numeric(avh.sigma.t[1514]) *avh.R[1514]) fit.Cofi<-garchFit( arma(2,2)+garch(1,1), data=T$cof[1:1516,], cond.dist="sstd") cof.R<-fit.Cofi@residuals cof.sigma.t<[email protected] cof.sigma.t[1516]<-predict(fit.Cofi, n.ahead = 1)[3] sstdFit(cof.R) cof.R[1516]<-qsstd(sim[4],mean=sstdFit(cof.R)$estimate[1], sd=sstdFit(cof.R)$estimate[2],nu=sstdFit(cof.R)$estimate[3], xi=sstdFit(cof.R)$estimate[4]) T$cof[1517]<- (as.numeric(coef(fit.Cofi)[1]) + as.numeric(cof.sigma.t[1516]) *cof.R[1516] + as.numeric(coef(fit.Cofi)[2])*P$cof[1515] BIJLAGE A. APPENDIX 112 + as.numeric(coef(fit.Cofi)[3])*P$cof[1514] + as.numeric(coef(fit.Cofi)[4])*as.numeric(cof.sigma.t[1515])*cof.R[1515] + as.numeric(coef(fit.Cofi)[5])*as.numeric(cof.sigma.t[1514])*cof.R[1514]) fit.Befi<-garchFit( arma(1,1)+garch(1,1), data=T$bef[1:1516,], cond.dist="sstd") bef.R<-fit.Befi@residuals bef.sigma.t<[email protected] bef.sigma.t[1516]<-predict(fit.Befi, n.ahead = 1)[3] sstdFit(bef.R) bef.R[1516]<-qsstd(sim[5],mean=sstdFit(bef.R)$estimate[1], sd=sstdFit(bef.R)$estimate[2],nu=sstdFit(bef.R)$estimate[3], xi=sstdFit(bef.R)$estimate[4]) T$bef[1517]<- (as.numeric(coef(fit.Befi)[1]) + as.numeric(bef.sigma.t[1516]) *bef.R[1516] + as.numeric(coef(fit.Befi)[2])*P$bef[1515] + as.numeric(coef(fit.Befi)[3])*as.numeric(bef.sigma.t[1515])*bef.R[1515]) kbc.R.edf<-ecdf(kbc.R) kbc.U<-kbc.R.edf(kbc.R) gbl.R.edf<-ecdf(gbl.R) gbl.U<-gbl.R.edf(gbl.R) avh.R.edf<-ecdf(avh.R) avh.U<-avh.R.edf(avh.R) cof.R.edf<-ecdf(cof.R) cof.U<-cof.R.edf(cof.R) bef.R.edf<-ecdf(bef.R) bef.U<-bef.R.edf(bef.R) Y<-P$kbc[1:1772]/5+P$gbl[1:1772]/5+P$avh[1:1772]/5+P$cof[1:1772]/5 +P$bef[1:1772]/5 X<-P.Re$gbl[1:1772]/5+P.Re$kbc[1:1772]/5+P.Re$avh[1:1772]/5 +P.Re$cof[1:1772]/5+P.Re$bef[1:1772]/5 VAR<-matrix(NA,257,1) for(i in 1:257) BIJLAGE A. APPENDIX VAR[i]<-VaR(Y[600+i:1515+i],0.95) VaRTest(alpha = 0.05, X[1516:1772], VAR, conf.level = 0.95) 113
© Copyright 2024 ExpyDoc