Download onderwerpen masterproef 2014-2015

Onderwerpen Masterproef Opleiding Wiskunde
Academiejaar 2014-2015
Vakgroep Toegepaste Wiskunde, Informatica en Statistiek
Gestructureerde populatiemodellen
Promotor: Prof. W. Govaerts ([email protected])
Begeleider: Charlotte Sonck ([email protected]))
Doelgroep: Master wiskunde
Korte beschrijving
In populatiemodellen is de basiseenheid het individu. Er wordt getracht om de kennis over mechanismen
op het individuele niveau te vertalen naar modellen voor het aantal individuen. Een voorbeeld van zo’n
individu is een cel, zoals biergist, waarvan men de individuele groei kan voorstellen door één of
meerdere differentiaalvergelijkingen. Bij het opstellen van populatiemodellen is men geïnteresseerd in
wat er een niveau hoger gebeurt: hoe is de verdeling van de celgrootte bij een populatie van cellen in
functie van de tijd? De meest natuurlijke aanpak is om de individuele celtoestand zo compleet mogelijk
trachten te beschrijven door een beperkt aantal numerieke variabelen (zoals grootte, massa,…) en om
vervolgens vergelijkingen op te stellen die het verband vormen tussen de processen in de individuele cel
en het statistische en dynamische gedrag van de populatie cellen.
Het is de bedoeling dat de student in deze thesis inzicht krijgt in de basis van gestructureerde
populatiemodellen aan de hand van het uitwerken van een aantal voorbeelden. Uitgangspunt hiervoor is
deel I van [1], een basiswerk voor dit soort modelleringen. Deze voorbeelden omvatten o.a. modellen
voor grootteafhankelijke reproductie bij ectothermische dieren en bij ééncelligen. Het uitwerken van
deze voorbeelden houdt o.a. het begrijpen van de onderliggende dynamiek in, het bestuderen van de
gewone en partiële differentiaalvergelijkingen en het oplossen van de oefeningen uit het hoofdstuk.
Naargelang de interesse van de student, kan dit onderwerp dan verder uitgespit worden in een bepaalde
richting.
Referentie: [1] J.A.J. Metz and O. Diekmann, The Dynamics of Physiologically Structured Populations,
Springer-Verlag 1986.
Titel: “Constant term identities”
Promotor: Joris Van der Jeugt ([email protected])
Doelgroep: Studenten uit de tweede master Wiskunde.
Korte beschrijving:
In de literatuur zijn er tal van intrigerende “constant term identities” te vinden, die dikwijls hun
oorsprong vinden in algebra of combinatoriek. Het berekenen of bepalen van de constante term van een
rationale functie (van een bepaalde klasse) is niet eenvoudig. Meestal moet men zich wenden tot
technieken die dan kunnen geïmplementeerd worden in computeralgebrapakketten.
Voor deze scriptie onderzoekt de student eerst een gebied waarin de berekening van constante termen
van belang is, zoals de bepaling van Kronecker coëfficiënten voor symmetrische functies. Hiervoor is
kennis van symmetrische functies en karakters van S_n een pluspunt.
Vervolgens onderzoekt de student enkele methodes/algoritmes om constante term berekeningen te
doen. Implementatie van zulke algoritmes in Maple (of Sage) maakt ook deel uit van het werk.
Referenties:
 A. Garsia, N. Wallach, G. Xin and M. Zabrocki, Kronecker coefficients via symmetric functions and
constant term identities. (zie o.a. arXiv:0810.0060 [math.CO]).
 G. Xin, A fast algorithm for MacMahon’s partition analysis (arXiv:math/0408377 *math.CO+).
Titel: Algoritmen voor symbolische sommatie
Promotor: Joris Van der Jeugt ([email protected])
Doelgroep: Studenten uit de tweede master Wiskunde.
Korte beschrijving:
De algoritmen van Gosper en Zeilberger dienen voor de symbolische sommatie van reeksen met
hypergeometrische termen (zoals bij voorbeeld reeksen met termen bestaande uit producten van
binomiaalcoëfficiënten, of rationale vormen). Deze algoritmen dateren uit het begin van de jaren 90 en
zijn nu reeds geïmplementeerd in een MAPLE-pakket sumtools.
De scriptie bestaat uit: overzicht van de belangrijkste sommatietheorema's voor reeksen; studie van
Gospers algoritme en Zeilbergers algoritme; gebruik van programma's in MAPLE.
Afhankelijk van de interesse van de student kan de studie uitgebreid worden met het onderzoek van
reeksen die voorkomen in “supersymmetrische uitbreidingen”.
Referenties:
 M. Petkovsek, H. Wilf en D. Zeilberger, A=B. A.K. Peters, 1996.
(http://www.math.upenn.edu/~wilf/AeqB.html)
 W. Koepf, Hypergeometric summation. Vieweg, 1998. (http://www.mathematik.unikassel.de/~koepf/hyper.html)
Titel: Risico’s verbonden aan de langere levensduur
Doelgroep: master wiskunde
Promotor: prof. M. Vanmaele
Korte beschrijving
De verlengde levensduur, “longevity” genoemd, heeft een grote impact op de levensverzekeringsector.
Bij het berekenen van de premie van een levensverzekeringsproduct wordt gebruik gemaakt van
geschatte overlevingstabellen. Door een verlenging van de levensduur is er een extra risico, namelijk het
systematische sterfterisico, dat in rekening moet gebracht worden. Daarnaast bestaat ook een nietsystematisch sterfterisico dat echter verdwijnt in een goed gediversifieerde portefeuille. De laatste jaren
is men gaan focussen op de ontwikkeling van stochastische modellen voor het sterftecijfer om de
onvoorziene veranderingen in de levensduur van polishouders bij verzekeringsmaatschappijen te kunnen
in rekening brengen. Er zijn continue modellen en modellen met sprongen om onverwachte
veranderingen zoals door een epidemie of een catastrofe te modelleren (zie bijvoorbeeld HainautDevolder 2008). Anderzijds ontwikkelt men zogenaamde longevity bonds en survivor swaps die kunnen
aangewend worden als indekking tegen het longevity risico.
De bedoeling is om zowel de modellen voor sterfte als het prijzen van longevity bonds en andere
levensverzekeringsproducten te bestuderen. Daarnaast kan ook een hedgingstrategie zoals de
risicominimiserende strategie (zie Barbarin 2008 en Biagini-Schreiber 2013) bestudeerd worden. Een
belangrijke stap bij het prijzen is de verandering van maat. De invloed hiervan op het model voor het
sterfterisico en bijgevolg op het prijzen van levensverzekeringsproducten kan ook geanalyseerd worden
(zie Biffis et al. 2010).
Voor deze studie kan gesteund worden op de volgende artikels:
 J. Barbarin. Heath-Jarrow-Morton modelling of longevity bonds and the risk minimization of life
insurance portfolios. Insurance: Mathematics and Economics, 43(1):41-55, 2008.
 F. Biagini, I. Schreiber. Risk-Minimization for Life Insurance Liabilities. SIAM Journal on Financial
Mathematics, 4:2243–264, 2013.
 E. Biffis, M. Denuit, P. Devolder. Stochastic mortality under measure changes. Scandinavian Actuarial
Journal, 4:284-311, 2010.
 M. Dahl, S. Glar, Th. Møller. Mixed dynamic and static risk-minimization with an application to
survivor swaps. European Actuarial Journal, 1(Suppl 2):S233–S260, 2011.
 D. Hainaut, P. Devolder. Mortality modelling with Lévy processes. Insurance: Mathematics and
Economics 42:409–418, 2008.
Targeted maximum likelihood estimation (TLME) voor het schatten van causale effecten in
observationele studies
Promotor: Prof. dr. S. Vansteelandt
Begeleider: Karel Vermeulen
Doelgroep: studenten wiskunde met interesse in mathematische statistiek
Korte beschrijving
In heel wat epidemiologische studies is men geïnteresseerd in het schatten van het causaal effect van
een blootstelling op een bepaalde uitkomst; bijvoorbeeld, het causaal effect van roken op het risico op
sterfte. Dit wordt vaak bemoeilijkt door confounding: de aanwezigheid van factoren die zowel de
blootstelling als uitkomst beïnvloeden, waardoor de associatie tussen beiden niet langer een zuiver
causaal effect weerspiegelt. Bijvoorbeeld, niet-rokers zijn doorgaans individuen met een gezondere
levensstijl dan rokers. Het niet in rekening brengen van confounding leidt tot een vertekende inschatting
van het effect van roken.
Over de laatste jaren zijn er heel wat schattingstechnieken ontwikkeld om vertekening ten gevolge van
confounding te elimineren. Hiervoor moeten statistische modellen worden gebouwd die de associatie
van confounders met de uitkomst en/of blootstelling modelleren. Wanneer deze modellen echter niet
correct gespecificeerd zijn, kunnen vertekende schattingen worden bekomen. Recent werd er in de
literatuur een algemene schattingsmethode voorgesteld, targeted maximum likelihood estimation, die
om die reden zuinig omspringt met statistische modellering en schatters met gunstige eigenschappen
(bvb. kleine variantie) oplevert.
Het doel van deze masterproef zal in eerste instantie zijn om inzicht te verwerven hoe deze
schattingsmethode te werk gaat en vervolgens de performantie van TMLE door middel van een
simulatiestudie te vergelijken met andere bestaande schattingsmethoden om een causaal effect van een
blootstelling op een uitkomst te schatten.
Uitgangspunt is het boek “Targeted Learning, causal inference for observational and experimental data”
van Mark J. van der Laan en Sherri Rose, Springer Series in Statistics, hoofdstukken 1 tot 7.
Optimale inschatting van nuisance parameters in statistische analyses
Promotor: Prof. dr. S. Vansteelandt
Begeleider: Karel Vermeulen
Doelgroep: studenten wiskunde met interesse in ofwel theoretische, ofwel toegepaste statistiek.
Korte beschrijving
Over de laatste jaren maken statistische analyses meer en meer gebruik van `invers wegen'. Dit is een
techniek waarbij de metingen van elk individu op een specifieke manier gewogen worden, met als doel
bepaalde vormen van vertekening (bijvoorbeeld, ten gevolge van confounding) te elimineren. Een nadeel
van deze techniek is echter dat de gewichten, die op basis van de maximum kans methode bekomen
worden, voor sommige individuen soms zeer hoog kunnen oplopen. Dat heeft tot gevolg dat deze
individuen zeer invloedrijk worden in de analyse, en bijgevolg de analyse danig in de war kunnen sturen.
In deze masterproef zult u betrokken worden in een lopend onderzoeksproject waarbij een algemene
theorie werd ontwikkeld om deze gewichten op een veel betere manier in te schatten (niet via de
maximum kans methode). Het doel zal er meer concreet in bestaan om, na een studie van deze theorie,
ze toe te passen op een concrete probleemstelling die momenteel zeer veel aandacht krijgt in de
literatuur. Met name zullen we de theorie toepassen om (via zogenaamde directe en indirecte effecten)
inzicht te krijgen in het causale mechanisme waarbij een bepaalde blootstelling een bepaalde uitkomst
beïnvloedt. Deze toepassing is gemotiveerd door de concrete probleemstelling waarom bepaalde genen
met longkanker geassocieerd zijn: omdat ze mensen ertoe aanzetten te roken, of omdat ze rechtstreeks
het risico op longkanker beïnvloeden.
De focus van deze masterproef kan, afhankelijk van de interesses van de student, van zeer theoretisch
tot zeer toegepast variëren.
Een ander onderwerp in het domein van de mathematische statistiek en/of toegepaste data-analyse
Promotor: Prof. dr. S. Vansteelandt
Doelgroep: studenten uit de tweede master Wiskunde.
Bespreekbaar
Option Pricing with Bayesian Learning
Promotor: David Vyncke
Begeleider: Hilmar Gudmundsson
Doelgroep: Toegepaste Wiskunde
Korte beschrijving
Currently, standard option pricing theory struggles to accommodate certain empirical characteristics of
real life option prices, such as smirks in the implied volatility surface. Various technical improvements
have been explored, including the introduction of stochastic volatility and jumps to better capture the
real life pricing process in the market. While the empirical fit can be significantly improved through these
modifications, they are ad hoc in nature and lack a clear connection to the decision making of investors
that drives price formation in the market.
The purpose of this project is to introduce a decision theoretic modification to jump diffusion, with the
aim of constructing a pricing model that has the potential to capture these empirical characteristics, i.e.
to get a model that has a good fit with prices in the market and has a clear economic justification.
This project requires solid knowledge of 1) stochastic processes, including Brownian motion and Poisson
processes, 2) the foundations of mathematical finance, including arbitrage pricing and option theory
such as the Black Scholes framework.
In addition, the project might require some familiarity with 3) time series analysis in financial markets, 4)
the concept of Nash equilibrium, and 5) programming in Matlab.
Onderwerp Masterproef
Frank-copula’s
Promotor: Prof. H. De Meyer ([email protected])
Begeleider: Prof. H. De Meyer
Doelgroep: Master Wiskunde (toegepaste wiskunde)
Korte beschrijving:
Tweedimensionale copula’s worden in stochastische modellen voornamelijk gebruikt om de afhankelijkheid tussen twee stochastische veranderlijken, los van
hun marginale verdelingen, te modelleren. Mathematisch kunnen ze ge¨ıdentificeerd worden met bijzondere functies van twee re¨ele veranderlijken gedefinieerd
over het eenheidsvierkant en met waarden in het eenheidsinterval.
Frank-copula’s vormen een belangrijke en frequent gebruikte geparametrizeerde
familie van copula’s, met volgend functievoorschrift:
"
#
1
(e−αx − 1)(e−αy − 1)
Fα (x, y) = − log 1 +
,
α
e−α − 1
α 6= 0 ,
waarbij α een re¨ele parameter is en waarbij in de limiet geldt
F−∞ (x, y) = max(x + y − 1, 0) , F0 (x, y) = xy , F+∞ (x, y) = min(x, y) .
Het is de bedoeling om een aantal bijzondere eigenschappen van deze familie
van copula’s te bewijzen en te interpreteren. Voor dit werk kan gesteund worden op een aantal recente publicaties en onderzoeksnota’s van de promotor,
meerbepaald over de eigenschappen van subadditiviteit, straalconvexiteit en
een karakterizerende ongelijkheid die nooit eerder in de literatuur bestudeerd
werd.
Referenties:
M. Frank, On the simultaneous associativity of F (x, y) and x + y − F (x, y),
Aequationes Mathematicae 19 (1979) 194–226.
H. De Meyer, B. De Baets, On a conjecture about the Frank copula family,
Fuzzy Sets and Systems, 228 (2013) 15-28.
Steiner trees in FiberPlanIT
Promotor: Veerle Fack
Contactpersoon Comsof: Stéphanie Vanhove
Doelgroep: master wiskunde / wiskundige informatica
Achtergrond
Comsof is een spin-off van Universiteit Gent en ontwikkelt o.a. FiberPlanIT, een tool voor planning van
glasvezelnetwerken. Via de verwerking van GIS-data die het wegennetwerk, de adressen van de klanten
en eventuele bestaande infrastructuur documenteren, wordt een geoptimaliseerd netwerkplan
berekend. Hier zijn heel wat algoritmen en heuristieken voor nodig, vooral in de grafentheorie. De
uitvoer bestaat uit GIS-data die het netwerk documenteren en een Excelbestand met een overzicht van
de kosten. FiberPlanIT werd in de voorbije jaren reeds gebruikt voor de planning van meer dan 14
miljoen adressen wereldwijd.
Voorbeelduitvoer van FiberPlanIT
Probleemstelling
Ieder gebouw moet via een kabel worden verbonden met een distributiepunt. Een belangrijk probleem
is bepalen hoe dit zo goedkoop mogelijk kan gebeuren. Hiervoor wordt gebruik gemaakt van Steiner
trees. Het Steiner tree probleem is een veralgemening van het probleem van de minimaal opspannende
boom, waarbij men een boom zoekt met zo laag mogelijk gewicht die alle toppen van de graaf verbindt.
Het probleem van de minimaal opspannende boom wordt voor een samenhangende graaf meestal
opgelost met het gekende algoritme van Prim. Het verschil is echter dat bij het Steiner tree probleem
niet alle, maar slechts een deelverzameling N van de toppen verbonden moeten worden. Dit betekent
dat ook toppen die geen deel uitmaken van N zich in de Steiner tree kunnen bevinden. Dit maakt het
probleem aanzienlijk complexer dan het bepalen van een minimaal opspannende boom, waardoor in de
praktijk meestal heuristieken worden gebruikt.
In de context van FiberPlanIT is een efficiënte heuristiek voor het Steiner tree probleem zeer belangrijk,
aangezien het om grote netwerken gaat en dit een bewerking is die vaak wordt opgeroepen.
Ook een heuristiek voor dynamische Steiner trees zou zeer nuttig zijn voor FiberPlanIT. Hier is het de
bedoeling snel de Steiner tree te herberekenen wanneer men een top toevoegt aan of verwijdert uit de
verzameling N.
Steiner tree in FiberPlanIT. De gebouwen (paars) worden geprojecteerd op de straat in een droppunt (blauw). Deze
droppunten worden verbonden door een Steiner tree (groen). Het distributiepunt (DP) is aangeduid in roos.
Doelstelling




Literatuurstudie
Ontwerpen en implementeren (in Java) van een efficiënte heuristiek voor het Steiner tree probleem
Testen binnen de FiberPlanIT software
Eventueel: uitbreiden met een heuristiek voor dynamische Steiner trees
Meer info
[email protected]
[email protected]
http://www.comsof.com
http://www.fiberplanit.com
Een studie van de theorie en de implementatie van Constant
Pertubation-methoden
Doelgroep: master wiskunde / master wiskundige informatica
promoter/begeleider : prof. M. Van Daele
Beschrijving
Klassieke methoden voor de numerieke integratie van gewone differentiaalvergelijkingen zijn vaak gebaseerd
op veelterminterpolatie. Dit zorgt ervoor dat wanneer de oplossing van het probleem een veelterm is van
voldoend lage graad, de exacte oplossing wordt teruggevonden, terwijl voor vele andere problemen een
numerieke oplossing gevonden kan worden die, binnen een bepaalde afgesproken toleratie, aanvaardbaar
is. Er kunnen echter problemen rijzen wanneer de oplossing sterk oscillatorisch is. In dat geval dient men
met een klassieke methode zeer kleine stapjes te nemen om de oplossing accuraat te kunnen beschrijven.
Dit resulteert in enorm veel rekenwerk, waardoor die klassieke methoden praktisch onbruikbaar zijn. Een
alternatief wordt geboden door de klasse van de CP-methoden, wat staat voor Constant Perturbation
methods.
Als concrete toepassing beschouwen we het berekenen van de golffunctie y van een Schr¨odinger-probleem.
Het Schr¨odingerprobleem bestaat uit een tweede orde gewone differentiaalvergelijking (ODE) van de vorm
y ′′ = (V (x) − E)y,
a < x < b,
(1)
met randvoorwaarden in de eindpunten a en b. De Schr¨odingervergelijking vormt de fundamentele vergelijking in de kwantummechanica. Een waarde voor de parameter E waarvoor een niet-nul oplossing bestaat,
wordt een eigenwaarde genoemd. De eigenwaarden worden typisch geordend als E0 < E1 < E2 < . . . en
de golffunctie of eigenfunctie yk (x), horende bij Ek , heeft dan exact k nulpunten in het interval (a, b).
Dit betekent dat de “hogere” eigenfuncties sterk oscilleren.
De eerste stap van een CP methode bestaat er in de functie V (x) stuksgewijs te benaderen door een
constante, d.w.z. in het interval [xi , xi+1 ] wordt de vergelijking (1) gewijzigd in
y ′′ = (V¯ − E)y,
xi < x < xi+1 ,
(1) ,
waarbij V¯ een geschikte constante is.
Deze vergelijking, waarvan de co¨effici¨enten constanten zijn, kan analytisch exact opgelost worden. Aldus
verkrijgen we de waarde van de golffunctie y en van de eerste orde afgeleide y ′ in een aantal roosterpunten.
Deze oplossing is uiteraard maar een benaderende oplossing, want V (x) werd vervangen door V¯ . Deze
benaderende oplossing, laat ze ons y (0) noemen, wordt vervolgens gecorrigeerd door het in acht nemen
van V (x) − V¯ . Via een perturbatieprocedure bekomt men uiteindelijk alsmaar betere benaderingen y (1) ,
y (2) , . . . die telkens analytisch kunnen worden bepaald.
Het doel van de thesis is een studie van de theorie en de implementatie van deze CP-methoden, die de
basis vormen van de succesvolle code MATSLISE, onwikkeld in de onderzoeksgroep Numerieke Wiskunde
van de UGent.
Literatuur
Enkele wetenschappelijke artikels:
1. L. Gr. Ixaru, Numerical operations on oscillatory functions, Computers and Chemistry 25 (2001).
2. L. Gr. Ixaru, CP methods for the Schr¨odinger equation, J. Comput. Appl. Math. 125 (2000).
Een link naar MATSLISE:
3.
http://www.twist.ugent.be/index.php?page=onderzoek&ot=SLsoftware
1
Het oplossen van randwaardeproblemen
Doelgroep: master wiskunde/ master wiskundige informatica
promoter/begeleider : prof. M. Van Daele
Beschrijving
In de cursussen Numerieke methoden voor Differentiaalvergelijkingen (opleiding wiskunde) en Wetenschappelijk rekenen (opleiding informatica) worden beginwaardeproblemen opgelost. Hierbij worden alle
voorwaarden, die opgelegd worden aan de oplossing van de differentiaalvergelijking, uitgedrukt in hetzelfde punt. Bij tweede-orde differentiaalvergelijkingen gebeurt het echter vaak dat de er een voorwaarde
opgelegd wordt in het beginpunt en het eindpunt van het interval. Men spreekt in dat geval over randwaardeproblemen.
Het doel van deze thesis is de studie van een aantal technieken (shooting, collocatie, deferred correction,
Galerkin, . . . ) om zo’n randwaardeproblemen op te lossen.
Literatuur
Enkele wetenschappelijke werken :
1. M. Heath, Scientific Computing, An Introductory Survey, Mc Graw-Hill (2002) 2. J.R. Cash, Numerical integration of non-linear two-point boundary-value problems using iterated deferred corrections
I : A survey and comparison of some one-step formulae. Comput. Math. Appl. 12, 10, Part 1 (1986),
1029-1048.
3. U. Asher, R. Mattheij, R. Russell, Numerical Solution of Boundary Value Problems for Ordinary
Differential Equations, SIAM (1995)
Numerieke methoden voor tweede-orde differentiaalvergelijkingen
Doelgroep: master wiskunde/ master wiskundige informatica
promoter/begeleider : prof. M. Van Daele
Beschrijving
In de cursussen Numerieke methoden voor Differentiaalvergelijkingen (opleiding wiskunde) en Wetenschappelijk rekenen (opleiding informatica) worden methoden besproken voor eerste orde differentiaalvergelijkingen. In principe volstaan deze om tweede-orde differtiaalvergelijkingen y ′′ = f (x, y) op
te lossen, want elke tweede-orde vergelijking kan omgezet worden in een stelsel eerste-orde vergelijkingen.
Hierdoor wordt echter y ′ ge¨ıntroduceerd in het probleem. Om dit te vermijden, zijn er ook methoden
ontwikkeld die rechtstreeks geschikt zijn voor tweede-orde (of algemeen gesproken hogere orde) differentiaalvergelijkingen. De meest bekende methode hiervoor is wellicht de Numerov methode.
Het doel van deze thesis is na te gaan hoe deze methoden kunnen geconstrueerd worden. Wat is hun
orde? Hoe zit de stabiliteitstheorie voor deze methoden in elkaar? . . .
Literatuur
o.a : E. Hairer, S.P. Norsett, G. Wanner, Solving Ordinary Differential Equations I, Springer-Verlag
(1991)
2
Exponential fitting
Doelgroep: master wiskunde/ master wiskundige informatica
promoter/begeleider : prof. M. Van Daele
Beschrijving
Heel veel numerieke methoden (voor de benadering van afgeleiden, de berekening van integralen, het
oplossen van differentiaalvergelijken, . . . ) steunen op veelterminterpolatie. Voor sommige toepassingen
(bvb. als geweten is dat het integrandum of de af te leiden functie periodiek is), zijn veeltermen niet zo
geschikt, maar zijn trigonometrische of exponenti¨ele functies eerder aangewezen. Daarom werden nieuwe
methoden ontwikkeld die met dit oscillerend of exponentieel karakter rekening houden. Deze techniek
heet exponential-fitting.
Het doel van deze thesis is dieper in te gaan op de exponential-fitting techniek en zo’n methoden toe te
passen op een aantal typische problemen.
Literatuur
o.a. Liviu Gr. Ixaru and G. Vanden Berghe, Exponential Fitting, Kluwer, Boston - Dordrecht - London,
2004.
3