CV Sara van de Geer

 Curriculum Vitae Prof. Dr. Sara van de Geer Name: Sara van de Geer Forschungsschwerpunkte: Empirische Prozesse, Entropie, hochdimensionale Modelle, l1‐Regulierung, Wahrscheinlichkeitsungleichungen bei Stochastischen Prozessen, statistisches Lernen Sara van de Geer lehrt und forscht auf dem Gebiet der mathematischen Statistik. Damit bewegt sie sich an der Schnittstelle zu konkreten Anwendungsfeldern aus verschiedenen Disziplinen, von der Medizin bis zur Wirtschaft. Ihre Arbeiten zur nicht‐parametrischen und hoch‐dimensionalen Statistik gelten als bahnbrechend. Sie war eine der frühen Pioniere, die die empirische Prozesstheorie – indiziert von Funktionen – auf statistische Methoden zur Schätzung abstrakter Parameter angewandt hat. Mit ihren Arbeiten hat sie großen Einfluss auf die moderne Statistik und die statistische Lerntheorie. Akademischer und beruflicher Werdegang seit 2005 Professorin am Department für Mathematik der Eidgenössischen Technischen Hochschule (ETH) Zürich, Schweiz 1999 ‐ 2005 Professorin an der Universität Leiden, Niederlande 1997 ‐ 1999 Assistenzprofessorin am Laboratoire de Statistique et Probabilités der Université Paul Sabatier, Toulouse, Frankreich 1990 ‐ 1997 Assistenzprofessorin am Mathematical Institute an der Universität Leiden, Niederlande 1989 ‐ 1990 Assistenzprofessorin an der Universität Utrecht, Niederlande 1988 ‐ 1989 Wissenschaftliche Mitarbeiterin am Centre for Mathematics and Computer Science Amsterdam, Niederlande 1987 ‐ 1988 Assistenzprofessorin an der School of Mathematics der University of Bristol, UK Nationale Akademie der Wissenschaften Leopoldina www.leopoldina.org 1 1983 ‐ 1987 Wissenschaftliche Mitarbeiterin am Centre for Mathematics and Computer Science Amsterdam, Niederlande 1982 ‐ 1983 Wissenschaftliche Mitarbeiterin am Department of Econometrics an der Universität Tilburg, Niederlande 1987 Promotion in Mathematik an der Universität Leiden, Niederlande 1982 Master in Mathematik an der Universität Leiden Funktionen in wissenschaftlichen Gesellschaften und Gremien seit 2015 Präsidentin der Bernoulli Society for Mathematical Statistics and Probability 2013 Mitglied im Auswahlkomitee des Spinoza Awards 2007 ‐ 2015 Mitglied im Forschungsrat der Swiss National Science Foundation Projektkoordination, Mitgliedschaft in Verbundprojekten seit 2008 DFG‐Projekt “Regularization Methods for High‐Dimensional Data”, Teilprojekt zu FOR 916 “Swiss‐German Bilateral Research Unit on: Statistical Regularisation and Qualitative Constraints ‐ Inference, Algorithms, Asymptotics and Applications” Auszeichnungen und verliehene Mitgliedschaften seit 2012 Mitglied der Nationalen Akademie der Wissenschaften Leopoldina International Statistical Institute Award Mitglied des Institute of Mathematical Statistics seit 2006 Korrespondierendes Mitglied der Dutch Royal Academy of Sciences Forschungsschwerpunkte Sara van de Geer lehrt und forscht auf dem Gebiet der mathematischen Statistik. Damit bewegt sie sich an der Schnittstelle zu konkreten Anwendungsfeldern aus verschiedenen Disziplinen, von der Medizin bis zur Wirtschaft. Ihre Arbeiten zur nicht‐parametrischen und hoch‐dimensionalen Statistik gelten als bahnbrechend. Sie war eine der frühen Pioniere, die die empirische Prozesstheorie – indiziert von Funktionen – auf statistische Methoden zur Schätzung abstrakter Parameter angewandt hat. Sie legte den Grundstein für die theoretischen Eigenschaften von Schätzverfahren, die auf Probleme mit unbekannter „Sparsity“ angewendet werden können. In der Statistik beschreibt Sparsity die Anzahl der irrelevanten Parameter innerhalb einer Stichprobe. Mit ihren Arbeiten hat Nationale Akademie der Wissenschaften Leopoldina www.leopoldina.org 2 Sara van de Geer großen Einfluss auf die moderne Statistik und die statistische Lerntheorie. Angesichts der heute in vielen Bereichen generierten Datenmengen ist die mathematische Statistik ein Schlüssel für deren Analyse und Interpretation. Eine zentrale Herausforderung ist dabei die Entwicklung von Analyseverfahren für massive Datensätze, komplexe Datenstrukturen und hochdimensionale Einflussgrößen. So gibt es eine Vielzahl von Algorithmen für maschinelles Lernen, die dabei helfen, mit Internet‐Suchmaschinen wie Google bestimmte Informationen zu finden, Gene aufzuspüren, die für bestimmte Krankheiten verantwortlich sind, oder auch herauszufinden, welche Abnehmer sich für bestimmte Produkte interessieren könnten. Statistiker wie Sara van de Geer entwickeln nicht nur die entsprechenden Algorithmen, sie interessieren sich vor allem auch dafür, wie gut diese Algorithmen sind: wie genau die gefundenen Ergebnisse passen und wie signifikant sie sind. Weil es hierfür viele Einflussfaktoren gibt, werden diese Fragen mit Methoden der statistischen Analyse hochdimensionaler Daten erforscht. Solche Methoden zu entwickeln gehört auch zu van de Geers Forschungsgebiet. Sie widmet sich der Theorie über die Beziehung zwischen der Komplexität eines Modells und der Schwierigkeit der Schätzung. Dafür nutzt sie einheitliche Wahrscheinlichkeitsungleichungen für Zufallsvariablen, die durch einen Parameter indiziert sind, und verschiedene Definitionen von Komplexität (Entropie). In dem hochdimensionalen Setup will sie zeigen, dass bestimmte statistische Verfahren in der Lage sind, ein „oracle“ zu imitieren, das das optimale Modell kennt. Ein Paradebeispiel ist das Lasso, das ein lineares Modell mit einer großen Anzahl von Variablen fast so gut abschätzen kann, als wäre bekannt, welche Variablen redundant sind. Die Anpassung an eine unbekannte „Sparsity“ ist ein anspruchsvolles Thema, das in weiten Bereichen der Statistik Anwendung findet. Nationale Akademie der Wissenschaften Leopoldina www.leopoldina.org 3