Computational Studies in Cancer Progression - ETH E

Diss. ETH No 23219
COMPUTATIONAL STUDIES IN
CANCER PROGRESSION AND TREATMENT
A thesis submitted to attain the degree of
DOCTOR OF SCIENCES of ETH ZURICH
(Dr. sc. ETH Zurich)
presented by
SIMONA CRISTEA
M.Sc. Computational Biology and Bioinformatics ETH,
Eidgenössische Technische Hochschule Zürich, Switzerland
born on 21.06.1987
citizen of Romania
accepted on the recommendation of
Prof. Dr. Niko Beerenwinkel
Prof. Dr. Jörg Rahnenführer
Prof. Dr. Shana J. Sturla
Prof. Dr. Fabio Vandin
2016
Abstract
This thesis discusses four studies on computational cancer genomics, developed by the
author and accepted for publication during her four-year tenure as a doctoral student
in the Computational Biology Group at the Department of Biosystems Science and Engineering at ETH Zürich. Using mathematical modeling and computational approaches,
these studies address various biological questions on the basis of cancer genomics data,
from identifying mutually exclusive groups of alterations to assessing the therapeutic
role of food components in cancer.
The present thesis is organized into four chapters. Chapter 1 introduces the field of cancer genomics and discusses how tumors evolve into highly diverse alteration landscapes,
driven however by only a small number of selectively advantageous genetic alterations.
Chapter 2 presents two probabilistic graphical models: TiMEx, a waiting time model for
mutually exclusive cancer alterations (Constantinescu et al., 2015a) and pathTiMEx, a
waiting time model for the joint inference of mutually exclusive cancer pathways and
their progression dynamics (Cristea et al., 2016). The two models address essential unsolved questions in cancer genomics: 1) which alterations drive tumor progression? and
2) what are the evolutionary constraints on the order in which these alterations occur?
TiMEx contributes to the cancer genomics literature as the first model that infers mutual
exclusivity as a continuous property with a probabilistic interpretation, rather than a binary value. pathTiMEx is a generalization of TiMEx and represents the first approach that
models and infers mutual exclusivity and evolutionary order constraints among groups
simultaneously, while allowing for multiple paths of cancer progression at the pathway
level. Chapter 3 consists of two publications discussing data mining approaches in toxicology. Constantinescu et al. (2015b) present five recent toxicogenomics cases studies
illustrating complementary strategies for mining genome-wide data after exposure to
toxicants. These studies include applications of pharmacokinetic/pharmacodynamic (PKPD) modeling, an application of pathway and network analyses, as well as pharmacogenomics analyses. Lastly, Constantinescu et al. (2014) is an explorative network study
about the effects of two food components with anticancer properties, Sulforaphane and
Selenium, on the cancerous cell line HT29 and on the noncancerous cell line HCEC. Chapter 4 concludes the thesis with a critical assessment of the presented works, remaining
open questions and future perspectives.
1
Kurzfassung
Diese Dissertation umfasst vier Studien auf dem Gebiet der rechnergestützten Krebsgenomik, die im Rahmen eines vierjährigen Doktorats in der Computational Biology Group
am Departement Biosysteme der ETH Zürich verfasst wurden. Mathematische Modelle gekoppelt mit rechnergestützten Herangehensweisen erlauben ein vertiefendes Verständnis von sich gegenseitig ausschließenden Gruppen von krebsverursachenden Genen mit Hilfe von Krebsgenomikdaten bis hin zu therapeutischen Charakteristika von
Lebensmittelinhaltsstoffen.
Die hier präsentierte Dissertation ist in vier Kapitel gegliedert. Kapitel 1 gibt einen Überblick über das Gebiet der Krebsgenomik und erläutert wie Tumore sich zu vielseitigen
Gebilden entwickeln, wobei nur eine kleine Anzahl an Genen einen Selektionsvorteil
verleihen, die zur Krebsentstehung führen. Kapitel 2 präsentiert zwei probabilistische
graphische Modelle: TiMEx, ein Wartezeitenmodell von sich gegenseitig ausschließenden krebsverursachenden Mutationen(Constantinescu et al., 2015a). Das zweite Wartezeitenmodell pathTiMEx inferriert nicht nur Gruppen von sich gegenseitig ausschließenden krebsverursachenden Genennetzwerken, sondern auch die fortschreitende Dynamik (Cristea et al., 2016). Beide Modelle gehen fundamentalen ungelösten Fragen der
Krebsgenomik nach: Erstens, welche Veränderungen sind Ursache für die Entstehung
von Krebs, und zweitens, was sind die evolutionären Einschränkungen zwischen jenen
krebsverursachenden Genen? TiMEx ist das erste Modell in der Literatur der Karzinogenese in dem der Grad der sich gegenseitigen Ausschließbarkeit als kontinuierlicher und
nicht als binärer Parameter erfasst wird. pathTiMEx stellt eine Verallgemeinerung von
TiMEx dar und inferriert evolutionäre Mutationseinschränkungen und Gruppen von sich
gegenseitig ausschließenden Genen simultan, wobei stets mehrere Mutationspfade auf
der Ebene der Gennetzwerke möglich sind. Kapitel 3 veranschaulicht Data Mining Herangehensweisen anhand zweier Publikationen in der Toxikologie. Constantinescu et al.
(2015b) veranschaulicht anhand von fünf aktuellen toxikogenomischen Fallstudien komplementäre Strategien der genomweiten Datensammlung nach Einwirkung eines Toxins.
Diese Studien enthalten Anwendungen von pharmakokinetischen und pharmakodynamischen (PK-PD) Modellen. Des Weiteren beinhalten sie auch pharmakogenomische
Analysen des Genregulationsnetzwerks. Schlussendlich ist Constantinescu et al. (2014)
eine explorative Netzwerkanalyse der Effekte zweiter Lebensmittelinhaltsstoffe, Sulforaphan und Selen, mit möglicherweise krebsvorbeugenden Eigenschaften, auf die nichtkanzeröse HCEC-Zelllinie, bzw. auf die Krebszelllinien HT29. Diese Arbeit wird mit Kapitel 4 abgeschlossen, in dem eine kritische Auseinandersetzung der präsentierten Werke
getätigt wird und in dem noch offene Fragen und Zukunftsperspektiven aufgezeigt werden.
3