Big Data und Digitale Wissenschaften - ETH-Rat

Strategische Fokusbereiche in der Forschung 2017–2020
Big Data und Digitale Wissenschaften
Exponentiell wachsende Datenbestände energieeffizient und sicher handhaben und analysieren:
Gemeinsam mit anderen Schweizer Forschungsinstitutionen entwickeln die Institutionen des
ETH-Bereichs Lösungen für die technische Bewältigung und die wissenschaftliche Nutzung von riesigen
Datenmengen (Big Data) – um damit zu neuen Erkenntnissen zu gelangen, die dazu beitragen
werden, globale Herausforderungen der Menschheit zu bewältigen, wie Gesundheit, Energie- und
Nahrungsmittelversorgung und Umgang mit Ressourcen.
Ausgangslage
Die Informationstechnologie ist eine unverzichtbare
Säule der heutigen Gesellschaft. Hier erleben wir
zurzeit eine zweite Revolution, in deren Mittelpunkt
Big Data steht: Wir erzeugen, sammeln, verarbeiten
und speichern Daten mit Steigerungsraten, die
mit herkömmlichen Informationstechnologien
nicht mehr zu bewältigen sind. Dass unser tägliches
Miteinander kaum noch ohne Datenaustausch
denkbar ist, zeigt sich u. a. in Bereichen wie Kommunikation, Unterhaltung, Finanz- und Gesundheitsdienstleistungen, soziale Netzwerke und
Mobilfunkdienste. In modernen Informationsökonomien wie der Schweiz sind Daten zentraler
Bestandteil von Produkten und Dienstleistungen
geworden.
Die Wissenschaft ist in ein datenzentriertes
«viertes Paradigma» eingetreten, das Theorie,
Experiment und Simulation durch die Analyse umfangreichster Datensätze ergänzt. Die Digitale
Wissenschaft (Digital Science) entwickelt quantitative
Instrumente zur Erstellung, Kalibrierung und Validierung von Modellen und Prognosen aus solchen
Analysen. Mit ihnen wird es möglich, auf der Basis
von Big-Data-Beständen nach empirischen Grundsätzen zu Erkenntnissen und Entscheidungen
zu gelangen. Beispiele für grosse datengetriebene
Bereiche der Wissenschaft sind etwa Pharmazeutik,
Wetter- und Klimaprognosen, Umweltforschung,
Genomik, Hirnforschung und komplexe Physik,
aber auch die Geistes- und Sozialwissenschaften.
Wissenschaftliche Instrumente für die Genomsequenzierung, Bio- und Materialwissenschaften
sowie Hochenergiephysik, Simulationsinstrumente
für Energiesysteme, Erdbebeningenieurwesen
und Industriedesign sowie soziale Medien generieren
riesige Datenmengen, die als Grundlage für neue
Ansätze in Wissenschaft und Ingenieurwesen dienen.
Es fehlen heute noch die rechnerischen und mathematischen Methoden, um von dieser Datenexplosion in vollem Umfang zu profitieren, ebenso wie –
was vielleicht ebenso problematisch ist – Experten
für datenzentrierte Technologien oder geschultes
Personal, das die Daten akquirieren, handhaben,
50
synthetisieren und visualisieren könnte. Die Analyse grosser Datenmengen erfordert wissenschaftliche und technologische Fortschritte in der skalierbaren Datenverarbeitung, bei Informationssystemen,
beim maschinellen Lernen, in der Computermathematik und -statistik sowie beim humanorientierten
Computing. Ausserdem erfordert sie eine enge
interdisziplinäre Forschungszusammenarbeit zwischen den Experten aus den jeweiligen Fachgebieten und den Experten für Daten- und Informationsverarbeitung.
Bisherige Beiträge des ETH-Bereichs
Aufgrund der starken und breiten Basis in Naturwissenschaften und Technologie ist der ETH-Bereich
für eine Führungsrolle bei der Generierung, dem
Management und der Auswertung von riesigen Datenbeständen (Big Data) prädestiniert. Der Erfolg der
Schweizer Wissenschaft und Wirtschaft wird immer
mehr von einer starken und wachsenden Kompetenz
in Big Data und Digital Science abhängen sowie
vom Einsatz neuer Technologien in diesem Gebiet.
Beiträge des ETH-Bereichs 2017–2020
Im Rahmen des strategischen Fokusbereichs Big Data
und Digitale Wissenschaften wird der ETH-Bereich
Beiträge in der Wissenschaft, an Plattformen und zum
Technologietransfer sowie in der Ausbildung leisten.
Wissenschaft: Die vielleicht grösste und
grundsätzlichste Herausforderung für die Forschung
ist die Umwandlung von Big Data mit hoher Komplexität in Modelle, die für Menschen verständlich
sind. Es gibt eine Reihe technischer und wissenschaftlicher Herausforderungen, denen sich die Institutionen des ETH-Bereichs stellen wollen, um
zur Erreichung dieses Ziels beizutragen. Die Extraktion hochwertiger Informationen und skalierbarer
Modelle für die Gewinnung reproduzierbarer wissenschaftlicher Ergebnisse aus grossen, heterogenen
und unbereinigten Datenmengen ist das Kernproblem bei der Entwicklung von Methoden und Werkzeugen der Digitalen Wissenschaft. Methoden sind
an den Schnittstellen zwischen Informatik, Mathematik, Statistik und Semantik zu finden. Für diese
Strategische Planung 2017-2020 für den ETH-Bereich
Big Data und Digitale Wissenschaften
Forschungsarbeiten müssen neue Plattformen, Programme und Projekte ins Leben gerufen werden,
um Wissenschaftler und Akteure mit unterschiedlichem Hintergrund und aus verschiedenen Bereichen
zusammenzubringen. Auf dieser Grundlage können
die Institutionen des ETH-Bereichs in Kooperation
mit anderen Schweizer Forschungseinrichtungen
und Universitäten neue Wissenschaften wie Digital
Humanities und Digital Medicine etablieren.
Technologieplattformen und Technologietransfer:
Die grösste technologische Herausforderung für
eine Big-Data-Infrastruktur sind die sinkende Skalierbarkeit im Umgang mit Big Data und der hohe
Stromverbrauch der Rechner- und Speicherinfrastruktur. Die Optimierung des Ressourceneinsatzes
und der Effizienz für datenzentrierte Dienste
erfordert neuartige Paradigmen und Technologien
für Server-Software und Hardware, skalierbare
Netzwerke, Kühlung und Stromversorgung. Für die
geplante nationale Initiative «Personalisierte Gesundheit» werden die erforderlichen Dateninfrastrukturen (z. B. eine Cloud-basierte Hardware) und
Technologieplattformen sowie Methoden für die
Datenintegration und –analyse entwickelt.
Ausbildung und Vernetzung: Im Rahmen des
Fokusbereiches «Big Data und Digitale Wissenschaften» soll ein neuer Typus von Spezialistinnen und
Spezialisten ausgebildet werden: sogenannte Datenwissenschaftlerinnen und Datenwissenschaftler,
deren Kompetenz an der Schnittstelle zwischen Informatik, Mathematik, Statistik und Semantik
liegt und die in der Lage sind, die Kluft zwischen
diesen Kernbereichen und den verschiedenen
Anwendungsfeldern zu überbrücken. Diese Spezialisten sind in Wirtschaft und Forschung sehr gefragt. Die beiden ETH werden daher Studiengänge
und Ausbildungsprogramme auf verschiedenen
Stufen entwickeln, insbesondere für die Masterund Doktorandenausbildung, unter anderem auf
der Basis der MOOC-Technologien.
Für die Schweizer Industrie wäre es zudem
nützlich, über ein Kompetenzzentrum zu verfügen,
auf das sie zur Unterstützung bei neuen fachlichen
Herausforderungen, für die Fortbildung der Mitarbeitenden und als Quelle für qualifiziertes Personal
zurückgreifen können. Ein solches Zentrum könnte
zum Nukleus für engere Forschungskooperationen
zwischen den Institutionen des ETH-Bereichs und
Schweizer Unternehmen werden, die im Zusammenhang mit der Verwertung von Big Data entstehen.
Strategische Planung 2017-2020 für den ETH-Bereich
Bedeutung für Wissenschaft und Gesellschaft
Die bestehende und zukünftige Fähigkeit, die
Umwelt im grossen Massstab quantitativ zu erfassen
und zu überwachen, aus den gesammelten Daten
aussagekräftige Modelle zu erstellen und mit Hilfe
der Datenanalytik intelligente Entscheidungen
zu ermöglichen, ist eine wichtige Voraussetzung für
die Bewältigung grosser Herausforderungen der
Menschheit. Beispiele dafür sind die ökologische
Nachhaltigkeit, das Risikomanagement in natürlichen
und technischen Systemen, die Stabilität der Wirtschaft, bezahlbare und gezielt wirkende Medikamente (Personalisierte Medizin). Die Digitale Wissenschaft wird die künftige Aktivität in Bereichen
wie Gesundheit, Kultur, Kunst, Sicherheit, Ingenieurwesen, soziale Medien, Forschung und Bildung
beeinflussen. Ausserdem wird sie dazu beitragen,
dass sich die traditionell disziplinär getrennten
Welten von Technologie und Ingenieurwesen
einerseits und Geistes- und Sozialwissenschaften
andererseits enger miteinander verflechten.
Die Beherrschung datengetriebener Wissenschaften und Technologien wird für die erfolgreiche
wirtschaftliche und gesellschaftliche Entwicklung
hoch industrialisierter Länder ein entscheidender
Wettbewerbsfaktor sein. Sie führt zu einem grundlegenden Wandel der IT-Branche – weg vom
Verkauf von Produkten und Plattformen, die Einzelpersonen, Organisationen oder Unternehmen
kaufen und lokal betreiben können, hin zur Erbringung von Dienstleistungen, die durch Grossrechenzentren zur Verfügung gestellt werden. Die Schweiz
ist hervorragend aufgestellt, um die Geschäftsmöglichkeiten zu nutzen, die sich aus Big Data ergeben. Die gute Infrastruktur, die politische Stabilität
und die verlässlichen rechtlichen Rahmenbedingungen der Schweiz ermöglichen und unterstützen
neuartige Big-Data-Geschäftsmodelle.
Big Data wird künftig zu einem zentralen
Wirtschaftsgut, das neuartige Fragen im Zusammenhang mit der digitalen Souveränität und Privatsphäre aufwirft, etwa in Bezug auf das Eigentum
an Daten, den Schutz der Privatsphäre und die
ökonomische Valorisation. Diese Fragen müssen
interdisziplinär angegangen werden, wobei es gilt,
technische Ansätze mit juristischen, politischen,
ethischen, sozialen, psychologischen und ökonomischen Aspekten zu verbinden.
51