Die richtige Behandlung dank Graph

MED Software Simulation
In der Medikation bei Krebserkrankungen gibt es oft neue Erkenntnisse. Doch Ärzte haben selten Zugriff auf alle Daten. Abhilfe schafft eine
Graphdatenbank, die komplexe Daten miteinander verknüpft.
U
m Medikamente sinnvoll für jeden Patienten kombinieren und verschreiben zu können, spielen spezifische Faktoren wie Alter, Geschlecht, Art der Krebserkrankung, Krankheitsverlauf und spezielle Genmutationen eine entscheidende Rolle. Beispielsweise um die Wirkung
zweier Medikamenten miteinander zu vergleichen. Zwar untersuchen mehr und mehr Forschungsprojekte den Erfolg bestimmter Wirkstoffe. Eine zentrale Datenbank mit allen
Schlüsselinformationen fehlt jedoch. Viele wichtige Informationen verschwinden daher in den Datensilos einzelner Forschungseinrichtungen. Die wenigen existierenden Datenbanken verfügen nicht über die Intelligenz, um in maßgeschneiderten Suchabläufen wesentliche Patienten- und
Krankheitsfaktoren zu berücksichtigen.
Hier können Graphdatenbanken ihre Vorteile voll und ganz
ausspielen. Ein Graph ist die allgemeine Bezeichnung für eine
abstrakte Struktur, die eine Menge von Objekten sowie die bestehenden Verbindungen zwischen diesen Objekten repräsentiert. In der Mathematik bezeichnet man diese als Knoten und
Kanten. Sowohl die Knoten als auch die Kanten können Ei-
Komplexe und unstrukturierte Daten: Im Vergleich zu relationalen Datenbanken arbeitet Neo4j bis zu 1.000 Mal schneller und kann auch Beziehungen zwischen den Daten abbilden.
MEDengineering 9-10/2015
genschaften, sogenannte Properties besitzen. In den meisten
Fällen werden Graphen als einzelne Kreise dargestellt, die mit
Linien verbunden sind, ähnlich wie Stammbäume, MindMaps oder das U-Bahn-Netz einer Stadt.
Gerade weil sie nicht nur einzelne Daten, sondern auch die
Beziehungen der Daten untereinander abbilden, eignen sich
Graphdatenbanken besonders gut, um stark vernetzte
und/oder unstrukturierte Informationen anschaulich darzustellen. Die Beziehungen können ganz unterschiedlicher Art
sein, zum Beispiel die Medikamentenfamilie oder die Krebsart. Zudem kann ihnen eine beliebige Anzahl von qualitativen
oder quantitativen Eigenschaften zugewiesen werden, zum
Beispiel optimale Dosierungsmenge, Erfolgsrate der Behandlung, Wirksamkeit gegen X Mutationen und Marktverfügbarkeit.
Beziehungen zwischen Daten sind also nicht mehr bloße Metadaten, sondern stehen vielmehr im Zentrum des Modells.
Graphdatenbanken unterstützen unzählige gerichtete Beziehungen zwischen den einzelnen Instanzen, so dass ein umfangreicher semantischer Kontext entsteht. Einmal in einer
Graphdatenbank aufgenommen, lässt sich eine ganze Reihe
neuer Zusammenhänge innerhalb der Daten untersuchen.
Anwender können völlig neue Fragen stellen, die mit einer herkömmlichen Datenbank-Technologie nicht möglich sind.
Überträgt man diese Suchmethode in den Bereich der Krebsbehandlung, lassen sich individuell auf den Patienten abgestimmte Suchbefehle eingeben. Zum Beispiel: „Finde alle
Medikamente, die seit 2012 erfolgreich bei der Behandlung
von Eierstockkrebs im Stadium 2 bei Frauen unter 30 Jahren
eingesetzt wurden.“
Ein weiterer Vorteil der Graphdatenbanken ist ihre hohe Performance auch bei vielen, miteinander verknüpften Datensätzen. Beziehungen zwischen Elementen müssen für eine Abfrage nicht aufwändig berechnet werden, sondern sind durch
die vorliegenden Strukturen einfach verfolgbar. Die Abfragegeschwindigkeit hängt nicht von der Gesamtmenge der Daten
in der Datenbank und der Anzahl von Verknüpfungsoperationen ab, sondern nur von der Anzahl der konkreten Beziehungen, die für die gewünschte Abfrage relevant sind. Abfragen,
22
www.med-eng.de
Grafik: Alberto Roque Carrizo Fernández, Luis Martínez Menéndez
Die richtige Behandlung
dank Graph-Technologie
MED Software Simulation
Grafik Ian Robinson
Schnelle Übersicht: Mit diesem Neo4j Graph wird klar welche Unternehmen für welche Krebserkrankungen Therapien entwickeln und wie weit
sie fortgeschritten sind.
die in anderen Datenbank-Technologien noch Minuten oder
gar Stunden dauerten, liefern jetzt in Millisekunden das Ergebnis. Zudem lässt sich das Datenmodell leicht mit beliebigen, zusätzlichen Hierarchien und Zugriffsstrukturen anreichern, die einen extrem schnellen Zugriff auf Teilaspekte der
Daten ermöglichen. Neu gewonnene Informationen wie etwa
aktuelle Studien oder neue Medikamente lassen sich als neue
Beziehungen im Graphen ablegen. Relevante Ausschnitte der
Datenbank kann der Nutzer direkt am Beispiel einsehen, und
so die gewünschten Informationen gewinnen und schnell reagieren. Neo4j verfügt dazu über ein eigenes VisualisierungsTool. Aber auch andere, eigenständige Visualisierungssoftwarepakete unterstützen bei der automatischen Aggregation,
Clusterfindung, Geo-Darstellung oder der Vergleichbarkeit
über verschiedene Datensets.
Ein konkretes Beispiel für die Anwendung von Graphdatenbanken in der Medizin zeigt Annai Systems. Das amerikanische Unternehmen arbeitet im Bereich Genomik und Datenmanagement und entwickelte mit Hilfe von Neo4J ein System, das umfangreiche Informationen bei der Behandlung
von Eierstockkrebs bereitstellt. Die größte Herausforderung
bestand darin, die bereits existierenden, jedoch meist isolierten Daten, effektiv in einer einheitlichen Datenbank miteinander zu verknüpfen. Auf Basis dieser Informationen sollte
die Datenbank dann eine schnelle Analyse aller Faktoren ermöglichen und Empfehlungen abgeben. Insgesamt bestimmte das Team von Annai 20 individuelle Datenbanken mit drei
Klassen von Informationen:
+
Patientendaten – Biologische Informationen und die spezifischen Merkmale der Krankheit.
www.med-eng.de
+
Referenzdaten – Weltweit bestehende Informationen zu
Genen und Medikamenten.
Erfahrungsdaten – Informationen aus wissenschaftlichen
Forschungsarbeiten und klinischen Studien und besten Therapie
+
Im nächsten Schritt wurden alle Daten der 20 individuellen
Datenbanken in einer Graphdatenbank zusammengefasst,
wobei die Entwickler die Informationen verfeinerten und standardisierten sowie die Beziehungen zwischen den Datensätzen definierten. Nach nur wenigen Monaten entstand so eine
umfangreiche und einheitliche Datenbank, die verschiedene
Behandlungsoptionen mit bestimmten Biomarkern der Patienten verknüpft und so eine Rangliste der Therapien erstellte.
Wirksame Behandlungen, zugeschnitten auf die individuellen
Anforderungen jedes einzelnen Patienten, lassen sich so
schnell und einfach finden. Kostspielige, langwierige und für
den Patienten beschwerliche „Trail-and-error“ Versuche erübrigen sich. Die von Annai entwickelte Lösung wird bereits
erfolgreich bei der Behandlung von Eierstockkrebs eingesetzt.
KONTAKT
Neo Technology
80639 München
Tel. 0151 67304361
www.neo4j.com
23
MEDengineering 9-10/2015