Datenanalyse hält Einzug bei der Schweizer Polizei

[ Redaktion ]
[ deutsch ]
Datenanalyse hält Einzug
bei der Schweizer Polizei
Erstmals setzt in der Schweiz die Kantonspolizei (Kapo) Zürich auf ein System zur Datenanalyse. Die Software liefert IBM, installiert wird sie von Unisys. Im Juli 2016 soll die AnalyseSoftware komplett betriebsbereit sein.
VR
Wie sehr inzwischen beispielsweise Gerichtsverhandlungen zur Dokumentenschlacht werden können, ist im Prozess
der USA gegen den ehemaligen UBSBanker Raoul Weil allgemein bekannt
geworden. Weil, der 2014 von einem
amerikanischen Gericht einstimmig von
dem Vorwurf der Verschwörung zum
Zwecke des Steuerbetrugs freigesprochen wurde, hatte für seine Verteidigung
einen Aktenberg von mehr als 4,5 Millionen elektronischen Seiten zu bewältigen. Ohne professionelle Datenanalyse,
so Weil in seinem kürzlich unter dem Titel «Der Fall Weil» publizierten Erfahrungsbericht, wäre dieses Volumen nicht
zu bewältigen gewesen.
Nicht anders sieht es bei der Ermittlungsarbeit der Polizei aus. Sie steht von
der Beweisaufnahme bis zur Sammlung
fallrelevanter Fakten für Kriminaldelikte vor ständig wachsenden Datenbergen an potenziellem Beweismaterial.
Das können Bild- oder Textdaten von
verschiedenen Straftaten sein, wobei
insbesondere im Bereich zur Bekämpfung der Kinderpornografie sehr grosse
Datenmengen einschliesslich Videos sichergestellt werden, wie es bei der Kapo
Zürich heisst. Dort sind allein in den
letzten acht Jahren die Datenbestände
von rund neun auf aktuell etwa 720
Terabyte um das Achtzigfache gewachsen. Wer sich die Zahl veranschaulichen
will, muss sich vorzustellen versuchen,
dass die Datenmenge von 720 Terabyte
so viele Wörter enthält, wie die rund
320 Millionen Amerikaner verwenden,
wenn sie sich knapp zehn Stunden lang
permanent unterhalten würden.
Und laut Peter Höpli, Spezialist für das
«Crime and Fraud Management» bei
Unisys Schweiz, werden die Datenbestände weiter wachsen. Sie seien heute
zu rund 80 Prozent unstrukturiert, was
es extrem aufwendig, teilweise sogar
unmöglich mache, relevante Informationen zu finden, wie er ergänzt. Hier
schaffe die moderne Technik «sehr
schnell analysierbare Datensätze, in denen Zusammenhänge und Muster sofort erkennbar sind». Für die Polizeiarbeit bedeute dies, dass sie sich auf die
Analyse und die eigentliche Ermittlerarbeit konzentrieren könne, zumal das
frühere Lesen Hunderter von Dokumenten nicht besonders spannend gewesen
sei und auch deshalb die automatisierte
Analyse eine Erleichterung der Polizeiarbeit bedeute.
Von der Beweisaufnahme bis zur Sammlung fallrelevanter Fakten professionalisiert Watson Content Analytics auch die Analyse unstrukturierter Datenberge.
| blaulicht | gyrophare bleu | girofaro blu |
11
[ deutsch ]
Pionierprojekt bei
der Schweizer Polizei
Es kann also durchaus verwundern,
dass sich angesichts dieser Situation
die Kapo Zürich erst jetzt entschieden
hat, für 890.000 Franken ein von Unisys
Schweiz geliefertes System zur Datenauswertung anzuschaffen, das auf der
IBM-Software «Watson Content Analytics» basiert. «Die Ausschreibung und
die Evaluierung geeigneter Software zur
Effizienz- und Qualitätssteigerung bei
der Datenauswertung dauerten sehr
lange», sagt denn auch Marc Besson,
Pressesprecher von der Kapo Zürich.
Es habe sich um ein Pionierprojekt gehandelt, denn «andere Polizeikorps der
Schweiz haben noch keine solchen Produkte im Einsatz». Man habe keinen
direkten Vergleich durchführen können, was die Auswahl und Beschaffung
wesentlich erleichtert und beschleunigt
hätte.
Unisys werde nun die nötige Hard- und
Software liefern und das System in die
«bestehende Infrastruktur der Datensicherung und -auswertung» integrieren.
Die Software werde dann von ausgebildeten Kriminalanalysten bedient, «eine
breite Streuung innerhalb der Ermittlungsdienste» werde es nicht geben, so
Besson. Höpli ergänzt: «Die Ausbildung
der Administratoren und Anwender beschränkt sich auf wenige Tage», denn
die Bedienung sei einfach und schnell erlernbar. Allerdings seien Fachwissen und
Erfahrung der Ermittler weiterhin gefragt. Auch wenn die Daten sehr schnell
12
| blaulicht | gyrophare bleu | girofaro blu |
aufbereitet seien, müssten «die entsprechenden Rückschlüsse daraus immer
noch die Fachleute» ziehen. Allerdings
könnten durch das System mit den vorhandenen Ressourcen mehr Fälle in kürzerer Zeit analysiert werden.
Worum es sich dabei konkret handelt,
erklärt Höpli stark vereinfacht so: Die
Textanalyse verlaufe in drei Schritten.
Daten würden eingelesen, indexiert und
dann analysiert. Als Datenquelle könnten dabei zum Beispiel sichergestellte
Medien, Mailserver, Datenbanken oder
Webseiten definiert werden, so Höpli.
Dabei erlaubt die Software auch, sogenannte unstrukturierte Daten auszuwerten. Eine grosse Stärke von Watson
Content Analytics sei die linguistische
Analysefunktion. Für die Polizeiarbeit
sei das deshalb interessant, weil «bei
der Indexierung die Sprache der Dokumente automatisch erkannt und Wörter
und Satzteile ermittelt werden». Weitere
Begriffe, sogenannte Annotatoren, können für die Analyse bereitgestellt werden. Das Spektrum reiche von einfachen
Wortlisten über reguläre Ausdrücke bis
zu speziell programmierten Annotatoren. So könnten fall- und themenspezifische Begriffe auf sehr einfache Weise
in die Analyse einbezogen werden, führt
Höpli aus. Welche Erleichterung das bedeutet, wird klar, wenn man sich vor Augen führt, dass bisher die Erfassung und
die Auswertung der immensen Datenmenge von der Untersuchungsbehörde
in zeitraubender «Handarbeit» durch
Sachbearbeiter durchgeführt werden
mussten, wie Besson ausführt.
Watson als
Kommissar Computer
Bei IBM verdeutlicht Watson Solution
Architect Andreas Schneider die in der
Analysetechnik schlummernden Möglichkeiten. Mit ihr würden die Ermittler
bereits bei der Identifizierung von sämtlichem belastenden und entlastenden
Material unterstützt - was übrigens ein
wichtiger Faktor im «Fall Weil» gewesen sein soll. Watson Content Analytics
ermögliche schon hier eine Fokussierung auf die fallrelevanten Daten, weshalb es entsprechend breit angelegt sei.
Zunächst würde dazu der Zugriff auf
alle verfügbaren Dokumente auch aus
mehreren heterogenen Quellen sichergestellt. In einer thematischen Vorsondierung der Inhalte würden dann Relevanz und Häufigkeit eruiert. Durch
eine einfache Verknüpfung von Merkmalen lasse sich die Analyse dann auf
tatsächlich relevante Dokumente eingrenzen. Bei der Aufbereitung der Informationen kämen zudem unterschiedliche heuristische Verfahren zum Einsatz,
die etwa zufällige Stichproben erlauben,
Scheinkorrelationen ausschliessen oder
Statistiken ermöglichen. Doch Watson
hilft den Ermittlern auch beim Erstellen
von Thesen und ihrer Erprobung in dem
System, reduziert redundanten Leseaufwand oder unterstützt mit Grafiken das
Validieren von Schlussfolgerungen.
Während Watson nun in die Kapo
Zürich Einzug hält, ist es beim Militär
längst angekommen.
[ Redaktion ]
Watson als Kommissar Computer
könne aber noch weit mehr, wie IBMMann Schneider anfügt. So eigne sich
die semantische Analyse unstrukturierter Massendaten auch zur Kriminalitätsbekämpfung. Bei der Analyse
in Ermittlungsverfahren bestünde die
Möglichkeit zur «wirkungsoptimierten» Unterstützung, man könne Geoinformationssysteme integrieren und
zum Beispiel auch Daten als operative
und strategische Führungsinformationen verfügbar machen. Zudem trage
Watson Content Analytics zur sogenannten vorausschauenden Polizeiarbeit bei, wenn Brennpunkte im räumlichen Kriminalitätsgeschehen unter
Nutzung kriminalitätsrelevanter Datenquellen und mathematischer Verfahren vorhergesagt werden. Watson
würde über seine Analysen ausserdem helfen, Kriminalitätsfelder zu ermitteln oder die zeitlich-geografischen
Verläufe von Delikten zu prognostizieren. Schliesslich verweist Schneider auf
die Informationsgewinnung aus sozialen Netzwerken. Hier können mit dem
Rückgriff auf Watson frühzeitig Gefahrenankündigungen oder auch aufkommende Themen inklusive ihrer Meinungsmacher rasch erkannt werden.
Neben der Bewältigung wachsender Papiersammlungen
sind es bei der Polizei insbesondere unstrukturierte Daten,
die den Watson-Einsatz nötig machen.
Allerdings ist der Einsatz von Analyse-Software insgesamt noch ein junges Thema. Selbst im EU-Raum gebe
es erst wenige Anwender, sagt Höpli.
Laut Schneider sei ein Pilotprojekt erfolgreich bei einem Landeskriminalamt
(LKA) in Deutschland initiiert worden, bei dem die Hintermänner zu einem Fall von Online-Banking-Betrug
aufgedeckt wurden. Watson Content
Analytics stehe aber auch beim Kommando strategische Aufklärung der
deutschen Bundeswehr im Einsatz. Allerdings, ergänzt Höpli, wachse das Interesse, unstrukturierte Daten zu analysieren, enorm: «Viel
Potenzial sehen
wir bei Banken, Versicherungen oder in
der Telekommunikationsbranche». Das
System sei generell überall
dort sinnvoll
einsetzbar, wo
grosse Mengen
unstrukturierter Daten analysiert werden
müssen.
| blaulicht | gyrophare bleu | girofaro blu |
13