[ Redaktion ] [ deutsch ] Datenanalyse hält Einzug bei der Schweizer Polizei Erstmals setzt in der Schweiz die Kantonspolizei (Kapo) Zürich auf ein System zur Datenanalyse. Die Software liefert IBM, installiert wird sie von Unisys. Im Juli 2016 soll die AnalyseSoftware komplett betriebsbereit sein. VR Wie sehr inzwischen beispielsweise Gerichtsverhandlungen zur Dokumentenschlacht werden können, ist im Prozess der USA gegen den ehemaligen UBSBanker Raoul Weil allgemein bekannt geworden. Weil, der 2014 von einem amerikanischen Gericht einstimmig von dem Vorwurf der Verschwörung zum Zwecke des Steuerbetrugs freigesprochen wurde, hatte für seine Verteidigung einen Aktenberg von mehr als 4,5 Millionen elektronischen Seiten zu bewältigen. Ohne professionelle Datenanalyse, so Weil in seinem kürzlich unter dem Titel «Der Fall Weil» publizierten Erfahrungsbericht, wäre dieses Volumen nicht zu bewältigen gewesen. Nicht anders sieht es bei der Ermittlungsarbeit der Polizei aus. Sie steht von der Beweisaufnahme bis zur Sammlung fallrelevanter Fakten für Kriminaldelikte vor ständig wachsenden Datenbergen an potenziellem Beweismaterial. Das können Bild- oder Textdaten von verschiedenen Straftaten sein, wobei insbesondere im Bereich zur Bekämpfung der Kinderpornografie sehr grosse Datenmengen einschliesslich Videos sichergestellt werden, wie es bei der Kapo Zürich heisst. Dort sind allein in den letzten acht Jahren die Datenbestände von rund neun auf aktuell etwa 720 Terabyte um das Achtzigfache gewachsen. Wer sich die Zahl veranschaulichen will, muss sich vorzustellen versuchen, dass die Datenmenge von 720 Terabyte so viele Wörter enthält, wie die rund 320 Millionen Amerikaner verwenden, wenn sie sich knapp zehn Stunden lang permanent unterhalten würden. Und laut Peter Höpli, Spezialist für das «Crime and Fraud Management» bei Unisys Schweiz, werden die Datenbestände weiter wachsen. Sie seien heute zu rund 80 Prozent unstrukturiert, was es extrem aufwendig, teilweise sogar unmöglich mache, relevante Informationen zu finden, wie er ergänzt. Hier schaffe die moderne Technik «sehr schnell analysierbare Datensätze, in denen Zusammenhänge und Muster sofort erkennbar sind». Für die Polizeiarbeit bedeute dies, dass sie sich auf die Analyse und die eigentliche Ermittlerarbeit konzentrieren könne, zumal das frühere Lesen Hunderter von Dokumenten nicht besonders spannend gewesen sei und auch deshalb die automatisierte Analyse eine Erleichterung der Polizeiarbeit bedeute. Von der Beweisaufnahme bis zur Sammlung fallrelevanter Fakten professionalisiert Watson Content Analytics auch die Analyse unstrukturierter Datenberge. | blaulicht | gyrophare bleu | girofaro blu | 11 [ deutsch ] Pionierprojekt bei der Schweizer Polizei Es kann also durchaus verwundern, dass sich angesichts dieser Situation die Kapo Zürich erst jetzt entschieden hat, für 890.000 Franken ein von Unisys Schweiz geliefertes System zur Datenauswertung anzuschaffen, das auf der IBM-Software «Watson Content Analytics» basiert. «Die Ausschreibung und die Evaluierung geeigneter Software zur Effizienz- und Qualitätssteigerung bei der Datenauswertung dauerten sehr lange», sagt denn auch Marc Besson, Pressesprecher von der Kapo Zürich. Es habe sich um ein Pionierprojekt gehandelt, denn «andere Polizeikorps der Schweiz haben noch keine solchen Produkte im Einsatz». Man habe keinen direkten Vergleich durchführen können, was die Auswahl und Beschaffung wesentlich erleichtert und beschleunigt hätte. Unisys werde nun die nötige Hard- und Software liefern und das System in die «bestehende Infrastruktur der Datensicherung und -auswertung» integrieren. Die Software werde dann von ausgebildeten Kriminalanalysten bedient, «eine breite Streuung innerhalb der Ermittlungsdienste» werde es nicht geben, so Besson. Höpli ergänzt: «Die Ausbildung der Administratoren und Anwender beschränkt sich auf wenige Tage», denn die Bedienung sei einfach und schnell erlernbar. Allerdings seien Fachwissen und Erfahrung der Ermittler weiterhin gefragt. Auch wenn die Daten sehr schnell 12 | blaulicht | gyrophare bleu | girofaro blu | aufbereitet seien, müssten «die entsprechenden Rückschlüsse daraus immer noch die Fachleute» ziehen. Allerdings könnten durch das System mit den vorhandenen Ressourcen mehr Fälle in kürzerer Zeit analysiert werden. Worum es sich dabei konkret handelt, erklärt Höpli stark vereinfacht so: Die Textanalyse verlaufe in drei Schritten. Daten würden eingelesen, indexiert und dann analysiert. Als Datenquelle könnten dabei zum Beispiel sichergestellte Medien, Mailserver, Datenbanken oder Webseiten definiert werden, so Höpli. Dabei erlaubt die Software auch, sogenannte unstrukturierte Daten auszuwerten. Eine grosse Stärke von Watson Content Analytics sei die linguistische Analysefunktion. Für die Polizeiarbeit sei das deshalb interessant, weil «bei der Indexierung die Sprache der Dokumente automatisch erkannt und Wörter und Satzteile ermittelt werden». Weitere Begriffe, sogenannte Annotatoren, können für die Analyse bereitgestellt werden. Das Spektrum reiche von einfachen Wortlisten über reguläre Ausdrücke bis zu speziell programmierten Annotatoren. So könnten fall- und themenspezifische Begriffe auf sehr einfache Weise in die Analyse einbezogen werden, führt Höpli aus. Welche Erleichterung das bedeutet, wird klar, wenn man sich vor Augen führt, dass bisher die Erfassung und die Auswertung der immensen Datenmenge von der Untersuchungsbehörde in zeitraubender «Handarbeit» durch Sachbearbeiter durchgeführt werden mussten, wie Besson ausführt. Watson als Kommissar Computer Bei IBM verdeutlicht Watson Solution Architect Andreas Schneider die in der Analysetechnik schlummernden Möglichkeiten. Mit ihr würden die Ermittler bereits bei der Identifizierung von sämtlichem belastenden und entlastenden Material unterstützt - was übrigens ein wichtiger Faktor im «Fall Weil» gewesen sein soll. Watson Content Analytics ermögliche schon hier eine Fokussierung auf die fallrelevanten Daten, weshalb es entsprechend breit angelegt sei. Zunächst würde dazu der Zugriff auf alle verfügbaren Dokumente auch aus mehreren heterogenen Quellen sichergestellt. In einer thematischen Vorsondierung der Inhalte würden dann Relevanz und Häufigkeit eruiert. Durch eine einfache Verknüpfung von Merkmalen lasse sich die Analyse dann auf tatsächlich relevante Dokumente eingrenzen. Bei der Aufbereitung der Informationen kämen zudem unterschiedliche heuristische Verfahren zum Einsatz, die etwa zufällige Stichproben erlauben, Scheinkorrelationen ausschliessen oder Statistiken ermöglichen. Doch Watson hilft den Ermittlern auch beim Erstellen von Thesen und ihrer Erprobung in dem System, reduziert redundanten Leseaufwand oder unterstützt mit Grafiken das Validieren von Schlussfolgerungen. Während Watson nun in die Kapo Zürich Einzug hält, ist es beim Militär längst angekommen. [ Redaktion ] Watson als Kommissar Computer könne aber noch weit mehr, wie IBMMann Schneider anfügt. So eigne sich die semantische Analyse unstrukturierter Massendaten auch zur Kriminalitätsbekämpfung. Bei der Analyse in Ermittlungsverfahren bestünde die Möglichkeit zur «wirkungsoptimierten» Unterstützung, man könne Geoinformationssysteme integrieren und zum Beispiel auch Daten als operative und strategische Führungsinformationen verfügbar machen. Zudem trage Watson Content Analytics zur sogenannten vorausschauenden Polizeiarbeit bei, wenn Brennpunkte im räumlichen Kriminalitätsgeschehen unter Nutzung kriminalitätsrelevanter Datenquellen und mathematischer Verfahren vorhergesagt werden. Watson würde über seine Analysen ausserdem helfen, Kriminalitätsfelder zu ermitteln oder die zeitlich-geografischen Verläufe von Delikten zu prognostizieren. Schliesslich verweist Schneider auf die Informationsgewinnung aus sozialen Netzwerken. Hier können mit dem Rückgriff auf Watson frühzeitig Gefahrenankündigungen oder auch aufkommende Themen inklusive ihrer Meinungsmacher rasch erkannt werden. Neben der Bewältigung wachsender Papiersammlungen sind es bei der Polizei insbesondere unstrukturierte Daten, die den Watson-Einsatz nötig machen. Allerdings ist der Einsatz von Analyse-Software insgesamt noch ein junges Thema. Selbst im EU-Raum gebe es erst wenige Anwender, sagt Höpli. Laut Schneider sei ein Pilotprojekt erfolgreich bei einem Landeskriminalamt (LKA) in Deutschland initiiert worden, bei dem die Hintermänner zu einem Fall von Online-Banking-Betrug aufgedeckt wurden. Watson Content Analytics stehe aber auch beim Kommando strategische Aufklärung der deutschen Bundeswehr im Einsatz. Allerdings, ergänzt Höpli, wachse das Interesse, unstrukturierte Daten zu analysieren, enorm: «Viel Potenzial sehen wir bei Banken, Versicherungen oder in der Telekommunikationsbranche». Das System sei generell überall dort sinnvoll einsetzbar, wo grosse Mengen unstrukturierter Daten analysiert werden müssen. | blaulicht | gyrophare bleu | girofaro blu | 13
© Copyright 2024 ExpyDoc