Die Kunst der Vorhersage: Prognose-Modelle für den

Die Kunst der Vorhersage:
Prognose-Modelle für den öffentlichen Sektor
Dipl.-Geol. Magnus Reimann
Techn. Presales & Innovation
Consultant - ORAYLIS
Agenda
Erstellung von Vorhersagemodellen – Predictive Analytics
Einordnung in Business Intelligence-Lösungen
AzureML – Vorhersagemodelle in der Cloud
Anwendungsbeispiele im öffentlichen Sektor
ORAYLIS Überblick
 Spezialist für Big-Data- und Business-Intelligence-Lösungen
 Gegründet 1999
 70 Mitarbeiter
 Full-Service Business Intelligence
 Plan -> Build -> Run
 ORAYLIS ist Top BI Partner von Microsoft
 Outstanding HP and Microsoft Frontline Partner of the Year 2012
(Data Management)
 Black Belt Partner
 APS Premium Partner
 Shortlist Partner Microsoft Consulting Services (MCS)
 Hortonworks (Hadoop) System Integrator Partner
Microsoft Business Intelligence und Best Practice / Vorgehensmodell
4
Copyright ORAYLIS GmbH
Unsere Kunden
5
Agenda
Erstellung von Vorhersagemodellen – Predictive Analytics
Einordnung in Business Intelligence-Lösungen
AzureML – Vorhersagemodelle in der Cloud
Anwendungsbeispiele im öffentlichen Sektor
Data Mining gibt es schon so lange – was ist neu an Predictive & Big Data










GPS
Proximity Sensor
Ambient Light Sensor
3-Axis Accelerometer
Magnetometer
Gyroscopic Sensor
Wifi
Camera(s)
UI (senses user interactions)
iBeacon
IT Innovation is a major driver for Business Innovation
Disruptive Digital Transformation ahead…
8
Dream for decades… will it ever come true?
Dream for decades… will it ever come true?
Kevin Kelly, founder of Wired Magazine:
Singularity is the point at which "all the change in the last million years will
be superseded by the change in the next five minutes."
„Every industry is now a software industry where they are building these systems of
intelligence… provide SaaS services that go along with your products.“ - Nadella
Big Data treibt Big Data Mining Use Cases
No
Big Data
Problem
13
Predictive Analytics
 Ableitung von Trends und Verhaltensmuster
 Mit Hilfe verschiedener statistischer Methoden und Modellierungstechniken
 Erkennung von Mustern in aktuellen und historischen Daten
 Erstellung von Modellen für zukünftige Daten
14
Wichtigste Einflussfaktoren
15
Predictive Analytics
 Descriptive / Data Discovery (Beschreiben)
 Sammlung aller relevanten Daten, die zu
einem bestimmten Verhalten führen können,
um daraus ein Muster abzuleiten
 Diagnostic (Erklären)
 Entwicklung eines Modells, um die
vergangenen Verhaltensmuster zu
begründen
 Predictive (Vorhersagen)
 Entwicklung eines statistischen Modells, um
darüber Vorhersagen für die Zukunft
ableiten zu können
 Prescriptive (Empfehlen)
 Ausarbeitung von Empfehlungen,
um bei einem bestimmten Trend
das Ergebnis in eine gewünschte
Richtung zu beeinflussen
16
Grundziele
1. Drive Smarter Decisions from Data: Government agencies overwhelmed with vast
quantities of data transform this challenge to an asset, employing predictive analytics to
discover relationships and patterns hidden to the human eye that serve as actionable
insights to drive smarter decisions.
2. Reduce Fraud, Waste, and Abuse: Recover and prevent improper payments using
predictive analytics to score potential payments, claims and benefits for errors, fraud,
waste, and abuse.
3. Automate Manual Processes: Employ analytics of both structured and unstructured
data (text analytics) in order to streamline approvals of claims and benefits, and find
documents of interest (E-discovery).
4. Prioritize Resources and Maximize Productivity: Use predictive analytics to score
cases where there are an overwhelming number to quickly process, search, or audit –
including payments, hotline tips and complaints, applicants for benefits, cargo shipments,
products pending approval or patents, and others – ranking them so that managers,
investigators, and auditors are more productive and efficient, spending their time on the
most valuable cases.
Quelle: www.predictiveanalyticsworld.com/gov/about.php
17
Agenda
Erstellung von Vorhersagemodellen – Predictive Analytics
Einordnung in Business Intelligence-Lösungen
AzureML – Vorhersagemodelle in der Cloud
Anwendungsbeispiele im öffentlichen Sektor
Einordnung in bestehende Business Intelligence-Lösungen
Traditional BI
(Batch)
Past
Monitoring BI
(Realtime)
Lambda Architecture
Present
Predictive BI
(Machine Learning)
Future
19
Microsoft Machine Learing History & AzureML
20
The
Microsoft
Data
Platform

Einordnung in bestehende Business Intelligence-Lösungen
Quelle: Bitkom
22
„Früher“ hieß es DataMining – hier die Sicht auf das Excel Plugin für
die DataMining Algorithmen des SQL Servers (ab 2005)
Technologischer Key-Enabler for Big Data – HDInsight von Microsoft
24
HDInsight Eco-System
HDInsight Ecosystem
25
HDInsight – „On Premise/Boxed“ or „As a Service“ – How big is your cluster?
27
28
Agenda
Erstellung von Vorhersagemodellen – Predictive Analytics
Einordnung in Business Intelligence-Lösungen
AzureML – Vorhersagemodelle in der Cloud
Anwendungsbeispiele im öffentlichen Sektor
Datamining Prozess
Validerung/
Backtesting
Analyse
Abfrage des
Modells
Modellierung
Training des
Modells
AzureML
Quelle: Microsoft
31
Beispiel: Decision Tree
Wettbewerbsfähigkeit
Produkt: Befriedigend u.
schlechter
Gesamter Datenbestand
70%
30%
Anzahl Beschwerden ≥ 3
70%
Anzahl Beschwerden < 3
25%
15%
85%
30%
75%
Anzahl Verträge: > 4
Wettbewerbsfähigkeit
Produkt: gut und sehr
gut
45%
65%
10%
75%
Anzahl Verträge: 2 oder 3
25%
75%
Anzahl Verträge: 1
50%
50%
32
AzureML - Algorithmen
Quelle: Microsoft
33
Vergleich unterschiedlicher Algorithmen
34
35
AzureML – Eigene Algorithmen mit R
Quelle: Microsoft
36
Microsoft Power BI für Discovery und Visualisierung
37
Agenda
Erstellung von Vorhersagemodellen – Predictive Analytics
Einordnung in Business Intelligence-Lösungen
AzureML – Vorhersagemodelle in der Cloud
Anwendungsbeispiele im öffentlichen Sektor
Precobs
Mit Hilfe von Precobs (Pre Crime
Observation System) kann die
Polizei vorhersagen, wo zukünftig
eingebrochen wird und so effektiv
die Kriminalität nicht nur
aufdecken, sondern verhindern.
Entwickelt wurde die Software in
Oberhausen und ist bereits in
Zürich sowie testweise in München
und Nürnberg im Einsatz.
Bildrechte: imago stock&people
http://www1.wdr.de/themen/politik/precobs100.html
39
Aufteilung der Fläche nach Quadranten, PLZ-Gebieten o.ä.
40
Mögliche Messungen pro Gebiet und Tag
 Einwohnerdichte / Kaufpreisindex / Verbraucherindex / Grundstückspreise / Anteil
Einfamilienhäuser / Arbeitslosenquote / Grünflächen (Anteil) etc.
 Bevölkerungszusammensetzungen (Alter, Nationalität)
 Stadtfeste, Feiern, Schulferien, Feiertage (evtl. Häufigkeitsverteilung der Zieladressen von
Taxifahrten)
 Nähe zur Autobahn
 Jahreszeit (z.B. Anzahl Nachtstunden), Wetter und Wettervorhersage
 Einbrüche in den letzten 3/6/12/48 Wochen
 Verkehrsaufkommen, Straßenbeleuchtung, Anzahl Hunde pro 100 Einwohner, Verteilung der
Fahrzeugherkunft aus Verkehrsüberwachung
 Werte aus benachbarten Quadranten
 Seiteneffekte: Polizeipräsenz
Messgrößen
 Einbrüche nach Kategorie (Häuser, Wohnungen), Versuchte Einbrüche
41
LKA Deutschland - Einbruchsbekämpfung
42
Mögliches Vorgehen
Zukünftige Daten für die
Vorhersage
Analyse der Daten
Datenquellen
anbinden
Data Mining
Modell
Abstimmung mit
Ermittlungsexperten
Verwendung der Vorhersage für
Vermeidung von Einbrüchen
Absicherung / Verbesserung
43
Betrugserkennung mit Big Data-Technologien
44
Kostenersparnis bei Gebäudeinstandhaltung und Strom durch AzureML
45
Innovation is a manageable process – Innovation Lab & Consulting
46
Approaching the Modern Data Architecture
 Think Big
 Start Small
 Discover Visual
 Scale Fast
47
Go try
Microsoft Azure kostenlos testen:
http://azure.microsoft.com/de-de/pricing/free-trial/
AzureML:
http://azure.microsoft.com/en-us/services/machine-learning/
ORAYLIS Blog: Jens Kröhnert: Data Scientist & Predictive BI
http://blog.oraylis.de/2014/11/innovation-lab-data-scientist-predictive-bi/
Download Power BI Designer (kostenlos):
https://www.powerbi.com/dashboards/downloads/
ORAYLIS TV: Jens Kröhnert: Power BI Serie
https://www.youtube.com/user/oraylisbi
48