Besser vorbereitet: Predictive Analytics mit SAP HANA von msg

Success Story
Besser vorbereitet: Predictive Analytics
mit SAP HANA von msg
Seitdem der Mensch denkt, denkt er über die Zukunft nach – und versucht herauszufinden, was ihn erwartet.
Heute sind wir mehr als jemals zuvor in der Lage, Entwicklungen auf der Basis großer Datenmengen zu analysieren und vorauszusehen. Das Orakel der IT-Branche heißt Predictive Analytics: Mittels SAP HANA zeigte der
Branchenspezialist msg jetzt für einen namhaften Automobilhersteller, wie sich aus vorliegenden Daten Prognosen für die Zukunft ermitteln lassen.
Welche Gemeinsamkeiten haben Fahrzeuge, die
besonders reparaturanfällig sind oder bei denen im
Produktionsprozess Qualitätsmängel festgestellt
werden? Wo lassen sich aus den Gemeinsamkeiten
Regeln ableiten und wie kann man die Ergebnisse für
die Zukunft nutzen? Zusammen mit einem großen
deutschen Automobilhersteller ist msg diesen Fragen
nachgegangen. Dafür wurde die in SAP HANA integrierte SAP Predictive Analysis Library (PAL) auf der
bei msg vorhandenen IT-Infrastruktur aufgesetzt.
Die Analytics-Lösung ermöglicht komplexe Analysen
von auffälligen Bauteil-Kombinationen. Bei einer
geschätzten Anzahl von 100.000 Bauteilen sind allein
fast 4,5 Milliarden Zweierkombinationen denkbar
– mit der gewählten Lösung lassen sich jetzt auch
Kombinationen von drei, vier oder mehr Bauteilen
ermitteln, die jede herkömmliche interne IT-Infrastruktur vor große Probleme stellen würden.
SAP
Predictive
Analytics
SAP HANA
Studio / AFM
SAP
InfiniteInsight
SAP Applied
Analytics
Industry
Solutions
SAP RDS
Analytics
Solutions
Partner
Analytical
BI & Tools
SAP HANA
Non-exhausive SAP HANA capabillities below
Search
Rules Engine
SAP
Sybase IQ
HADOOP
Text Mining
R
Predictive
Business
Analysis Library Function Library
3rd Party
Data Source
SAP
Sybase ESP
Spatial
SAP Data
Services
Data types
Connects to SAP HANA directly OR via Sybase IQ / HADOOP / ESP / Data Services
Transaction
Data
Unstructured
Data
Real-time
Data
Location
Data
Machine
Data
Others
SAP Data Science Environment
.consulting .solutions .partnership
Data
Connectors
Analyse auf Basis von Warenkörben
Für die vorliegende Aufgabe wählten die Experten von
msg den sogenannten A-Priori-Algorithmus, ein aus
der Warenkorbanalyse bekanntes, statistisches Assoziationsverfahren. Damit ist es möglich, die Kombination
von gekauften Artikeln in einem Warenkorb anhand
von Regeln auszuwerten. Zu jeder Regel gibt es drei
Kennzahlen, die ihre Güte beschreiben: der „Support“
bezeichnet die relative Häufigkeit der Beispiele, in
denen die Regel anwendbar ist; die „Konfidenz“ zeigt,
wie häufig die Regel zutrifft; der „Lift“ gibt an, wie hoch
der Konfidenzwert über dem Erwartungswert liegt.
Assoziationsregel: WENN Artikel a DANN Artikel b
{a} ➝ {b}
WENN Artikelmenge X
DANN Artikelmenge Y
X➝Y
Dieses Verfahren wurde nun auf Bauteile von Fahrzeugen angewendet, indem die einzelnen Fahrzeuge
als „Warenkorb“ definiert und ein Bauteil als Analogie
zu einem „Artikel“ festgelegt wurde. Eine Eingangstabelle in SAP HANA erfasste zur Vorbereitung der
eigentlichen Analyse Fahrzeug und Bauteil. Anschließend wurde der Algorithmus auf einem Teildatenbestand mit unterschiedlichen Parametersätzen
ausgeführt, um den Analyseansatz zu kalibrieren und
festzustellen, wie viele Regeln aus dem Datenbestand
sinnvoll zu extrahieren sind.
Success Story
Regelbasierte Auswertung
Im Anschluss untersuchten die Experten von msg,
ob und in welchem Maß sich die Wahrscheinlichkeit einer Regel zwischen der Analysebasis „Fahrzeuggesamtheit“ und der Analysebasis „selektierte
Fahrzeuge“ – zum Beispiel die reparaturanfälligen
Fahrzeuge – unterscheidet. Der Algorithmus wurde dabei zunächst auf die Grundgesamtheit aller
Fahrzeuge angewendet, um die vorhandenen Regeln
und Kennzahlen zu ermitteln, und danach auf eine
selektierte Gruppe von Fahrzeugen. Auf Basis der Regeln, die in beiden Ergebnismengen vorkommen, ließ
sich dann die Differenz der Support-Werte berechnen.
So ist leicht zu erkennen, welche Regeln eine relativ
hohe Support-Differenz haben (siehe Markierungen
in der Abbildung). Genau hier liegt der Schlüssel zu
den Gemeinsamkeiten reparaturanfälliger oder im
Produktionsprozess nicht den Qualitätsvorgaben
entsprechender Fahrzeuge, denn diese Werte lassen
sich dann im Hinblick auf mögliche Ursachen interpretieren und auswerten.
für Business Intelligence und SAP HANA bei msg.
„Nur dann kann man am Ende die richtigen Schlüsse
ziehen und die zukünftige Strategie entsprechend
anpassen.“
Performante und schnelle Ergebnisse
Nach insgesamt rund sechs Wochen konnten im
vorliegenden Fall aus einer Gesamtmenge von über
5 Millionen Fahrzeug-Bauteil-Paaren innerhalb von
2 Minuten rund 11 Millionen Regeln ermittelt werden.
Durch die Performanz des gewählten Ansatzes ist es
möglich, die selektierte Fahrzeugmenge gezielt zu
verändern, diese Berechnungen in kurzen Zeiträumen
wiederholt durchzuführen und damit das Problem
interaktiv und iterativ einzugrenzen. So kann der Kunde
künftig die ursprünglich gestellte Frage nach den
Gemeinsamkeiten reparaturanfälliger Fahrzeuge problemlos beantworten. Darüber hinaus sind zahlreiche
weitere Einsatzszenarien denkbar: beispielsweise
könnten die gewonnenen Informationen in die Berechnung der Kfz-Versicherungsprämien einfließen.
Die Spezialisten von msg unterstützten den Kunden
in allen Aspekten des Projektes. Insbesondere die
Expertise der erfahrenen Data Scientists war bei der
Umsetzung der Lösung und der Analyse der Ergebnisse sehr gefragt. Denn um aus den Daten mit Hilfe
von Predictive-Analytics-Werkzeugen die richtigen
Rückschlüsse zu ziehen, ist vor allem die Fähigkeit
nötig, Zusammenhänge in den Daten erkennen und
richtig interpretieren zu können.
20%
18%
16%
14%
12%
10%
8%
6%
4%
2%
OFA->6AO
OVC->4LA
1N1->7XO
2B1->3YO
3L3->QAO
4LA->8Q1
4X1->1DO
5RQ->3YO
6E1->1N1
7XO->9JO
8SA->5D1
9AK->QVO
BO1->6AO
LOL->9DO
UOC->6R1
OG1->1N1
OLW->9MO
1BA->8E2
1EO->1VG
1NA->6EP
1TO->3MQ
1WD->8NA
1ZC->8NA
2TO->1EO
3C3->8E2
3GK->6R1
3MQ->4LA
3S2->9FA
4A3->9MO
4L6->5CO
4R3->8F2
4X3->2GO
5RQ->3B4
6PC->2GO
6SL->4TD
7AO->EOA
7P4->5SL
8E2->4K3
8L3->ODE
8RE->OGE
8T1->VXO
9DO->FB3
9JA->1VG
9WO->1AT
BOA->1BA
FOA->9Y1
JOR->1Q1
Q2J->1Q1
UOC->OGE
0%
Bauteilkombinationen im Vergleich: Delta Support
„Voraussetzung für eine erfolgreiche PredictiveAnalytics-Anwendung ist eine strukturierte Herangehensweise, bei der der Schwerpunkt auf der sorgfältigen Auswahl und Vorbereitung der zu analysierenden Daten liegt“, betont Dr. Christian Levin, Experte
msg systems ag
Robert-Bürkle-Straße 1 | 85737 Ismaning/München
Telefon: +49 89 96101-0 | Fax: +49 89 96101-1113
www.msg-systems.com | [email protected]
„Neben hoch performanten, zuverlässigen AnalyseTools ist die Expertise der Data Scientists essentiell“, unterstreicht Dr. Christian Levin. „Technisch
ausschlaggebend für den Erfolg des Projekts waren
die Schnelligkeit durch die In-memory-Technologie
sowie die Funktionsbibliothek PAL von SAP HANA.
Bei ähnlichen Projekten oder Testläufen, die wir bei
uns für Kunden verschiedenster Branchen durchführen, hat sich diese Lösung sehr bewährt.“
Mehr Informationen und
Publikationen finden Sie
in unserem BI-Internetauftritt.
http://www.msg-systems.com/bi
XBI-030-1411-1
Delta
Support