DER Partner, der Business in IT übersetzt

DER Partner, der Business in IT übersetzt
TDWI Konferenz 2015
22. - 24. Juni 2015
Einführung einer Big Data Plattform bei einem Automobilkonzern
© Copyright Woodmark Consulting AG, Grasbrunn
Dokumenteneigentümer: Rainer Unsöld
Öffentlich
Agenda
 Woodmark
 Big Data
 Projektauftrag
 Technische Architektur
 Use Case
 Zusammenfassung
Öffentlich
2
Woodmark Consulting AG auf einen Blick
Öffentlich
Dienstleistungsportfolio Big Data und Analytics
Wartung und
Support
Business
Consulting
Programmund ProjektManagement
Design und
Konzeption
Umsetzung
Öffentlich
4
Big Data und Analytics Spektrum
BI-Strategie, Organisation und Prozesse
Reporting, Analyse und Steuerung
Planung und Simulation
Predictive Analytics
Data Warehouse
Architektur
Big Data
Öffentlich
5
Die Besten vertrauen auf Woodmark
Automobilindustrie
Bank und
Versicherung
Pharma
Sciences
Öffentlich
Öffentlicher
Dienst
weitere
Kunden
6
Wir haben starke Partner
Öffentlich
7
Agenda
 Woodmark
 Big Data
 Projektauftrag
 Technische Architektur
 Use Case
 Zusammenfassung
Öffentlich
8
Der Versuch Big Data zu definieren hat ein Prinzip hervorgebracht,
welches eine erste Strukturierung unterstützt.
Das 3V - Prinzip
 Volume:
Die exponentiell steigenden Datenvolumia verlagern den Fokus auf
Datenspeicherstrategien und Technologien
 Velocity:
Die Geschwindigkeit der Datenerzeugung über heterogene Quelllen
nimmt drastisch zu
 Variety:
Die Vielfalt der Daten steigt und die Datentypen (strukturiert, semistrukturiert und unstrukturiert) variieren
Öffentlich
9
Das Themengebiet Big Data lässt sich in folgende
Handlungsfelder aufteilen.
Quelle: BITKOM Leitfaden Big Data Technologien (2014), S. 23
Öffentlich
10
Was bringt uns Hadoop in Abgrenzung zu klassischen
BI Lösungen?
Drei Fähigkeiten bilden den Kern von Hadoop
1. „Skalierbarkeit bezahlbar machen“ d.h. Daten so preiswert speichern wie
möglich
2. Daten auf vielfältige und flexible Weise zu <<befragen>> um umsetzbare
und wertvolle Erkenntnisse zu gewinnen
3. Erkenntnisse zeitnah zur Verfügung stellen
Die Nachteile der klassischen Lösungen werden somit negiert
 Versagen bei „variety“
 Hohe Kosten pro Terabyte => Datenmengen übersteigen verfügbare
Budgets
Öffentlich
12
Die Speicherkosten pro Terrabyte, werden durch Hadoop
Einsatz signifikant gesenkt.
Öffentlich
13
Agenda
 Woodmark
 Big Data
 Projektauftrag
 Technische Architektur
 Use Case
 Zusammenfassung
Öffentlich
14
Projektauftrag bei Daimler:
Ausgangsbasis
Kundennutzen


Ein Verantwortlicher für das Gesamtprojekt

Einsparungen beim Aufsetzen von zukünftigen
neuen Projekten im operativen Betrieb (z.B.
Support), bei der Infrastruktur und bei den
Lizenzkosten

Schaffen von Grundlagen (Service Katalog) für
den Dialog mit den Business und für die
Zusammenarbeit mit den nachgelagerten
internen und externen Dienstleistern des
Competence Centers

Governance durch klare Vorgaben hinsichtlich
Projekt-Onboarding. Eindeutig beschriebene
Rollen und Umsetzung der Policies unter
Verwendung handhabbarer Checklisten
Vorstudie


Durchführen eines PoC´s
Einführung einer konzernweiten Big Data
Plattform

Projektmanagement

Implementierung folgender Komponenten:
- Predictive Analytics (IBM SPSS)
- Hadoop 2.1 (Hortonworks)
Projektergebnis

Technische & organisatorische Bereitstellung
der Plattform

Konzeption und Einführung aller notwendigen
Prozesse  Readiness für Onboarding
Projekte

Know-how Transfer an das Application
Operations Team in Indien
Öffentlich
Das Projektumfeld
Verteiltes Projektteam incl. 40% Offshore
Anteil
• Projektmanagement in
Stuttgart
• Application Owner/Betrieb
in Bangalore
• DataCenter in Stuttgart
• Center of Excellence in
Stuttgart
Deutschland
Indien
Öffentlich
16
Business Analytics Architektur
Data Science with SPSS Modeler
Data
Description
Analytics
Descriptive Analytics
Reuse and integrate existing BI frontend platforms (iBISS, MS-BISS,
QV-BISS)
Data
Description
Reporting
Integration of SPSS Modeler Technology in Daimler IT Landscape
Diagnostic Analytics
Data
Mining
Analytic
Archiving
Big Data
Storage
100% Hadoop
ecosystem open
source distribution.
Hortonworks
Data
Platform
Data
Sourcing
Data
sources
Unstructured
Data
and others:
Data
Sourcing
Data
Processing
& Storage
Data
Mining
BI Data Warehouses
Existing Sources
Emerging Sources
(CRM, ERP, Clickstream, Logs)
(Sensor, Sentiment, Geo, Unstructured)
Öffentlich
17
Hortonworks Data Plattform (HDP 2.3)
Big Data
Storage
100% Hadoop
ecosystem open
source distribution.
Öffentlich
Hortonworks
Data
Platform
18
Project Scope dargestellt im CRISP DM Collaboration
Prozess
Öffentlich
19
IBM Analytics Plattform methodische Vorgehensweise
Process
Professional Big Data
Platform
Architecture
Infrastructure
Collaboration
BIG Data Test Cases
BIG Data Use Cases
review on product
retrospective on process
-Tailored
Service Models-
Big Data Platform
- Pilot Projects -
review on product
retrospective on process
Big Data Platform
- Basic Version review on product
retrospective on process
Prototype
Öffentlich
20
Agenda
 Woodmark
 Projektauftrag
 Technische Architektur
 Use Case
 Zusammenfassung
Öffentlich
21
Technische Architektur
Öffentlich
22
Agenda
 Woodmark
 Big Data
 Projektauftrag
 Technische Architektur
 Use Case
 Zusammenfassung
Öffentlich
23
Use Case: S-Klasse Motorhaubespaltmasse
Problemstellung
• Spaltmasse der
Motorhaube
uneinheitlich bei
Produktion SKlasse
Analyse
• Extraktion der
Maschinendaten …
• Verdichtung…
• Bildung von DatenKorrelationen…
• Analyse…
Öffentlich
Lösung
• Auswertung der
Ergebnisse
• Einleitung
korrigierender
Maßnahmen
24
Agenda
 Woodmark
 Big Data
 Projektauftrag
 Architektur
 Use Case
 Zusammenfassung
Öffentlich
25
Projekt Zusammenfassung:
Result / Ergebnis
• In 6 Monaten wurde eine konzernweite Big Data Plattform incl. prediktive
Analytics Komponente, bereitgestellt
Benefit / Nutzen
• Kosteneinsparung beim onboarding neuer UseCases
• Time to Market durch adhoc verfügbare, skalierbare Server und Services
• Qualität durch Standards bei Prozessen
• Governace durch klare Rollen und Verantwortlichkeiten
Challenge /
Herrausforderung
Lessons Learned /
???
• Verteiltes Projektteam incl. 40% Offshore Anteil
• 6 Monate Projektlaufzeit
• Neue Technologien
• Offshore Teammitglieder frühzeitig und eng ins Projekt einbinden und
dadurch aufwendigen Know-how Transfer vermeiden
• Hohe Disziplin bei der Einhaltung der agilen Regeln ermöglicht flexibles
Changemanagement im Projekt
Öffentlich
26
Kontaktdaten
Öffentlich
27