Wie die
Technologie-Evolution
für Analytics einen
„Datensee“ ermöglicht
Michael Ehrmantraut
(Executive IT Architect, FSS)
Mainframe Aktuell 2015
Nürnberg, den 13. November
Analytics
Agenda
1. Die Herausforderung an Unternehmen
durch die Digitalisierung
2. Die Analytics „Schattierungen“
3. Data Reservoir
1
IBM Analytics – Wie die Technologie-Evolution für Analytics einen „Datensee“ ermöglicht
M. Ehrmantraut
v 0.2
© 2015 IBM Corporation
2
Die Herausforderungen
an Unternehmen durch die
Digitalisierung
IBM Analytics – Wie die Technologie-Evolution für Analytics einen „Datensee“ ermöglicht
M. Ehrmantraut
1
v 0.2
© 2015 IBM Corporation
Der Begriff „Digitalisierung“ im Wandel der Zeit
„Cognitive
Berater“
Analytics Maturity
„ProzessAutomatisierung“
„Datenzentrierung“
„multiChannel“
„papierloses
Büro“
• „eAkte“ / ECM
• Suchen, Darstellen
• Scannen, OCR
Zeit
3
• „One-Click-Abschluss“
• BPM, Cloud,
Mobile First
• Big Data / 360°
• Next-Best-Action
• Hadoop, Social Media
• Kioske, Web-Shops
• Call-Center
• SOA, 3-Tier
IBM Analytics – Wie die Technologie-Evolution für Analytics einen „Datensee“ ermöglicht
• Advisor- / Expertensystem
• IBM Watson
Erwartungen und Verhalten von
Kunden, Partnern und Mitarbeitern haben sich nachhaltig
verändert. Im Back-Office bieten
sich durch Automatisierung
erhebliche Effizienzpotenziale.
Die Verbindung von Hyperdigitalisierung von
Inhalten und Lebenssituationen mit Social Media
Analytik schafft neue Möglichkeiten und
Bedrohungen im etablierten Geschäftsmodell
Digitalisierung ist nicht nur ein technologisches,
sondern vor allem ein gesellschaftliches Phänomen.
M. Ehrmantraut
v 0.2
© 2015 IBM Corporation
Vier Faktoren treiben durch ihr Zusammenspiel die digitale Transformation.
Mobiler Lebensstil
Zugang in die digitale Welt immer und überall.
Smartphones (Wearables,...) plus „Konten“ werden zur digitalen Identität
der Menschen
Visuelle und akustische Darstellung von Inhalten für Menschen.
Social Media
Explosion
Hyperdigitalisierung
Alle Inhalte werden digitalisiert
(Musik, Filme, Bücher, Fotos,...).
In allen Lebenssituationen
werden Daten erzeugt (von
Smartphones, Sensoren,...)
Jeder Konsument wird zu
einem Produzenten von
Inhalten („Procument“)
Bedürfnis nach
Selbstdarstellung treibt
Nutzung der Plattformen.
Zwischenmenschliche
Interaktion wird digital
aufgezeichnet.
*
Macht von Daten und Analysen
Mächtige Technologien sind verfügbar, die alle Informationen
(unstrukturiert, strukturiert) in Echtzeit kognitiv auswerten können
und Menschen visuell und in menschlicher Sprache verfügbar
gemacht werden..
Die Digitalisierung verändert massiv die Kundeninteraktion (Front-OfficeTransformation) und die Anbindung ans Back-Office.
4
IBM Analytics – Wie die Technologie-Evolution für Analytics einen „Datensee“ ermöglicht
M. Ehrmantraut
v 0.2
© 2015 IBM Corporation
Auch der Begriff „Analytics“ unterliegt einem Wandel.
Dabei wird „Analytics“ oft entlang unterschiedlicher Dimensionen definiert.
Dimension: Analytics Maturity Modell
Dimension: Datentyp
Dimension: Datennutzung
Dispositive
Daten
Operative
Daten
5
IBM Analytics – Wie die Technologie-Evolution für Analytics einen „Datensee“ ermöglicht
M. Ehrmantraut
v 0.2
© 2015 IBM Corporation
6
Die Analytics
„Schattierungen“
IBM Analytics – Wie die Technologie-Evolution für Analytics einen „Datensee“ ermöglicht
2
M. Ehrmantraut
v 0.2
© 2015 IBM Corporation
1
In-Transaction-Analytics (In-Tx-Analytics):
Die klassische Wurzel von Analytics in Enterprises
Operational
Systems
Beschreibung:
Anwendung basiert auf
IMS, CICS oder einer
relationalen Datenbank
(RDBMS)
Tx
Daten-Verarbeitung:
• DB Transaction (Tx)
− Short running
− All-or-nothing
• OLTP Load
• ACID Prinzip
Application
Use Cases:
a) Traditionell:
Einfache Berechnungen und Aggregationen, um Laufzeit zu minimieren
b) Zukunft:
“Money Laundering” (Analytics während Zahlungsverkehrs Transaktionen)
Infrastruktur:
- Text basierte Terminals
- IBM System Z
- AS400
- BS2000
Treiber:
a) Regulatorische Anforderungen
In-TX-Analytics
7
IBM Analytics – Wie die Technologie-Evolution für Analytics einen „Datensee“ ermöglicht
M. Ehrmantraut
v 0.2
© 2015 IBM Corporation
2
Post-Transaction-Analytics(Post-Tx-Analytics):
Analytics wird komplexer, da stärker entkoppelt von Tx
Operational
Systems
Tx
Step of Workflow
Datenverarbeitung:
• Workflow
• DB Transaction (Tx)
• DB Queries
− long running
− Wohl-definiert
• Mixed Load
− OLTP
− OLAP für Analytics
• ACID Prinzip
ESB
Analytics
Analytics
Application
Beschreibung
Anwendung basiert auf
relationaler Datenbank
(RDBMS)
non-operational System
Use Cases:
a) “Know-your-customer” (KYC)
b) “Peer group validation”
c) Trends gehen in Richtung Analytics auf nicht-operationalen bzw. dispositiven Systemen
8
Treiber:
a) ESB:
Initiativen wie z.B. SOA, Big Data, Digitalisierung
b) UseCases:
Regulatorische Anforderungen, Prozess Optimierungen
IBM Analytics – Wie die Technologie-Evolution für Analytics einen „Datensee“ ermöglicht
Infrastruktur:
- Web Anwendungen
- IBM System Z
- RDBMS
- Unix / Windows Anw..
- Enterprise Service Bus
Post-TXAnalytics
M. Ehrmantraut
v 0.2
© 2015 IBM Corporation
3
Operational Analytics(OpAnalytics):
Verwendet durch Analysten mit Interesse an spezifischen Daten
Operational
Systems
Beschreibung
Analytics Werkzeug /
Anwendung verwendet
SQL zum direkten Zugriff
auf die Operationalen
Systeme
Application
OpAnalytics – alternative A: “direct”
Copy
Replication
E(T)L
OpAnalytics – alternative B: “Copy”
OpAnalytics – alternative C: “Data Mart”
Use Cases:
a) Analysen auf homogenen Daten eines Einzelsystems oder einer Systemgruppe
b) Use Case Beispiel: Berechnung von Quartals-Berichten
c) Trend: Forderung nach immer mehr Ad-Hoc Abfragen
Datenverarbeitung:
• DB Queries
− long running
− well-known
− Ad-hoc
• OLAP Load
• System RessourcenSeiteneffekte mit Op.
System möglich in
Alternative “direct”!
Infrastructure:
- RDBMS
- Reporting Werkzeuge
(COGNOS, SPSS, N)
- Windows Frontend
Treiber:
a) Verwendung von Daten, die sehr „nah“ (zeitlich & inhaltlich) an den Operationalen
Systemen sind
9
IBM Analytics – Wie die Technologie-Evolution für Analytics einen „Datensee“ ermöglicht
M. Ehrmantraut
Operational
Analytics
v 0.2
© 2015 IBM Corporation
4
Dispositive Analytics(DisAnalytics):
Der traditionelle Weg für Analysen in Unternehmen
Operational
Systems
Beschreibung
Analytics Werkzeug /
Anwendung verwendet via
SQL ein Data Warehouse
(DWH), welches mit
transformierten Daten
geladen wurde.
Dispositive
Systems
Application
Extract
Extract
Core DWH
Analytics DWH
Data Marts
Data Warehouse
Application
Use Cases:
a) Reporting, Controlling, Vertriebssteuerung, Regulatorische Meldungen u.v.m.
Datenverarbeitung:
• DB Queries
− long running
− well-known
− (Ad-hoc)
• OLAP Load
• Entkoppelt von
Op. Anwendungen!!
Infrastruktur:
- UnternehmensDatenmodelle
- RDBMS
- Reporting Werkzeuge
(COGNOS, SPSS, N)
Treiber:
a) Zentraler, unternehmensweiter Datenhaushalt
Dispositive
Analytics
b) Transformation: Konsolidierung, Bereinigung (cleansing), Filterung
c) Aufbau einer Datenhistorie mit fachlichen und technischen timestamps
10
IBM Analytics – Wie die Technologie-Evolution für Analytics einen „Datensee“ ermöglicht
M. Ehrmantraut
v 0.2
© 2015 IBM Corporation
5
Big Data Analytics(BDAnalytics):
Der Weg zur Erweiterung des DWH für neue Datentypen und Analytics
Operational
Systems
Beschreibung:
Unstrukturierte Daten
(Dokumente, Social Media,
Multimedia) oder
strukturierte Daten
(Replikate, Archive,
externe) wird “as-is”
gespeichert
Dispositive
Systems
Application
Extract
Extract
Core DWH
Analytics DWH
Data Marts
Data Warehouse
Replication
/ Load
Landing
Zone
External
Sources
Table
Zone
Big Data HUB
11
Infrastruktur:
- High-perform. cluster
(HPC) auf low-cost x86
Hardware
- Hadoop/Spark Eco-Sys.
- Reporting Tools
(COGNOS, SPSS, N)
Big Data
Analytics
Use Cases:
a) Typische Big Data Use Cases
Social
Media
Datenverarbeitung:
• „As-is“ Speicherung
• Massive parallele
Datenverarbeitung
• Text Analyse
• Batch Prozessierung
• BASE Prinzip
Treiber:
a) Ermöglicht Analytics auf bis dato nicht verfügbaren Daten
IBM Analytics – Wie die Technologie-Evolution für Analytics einen „Datensee“ ermöglicht
M. Ehrmantraut
v 0.2
© 2015 IBM Corporation
6
In-Hadoop-Analytics(InHadAnalytics):
Der Trend: Bringe Analytics zu den Daten (vs. Datenabfragen)
Operational
Systems
Beschreibung:
Erweiterung der Big Data
Analytics durch
Verlagerung des Analytics
Algorithmus in das Hadoop
Cluster hinein
Dispositive
Systems
Application
Extract
Extract
Core DWH
Analytics DWH
Data Marts
Data Warehouse
Replication
/ Load
Landing
Zone
External
Sources
Table
Zone
Deep
Analytics Z.
Big Data HUB
Datenverarbeitung:
• „As-is“ Speicherung
• Massive parallele
Datenverarbeitung
• Text Analyse
• Batch Prozessierung
• BASE Prinzip
Infrastruktur:
- High-perform. cluster
(HPC) auf low-cost x86
Hardware
- Hadoop/Spark Eco-Sys
- Reporting Werkzeuge
(BigSheets, SPSS, R,
SAS)
In-Hadoop
Analytics
Use Cases:
a) Big Data Analytics mit extrem parallelisierten Algorithmen
Social
Media
12
Treiber:
a) Deep Analytics auf sehr großen Datenmengen
IBM Analytics – Wie die Technologie-Evolution für Analytics einen „Datensee“ ermöglicht
M. Ehrmantraut
v 0.2
© 2015 IBM Corporation
7
Analytics auf Near-Time Daten (NTDataAnalytics):
Der Trend zur Nutzung aktueller Daten für Analytics (vs. tagesaktuell)
Operational
Systems
Beschreibung:
Ersetzen von klassischen
ETL basierten LadeVerfahren durch
Replikation
Dispositive
Systems
Application
OpAnalytics – alternative A: “direct”
Replication
Core DWH
Replication
Analytics DWH
Data Marts
Data Warehouse
Replication
Landing
Zone
Table
Zone
Deep
Analytics Z.
Big Data HUB
Use Cases:
a) Real-time Kopie von Daten für Analytics
Datenverarbeitung:
a) Direkter Zugriff auf
Quellsysteme bei
bereits erwähnten
Seiteneffekten
b) Schrittweise “neartime” Kopie von
Quelldaten zur
Vermeidung der
erwähnten
Seiteneffekte
Infrastruktur:
- Quelle: RDBMS
- Ziel: RDBMS oder
Hadoop / Spark
- Reporting Werkzeuge
(Cognos, SPSS, N)
Analytics on
near-time data
Treiber:
a) Aktuelle Sicht auf Unternehmensdaten
13
IBM Analytics – Wie die Technologie-Evolution für Analytics einen „Datensee“ ermöglicht
M. Ehrmantraut
v 0.2
© 2015 IBM Corporation
8
Real-Time- / Stream- Analytics(StreamAnalytics):
Analytics auf großen, nicht persistierten Datenströmen
Operational
Systems
Dispositive
Systems
Use Cases:
a) Analytics auf “data in motion”
Treiber:
a) Zeitnahe Reaktion auf Events, die aus großen Datenströmen zu identifizieren sind
Core DWH
Analytics DWH
Data Marts
Data Warehouse
Landing
Zone
Table
Zone
Deep
Analytics Z.
Sensor
Big Data HUB
OP
OP
OP
Social
Media
14
Beschreibung:
Analytics auf großen
Datenströmen durch
Filterung, Aggregation und
andere Berechnungen auf
interessanten Teilbereich
reduziert.
Datenverarbeitung:
• “Data-in-motion”
• parallele Stream
Prozessierung
• Nur Ergebnisse
werden persistiert
Infrastruktur:
- Stream Analytics
Werkzeuge
- Benutzung von
Datenspeichern
(DWH, Hadoop, Spark)
für Ergebnis
Persistierung
OP
OP
Stream
Analytics
OP
OP
Stream Analytics
IBM Analytics – Wie die Technologie-Evolution für Analytics einen „Datensee“ ermöglicht
M. Ehrmantraut
v 0.2
© 2015 IBM Corporation
9
In-Memory-Analytics (InMemAnalytics)
Verwendung des Hauptspeichers zur Beschleunigung von Analytics
Operational
Systems
Beschreibung
Hauptspeicherbasierte
Datenverwaltung in Verbindung mit spaltenbasierter Organisation der
Daten zur Beschleunigung
von OLAP Analytics.
Dispositive
Systems
Application
Core DWH
Analytics DWH
Data Marts
Data Warehouse
Landing
Zone
Table
Zone
Deep
Analytics Z.
Big Data HUB
OP
OP
OP
Datenverarbeitung:
• OLAP Load
• High Performance
Abfragen
• Benötigt zusätzliche
Persistierung
(z.B. RDBMS)
Infrastruktur:
- In Memory Datenbank
- Große Datenmengen
benötigen trotz sehr
guter Komprimierung
(teuren) RAM
OP
OP
In-Memory
Analytics
OP
OP
Stream Analytics
15
IBM Analytics – Wie die Technologie-Evolution für Analytics einen „Datensee“ ermöglicht
M. Ehrmantraut
v 0.2
© 2015 IBM Corporation
“All Shades of Analytics” in einer Gesamtübersicht
Operational
Systems
Tx
Tx
Application
1
Dispositive
Systems
In-Transaction
Analytics
2
Step of Workflow
Post-Transaction
Analytics
ESB
7
Analytics
Near-time Analytics
Operational Analytics
Extract
Extract
Core DWH
Analytics DWH
Data Marts
4
Data Warehouse
Replication
/ Load
5
Landing
Zone
Table
Zone
External
Sources
6
Big Data HUB
OP
Sensor
Social
Media
16
Deep
Analytics Z.
OP
OP
OP
OP
8
OP
OP
Stream Analytics
IBM Analytics – Wie die Technologie-Evolution für Analytics einen „Datensee“ ermöglicht
M. Ehrmantraut
Dispositive
Analytics
Big Data
Analytics
In-Memory Analytics
3
9
In-Hadoop
Analytics
Stream
Analytics
v 0.2
© 2015 IBM Corporation
3
Data Reservoir
17
IBM Analytics – Wie die Technologie-Evolution für Analytics einen „Datensee“ ermöglicht
M. Ehrmantraut
v 0.2
© 2015 IBM Corporation
Typische Anforderungen der Fachbereiche bei UnternehmenN
Fachbereichsmitarbeiter benötigen Zugang zu den Informationen ihres Unternehmens,
um sie zu untersuchen, auszuwählen, zu kontrollieren und zu erweitern. Dabei möchten
sie ihre eigene Geschäftsterminologie unter Berücksichtigung eines Mindestmaß an
Sicherheit und Governance nutzen.
Data Scientisten suchen Daten für
neue analytische Modelle.
• Day-to-day Aktivitäten
• benötigen Ad-hoc Zugang
zu einem weiten Feld an
Datenquellen.
• Unterstützen Analysen
und Entscheidungsfindungen.
• Verwenden
Geschäftsterminologie.
Marketiers suchen Daten für neue
Kampagnen.
Betrugsfahnder suchen Daten um
die Details von suspekten Aktivitäten zu verstehen
Erwünscht ist die Flexibilität von Spreed Sheets aber
mit den Skalierungsmöglichkeiten für sehr große
Volumen und eine breite Palette von unterschiedlichen Informationstypen - jedoch unter
Berücksichtigung von Konzepten zum Schutz,
Optimieren und Bereitstellen von Daten.
18
IBM Analytics – Wie die Technologie-Evolution für Analytics einen „Datensee“ ermöglicht
M. Ehrmantraut
v 0.2
© 2015 IBM Corporation
N resultieren in einem Spannungsfeld mit der IT des Unternehmens.
Fachabteilungen möchten
•
•
•
uneingeschränkten Zugang zu allen verfügbaren Informationen
mächtigere Analyse- und Visualisierungs-Werkzeuge
Schnelle Umsetzung und niedrige Kosten für die
Bereitstellung neuer Daten
IT Abteilungen sorgen sich um
•
Fachabteilungen betreiben
•
•
•
•
IT Abteilungen
eigene Server mit zusätzlichen Daten
•
bewirtschaften Daten manuell
meist fehlende Governance
•
betrachten Datenqualität als „IT Problem“ •
Aufbau einer sog. Schatten-IT
Compliance
19
• Klare und stabile Prozesse
• Datenqualität und Pflegeprozesse
• Wartung und Pflege von Anwendungen
• Einhaltung von Unternehmensstandards
Governance und regulatorische Anforderungen
Datenqualität
konzentrieren sich auf Kernbereiche
wie z.B. Produktionssysteme und DWH
verharren weiterhin in starren Prozessen
ignorieren Brüche der Standards
„saubere“ aber unflexible Kern-IT
Unternehmens-Standards
IBM Analytics – Wie die Technologie-Evolution für Analytics einen „Datensee“ ermöglicht
M. Ehrmantraut
Gesamt-IT-Kosten
v 0.2
© 2015 IBM Corporation
Der Wunsch: Ein Data Lake für alle verfügbaren Informationen
Ein Data Lake
• enthält alle verfügbaren Informationen
eines Unternehmens
(strukturiert/unstrukturiert, intern/extern)
• bietet standardisierten Zugriff
• enthält Daten unterschiedlicher Herkunft
und Qualität koexistent nebeneinander
Durch exzessive Nutzung dieses
Konzeptes kann jedoch ein
Data Swamp entstehen!
• Nutzer verlieren den Überblick bei den
verfügbaren Daten
• Das Vertrauen in die Daten (-Qualität)
geht schrittweise verloren
• Informationen sind zwar verfügbar aber
nicht auffindbar
20
IBM Analytics – Wie die Technologie-Evolution für Analytics einen „Datensee“ ermöglicht
M. Ehrmantraut
v 0.2
© 2015 IBM Corporation
Die Idee: Ein Data Reservoir
Ein Data Reservoir
• enthält ebenfalls alle verfügbaren
Informationen eines Unternehmens, verfügt jedoch über
eine strenge „Zulaufkontrolle“
• enthält als zentrale Komponente
einen Katalog mit Metadaten
(fachlich, technisch, dynamisch)
zu allen verfügbaren Informationen
• Der Katalog ist der Schlüssel
sowohl für die Kontrolle der Daten
als auch für deren Nutzung
21
IBM Analytics – Wie die Technologie-Evolution für Analytics einen „Datensee“ ermöglicht
M. Ehrmantraut
v 0.2
© 2015 IBM Corporation
22
Was ist ein
Data Reservoir?
IBM Analytics – Wie die Technologie-Evolution für Analytics einen „Datensee“ ermöglicht
M. Ehrmantraut
v 0.2
© 2015 IBM Corporation
Was ist ein Data Reservoir?
Data Reservoir Services
Ein Data Reservoir ist ein Data Lake, der
alle Daten eines Unternehmens für vielfältige Arten von Analytics enthält wie z.B.:
–
–
–
–
–
Discovery und Exploration
Simple Ad-hoc Analysen
komplexe Analysen für Geschäftsentscheidungen
Reporting
Echtzeit-Analysen
Es ist möglich, Analytics in das Data
Reservoir zu verlegen, um zusätzlichen
Erkenntnisse über die Daten zu erlangen.
Ein Data Reservoir verwaltet gemeinsam
genutzte Repositories mit Informationen
für analytische Zwecke.
Jedes Data Reservoir Repository ist für
einen speziellen Typ von Analytics optimiert
(Real-time Analytics, Data Mining,
explorative Analytics, OLAP, Reporting, …)
23
Data Reservoir Repositories
Information Management and Governance Fabric
Data Reservoir
Daten können prinzipiell mehrfach in
verschiedenen Repositories enthalten
sein, sie wurden jedoch kontrolliert und
katalogisiert mittels einer klar definierten
Verarbeitungskette hinzugefügt.
Daten können über unterschiedliche
Schnittstellen - den Data Lake Services ausgelesen werden.
IBM Analytics – Wie die Technologie-Evolution für Analytics einen „Datensee“ ermöglicht
M. Ehrmantraut
v 0.2
© 2015 IBM Corporation
24
11
Typisches FSS
DWH Scenario
IBM Analytics – Wie die Technologie-Evolution für Analytics einen „Datensee“ ermöglicht
M. Ehrmantraut
v 0.2
© 2015 IBM Corporation
IBM Referenzarchitektur für Advanced Analytics und Big Data
Alle
Datenquellen
Streaming Data
Text Data
Applications
Data
Advanced
Analytics /
New Insights
Platform
Merkmale
•
•
•
•
Neue /
erweiterte
Anwendungen
Information Ingest and Refinery
Watson
Batch & Real Time Analytics
Warehouse & Analytic Appliances
Information Governance
Cognitive
Learn Dynamically?
Real-time
Real-time Data
Processing & Analytics
Analytics
Prescriptive
Alerts
Automated Process
Best Outcomes?
Zone
Time Series
Geo Spatial
Information
Ingestion
and
Operational
Operational
Information
data zone
Video &
Image
Landing,
Exploration
Landing
and
and
Archive
Exploration
data
zone
Zone
Deep
Enterprise
Warehouse
Analytics
and Mart
dataZone
zone
Predictive
What Could Happen?
Descriptive
What Has Happened?
EDW and
data mart
zone
Exploration and
Discovery
What Do You Have?
Relational
Information
Governance,
Security and
Business Continuity
Information
Integration
& Governance
Social Network
Systems
Security
Case Management
Analytic Applications
Cloud Services
ISV Solutions
Storage
On premise, Cloud, As a service
25
IBM Analytics – Wie die Technologie-Evolution für Analytics einen „Datensee“ ermöglicht
M. Ehrmantraut
v 0.2
© 2015 IBM Corporation
Ein typisches DWH / Analytics Szenario besteht meist aus mind. zwei
voneinander getrennten Bereichen (Silos) mit separierten Daten-Domänen
Operational
Systems /
Data
ETL,
Transformation,
Cleasing
Analytics
Systems /
DWH / EDWH
Predict
Data Integration
SAP BI-BW
SAP Module
26
IBM Analytics – Wie die Technologie-Evolution für Analytics einen „Datensee“ ermöglicht
M. Ehrmantraut
v 0.2
© 2015 IBM Corporation
In vielen Unternehmen der Finanzindustrie haben sich parallel mehrere
DWH etabliert, welche separate Geschäftsbereiche abdecken
Operational
Systems /
Data
Analytics
Systems /
Data Integration
Data Integration
DWH A
Predict
DWH B
SAP BI-BW
SAP Module
27
IBM Analytics – Wie die Technologie-Evolution für Analytics einen „Datensee“ ermöglicht
M. Ehrmantraut
v 0.2
© 2015 IBM Corporation
Aktuell haben viele Unternehmen ein weiteres Silo für PoCs/Projekte für
Analytics auf nicht-strukturierten Daten auf Basis von Hadoop gestartet
Operational
Systems /
Data
Analytics
Systems /
Data Integration
DWH A
Data Integration
DWH B
Predict
External
Sources
Social
Media
Big Data Analytics
Sensor
SAP BI-BW
SAP Module
28
IBM Analytics – Wie die Technologie-Evolution für Analytics einen „Datensee“ ermöglicht
M. Ehrmantraut
v 0.2
© 2015 IBM Corporation
Ein IBM Data Reservoir löst die Silos auf und etabliert eine Agile Datenversorgung für Self-Service BI für direkten Zugriff auf alle Unternehmensdaten
Operational
Systems /
Data
Analytics
Systems /
Social
Media
All Data /
Data Types in as-is format
External
Sources
ETL, Load, Replication
Governance Catalog
DWH A
Data Mart
Predict
DWH B
Data Mart
Sensor
Explore
Big Data Analytics
Data Mart
Refinery
SAP Module
29
Landing
Zone
SAP BI-BW
Data Reservoir
IBM Analytics – Wie die Technologie-Evolution für Analytics einen „Datensee“ ermöglicht
M. Ehrmantraut
v 0.2
© 2015 IBM Corporation
Zusammenfassung
• Digitalisierung fördert massiv Analytics
• Alle Arten von Arten sind betroffen
• Viele Analytics sind prädestiniert für den Mainframe
30
IBM Analytics – Wie die Technologie-Evolution für Analytics einen „Datensee“ ermöglicht
M. Ehrmantraut
v 0.2
© 2015 IBM Corporation
BI-SPEKTRUM
Ausgabe 01/2015
Titelthema: Big-Data-Architekturen
http://www.tdwi.eu/fileadmin/user_uploa
d/zeitschriften//2015/01/ehrmantraut_BI
S_01_2015_jhre.pdf
31
IBM Analytics – Wie die Technologie-Evolution für Analytics einen „Datensee“ ermöglicht
M. Ehrmantraut
v 0.2
© 2015 IBM Corporation
Thank You !
Michael Ehrmantraut
Executive Information Architect
Lead Architect IM FSS Germany
Member of the IBM TEC
IBM Deutschland GmbH
Telefon:
E-Mail:
+49-171 223 7186
[email protected]
Analytics