Data Vault – ein moderner und erfolgversprechender

HERAUSGEBER
Data Vault – ein moderner und
erfolgversprechender Modellierungsansatz
für das unternehmensweite Data Warehouse
Am Anfang der Evolution der elektronischen Datenverarbeitung stand die Entwicklung operativer Systeme. Im Laufe der Zeit rückte die Integrität der Daten im Vordergrund.
Diese Integrität wird durch relationale Datenbanken und
die Modellierung in der dritten Normalform optimal unterstützt. Es entstand der Gedanke, die Daten aus den operativen Systemen für Auswertungszwecke zu verwenden. Die
Daten werden, um die operativen Systeme nicht zu belasten,
aus den operativen Systemen extrahiert und in eine andere
Datenbank geladen. Die Integration der Daten über mehrere Systeme hinweg wurde wichtig. Historisierte Daten erlangten Bedeutung. Relationale Datenbanken und die Modellierung in dritter Normalform waren auch für das Data
Warehouse nach Prägung von Bill Inmon ein naheliegender
Gedanke.
Aber sind wir in der Evolution vielleicht auf den falschen Pfad abgebogen? Müssen wir den berühmten Schritt
zurückgehen, um zwei Schritte voranzukommen? Gerade
die Integration von Daten über mehrere Systeme hinweg,
historisierte Speicherung und die Daten- und Informationsbereitstellung sind Sinn und Zweck eines Data Warehouse.
Werden diese Zwecke optimal von der Modellierung in der
dritten Normalform unterstützt?
Heute wird die Data-Vault-Modellierung als Alternative
immer bekannter. Merkmale der Data-Vault-Modellierung
sind die frühe Integration der Geschäftsschlüssel in Hubs,
die Integration von Assoziationen (zwei oder mehrere Geschäftsschlüssel) über einen Link sowie die historisierte
Ablage von Attributen getrennt nach Quellsystemen im
Satelliten. Eine nachgelagerte Integration der Attribute
zum spätmöglichsten Zeitpunkt erscheint sinnvoller. Auch
Regeln sollen zum spätmöglichsten Zeitpunkt angewandt
werden. Im Vordergrund steht die Zerstörungsfreiheit des
Modells. Der Zwang, bei Änderungen im Geschäftsmodell
Teile des Modells zu redesignen, fällt auf einmal fast gänzlich weg und damit viele nachgelagerte Prozesse. Ein Data
Vault zu modellieren ist nicht keine triviale Angelegenheit,
weil die Fähigkeiten, die dazu nötig sind, kaum oder auch
gar nicht gelehrt werden. Dazu der Artikel „Data Vault
Links“ von Michael Müller.
Ein Data Vault ist eine Variante einer Implementierungsmodellierung. Wir modellieren ein der Physik nahes Modell.
War das nicht mal für eine relationale Datenbank vorgesehen? Man modelliert logisch und die Datenbank entscheidet
über die physische Speicherung! Was hat die Evolution der
Datenbanken doch für einen Einfluss? Können wir nicht
auch hier wieder einen Schritt zurückgehen? Das ist leider
nicht immer möglich, Investitionen in bisherige Technik
sind wohl zu wertvoll!
So erleben wir das Erstarken einer Implementierungsvariante einer Modellierung mit dem Namen Data Vault. Auch
das Data Vault unterliegt der Evolution – Dan Linstedt, der
Erfinder des Data Vault, hat das Data Vault einer Anpassung
an die Umwelt unterzogen. Data Vault 2.0 erhebt nun den
Anspruch, eine Architektur zu sein und arbeitet mit Hashschlüsseln, um Daten aus NoSQL-Datenbanken integrieren
zu können. Hashschlüssel ermöglichen ebenfalls eine gute
Verteilung über mehrere Knoten.
Dieses Themenspecial ist eine Reise über verschiedene
Aspekte von Data Vault. Der ins Thema einleitende Artikel
„Data Vault heißt die moderne Antwort“ von Dirk Lerner
und mir ist einer Aktualisierung unterzogen worden. Der
übersetzte Artikel von Hans Hultgren, Autor des Buches
„Modeling the Agile Data Warehouse with Data Vault“, hat
die Charakteristika von Modellierungsmustern zum Thema.
Lutz Bauer folgt dem Gedanken der Automation und generiert ein am Quellsystem orientiertes Data Vault. Wie eine
Generierung von Tabellen und Mappings für Data VaultModelle funktioniert, zeigen Michael Klose und Markus
Kollas. Torsten Glunde macht sich die Prüffähigkeit des
Data Vault zunutze und überträgt diese zu Recht auf die
Modernisierung der Risikosteuerung bei Banken. Michael
Müller schreibt in „Architekturen in Data Vault 2.0“ über
die Einbindung von NoSQL-Quellen im Data Vault. Lars
Nielsch richtet seinen Blick auf erweiterte Konzepte im Data Vault, und Michael Hahne gibt ein differenziertes Interview zu Data Vault.
Ich wünsche Ihnen viel Spaß und Erkenntnisse durch
diese Artikel zum Thema Data Vault und verbleibe
Oliver Cramer
ONLINE THEMENSPECIAL DATA VAULT MODELING 01