HERAUSGEBER Data Vault – ein moderner und erfolgversprechender Modellierungsansatz für das unternehmensweite Data Warehouse Am Anfang der Evolution der elektronischen Datenverarbeitung stand die Entwicklung operativer Systeme. Im Laufe der Zeit rückte die Integrität der Daten im Vordergrund. Diese Integrität wird durch relationale Datenbanken und die Modellierung in der dritten Normalform optimal unterstützt. Es entstand der Gedanke, die Daten aus den operativen Systemen für Auswertungszwecke zu verwenden. Die Daten werden, um die operativen Systeme nicht zu belasten, aus den operativen Systemen extrahiert und in eine andere Datenbank geladen. Die Integration der Daten über mehrere Systeme hinweg wurde wichtig. Historisierte Daten erlangten Bedeutung. Relationale Datenbanken und die Modellierung in dritter Normalform waren auch für das Data Warehouse nach Prägung von Bill Inmon ein naheliegender Gedanke. Aber sind wir in der Evolution vielleicht auf den falschen Pfad abgebogen? Müssen wir den berühmten Schritt zurückgehen, um zwei Schritte voranzukommen? Gerade die Integration von Daten über mehrere Systeme hinweg, historisierte Speicherung und die Daten- und Informationsbereitstellung sind Sinn und Zweck eines Data Warehouse. Werden diese Zwecke optimal von der Modellierung in der dritten Normalform unterstützt? Heute wird die Data-Vault-Modellierung als Alternative immer bekannter. Merkmale der Data-Vault-Modellierung sind die frühe Integration der Geschäftsschlüssel in Hubs, die Integration von Assoziationen (zwei oder mehrere Geschäftsschlüssel) über einen Link sowie die historisierte Ablage von Attributen getrennt nach Quellsystemen im Satelliten. Eine nachgelagerte Integration der Attribute zum spätmöglichsten Zeitpunkt erscheint sinnvoller. Auch Regeln sollen zum spätmöglichsten Zeitpunkt angewandt werden. Im Vordergrund steht die Zerstörungsfreiheit des Modells. Der Zwang, bei Änderungen im Geschäftsmodell Teile des Modells zu redesignen, fällt auf einmal fast gänzlich weg und damit viele nachgelagerte Prozesse. Ein Data Vault zu modellieren ist nicht keine triviale Angelegenheit, weil die Fähigkeiten, die dazu nötig sind, kaum oder auch gar nicht gelehrt werden. Dazu der Artikel „Data Vault Links“ von Michael Müller. Ein Data Vault ist eine Variante einer Implementierungsmodellierung. Wir modellieren ein der Physik nahes Modell. War das nicht mal für eine relationale Datenbank vorgesehen? Man modelliert logisch und die Datenbank entscheidet über die physische Speicherung! Was hat die Evolution der Datenbanken doch für einen Einfluss? Können wir nicht auch hier wieder einen Schritt zurückgehen? Das ist leider nicht immer möglich, Investitionen in bisherige Technik sind wohl zu wertvoll! So erleben wir das Erstarken einer Implementierungsvariante einer Modellierung mit dem Namen Data Vault. Auch das Data Vault unterliegt der Evolution – Dan Linstedt, der Erfinder des Data Vault, hat das Data Vault einer Anpassung an die Umwelt unterzogen. Data Vault 2.0 erhebt nun den Anspruch, eine Architektur zu sein und arbeitet mit Hashschlüsseln, um Daten aus NoSQL-Datenbanken integrieren zu können. Hashschlüssel ermöglichen ebenfalls eine gute Verteilung über mehrere Knoten. Dieses Themenspecial ist eine Reise über verschiedene Aspekte von Data Vault. Der ins Thema einleitende Artikel „Data Vault heißt die moderne Antwort“ von Dirk Lerner und mir ist einer Aktualisierung unterzogen worden. Der übersetzte Artikel von Hans Hultgren, Autor des Buches „Modeling the Agile Data Warehouse with Data Vault“, hat die Charakteristika von Modellierungsmustern zum Thema. Lutz Bauer folgt dem Gedanken der Automation und generiert ein am Quellsystem orientiertes Data Vault. Wie eine Generierung von Tabellen und Mappings für Data VaultModelle funktioniert, zeigen Michael Klose und Markus Kollas. Torsten Glunde macht sich die Prüffähigkeit des Data Vault zunutze und überträgt diese zu Recht auf die Modernisierung der Risikosteuerung bei Banken. Michael Müller schreibt in „Architekturen in Data Vault 2.0“ über die Einbindung von NoSQL-Quellen im Data Vault. Lars Nielsch richtet seinen Blick auf erweiterte Konzepte im Data Vault, und Michael Hahne gibt ein differenziertes Interview zu Data Vault. Ich wünsche Ihnen viel Spaß und Erkenntnisse durch diese Artikel zum Thema Data Vault und verbleibe Oliver Cramer ONLINE THEMENSPECIAL DATA VAULT MODELING 01
© Copyright 2024 ExpyDoc