Data Vault – Kosten, Daten und Zeit im Griff
Der Mensch hat schon immer nach optimalen Lösungen gesucht, um Informationen intelligent und platzsparend ablegen zu können. Gleichzeitig sollen diese aber auch schnell wieder verfügbar gemacht werden. Dieses Bestreben hat bei den Unternehmen bis vor einiger Zeit nur mäßigen Erfolg gehabt. Nun kommen aber bereits neue Herausforderungen auf die IT-Abteilungen zu: es müssen sozusagen in Echtzeit mehr und flexibler Informationen verfügbar sein. Außerdem kommen immer mehr Daten mit teils sehr unterschiedlichen Granularitäten zusammen, die in einem Data Warehouse integriert werden müssen.
Die bisher eingesetzten Technologien sind zumeist in die Jahre gekommen oder erlauben keine einfache Anpassung des Datenmodells. „Dies liegt häufig daran, dass sie nach der klassischen Lehre in der 3. Normalform bestehen oder in einem Star Schema redundant abgelegt sind. Beide Techniken haben Vor- und Nachteile, sind jedoch dann anfällig, wenn sie kostengünstige Modellanpassungen erlauben oder zeitabhängige Aussagen abdecken sollen“, weiß Uli Drexelius, Principal Consultant bei der mip Management Informationspartner. Hier setzt mip auf den Ansatz des „Data Vaults“.
Das Beste aus beiden Welten
Bereits Mitte der 1990er Jahre beschäftigten sich eine ganze Reihe von Datenbankspezialisten mit der Data Vault Idee. So auch der Amerikaner Daniel Linstedt. Er war ein Pionier im Bereich der Datenbanken sowie der Prozess-Optimierung von ETL-Strecken (und ist es auch heute noch!). Seine Ideen konnte er in einigen Firmen und auch bei der amerikanischen Regierung umsetzen. Die Erfahrungen, die er dabei gemacht hat, führten zu dem Data Vault Modell: ein Hybrid aus einem klassischem 3. Normalform- und einem Star Schema-Modell. Es nutzt jedoch jeweils nur die Vorteile der beiden Modelle und fügt darüber hinaus noch weitere hinzu. So lassen sich beispielsweise neue Informationen auf einfache Weise in den ETL-Prozess einbinden, ohne das Datenmodell zu verbiegen oder in zahlreichen Anpassungen die Prozessketten an die neuen Gegebenheiten anzupassen. Das Vorgehen des Data Vault-Modells spart bei der Integration von Daten nicht nur Zeit und Kosten, sondern ermöglicht mehr Flexibilität bei einer langfristigen Datenhaltung.
Die Objekte eines Data Vaults
Ein Data Vault besteht typischerweise aus drei Objekten: Hub, Link und Sattelite. Der Objekttyp „Hub“ beinhaltet den fachlichen Schlüssel, zum Beispiel eine Kunden- oder Artikelnummer, welcher mit einem technischen Schlüssel sowie einer Zeitstempel- und einer Datenquelle-Spalte ergänzt wird. Somit erhält der Anwender bereits Informationen darüber, zu welchem Zeitpunkt ein Schlüssel aus welcher Quelle kam.
Beim „Link“ werden alle Beziehungen zwischen den HUBs gespeichert. Was in der 3. Normalform der Fremdschlüssel ist, wird hier in ein eigenes Datenbankobjekt ausgelagert. Ein besonderer Vorteil: Bei Veränderung der Zuordnung (beispielsweise des Vertreters bei einem Kunden) wird über die auch in diesem Objekttyp vorhandene Zeitstempel- und Datenquellen-Spalte ein Nachvollziehbarkeit protokolliert.
Informationen zu einem Hub oder einem Link werden im „Satellite“ abgelegt, also zum Beispiel den Namen des Kunden oder das Datum des letzten Kundenbesuchs des Vertreters. Durchaus aber auch, welchen Preis ein Artikel in einem Auftrag hat. Da auch dieser Objekttyp über eine Zeitstempel- und eine Datenquelle-Spalte verfügt, sind gleichartige Informationen aber aus unterschiedlichen Datenquellen nachvollzieh- und auch abgrenzbar.
Mit Hilfe dieser Objekttypen-Verbindungen lassen sich also sowohl Stamm- als auch Bewegungsdaten abbilden. So bekommen Stammdaten eine Historie und Bewegungsdaten eine eindeutige Struktur.
Von der Datenintegration zum „Business Vault“
„Das Prinzip ist simpel, es braucht aber gewisse Hilfsmittel, um die Daten am Ende auch auf Anwenderseite sinnvoll nutzen zu können. Was für die IT, beziehungsweise den ETL-Prozess der dahinter steht, eine tolle Sache ist, löst auf Anwenderseite eher Stirnrunzeln aus. Bei der Aufteilung in die drei Objekttypen können schnell eine Vielzahl an Tabellen und Beziehungen entstehen, die auch die Datenbank-affinen Fachbereichsmitarbeiter schnell an ihre Grenzen stoßen lassen“, so Uli Drexelius. Deshalb ist sein Vorschlag, den Data Vault um einige Hilfsobjekte zu erweitern, damit ein sogenannter „Business Vault“, also ein Datenmodell, mit dem der Fachbereich sinnvoll arbeiten kann, erlangt wird. So haben die Kunden der mip ihre Kosten, Daten und Zeit im Griff.
Zeichenzahl: Zeichen (inkl. Leerzeichen) 4.840
Autor:
Uli Drexelius, Principal Consultant, Ulrich.Drexelius@mip.de
bei der
mip Management Informationspartner GmbH
Fürstenrieder Str. 267
81377 München
www.mip.de
Pressekontakt:
Gabriela von Bargen
Marketing
Telefon: +49 89 589394 31
Fax: +49 89 589394 50
Mail: Gabriela.Bargen@mip.de
Die mip Management Informationspartner GmbH ist seit mehr als 30 Jahren ein zuverlässiger Partner und Ideengeber für mittelständische sowie große Unternehmen, die ihre Unternehmensdaten intelligent verknüpfen und profitabel einsetzen wollen. Mit dem Hauptsitz in München und einer Niederlassung in Stuttgart agiert das Unternehmen vom Süden Deutschlands aus im gesamten deutschsprachigen Raum. Die Schwerpunkte liegen seit der Firmengründung 1988 in den Bereichen Data Warehouse und Business Intelligence. Heute berät die mip GmbH mittelständische sowie große Unternehmen und entwickelt für diese nutzenorientierte Datenanalyse-Lösungen als Basis für die digitale Transformation. Dabei stehen Data-Warehouse-, Business- und Predictive-Analysis- sowie Enterprise-Search-Lösungen im Vordergrund. Strategische Partnerschaften mit großen Herstellern und spezialisierten Häusern sorgen für den technologischen Unterbau.
mip Management Informations Partner GmbH
Fürstenrieder Straße 267
81377 München
Telefon: +49 (89) 589394-0
Telefax: +49 (89) 589394-50
http://www.mip.de
Marketing Manager
Telefon: +49 (89) 589394-31
E-Mail: Gabriela.Bargen@mip.de