BLOG

Data Vault: Datenmodellierung für zukunftssichere Cloud-Plattformen

10.10.2024 Julian Krüger

Skalierbarkeit, Flexibilität, Performance, Sicherheit – die Anforderungen an moderne Datenplattformen sind vielfältig. Allgemein wird die Cloud als Lösung propagiert, was grundsätzlich stimmig ist. Cloud-Services bieten genau die Eigenschaften, die Unternehmen für ihre schrittweise Transformation zur Data Driven Company benötigen. Allerdings ist die Cloud nicht der einzige Erfolgsfaktor bei der Planung und dem Aufbau einer zukunftssicheren Datenlösung. Ein weiterer Aspekt ist die Art und Weise, wie die Daten innerhalb der Cloud-Architektur modelliert werden. Mit dem falschen Ansatz gehen auch viele der Cloud-Vorteile verloren.

Aber welche Form der Datenmodellierung wird der dynamischen Geschäfts- und Datenwelt von heute gerecht? „Data Vault“ lautet inzwischen oftmals die Antwort. Die Modellierungstechnik hat sich seit jeher ein flexibles Wachstum auf der Grundlage von stabilen, klar nachvollziehbaren Datenstrukturen auf die Fahne geschrieben. Insofern passt der Ansatz hervorragend zu komplexen Cloud-Lösungen, die immer wieder auf neue, geschäftliche Anforderungen ausgerichtet werden müssen.

Im Folgenden werde ich beschreiben, wie Sie mit Data Vault die positiven Eigenschaften von Cloud-Plattformen unterstützen oder sogar potenzieren können. Zum Einstieg gehe ich auf die grundlegenden Komponenten jedes Data-Vault-Modells ein.

Data Vault Basics: Flexible Datenstrukturen aufbauen

Für die Entwicklung eines Data-Vault-Modells stehen diverse Objekttypen zur Verfügung, mit denen sich sehr spezifische Anforderungen umsetzen lassen. Ich möchte mich in diesem Beitrag auf das Basis-Konzept konzentrieren und damit auf die drei grundlegenden Typen:

  • Hub: Mit dem Hub wird ein Geschäftsobjekt abgebildet, wie etwa ein Kunde oder Lieferant, ein Produkt oder Vertrag. Dabei dient der Hub als Sammelstelle für jene Informationen, die das Geschäftsobjekt identifizierbar bzw. einzigartig machen, wie etwa eine Artikel- oder Kundennummer. Der Hub ist somit der Ausgangspunkt für Ihre weitere Modellentwicklung.
  • Link: Links stellen das betreffende Geschäftsobjekt in Beziehung zu anderen Geschäftsobjekten, wie zum Beispiel den Kunden zu allen seinen Käufen. So werden die realen Geschäftsabläufe in ihren Grundzügen auf Ihrer Plattform abgebildet.
  • Satellit: Durch den Einsatz von Satelliten können Sie schließlich Geschäftsobjekte und Beziehungen durch weiter Kontextinformationen anreichern. Die Anzahl der Satelliten ist nicht limitiert, sodass Sie Ihr Geschäft immer detaillierter in Datenform nachzeichnen und verstehen können.
Übersichtsgrafik von einem ersten Data-Vault-Aufbau mit Hub, Link und Satellit.

Das Data-Vault-Modell in einer einfachen Ausführung.

Dabei sind die Daten einerseits in einer strukturierten Weise organisiert und andererseits sehr flexibel erweiterbar. Sie können also Ihre Plattform nun agil wachsen lassen und die Vorteile der Cloud voll ausschöpfen.

Schnelle Erweiterung des Modells

Zukunftssichere Datenlösungen müssen flexibel wachsen können, um in einem sich schnell wandelnden Geschäftsumfeld dauerhaft als fundierte Ratgeber relevant zu bleiben. Cloud-Provider unterstützen dieses Bestreben, indem sie hochskalierbare Rechen- und Speicherkapazitäten bereitstellen, die sich ganz nach Bedarf der aktuellen Situation anpassen lassen. Hinzu kommen zahllose Konnektoren, mit denen Sie unterschiedlichste Quellen nahtlos anbinden können.

Währenddessen bietet das Data-Vault-Modell mit seinem modularen Konzept eine bedarfsgerechte Struktur zur Datenintegration. Im Prinzip können Sie jede Information als neues Objekt integrieren, ohne in den bestehenden Aufbau eingreifen zu müssen:

> Neue Geschäftsobjekte werden als Hub angelegt und bilden dadurch einen Geschäftszweig.

Grafik, die Kunden-Hub beispielhaft zeigt.

> Kontextinformationen, die das Geschäft detaillierter erklären, werden als Satelliten angedockt.

Grafik, die die Ergänzung von Satelliten zeigt.

> Über Links können Sie jederzeit Beziehungen zwischen neuen und alten Objekten erzeugen.

Grafik, die Verlinkungen zwischen Hub und Satelliten zeigt.

Volle Transparenz über Datenhistorie

Das Cloud-Zeitalter ist zugleich das Zeitalter von Big Data. Im Prinzip können Sie unbegrenzt Daten abspeichern und geschäftlich nutzen. Entsprechend wird es immer wichtiger, die Herkunft, Veränderung und Verarbeitung von Daten vollständig transparent zu halten – insbesondere, wenn es um regulierte Branchen geht, wie dem Finanz- oder Versicherungswesen.

Bei einem Data-Vault-Ansatz ist die sogenannte Auditierbarkeit per Design gegeben. Eine entscheidende Rolle spielen erneut die Satelliten: Sie können hier jede Version eines Datensatzes speichern. Sämtliche Eingriffe werden sorgfältig dokumentiert, sodass eine lückenlose Historie gewährleistet ist. Das heißt: Jede weitere Änderung – etwa an den Verträgen eines Kunden – wird umgehend erfasst und dauerhaft festgehalten.

Infolgedessen kann jeder Datensatz mit all seinen Beziehungen und Veränderungen auch vollständig rekonstruiert werden. Das gibt Unternehmen nicht nur Sicherheit. Vielmehr besteht die Möglichkeit, neue Erkenntnisse aus sehr fundierten, zeitlichen Analysen bzw. Verläufen zu gewinnen.

Daten für viele Use Cases bereitstellen

Ein weiteres Ziel beim Einsatz von Cloud-Plattform ist es, eine Vielzahl unterschiedlicher Use Cases parallel und performant mit Daten zu bedienen. Auch hier flankiert Data Vault mit transparenten Datenstrukturen: Sie können sämtliche Quellen zu jeder Zeit separat voneinander beladen, sodass Abhängigkeiten auf das Kleinstmögliche reduziert und Tabellen schnellstmöglich bereitgestellt werden. Gleichzeitig haben Sie eine ideale Grundlage für Automatisierungen rund um den Lösungsbetrieb geschaffen.

Durch die Unterteilung in isolierte Objekte stellen Sie zudem sicher, dass die Daten nicht miteinander vermischt werden oder unterschiedliche Datenstände aufeinander Einfluss haben können. Jedes Objekt bleibt in sich konsistent und repräsentiert die Daten in ihrem aktuellen Zustand sowie seine gesamte Historie. So lässt sich individuell für jeden Use Case bestimmen, wie die Daten weiterverarbeitet werden sollen.

Datenschutz und Datensicherheit gewährleisten

Unumgänglich beim Aufbau einer modernen Datenplattform ist schließlich die Diskussion um den Datenschutz und die Datensicherheit. Für die Umsetzung einer entsprechenden Data Governance bieten die Cloud-Provider auf technologischer Ebene innovative Sicherheits- und Verschlüsselungsverfahren. In Verbindung mit dem passenden Organisationskonzept besteht auch die Möglichkeit, definierte Vorgaben und Standards zentral zu überwachen und zu steuern.

Grafik, die eine Data-Vault-Modellierung mit geschützten Satelliten.

Absicherung von schützenswerten Daten im Rahmen eines Data-Vault-Modells.

Das Data-Vault-Konzept unterstützt dieses Vorgehen erneut durch die Trennung der einzelnen Attribute eines Geschäftsobjektes. So können die thematischen Satelliten mit unterschiedlichen Schutzstufen versehen werden, die einzelnen Nutzergruppen den Zugriff nur auf bestimmte Informationen gewähren. Beispielweise enthält ein Produkt-Satellit allgemeine Informationen, wie den Produktnamen und die Produktkategorie, die für jeden zugänglich sind. Währenddessen wird der Einkaufpreis in einem gesonderten Satelliten hinterlegt und mit einem spezifischen Schutzstatus versehen. Genauso könnten Sie alle DSGVO-relevanten Informationen in einem Satelliten platzieren und gemäß der Richtlinien absichern

Wollen auch Sie die Potenziale Ihrer Daten mit einer optimal implementierten Cloud-Plattform voll ausschöpfen? Dann informieren Sie sich jetzt zu unserem Training Data Lakehouse – Cloud-Plattformen aufbauen und geschäftlich nutzen.

Your email address will not be published. Required fields are marked *

DATA LAKEHOUSE

Cloud-Plattformen aufbauen und geschäftlich nutzen

 

Sichern Sie sich Ihr Geschäft von Morgen! Mit einem Data Lakehouse können Sie Ihren Daten vollkommen neue Werte entlocken. Begeistern Sie Kunden und Mitarbeiter mit digitalen Services auf der Basis von Internet of Things und Echtzeit-Streaming. Unser Training vermittelt Ihnen die technischen Grundlagen in der Azure Cloud.

Join #teamoraylispeople

Gestalte mit uns
die Welt der Daten