„Garbage in, garbage out“ heißt es gerne, wenn es um die Datenqualität bei Analytics-Lösungen geht. Den meisten Verantwortlichen in Unternehmen ist inzwischen sehr wohl bewusst, dass sich nur mit einer hohen Datenqualität zuverlässige Ergebnisse erzielen lassen (Abb. 1). Und das gilt nicht nur für die klassische Analyse von Unternehmensdaten im Rahmen der Business Intelligence. Auch Echtzeitanalysen und Künstliche Intelligenz funktionieren nur dann reibungslos, wenn eine stabile Datenbasis zugrunde liegt – ganz gleich, ob es nun um die Vorhersage von Absatzzahlen im Handel, die Optimierung von Produktionsprozessen in der Industrie oder eine Trenderkennung bei der Polizeiarbeit geht.
Wie aber lässt sich eine hohe Datenqualität erreichen? Im Folgenden möchte ich Ihnen fünf Maßnahmen vorstellen, durch die Sie die Qualität Ihrer Daten gezielt verbessern können. Bei der Anwendung dieser Maßnahmen ist es wichtig, dass es sich nicht nur um eine „Einmal-Aktion“ im Sinne eines Projektes handelt. Vielmehr ist die Datenqualität als kontinuierlicher Prozess zu verstehen. In diesem Kontext wird auch häufig vom „Closed-Loop“ oder „Data Quality Circle“ gesprochen. Die Qualität muss also in regelmäßigen Abständen definiert und geprüft werden, um nachhaltige Effekte zu erzielen (Abb 2).
Konkret schauen wir uns nun folgende Maßnahmen an:
- Definieren Sie Datenqualität
- Messen Sie kontinuierlich mit erprobten Tools
- Beziehen Sie Stakeholder und Berater ein
- Folgen Sie dem „First-Time-Right“-Ansatz
- Vermeiden Sie Datensilos
1. Definieren Sie Datenqualität
Was bedeutet überhaupt „Datenqualität“? Wie so oft bei Definitionen rund um Daten gilt auch hier: Fragen Sie fünf Experten und Sie werden fünf verschiedene Antworten erhalten. Umso mehr sollten die Verantwortlichen im Unternehmen ein einheitliches Verständnis von dem Begriff herstellen, bevor die Datenqualität in Angriff genommen wird. Eine – zugegebenermaßen recht allgemeine – Definition könnte in diesem Zusammenhang lauten:
Datenqualität ist die Eignung von Daten zu einem bestimmten Zweck der Nutzung.
Dabei kann die Qualität anhand der folgenden Kriterien bewertet werden:
- Konsistenz: Daten müssen widerspruchs- und dublettenfrei sein.
- Vollständigkeit: Die Datenmenge muss exakt stimmen.
- Validität: Daten müssen aus glaubwürdigen Quellen stammen.
- Genauigkeit: Daten müssen im geeigneten Format mit der erforderlichen Anzahl an Nachkommastellen vorliegen
- Aktualität: Daten müssen entsprechend der Erwartungen pünktlich bereitgestellt werden.
Gleichzeitig ist es hilfreich, die einzelnen Kriterien zu priorisieren. Denn: Je nach Branche und Geschäftsprozess können einzelne Punkte stärker im Fokus stehen. Bei Gewinn- und Verlustrechnungen im Controlling ist beispielsweise die Genauigkeit der Daten von besonderer Bedeutung. Für eine bedürfnisbezogene Kundenansprache sind indes konsistente bzw. widerspruchsfreie Daten wichtig. Diese Prioritäten können sich mit der Zeit aber auch verändern. Nicht zuletzt sollte das Verständnis von und die Anforderung an Datenqualität in regelmäßigen Abständen auf den Prüfstand gestellt werden. So können Sie bewerten, ob das Verständnis von Datenqualität noch dem aktuellen Bedarf entspricht.
2. Messen Sie kontinuierlich mit erprobten Tools
Messen Sie Ihre Datenqualität kontinuierlich und automatisiert mit geeigneten Softwareanwendungen. Denn: Ohne regelmäßige Kontrolle ist die Gefahr groß, dass einmal erreichte Ziele mit der Zeit wieder verloren gehen. Entsprechende Tools entdecken Widersprüche, Redundanzen sowie fehlende Daten und melden diese auf Wunsch per automatisiertem Alarm. Alle Ergebnisse des Monitorings werden transparent und übersichtlich dargestellt. Als Maßstab für die Bewertung bzw. Quantifizierung dieser Ergebnisse dienen schließlich geschäftsorientierte Datenqualitätsregeln und entsprechende Ziele, die im Vorfeld zu definieren sind.
Wer indes in Sachen Datenqualität auf der grünen Wiese startet, für den erscheint auch ein Audit sinnvoll, bei dem zunächst der Status Quo ermittelt wird. Im Anschluss kann dann ein automatisierter Prozess etabliert werden.
3. Beziehen Sie Stakeholder und Berater ein
In Anknüpfung an den vorherigen Punkt: Verlassen Sie sich nicht allein auf das „grüne Lämpchen“ einer Software, um die Qualität Ihrer Daten zu bewerten. Holen Sie das Feedback von Fachanwendern ein, die laufend mit den betreffenden Daten arbeiten. Auch externe Berater können mit Best Practices und Erfahrung unterstützen. Zudem sind die unterschiedlichen Beteiligten regelmäßig an einen Tisch zu bringen. Ein intensiver Austausch verhindert Missverständnisse und macht beispielsweise Änderungen in Geschäftsprozessen transparent. Das homogene Zusammenspiel von fachlichen und technischen Ansprechpartnern ist somit ein wichtiger Schritt hin zu einer besseren Datenqualität.
4. Verfolgen Sie den First-Time-Right Ansatz
Mängel bei der manuellen Dateneingabe – etwa in einem Call Center – können ebenfalls eine Quelle schlechter Daten sein. Daher ist es sinnvoll, bereits bei der Erfassung mit entsprechenden Maßnahmen anzusetzen statt erst im System. Hierzu zählt eine Prüfung auf Plausibilität und Form, die über intelligente Eingabemasken erfolgen kann. Beispielsweise sollte das Geburtsdatum kein Frei-Text-Feld sein. Ebenso sollten Sie Adressangaben nicht ungeprüft ins System übernehmen, sondern einer postalischen Verifizierung unterziehen. Weitere Maßnahmen sind eine Eingabevalidierung mittels Referenzwerten oder eine Dublettensuche. Sprich: Wer die Datenqualität bereits bei der Erfassung berücksichtigt, spart sich viel Aufwand bei der späteren Bereinigung.
5. Vermeiden Sie Datensilos
Historisch gewachsene Datensilos einzelner Abteilungen sind eine weitere Quelle von widersprüchlichen und fehlerhaften Analyseergebnissen. Diese Silos gilt es aufzubrechen und auf einer einheitlichen Analyseplattform zu integrieren. Auf diese Weise erhalten Sie eine Single Version of Truth, die eine konsistente Sicht auf sämtliche Unternehmensdaten gewährleistet und somit einen konsolidierten Anlaufpunkt für sämtliche Nutzer bildet.
Heißt zusammengefasst: Eine hohe Datenqualität resultiert stets aus dem Zusammenspiel von Technik, Wissen und persönlichem Austausch. Dabei muss jedes Unternehmen für sich den richtigen Mix finden. Ebenso gilt es, das Kosten-/Nutzen-Verhältnis der einzelnen Maßnahmen miteinzubeziehen. Wenn Sie diese Aspekte berücksichtigen, sind Sie auf dem besten Weg hin zu einer hochwertigen und zuverlässigen Datenbasis.
Wünschen Sie sich weitere Informationen darüber, wie Sie eine hochwertige Datenbasis für Ihren digitalen Wandel schaffen? Dann schauen Sie mal auf der Seite Big Data Engineering vorbei oder besuchen Sie unser Data Strategy Assessment.
Kommentare (0)