Wiki

Data Quality

Was ist Data Quality?

„Garbage in, garbage out“ lautet eine scherzhafte Phrase in der Informatik, die die Bedeutung von Data Quality – zu Deutsch: Datenqualität – sehr treffend erfasst. Denn die Qualität von Analyseergebnissen hängt immer von der Qualität der zugrundeliegenden Daten ab. Kurz gesagt: Unsaubere Daten führen im Regelfall zu unbrauchbaren Erkenntnissen. Eine hohe Data Quality ist somit ein entscheidender Erfolgsfaktor für Unternehmen, um konkrete Geschäftswerte zu generieren und die digitale Transformation erfolgreich zu bewältigen.

Dabei ist Data Quality ein subjektiver Begriff, der für jedes Unternehmen individuell definiert werden muss. Sehr allgemein gesprochen handelt es sich um die Gesamtheit aller Eigenschaften eines Datenbestandes, mit denen die Anforderungen des Anwenders bzw. Anwenderunternehmens erfüllt werden.

Woran lässt sich Data Quality festmachen?

Anhand der folgenden Kriterien können Unternehmen die Qualität ihrer Daten individuell definieren und bewerten:

  • Konsistenz: Die Daten müssen widerspruchs- und doublettenfrei sein.
  • Vollständigkeit: Die Datenmenge muss exakt stimmen.
  • Validität: Die Daten müssen aus glaubwürdigen Quellen stammen.
  • Genauigkeit: Die Daten müssen im geeigneten Format mit der erforderlichen Zahl an Nachkommastellen vorliegen
  • Aktualität: Die Daten müssen entsprechend der Anforderung pünktlich bereitgestellt werden.

Je nach Branche und Geschäftsprozess sind bestimmte Kriterien wichtiger als andere. Beispielsweise sind in der Gewinn- und Verlustrechnung exakte Daten unverzichtbar. Für eine bedürfnisbezogene Kundenansprache müssen die Daten indes vollkommen widerspruchsfrei sein. Daher können sich die Prioritäten mit wechselnden Geschäftsanforderungen auch verschieben.

Wie erziele ich eine hohe Data Quality?

Rund um die genannten Kriterien können Unternehmen konkrete Maßnahmen zur Qualitätsprüfung und -sicherung ihrer Daten festlegen. Dabei sollte es sich nicht nur um „Einmal-Aktionen“ handeln. Vielmehr bedarf es laufender Prozesse, um sich dauerhaft auf eine hohe Datenqualität verlassen zu können. In diesem Zusammenhang wird auch häufig vom „Data Quality Circle“ gesprochen, nachdem Qualitätskriterien in regelmäßigen Abständen zu definieren und zu prüfen sind (Abb.).

Data Quality

Folgende Maßnahmen bieten sich zur Steigerung der Datenqualität an – idealerweise in Kombination:

  • Automatisierte Software-Tools, die die Daten laufend auf Widersprüche, Redundanzen und Vollständigkeit prüfen.
  • Vordefinierte Prozesse und Regeln, um Maßnahmen zu automatisieren und manuelle Fehler zu reduzieren
  • Feedback von Fachanwendern, das Informationen zur täglichen Arbeit mit den Daten liefert.
  • Beratung durch externe Experten, die spezielle Best Practices und langjährige Projekterfahrung einbringen.
  • Regelmäßiger Expertenaustausch, der einen Abgleich von fachlichen und technischen Anforderungen ermöglicht
  • Einführung intelligenter Eingabemasken, die Fehler bei der manuellen Datenerfassung vermeiden
  • Auflösen von Datensilos, um inkonsistente Datenbestände in einer einheitlichen Datenbasis zusammenzuführen

Wollen auch Sie den digitalen Wandel Ihres Unternehmens mit qualitativ hochwertige Daten sicherstellen? Dann schauen Sie auf der Big Data Engineering vorbei oder informieren Sie sich über unser Training Microsoft BI: Grundlagen zur Planung und Umsetzung von Business Intelligence-Projekten.

turn your data into value.

Microsoft BI

Grundlagen zur Planung und Umsetzung von Business Intelligence-Projekten

In unserem Training erfahren Sie, wie Sie die zukunftsweisenden Technologien von Microsoft nutzen können, um mit Ihren Daten bessere Entscheidungen zu treffen und erfolgreich zu wachsen.

Join #teamoraylispeople

Gestalte mit uns
die Welt der Daten