Was ist ein Data Lake?
Der Data Lake ist das führende Konzept für Unternehmen, um Daten auch in großem Umfang zentral abzuspeichern und für die gewünschten Auswertungsszenarien bereitzustellen. Dabei kann ein Data Lake im Unterschied zum klassischen Data Warehouse (DWH) ganz unterschiedliche – strukturierte und unstrukturierte – Datenformate aufnehmen, angefangen bei klassischen ERP- und CRM-Daten über Bilder bis hin zu Sensordaten und Social-Media-Posts.
So lassen sich nicht nur die Fachabteilungen wie gewohnt mit Berichten zu Unternehmenszahlen sowie konsolidierten Daten für Ad-hoc-Analysen versorgen. Gerade Data Scientists eröffnet das Konzept die Möglichkeit, laufend explorative Analysen auf sämtlichen Rohdaten vorzunehmen und daraus neue Erkenntnisse zu erschließen. Unternehmen können also viel mehr als in der Vergangenheit auf Basis ihrer Daten digitale Optimierungs- bzw. Innovationsprozesse einleiten und gestalten.