Satya Nadella hat es bereits gestern in seiner Keynote auf der aktuell laufenden Microsoft Ignite – der Entwicklermesse von Microsoft – vorgestellt: Das neue Azure Produkt „Azure Synapse Analytics“ ist raus. Aktuell befindet es sich noch in einer Preview Phase, bildet aber die neue Grundlage für das bewährte Architektur-Konzept des „Modern Data Warehouse“.
Neben vielen neuen Details verbirgt sich hinter dem Azure Service zunächst die Zusammenfassung bisheriger Möglichkeiten unter einer neuen webbasierten Arbeitsoberfläche (Workspace).
Integriert wurden u. a. Azure Data Factory mit den Mapping Data Flows – einem graphischen ETL-Tool, nicht unähnlich zu den Integration Services aus dem SQL Server.
Als Datenspeicher für strukturierte Daten wurde das Azure Data Warehouse überarbeitet und integriert, genauso wie Power BI inkl. der vielen Power BI-Datenquellen, der Zugriff auf Daten über den Common Data Service (CDS) und schnelle AI-Einblicke.
Während man bisher eher entweder den Data Lake oder ein DWH abgefragt hat, ist hier die Datenpipeline durch neue Bausteine wie eine „On demand“ und „Serverless“ Spark Engine-Integration nahtlos abgebildet.
Hiermit können die Daten auf dem Data Lake in SQL, Python oder Scala als auch .NET aus der gleichen Umgebung abgefragt werden, mit der man dann auch die Daten des DWH abfragt.
Dateien auf dem Data Lake können sofort z. B. mittels SQL analysiert werden.
Die strukturierten Daten des DWH können ebenso im gleichen Workspace abgefragt werden. DWH- und Data Lake-Tabellen befinden sich in der Oberfläche in einem Zugriff – für den Anwender sind beide gleichermaßen greifbar und zusammen auswertbar.
Die Integration umfasst auch Power BI:
Genauso wie Azure Machine Learning, hier wurde u. a. SQL um ML-Befehle ergänzt:
So ist man z. B. gegenüber AWS Redshift und Google BigQuery nun führend bezüglich der Abfrageperformance bzgl. standardisierter TPC-H Testabfragen auf sehr großen Datenmengen (1 Petabyte). Zudem geht die Konkurrenz wohl bei > 100 konkurrierenden Abfragen in die Knie, während Azure Synapse Analytics hier weiterskaliert.
Sicher wären viele weitere Detail-Neuerungen zu nennen. Das Wichtigste ist jedoch das einfache und integrierte Setup im Gegensatz zum individuellen Zusammenbau der Komponenten für eine Kundenumgebung.
Zudem können die verschiedenen Rollen eines Unternehmens vom Data Engineer über den Data Scientists bis hin zum Business Analyst in einem Workspace zusammenarbeiten, was sicherlich die Geschwindigkeit, um von Daten zu Werten zu kommen, beschleunigt und die Zusammenarbeit optimiert.
Die Highlights zusammengefasst:
- Enterprise Data Warehousing (MPP)
- Data Lake Exploration
- Wahl der Sprache (T-SQL, Python, Scala, Spark SQL, .nET)
- Wahl der Ausführungsressource: Serverless oder dedizierte Rechenressourcen
- Integrierte SPARK und SQL Engines (T-SQL Queries on Spark!)
- Streaming Datenintegration und Analyse
- Business Intelligence und Künstliche Intelligenz integriert
Das Ganze gekoppelt mit den Möglichkeiten des größten verfügbaren DataCenter-Netzwerkes, der Azure Cloud, ergibt hochspannende Möglichkeiten für alle Unternehmen, Ihre Datenplattform auf modernste Beine zu stellen. Dabei lassen sich bisherige Azure BI-/Big-Data-/KI-Nutzer ihre Bausteine in den neuen Workspace nahtlos integrieren.
Wollen auch Sie Microsofts zukunftsweisenden Analysedienst nutzen, um aus Ihren Daten effektiver neue Werte für Ihr Geschäft zu generieren? Dann informieren Sie sich weiter unter Azure Synapse Analytics oder besuchen Sie unser Training zum Microsoft Modern Data Warehouse.
Kommentare (0)