Falls Sie sehen wollen, wie eine einfache Analytics Platform aussehen kann, haben wir hier eine einfache Variante basierend auf einem Modern Data Warehouse für Sie. So könnte also eine Analytics Platform in Azure aussehen.
Egal welche Quellen Sie anbinden müssen, die Integration Ihrer Quellen läuft über eine Azure Data Factory (ADF). Diese bringt eine Vielzahl an verschiedenen Konnektoren zu Systemen wie z.B. SAP, Oracle, MS SQL uvm. mit. Mit der ADF kann man mit nur wenig bis gar keinem Code einfache ETL-Strecken realisieren und orchestrieren. Die Rohdaten aus den Quellsystemen landen in einem Data Lake und können dort organisiert und Reporting oder Data Science Projekten bereitgestellt werden.
Für die Aufbereitung der Daten empfehlen wir Databricks wegen seiner Flexibilität. Ob nun kleine oder wirklich große Datenmengen, mit Databricks haben Sie immer nötigen Rechenleistung in nur wenigen Klicks verfügbar. Die Arbeit in Databricks erfolgt in Notebooks, in denen wahlweise mit Python, SQL, Scala, R oder Java die Datentransformationen programmiert werden. Damit haben Sie bereits alle nötigen Werkzeuge, um Ihre Daten zentral im Data Lake zu organisieren und aufzubereiten.
Die für Reporting-Zwecke benötigten Daten können anschließend in eine Datenbank synchronisiert werden, die als Data Warehouse dient. Im Gegensatz zu traditionellen Data Warehouses reicht es hier lediglich die aufbereiteten Daten bereitzustellen, da alle Vorverarbeitung bereits vorher geschieht. Das hält die Aufwände für dieses Data Warehouse auf einem Minimum. Das Data Warehouse dient im Wesentlichen als Schnittstelle zu ihrem Reporting in beispielsweise Power BI oder anderen Unternehmensinternen Applikationen.
Für die Umsetzung von Data Science Projekten empfehlen wir den Azure ML Workspace. Er bringt alles mit was ein Data Scientist in einem Projekt braucht, also Werkzeuge für die Datenexploration, Training von Modellen, automatisierte Protokollierung der Trainingsparameter, Modell Deployment-as-a-Service bis hin zum Monitoring von produktiv geschalteten Modellen.
Alles in allem deckt die hier dargestellte Analytics-Platform alle Grundbedürfnisse eines Unternehmens ab, das einen ersten Schritt oder auch gleich den ganzen Sprung in die Cloud wagen möchte. Anforderungen wie Echtzeitanalysen haben wir in diesem Beispiel der Einfachheit halber ausgelassen. Diese können aber problemlos ergänzt werden. Für weitere Details zu Datenplattformen sehen Sie sich gerne auch unsere Lösungen im Bereich Data Management an.