Big Data in a box: Was hinter dem neuen Analytics Platform System (APS) von Microsoft steckt

Im Zuge des Events „Accelerate your Insights“ stellte Microsoft im April diesen Jahres den SQL Server 2014 vor. Und auch ein weiterer neuer Name tauchte auf: Analytics Platform System, kurz APS. Bei dieser Appliance, also der Kombination von Hard- und Software, handelt es sich allerdings nicht um eine komplett neue Lösung, sondern vielmehr um den neuen Namen der MPP-Datenbank (massiv parallel processing) von Microsoft, die bisher als Parallel Data Warehouse (PDW) bekannt war. Doch wie kam es zu dieser Umbenennung und gibt es außer der Bezeichnung noch weitere Unterschiede zwischen PDW und APS?

Dass in Unternehmen immense Mengen an Daten anfallen, die in unterschiedlichsten Größen und Formen vorliegen und gesammelt sowie ausgewertet werden müssen, ist allseits bekannt. Hierbei stößt die traditionelle Data Warehouse (DW) Architektur an ihre Grenzen. Deshalb wurde das Parallel Data Warehouse (PDW) von Microsoft bereits seit 2012 um weiterführende Komponenten ergänzt. Da das auf einer Massively Parallel Processing(MPP)-Architektur basierende PDW, das auf den Microsoft SQL Server als Datenbank zurückgreift, nur strukturierte Daten verarbeiten kann, wurde zum Beispiel ein zweites Framework für die Integration unstrukturierter Daten notwendig: Apache Hadoop.

 

Microsoft hat zusammen mit Hortonworks eine eigene 100-prozentige Open Source-Hadoop-Distribution namens HDInsight entwickelt, die entgegen allen anderen Distributionen am Markt auf Windows betrieben werden kann. Für die Verbindung der strukturierten (aus dem PDW) und unstrukturierten (aus HDInsight) Daten wird die Technologie PolyBase genutzt. So gelangt man zu einer integrierten Data Analytics Plattform, in der alle Datenformen gesammelt und ausgewertet werden können.

 

 

Diese einzelnen Komponenten – PDW, HDInsight und PolyBase – werden mit APS nun in einer einzigen Lösung zusammengefasst. Das Analytics Platform System (APS) enthält in jedem Fall das Parallel Data Warehouse (PDW). HDInsight hingegen bietet eine Option, die je nach Bedarf integriert werden kann. Sollte bereits ein Hadoop Cluster im Unternehmen in Verwendung sein, so kann dieses natürlich auch mit der neuen APS-Lösung integriert werden. Alternativ kann auch ein Hadoop Cluster in der Cloud, zum Beispiel in Windows Azure, mit Zusammenspiel mit APS und Polybase integriert werden.

 

 

Datenüberblick für alle

Diese hybride Lösung hat zahlreiche Vorteile. Zum einen bietet sie „Enterprise-ready Big Data“. So ist es unter anderem allen Personenkreisen im Unternehmen möglich, einen Überblick über Daten zu bekommen – und das in einem altbewährten Business Intelligence (BI)-Tool wie zum Beispiel Microsoft Excel. Außerdem ist bei dieser Lösung ein Scale-out, also die lineare Erweiterung der Plattform, einfach und in sehr großem Umfang möglich. Ein letzter, jedoch nicht minder wichtiger Punkt ist das Kosten-Nutzen-Verhältnis. Dieses wurde schon beim PDW von zahlreichen Nutzern gelobt und jetzt mit APS durch die Integration der verschiedenen Anwendungen noch weiter verbessert.

 

Weitere Intentionen und Hintergründe bezüglich dieser Neuerung finden Sie auch im Blogbeitrag „A data culture for everyone“ von Satya Nadella, Chief Executive Officer von Microsoft.