Modern Data Warehouse

Ein Modern Data Warehouse ist ideal für strukturierte Daten

Ein Data Warehouse bzw. das Konzept eines Modern Data Warehouse wird seit vielen Jahren diskutiert und realisiert. Ein Modern Data Warehouse gilt als Fundament für unternehmensweite Business Intelligence Lösungen, weil es der „Single-Point-of-Truth“ ist, in dem die „absolute Unternehmenswahrheit“ enthalten ist. Obwohl viel Zeit und Ressourcen dafür verwendet wurde, Unternehmensprozesse zu harmonisieren und zu strukturieren, damit die anfallenden Daten ins Modern Data Warehouse übernommen werden konnten, haben diese Bemühungen nur in seltenen Fällen zum Erfolg geführt. Die vermeintlichen Ursachen waren – verbunden mit entsprechenden Schuldzuweisungen - schnell gefunden: Die Unternehmensprozesse seien zu unstrukturiert bzw. wurden nicht eingehalten, die Anwender in den Fachabteilungen seien zu undiszipliniert, vom Fachbereich sei zu wenig Zeit und Aufmerksamkeit auf die Konzeption verwendet worden, etc. Kurzum: der Faktor Mensch war inkompatibel mit der Idee – besser: der Utopie - des „Single Point of Truth“.

Ein Modern Data Warehouse nutzt ein Daten Repository

Im Rückblick unverständlich wurde versucht, den Menschen bzw. die Anwender zu ändern, ja sogar umzuerziehen, damit sie ein strukturierbarer und disziplinierbarer Teil des „Ökosystems Data Warehouse“ werden. Spätestens die Finanzkrise 2008/2009 hat zu der Erkenntnis geführt, dass das strukturierte und integrierte Data Warehouse für die schnelle Verwirklichung vieler neuer und unternehmenskritischer Anforderungen an eine Business-Intelligence-Anwendung einfach viel zu behäbig und starr ist. Die Turbulenzen in der Finanzkrise und die wirtschaftliche Realität verlangten nach höherer, maximaler Umsetzungsgeschwindigkeit. Daran sowie an den Bedürfnissen und Verhaltensweisen der Menschen und Anwender hat sich die Technologie auszurichten. Der Versuch, Menschen bzw. deren Verhalten an eine Data Warehouse Lösung anzupassen, war ein Irrweg.

Utopie des „Single-Point-of-Truth“

Die Utopie des „Single-Point-of-Truth“: Schon seit Jahrhunderten lehrt uns die Philosophie, dass die Wahrheit im Auge des Betrachters liegt. Die moderne Quantenphysik geht einen Schritt weiter: Das Auge des Betrachters definiert sogar die Wahrheit. () Daraus eine umfassende Analogie zum Data Warehouse zu ziehen, soll hier gar nicht versucht werden, aber eine Aussage lässt sich daraus ableiten: Einen „unternehmensweiten Single-Point-of-Truth“ kann es in der Realität sowohl praktisch als auch theoretisch nicht geben.

 

Die Utopie des „Single-Point-of-Truth“: Schon seit Jahrhunderten lehrt uns die Philosophie, dass die Wahrheit im Auge des Betrachters liegt. Die moderne Quantenphysik geht einen Schritt weiter: Das Auge des Betrachters definiert sogar die Wahrheit. (http://de.wikipedia.org/wiki/Schr%C3%B6dingers_Katze) Daraus eine umfassende Analogie zum Data Warehouse zu ziehen, soll hier gar nicht versucht werden, aber eine Aussage lässt sich daraus ableiten: Einen „unternehmensweiten Single-Point-of-Truth“ kann es in der Realität sowohl praktisch als auch theoretisch nicht geben.

Deswegen ist ein Data Warehouse aber keinesfalls sinnlos. Für viele Anforderungen der Anwender gerade im Finanzbereich und im Controlling wird nach wie vor ein Data Warehouse die richtige Lösung sein. Ganz wichtig ist das Verständnis dafür, dass nicht alle Anforderungen an eine Business Intelligence Lösung von einem Data Warehouse abgedeckt werden können und sollen. Vielmehr ist ein Data Warehouse ein Bestandteil eines Data Lake bzw. eines Daten Repository.

Die drei wichtigsten Anforderungen an ein Daten Repository: Geschwindigkeit der Umsetzung, Einfachheit und Sicherheit

Bislang wurde immer versucht, ein Data Warehouse „am Reißbrett“ zu entwerfen. Dafür wurden die Anforderungen gesammelt zusammengeführt (Whiteboarding) und dann implementiert. In der Hoffnung, dass das Resultat den Erwartungen entsprach.

 

Ein solches Vorgehen ist bei stark vordefinierten Prozessen, wie sie beispielsweise in der Finanzabteilung oder im Controlling vorzufinden sind, auch erfolgreich. Wenn die Prozesse weniger vordefiniert oder gar als intransparent gelten, wie das beispielsweise im Vertrieb oder im Marketing der Fall ist, scheint ein solches Vorgehensmodell regelmäßig zu scheitern. Ein einfacher Grund dafür ist, dass sobald Systeme und Prozesse eine gewisse Komplexität erreicht haben, sich diese kaum vordefinieren lassen. Dieser Faktor bekommt durch den Einzug von Technologien, die mit großen Mengen von strukturierten Daten (Zahlen) und unstrukturierten Daten (Texten) umgehen können, noch stärkeres Gewicht. Solche Technologien, wie etwas das Hadoop Framework, werden derzeit unter den Schlagworten Big Data Analytics oder Data Lake diskutiert und kommen in der Unternehmenspraxis bereits zum Einsatz.

 

 

Änderungsfähigkeit und Agilität einer Lösung

Für Business Intelligence und Analyse sind kritische Faktoren für deren Erfolg, weil sich die Anforderungen permanent ändern. Veränderung ist Teil des Systembetriebs. Diese Realität findet sich aber in keinem Data Warehouse. Data-Warehouse-Verantwortliche diskutieren in der Praxis über statische Architekturen bzw. Architekturen die immer nur auf „perfekte“ Endzustände abzielen.

Die Berücksichtigung von geänderten Anforderungen der Anwender im Zeitablauf ist ein ganz wichtiger Bestandteil eines Daten Repository bzw. einem Data Lake. Im Unternehmensalltag entstehen unzählige Fragen, deren Beantwortung eine Aufarbeitung von Daten bedarf.

 

Würde ein klassisches Data Warehouse versuchen, alle Anfragen zu beantworten, die in einem Unternehmen auftauchen, würde spätestens nach mehreren Jahren ein großer Teil des Data Warehouse irrelevant sein, aber im Betrieb weiter Kosten verursachen. In der Realität wird das Data-Warehouse-Team nicht annähernd alle Anforderungen erfüllen können, weshalb die Fachbereiche versuchen, ihre Probleme selbstständig zu lösen – nötigenfalls auch heimlich.

 

Mit der Idee des Data Lake gibt es heute die notwendigen Technologien, um die iterative und agile Analyse-Welt der Data Scientists mit der vordefinierten, standardisierten Welt des Data Warehouse zu integrieren. 

 

Die Experten der pmOne können hinsichtlich eines Data Warehouse eine End-to-End-Angebot machen: Von der Konzeption und Architektur, über das Design bis hin zur Implementierung einer Lösung. Und die laufende Betreuung von Applikationen, also die Operation Services, übernimmt die pmOne auch gerne.

Boris Cordes
VP BI & Analytics Platform
pmOne AG
Freisinger Str. 9
85716 Unterschleißheim
+49 89 4161761-0
Boris Cordes
Stefan Kaffl
Product Manager cMORE
pmOne AG
Freisinger Straße 9
85716 Unterschleißheim
+49 89 4161761-0
Stefan Kaffl