Warum Data Science Projekte nur gemeinsam erfolgreich sind? » pmOne

Warum Data Science Projekte nur gemeinsam erfolgreich sind?

Data Science Projekte versprechen wahre Wunder. Oft ist der Wunsch jedoch Ausdruck einer falschen Erwartungshaltung. Wir bringen Klarheit in unklare Ideen.
on on on on on on

Das Potential, welches in den stetig wachsenden Datenvolumen von Unternehmen schlummert, war nie größer als heute. Vor allem Methoden aus dem Umfeld von Data Science und Machine Learning versprechen wahre Wunder, wenn man der häufigen Nutzung dieser Begriffe als Buzzwords Glauben schenken mag. Oft ist dies mit der Vorstellung verbunden, dass man lediglich eine Software installieren und einen Algorithmus laufen lassen muss, damit die Optimierung bestehender Prozesse erfolgen kann. Bevor das Optimierungspotenzial jedoch erschlossen werden kann, sind einige Hürden zu meistern. Aber was sind die erfolgsversprechenden Ansätze, damit Data Science Projekte gelingen und Erfolge langfristig gesichert werden können?

Darstellung Data Science Projekte: Wunsch und Wirklichkeit

Abb. 1: Data Science Projekte: Wunsch und Wirklichkeit

Besonderheiten von Data Science Projekten

Schnell stellt man dann fest, dass nicht nur technologische Gesichtspunkte relevant sind sondern vor allem auch das Wissen von Fachabteilungen mit in den Prozess einfließen muss. Zudem ist der Rückhalt seitens des Managements notwendig, um ein Data-Science-Projekt erfolgreich durch die ersten Phasen zu führen. Dabei geht  es zunächst darum, die Grundlagen zu schaffen und zwar noch bevor valide Erkenntnisse oder Vorhersagen abgeleitet werden können.

Es gibt viele Gründe warum Data Science Projekte scheitern. Die Herausforderungen liegen oft in der Komplexität der Fragen, welche durch Data Science Projekte beantwortet werden sollen. aber auch in unklaren Ideen, welche Ziele konkret erreicht werden sollen bzw. welche Vorteile konkret entstehen sollen. Ergänzend kommt hinzu, dass Ergebnisse anfangs nur schwer vorherzusagen sind und dennoch Zeit und Ressourcen in die Umsetzung des Projektes investiert werden müssen. Neben einer mangelnden Datenqualität sind auch falsche Erwartungen, unzureichendes Projektmanagement oder methodisch-technische Fehler häufige Barrieren für eine erfolgreiche Umsetzung.

Damit Sie Data Science in Ihrem Unternehmen erfolgreich und profitabel umsetzen, unterstützt pmOne mit Beratungsleistungen in sämtlichen Phasen - von der Use-Case-Entwicklung bis zur Implementierung und dem Betrieb. Ihre Business Ziele haben wir immer im Blick, so dass sich Ihre Investition in Data Science schon nach kurzer Zeit amortisiert.

Data Science Projekte benötigen eine geeignete Datengrundlage

Vor der Ausarbeitung des eigentlichen Data-Science-Modells ist eine geeignete Datengrundlage notwendig. Dabei spielen nicht nur Aspekte wie Datenqualität und Datenverfügbarkeit eine Rolle.  Die Daten müssen auch in der notwendigen Granularität zur Verfügung stehen. Sind diese Voraussetzungen erfüllt, werden die Daten aufbereitet. Zudem  müssen neue Merkmale erstellt bzw. abgeleitet werden.

Um die Datengrundlage langfristig zu verbessern, sollte die Datenpflege ein integraler Bestandteil der internen Prozesse sein: Nur wenn sich abteilungsübergreifend ein entsprechendes Bewusstsein etabliert, kann sich diese nachhaltig bessern.

Manchmal kann die Fragestellung anhand der Daten noch nicht beantwortet werden. Dann muss die ursprüngliche Fragestellung in einzelne Fragestellungen zerlegt werden, um sich der Beantwortung der Frage zu nähern und ergänzende Daten zu sammeln. Im Falle von Predictive Maintenance benötigt man zunächst genügend Beobachtungen und Werte zum Ausfall einer Maschine, um anhand der Historie verlässlich auf zukünftigen Wartungsbedarf schließen zu können.

Bereits an dieser Stelle zeigt sich, dass sowohl ein technischen als auch ein fachliches Verständnis hinsichtlich der Daten, Prozesse und Zusammenhänge in Data-Science-Projekten erforderlich ist. In Rahmen unserer Beratung legen wir daher großen Wert auf ein gemeinsames Business (Geschäftsverständnis) und Data Understanding (Datenverständnis) als Grundlage für die weitere Projektumsetzung. Dies erfolgt in Anlehnung an das Vorgehensmodell CRISP-DM (Cross Industry Standard Process for Data Mining).

Darstellung CRISP-DM (Cross Industry Standard Process for Data Mining)

Abb. 2: CRISP-DM (Cross Industry Standard Process for Data Mining)

Data Scientist als Berater und Vermittler

Um die erforderlichen Fachkenntnisse in ein Data Science Projekt mit einzubeziehen, ist im Rahmen unserer Beratung für uns ein kontinuierlicher Austausch mit den Fachabteilungen und Stakeholder eine Grundvoraussetzung für die Umsetzung der Datenaufbereitung und die Erstellung eines adäquaten Modells. Unsere Data Scientists agieren als Vermittler, welche das erforderliche Wissen für die Umsetzung des Data Science Projektes besitzen und zudem in der Lage sind, sowohl die Sprache der IT- als auch der Fachabteilung zu sprechen, um einen geeigneten Lösungsansatz zu erarbeiten.

Damit das Wissen, welches am Ende des Projekts durch das Modell generiert wird, auch zur Anwendung kommt, ist zudem die Unterstützung des Managements unerlässlich. Stellt sich heraus, dass die Empfehlung eine Anpassung der Prozesse erforderlich macht, um die möglichen Vorteile zu erschließen, muss dies von einer Person im Unternehmen auf den Weg gebracht werden, die mit der notwendigen Entscheidungsgewalt ausgestattet ist. Ein Data Scientist, der in der Lage ist, die Erkenntnisse, die sich aus dem Data-Science-Projekt ergeben, gemeinsam mit dem Fachbereich anzusprechend und im Hinblick auf die beinflussbaren Geschäftsziele aufzubereiten, ist in der Beratung besonders wertvoll.

Modellierung, Evaluierung und Bereitstellung im Data Science Projekt

Bevor das Ziel des Data Science Projekts erreicht ist, gilt es doch zunächst erst einmal, in die heiße Phase der Beratung und den Bereich, in dem ein Data Scientist sein ganzes Können ausspielen kann. Im Rahmen der Modellierung werden die für die Aufgabenstellung potenziell geeigneten Methoden aus der Welt der Data Science auf den in der Datenaufbereitung erstellten Datensatz angewandt. Kennzeichnend für diese Phase ist die Optimierung von Parametern und die Erstellung mehrerer Modelle, um anschließend bei der Evaluierung das passendste Modell für die Aufgabenstellung auszuwählen.

Die letzte Phase des CRISP-DM ist die Bereitstellung des Modells. In dieser Phase werden die gewonnenen Ergebnisse aufbereitet und präsentiert.  Zum Abschluss der Beratung erhält der Auftraggeber damit eine Grundlage für seinen Entscheidungsprozess zuzuführen. Anschließend können die Modelle implementiert und produktiv genutzt werden, um fortlaufend angewendet zu werden.

So prüfen ML-Algorithmen den Datenbestand stetig auf Muster und Zusammenhänge und können mit der Zeit immer präzisere Prognosen abgeben. Dies zeigt, dass zwar das eigentliche Projekt abgeschlossen ist, dieses aber fortlaufend optimiert und angepasst werden sollte.

Data Science Projekt: Strategie entwickeln, agil umsetzen

Der Erfolg von Data Science Projekten kann entscheidend positiv auf den Erfolg des ganzen Unternehmens einwirken. Im Idealfall sollte es daher eine übergreifende Strategie geben, wie Daten erfasst, aufbereitet und perspektivisch genutzt werden. Liegt eine solche Strategie nicht vor, ist dies jedoch kein Grund, nicht mit dem ausgewählten Data-Science-Projekt in einzelnen Pilotprojekten zu beginnen.

In unserer Beratungspraxis haben wir festgestellt, dass sich oft der Einstieg über einen Data Thinking Workshop lohnt. Data Thinking vereint Data Science und Design Thinking zu einem ganzheitlichen Ansatz für datengetriebene Innovationen und identifiziert Anwendungsfälle, die einen hohen Nutzen versprechen und sich möglichst einfach umsetzen lassen. Data Thinking stellt die wirklich geschäftsrelevanten Use Cases an den Anfang jeder analytischen Roadmap und leiten davon ab, welche Daten in welcher Qualität für die Umsetzung eines Data-Science-Projekts benötigt werden.

Für die Umsetzung von Data Science Projekten eignen sich besonders agile Ansätze (z.B. Scrum). Innerhalb agiler Projektansätze werden zu Beginn eines iterativen Zyklus ausgewählte Zwischenziele definiert, die dann im Hinblick auf die Zielerreichung ausgewertet werden. Die gewonnen Erkenntnisse dienen als Basis für die nächste Zielsetzung und verändern ggf. auch das Gesamtziel des Projekts. Durch die agile Vorgehensweise können Kosten und Ressourcen flexibel an den Projektverlauf angepasst werden. So kennt der Kunde stets den aktuellen Projektstatus und ist an jeder relevanten Entscheidungssituation aktiv beteiligt.

Unsere Data Science Beratung unterstützt diesen Prozess mit folgenden Leistungen:

Darstellung Data Science Beratung (pmOne)

Abb. 3: Data Science Beratung (pmOne)

Fazit: Data Science Projekte erfolgreich umsetzen

Ob es nun um Anomalieerkennung oder die Vorhersage von Kundenwerten geht, mit Data Science können Unternehmen den größtmöglichen Nutzen aus ihrem Datenbestand ziehen. Dabei ist jedoch nicht die Menge an Daten entscheidend, sondern vor allem deren Eignung und Aufbereitung für die jeweilige Fragestellung. Zudem sind eine konkrete Zieldefinition und abteilungsübergreifende Kooperation von wesentlicher Bedeutung.

Die datenorientierte Ausrichtung von Unternehmen ist ein wesentlicher Erfolgsfaktor, um Data Science Projekte erfolgreich umzusetzen. Unternehmen, bei denen ein datenorientiertes Denken noch nicht etabliert ist und bei denen IT- und Fachabteilungen eher gegen als miteinander arbeiten, werden es zukünftig schwer haben, im Wettbewerb zu bestehen. Die Beratung und Vermittlung zwischen den Beteiligten durch einen erfahren Data Scientist fördert nicht nur den Projekterfolg, sondern auch die Etablierung von Datenkulturen in Unternehmen.

Nur wenn Unternehmen dies beachten, kann Data Science dazu beitragen, bislang verborgenes Wissen zu erschließen und gewinnbringend zu nutzen.

Pfeil Rechts
3
3
3
3
pmOne_Logo_png
3
3

Oleg Travkin

Senior Data Scientist

Oleg Travkin

Senior Data Scientist

Oleg Travkin

Senior Data Scientist

Themen
Marketing & Sales
Customer Analytics Platform
Lösungen
Data Science & KI
Analytics Platform
Data & AI Assessment
Data Modelling Review
Data Screening
Data Thinking
Kundensegmentierung
Proof of Concept

Neueste Beiträge

*“ zeigt erforderliche Felder an

Die mit *-markierten Felder sind Pflichtfelder
Dieses Feld dient zur Validierung und sollte nicht verändert werden.
Menü