Der Daten-Analyse-Prozess

Wie im Abschnitt Das Business Problem verstehen beschrieben, beginnt alles mit der Frage, welches Problem eigentlich gelöst werden soll. Diese Probleme sollten immer auf das Business-Ziel einzahlen, also den Gewinn zu erhöhen. Erst danach wird überlegt, welche Daten überhaupt benötigt werden. Der Vorteil dieses Ansatzes ist, dass dann nicht einfach von dem ausgegangen wird, was man bereits hat, sondern sich keine Grenzen setzt (“Die Daten habe ich nicht in dem Tool, also überlege ich auch nicht, woher ich sie ansonsten herbekommen kann.”)

Die Phasen einer Daten-Analyse oder eines Data Science-Projekts werden häufig in 5 Teilen unterschieden. Der Kurs ist genau nach diesen 5 Teilen aufgebaut:

  • Das Problem verstehen
  • Die Daten akquirieren
  • Die Daten analysieren
  • Modellieren und Testen
  • Kommunizieren

Auch wenn dies nach einem Wasserfallprozess aussieht, so kann es in der Realität häufig ein iterativer Prozess sein. So kann bei der Analyse festgestellt werden, dass ein Teil der akquirierten Daten nicht für die Analyse geeignet ist und damit wieder ein Schritt zurück gegangen werden muss.

Nächster Abschnitt: Die Daten-Akquise