<< Back

Alteryx Predictive Schema

Für die Planung der zukünftigen Entwicklung Ihres Unternehmens werden datengestützte Vorhersagemodelle immer wichtiger. Alteryx bietet hierzu viele Möglichkeiten, eigene Modelle zu erstellen, ohne dabei auf Programmiersprachen angewiesen zu sein. Eine Möglichkeit, Datenanalyse direkt in Alteryx zu betreiben, sind die Predictive-Tools. Im folgenden Beitrag zeigen wir Ihnen, wie Sie mehrere Modelle untereinander vergleichen können.

Die Aufbereitung

Am Anfang steht wie immer die eigene Datensammlung. Ziel der Analyse ist es nun, mit Hilfe der gesammelten Daten die Entwicklung eigener KPIs vorherzusagen. Hierfür sollten die Daten zunächst für die spätere Analyse aufbereitet werden. Je nach Art der Daten folgt hier also ein spezifischer ETL-Workflow (Extract, Transform, Load).

In diesem speziellen Fall wird als erstes sichergestellt, dass sämtliche Felder den richtigen Datentyp besitzen. Das lässt sich am einfachsten mit dem Select-Tool überprüfen. Anschließend werden sämtlich Null-Felder mit Hilfe des Filter-Tools aus dem Datensatz entfernt. Hierbei ist es wichtig, die Struktur der Null-Felder zu beachten. Angenommen, die leeren Felder sind nicht zufällig entstanden, sondern haben ein gemeinsames Merkmal, so würde man ein wichtiges Merkmal für die spätere Vorhersage entfernen. So kommt es beispielsweise bei Einkommensbefragungen häufig vor, dass Befragte mit einem besonders hohen Einkommen keine Aussage treffen. In diesem Fall gehen wir allerdings von einer zufälligen Verteilung der fehlenden Werte aus und entfernen diese einfach.

 Das Sampling

Im nächsten Schritt teilen wir die Daten in zwei Stichproben. Stichprobe Nummer 1 wird dazu dienen, die unterschiedlichen Modelle mit den entsprechenden Schätzern zu erstellen. Anhand der zweiten Stichprobe wird dann im Anschluss die Genauigkeit der Modelle getestet. Dieser Test untersucht, wie genau sich die Daten aus der zweiten Stichprobe anhand der Modelle beschreiben lassen. Dazu kann das Create Sample-Tool benutzt werden, wodurch wir automatisch unterschiedliche Stichproben bekommen.

 Der Vergleich

Anschließend folgt der Vergleich der unterschiedlichen Modelle, um später ein möglichst genaues Vorhersagemodell zu erhalten. Hierfür wird das Model-Comparison-Tool benötigt, welches Sie in der Alteryx Gallery finden. Abhängig von der Datenstruktur kommen an dieser Stelle unterschiedliche Modelle in Frage. Hier zeigt sich auch der Vorteil des Einsatzes von Alteryx in den einzelnen Fachbereichen: Das Fachwissen über die Datenstruktur und die Zusammenhänge der einzelnen KPIs ist hier am größten und dementsprechend ist hier auch die Expertise zur Wahl des richtigen Modells zu finden.

Die notwendigen Schritte in Alteryx sind hierbei schnell getan. Einfach die Daten aus der E-Schnittstelle des Create-Sample-Tools an die einzelnen Predictive-Tools anschließen und anschließend über das Union-Tool vereinen. An dieser Stelle kommt das Model-Comparison-Tool zum Einsatz. Die Daten der verschiedenen Modelle fließen in die M-Schnittstelle, jene der zweiten Stichprobe in die D-Schnittstelle.

Das Browse-Tool gibt anschließend die Ergebnisse des Vergleichs aus. Mit STRG+SHIFT+B können Sie dieses Tool ganz einfach an sämtliche Schnittstellen anhängen.

 Die Vorhersage

Wenn Sie sich für ein Modell entschieden haben, geht es darum, die Originaldaten mit den Schätzungen des Modells zu verbinden und letztlich eine Vorhersage zu generieren. Hierfür wird die obere Verbindung des Score-Tools mit der O-Schnittstelle des gewählten Modells und die untere Verbindung mit den Originaldaten verbunden. Der Output des Score-Tools zeigt jetzt die gewünschte Vorhersage der ausgewählten KPI an.

 Der Workflow

Der abgebildete Workflow zeigt exemplarisch, wie man in Alteryx verschiedene Vorhersagen miteinander vergleicht und sein eigenes Vorhersagemodell aufstellt. Dabei liegt der Fokus weniger auf der Funktion der einzelnen Tools als auf der generellen Vorgehensweise. Weitere Informationen zu den einzelnen Predictive-Tools finden Sie hier.

Neben den Predictive-Tools bietet Alteryx eine Vielzahl anderer Möglichkeiten zur Datenaufbereitung. Lernen Sie mehr darüber, wie Alteryx Ihnen bei der täglichen Arbeit helfen kann.

Alteryx kennenlernen

Carlo Bartsch

Business Intelligence Consultant