• Software Solutions

          Wir helfen Ihnen bei der Auswahl 
          der richtigen Lösungen, um die 
          Kraft Ihrer Daten freizusetzen.
        • Tableau
        • Das weltweit leistungsstärkste Tool zur Datenvisualisierung und -analyse.

        • Alteryx
        • Die führende Plattform in der
          dynamischen Welt der Analytic
          Process Automation.

        • Amazon Web Services (AWS)
        • Führend bei Cloud-First-Datenlösungen.

        • Snowflake
        • Für Cloud-basierte Data-Warehouse-Lösungen der nächsten Stufe.

        • Celonis
        • Process Mining aus Deutschland. Verschaffen Sie sich ein objektives und datengetriebenes Bild Ihrer internen Prozesse. Ganz im Sinne der optimierten  Wertschöpfung.

  • The Data School
  • News
  • Data Events
        • Über Uns

          Lernen Sie The Information Lab kennen, unser Team, unsere Kunden und erfahren Sie, wie auch Sie ein Teil davon werden können.

          Mehr erfahren

        • Use Cases
        • Wir bieten seit Jahren Datenlösungen für Unternehmen. Und so wie hinter allen Daten eine Geschichte steckt, steckt auch hinter jedem unserer Projekte eine Geschichte.

        • Centre of Excellence
        • Geteiltes Wissen ist Macht – vernetzen Sie sich mit unserer wachsenden Zahl von Beratern und Kunden in ganz Europa. Zusammenarbeit ist der beste Weg zu lernen.

        • Internationales Setup
        • The Information Lab ist an 8 europäischen Standorten mit über 300 Consultants aktiv. Unsere Data School gibt es bereits in London, Sydney und Hamburg.

        • Kunden
        • Wir unterstützen seit 2014 namhafte Unternehmen in der DACH-Region und im deutschen Mittelstand.

        • Team
        • Lernen Sie die Menschen hinter The Information Lab kennen.

        • Karriere
        • Join our team! Wir wachsen stetig und suchen insbesondere im Consulting und unserer Data School stets tolle Kollegen und Kolleginnen.

Tableau 2020.4  – Predictive Modelling
Tableau 2020.4 – Predictive Modelling

Die Neuerungen von Tableau 2020.4 beinhalten verschiedenste neue Features. Falls Sie sich noch einen generellen Überblick verschaffen möchten, können sie HIER zum Artikel von Florian Ziegler gelangen. Dieser Artikel soll dazu dienen, das prädiktive Modellieren von Tableau 2020.4 näher kennenzulernen.

Bereits bei früheren Versionen war es möglich, Prognosen und Trendlinien im Dashboard darzustellen. Diese Funktionen sind gerade dann im Arbeitsalltag wichtig, wenn man Fragen beantworten möchte wie: „Mit welchem Verkauf habe ich in der nächsten Wintersaison zu rechnen?“, „Haben die Krankheitstage meiner Mitarbeiter über die letzten Jahre zugenommen?“.

Wer sich in Statistik auskennt, hat möglicherweise schon entdeckt, dass die Signifikanz eines Modells über alle wichtigen Beurteilungsmaße einsehbar ist. So können nicht nur Aussagen über die Trends getroffen werden, sondern auch über deren praktische Signifikanz.

Dennoch gibt es eine zunehmende Anwendung von Bayes Statistik, weg von der vertrauten und klassischen Statistik. Abstrakt gesprochen geht man davon aus, von Stichproben auf die Gesamtheit schließen zu können. Hierbei gibt es zwei bekannte Richtungen – die klassische Statistik und Bayes Statistik. Ersteres verwendet beim Schätzvorgang Parameter um eine Hypothese („Sind die Einnahmen über die Pandemie eingebrochen?“) zu testen. Hierbei wird eine Stichprobe verwendet, beispielsweise die Verkaufszahlen des letzten Jahres. Die bayessche Statistik dagegen bedenkt zusätzlich, welche Informationen generell noch über das Problem vorhanden sind. Beide Richtungen haben eine unterschiedliche Auffassung davon, was Wahrscheinlichkeit bedeutet: relative Häufigkeit in Zufallsexperimenten (klassische Statistik) oder einen Ausdruck des Wissens (Bayes Statistik).

Tableau hat mit 2020.4 die Möglichkeit eingebaut, Vorhersagen treffen zu können, ohne eine Zeitachse im Modell zu besitzen. Zusätzlich dazu können Sie jetzt Ausreißer leicht identifizieren und nicht vorhandene Daten vorhersagen – ohne mit R oder Python arbeiten zu müssen.

Die beiden neuen Predictive Funktionen heißen MODEL_PERCENTILE und MODEL_QUANTILE. Diese neuen Tabellenberechnungen sind die Gegenstücke zueinander. Kurz gesagt, mit MODEL_QUANTILE kann man den zu erwartenden Wert in einem vorher festgelegten Quantil anzeigen lassen. Mit MODEL_PERCENTILE die Wahrscheinlichkeit, in der der zu erwartende Wert weniger oder gleich dem Wert ist, der als Ausgangspunkt mitgegeben wird.

Doch Welche Use Cases gibt es für diese Funktionen?

Falls Sie sich um die Betrugserkennung (Fraud Detection) kümmern, könnte diese Funktion für Sie hilfreich sein. Ebenso können Sie sich ausgeben lassen, welche Kunden unerwartet viel/wenig kaufen. Genauso aber auch, falls Sie sich fragen, ob Verkäufe dieses Jahr trotz Pandemie noch 90% der erwarteten Gewinne einfahren werden. Gehaltsdaten lassen sich auch damit analysieren, sodass man wissen könnte, welches minimale Gehalt bei einem Berufsantritt gezahlt werden müsste.  

Credits: Tableau

MODEL_QUANTILE:

Berechnet das A-Posteriori Quantil, also den zu erwartenden Wert in einem Quantil, das vorher festgelegt wird. Anders gesagt, kann man hiermit Vorhersagen ausgeben lassen, je nach Prädiktoren, die im Modell vorhanden sind. Beispielhaft könnte man in der untenstehenden Abbildung über alle Punkte der braunen Linie gleiten, um sich die Vorhersage auszugeben, die Tableau berechnet hätte.

Konkret wird in Tableau diese Syntax verwendet:

MODEL_QUANTILE( Quantile, Target Expression, Predictor(s) )

Pro Tipp: Wenn Sie sich 2 berechnete Felder bauen, in dem die MODEL_QUANTILE jeweils auf 0.05 und 0.95 eingestellt sind, bekommen Sie dynamisch das 90% Konfidenzintervall ausgegeben.

MODEL_PERCENTILE:

Die Funktion gibt Ihnen die Wahrscheinlichkeit zurück, dass der beobachtete Wert unterhalb oder genau der gleiche Wert wäre, basierend auf den Prädiktoren, die im Modell vorhanden sind. Besser bekannt ist diese Funktion als CDF (Cumulative Density Function). Kurz gesagt, bekommen wir hier die Wahrscheinlichkeit, wo sich der Wert auf der Kurve finden würde. Als Beispiel, welches hoffentlich jeder nachvollziehen kann: Stellen Sie sich vor, Sie befragen Ihren Kollegen nach seinem Alter. Der Kollege ist 56. Damit ist der Kollege weiter rechts auf der Kurve, die wie eine Glocke aussieht, denn mit 63 wird der Datenpunkt, der Ihren Kollegen darstellt, verschwinden. Damit liegt er im 95th Perzentil für Alter. 95% aller Arbeitskollegen sind jünger als der Befragte.

In Tableau wird diese Syntax verwendet:

MODEL_PERCENTILE( Target Expression, Predictor (s) )

Um Werte für die Daten hervorzusagen, sollten Sie darauf achten, dass jede Markierung für einen Datenpunkt steht. Tableau ordnet jeder Markierung die gleiche Wahrscheinlichkeit zu, ob hinter diesem Datenpunkt nun 1 oder 10 Zeilen stehen. Zum Nachlesen auch gerne nochmal hier über die Tableau Seite, in der klar gesagt wird, dass nur aggregierte Werte wie SUM und COUNT verwendet werden können, wenn man mit Aggregationen arbeitet. Als Tipp daher: Verwenden Sie Visualisierungen in dem jede Markierung für eine diskrete Einheit (z.B. Produkt, Person) verwendet wird. Auch sollten alle verwendeten Prädiktoren auf der gleichen Detailebene vorliegen.

Fazit

Als Fazit ist zu sagen, dass die neuen Funktionen die Qualitäten von Tableau weiter ausbauen, um auch mit Tools wie R mithalten zu können. Der Produktfokus liegt nicht auf der Entwicklung einer weiteren Statistikplattform, dennoch zeichnet sich ab, wie Prädiktives Modellieren immer mehr verfeinert wird.

Neugierig geworden? Dann testen Sie Tableau 2020.4 gleich selbst! Hier geht es zur Testversion.

Unsere Kollegen aus UK haben die Neuerungen in Tableau 2020.4 hier in kompakten Videos zusammengetragen.

Und hier geht es zum Blog über die wichtigsten Neuerungen in Tableau 2020.4.

[button URL=“https://www.theinformationlab.de/videos/tableau-2020-4-die-neuerungen-im-video-erklaert/?preview=true“ target=“_self“]Zu den Videos[/button]

[button URL=“https://www.theinformationlab.de/tableau-software/tableau-desktop/“ target=“_new“]Zur Testversion[/button]

[button URL=“ [button URL=“https://www.theinformationlab.de/news/tableau-2020-4-die-neuerungen-im-ueberblick/“ target=“_self“]Tableau 2020.4 Blog[/button]