• pexels-markus-spiske-2004161.
        • Software Solutions

          Wir helfen Ihnen bei der Auswahl 
          der richtigen Lösungen, um die 
          Kraft Ihrer Daten freizusetzen.
        • Tableau
        • Das weltweit leistungsstärkste Tool zur Datenvisualisierung und -analyse.

        • Alteryx
        • Die führende Plattform in der
          dynamischen Welt der Analytic
          Process Automation.

        • Amazon Web Services (AWS)
        • Führend bei Cloud-First-Datenlösungen.

        • Snowflake
        • Für Cloud-basierte Data-Warehouse-Lösungen der nächsten Stufe.

        • Celonis
        • Process Mining aus Deutschland. Verschaffen Sie sich ein objektives und datengetriebenes Bild Ihrer internen Prozesse. Ganz im Sinne der optimierten  Wertschöpfung.

  • The Data School
  • News
  • Data Events
        • LockScreen.
        • Über Uns

          Lernen Sie The Information Lab kennen, unser Team, unsere Kunden und erfahren Sie, wie auch Sie ein Teil davon werden können.

          Mehr erfahren

        • Use Cases
        • Wir bieten seit Jahren Datenlösungen für Unternehmen. Und so wie hinter allen Daten eine Geschichte steckt, steckt auch hinter jedem unserer Projekte eine Geschichte.

        • Centre of Excellence
        • Geteiltes Wissen ist Macht – vernetzen Sie sich mit unserer wachsenden Zahl von Beratern und Kunden in ganz Europa. Zusammenarbeit ist der beste Weg zu lernen.

        • Internationales Setup
        • The Information Lab ist an 8 europäischen Standorten mit über 300 Consultants aktiv. Unsere Data School gibt es bereits in London, Sydney und Hamburg.

        • Kunden
        • Wir unterstützen seit 2014 namhafte Unternehmen in der DACH-Region und im deutschen Mittelstand.

        • Team
        • Lernen Sie die Menschen hinter The Information Lab kennen.

        • Karriere
        • Join our team! Wir wachsen stetig und suchen insbesondere im Consulting und unserer Data School stets tolle Kollegen und Kolleginnen.

Banner background image - news

Analysetabellen vorbereiten: kumulierte Werte in Tableau Prep

Tableau Desktop ist ein mächtiges Analysewerkzeug, mit dem man sehr viele Fragen an seine Daten beantworten kann. Manchmal ist das aber deutlich einfacher, wenn die Daten schon vorberechnet wurden. Ein Beispiel hierfür ist der Vergleich von IST und kumulierten IST-Werten in der gleichen Visualisierung.

Die einfache Kumulation von Werten ist in Tableau Desktop über eine schnelle Tabellenberechnung möglich. Was aber, wenn ich den IST und den kumulierten IST-Wert nur für einen Monat sehen möchte und den bisherigen Jahresverlauf ausblenden möchte?

Auch das geht natürlich, ist aber dann schon aufwendiger. Und wenn ich dann mit den Werten noch verschiedene Berechnungen erstellen möchte oder eine komplexere Filterung ins Spiel kommt, kann es sehr unschön werden. In der Praxis werden häufig komplexe Datenaufbereitungen und Berechnungen in Tableau Desktop vorgenommen. Heraus kommen hierbei schwer wartbare und teils nicht-performante Dashboards. Was da helfen kann? Vorgelagerte Datenaufvereitung. Zum Beispiel mit einem einfach nutzbaren Tool wie dem Tableau Prep Builder.

Gerade für komplexere Datenaufbereitung ist das Tool deutlich besser geeignet als Tableau Desktop. In diesem Blog geht es also darum, wie man kumulierte Werte (oder auch laufende Gesamtwerte / Summen) in Prep erstellen kann.

Der Datensatz für dieses Beispiel ist der einfachste Fall: Es gibt einen Wert pro Monat. Unser Ziel ist es, eine neue Spalte zu erstellen, in der in jeder Zeile die bis dorthin kumulierten Werte stehen, um dies aus obengenannten Gründen nicht in Tableau Desktop tun zu müssen.

content image
Datensatz

Da der Tableau Prep Builder keine Tabellenberechnungen wie in Tableau Desktop ausführen kann, müssen wir etwas kreativ werden und konventionelle Mittel neu nutzen.

Das im Folgenden beschriebene Vorgehen, führt zu einem Prep-Flow, der folgendermaßen aussieht:

content image
Tableau Prep-Flow

Die verwendete Methode ist robust und gut verständlich, wenngleich sie im ersten Moment unelegant wirken mag. Grundsätzlich geht es darum, an jeden Datensatz (in unserem Fall jeden Monat) alle anderens Monate zu joinen, die früher im gleichen Jahr vorkamen. Das bedeutet, dass der Datensatz mit sich selbst verknüpft wird und dadurch die einzelnen Zeilen vervielfältigt werden. Im Januar gibt es nur eine Zeile, weil davor bisher nichts passiert ist. An den Februar werden Januar und Februar verknüpft und im März dann entsprechend Januar, Februar und März.

content image
Vervielfältigung durch Verknüpfung

Das wird möglich durch eine „ungleiche“ Verknüpfung, indem alle früheren Monate des gleichen Jahres mit einem Monat verknüpft werden.

content image
Konfiguration der Verknüpfung

Ob das Vorgehen grundsätzlich funktioniert hat, kann man daran erkennen, dass das Profil der Datums-Spalte ein charakteristisches „Tannenbaum“-Muster annimmt. Das zeigt an, dass die Anzahl der Datensätze je Monat über die Monate hinweg zunimmt.

content image
„Tannenbaum“-Muster

Sobald das geschehen ist, können die Daten mithilfe eines Aggregieren-Schritts zusammengefasst werden. Um die originalen IST-Werte zu behalten, kann die IST-Spalte mithilfe einer MIN(), MAX() oder AVG()-Funktion aggregiert werden. Die kumulierten Werte müssen hier jedoch üblicherweise mit einer SUM()-Funktion aggregiert werden, damit alle bis dahin auftretenden Werte addiert werden. Das Resultat sieht dann aus wie gewünscht, sowohl IST als auch kumulierte IST-Werte können einfach verwendet werden und müssen nicht aufwändig in Tableau erstellt werden.

content image
Aggregationsschritt
content image
Verarbeitetes Datenset

Zum Abschluss noch ein paar Tipps und Hinweise:

  • Man sollte immer die Spalten der beiden getrennten Datenströme unterschiedlich benennen, ansonsten kommt man im Verknüpfungsschritt durcheinander
  • Die Verknüpfungsfelder sollten alle erstellt sein, bevor die Ströme getrennt werden. In unserem Beispiel ist das Jahr-Feld notwendig, damit man keine laufende Summe über zwei Jahre hinweg bekommt
  • Falls es in einem Monat keine IST-Werte gibt, wird es in diesem Monat mit dieser Methode auch keine kumulierten Werte geben, was natürlich falsch ist. In diesem Fall müsste eine Master-Tabelle erstellt und VOR dem Selbst-Join verknüpft werden, damit alle Zeilen korrekt vorhanden sind und gefüllt werden
  • Es muss sichergestellt werden, dass die Verknüpfung auf dem untersten benötigten Detaillevel stattfindet. Falls in der Datenquelle in einem Monat zwei oder mehr Zeilen vorhanden wären, würden diese noch weiter vervielfältigt werden. Dadurch sind dann die kumulierten Werte falsch. Beheben lässt sich das, indem man die Daten mithilfe eines Aggregieren-Schrittes auf dem korrekten Level gruppiert, bevor man in den beschriebenen Prozess einsteigt

Der Prep-Flow ist HIER zum Download verfügbar.

Der Tableau Prep Builder ist mit einer Tableau-Creatorlizenz nutzbar und muss nicht separat erworben werden. Probiert es also einfach aus!