• pexels-markus-spiske-2004161.
        • Software Solutions

          Wir helfen Ihnen bei der Auswahl 
          der richtigen Lösungen, um die 
          Kraft Ihrer Daten freizusetzen.
        • Tableau
        • Das weltweit leistungsstärkste Tool zur Datenvisualisierung und -analyse.

        • Alteryx
        • Die führende Plattform in der
          dynamischen Welt der Analytic
          Process Automation.

        • Amazon Web Services (AWS)
        • Führend bei Cloud-First-Datenlösungen.

        • Snowflake
        • Für Cloud-basierte Data-Warehouse-Lösungen der nächsten Stufe.

        • Celonis
        • Process Mining aus Deutschland. Verschaffen Sie sich ein objektives und datengetriebenes Bild Ihrer internen Prozesse. Ganz im Sinne der optimierten  Wertschöpfung.

  • The Data School
  • News
  • Data Events
        • LockScreen.
        • Über Uns

          Lernen Sie The Information Lab kennen, unser Team, unsere Kunden und erfahren Sie, wie auch Sie ein Teil davon werden können.

          Mehr erfahren

        • Use Cases
        • Wir bieten seit Jahren Datenlösungen für Unternehmen. Und so wie hinter allen Daten eine Geschichte steckt, steckt auch hinter jedem unserer Projekte eine Geschichte.

        • Centre of Excellence
        • Geteiltes Wissen ist Macht – vernetzen Sie sich mit unserer wachsenden Zahl von Beratern und Kunden in ganz Europa. Zusammenarbeit ist der beste Weg zu lernen.

        • Internationales Setup
        • The Information Lab ist an 8 europäischen Standorten mit über 300 Consultants aktiv. Unsere Data School gibt es bereits in London, Sydney und Hamburg.

        • Kunden
        • Wir unterstützen seit 2014 namhafte Unternehmen in der DACH-Region und im deutschen Mittelstand.

        • Team
        • Lernen Sie die Menschen hinter The Information Lab kennen.

        • Karriere
        • Join our team! Wir wachsen stetig und suchen insbesondere im Consulting und unserer Data School stets tolle Kollegen und Kolleginnen.

        • Frequently Asked Questions
        • Häufig gestellte Fragen über uns, unsere Produkte u.v.m.

Banner background image - news

Tableau Prep & R-Skript: Fehlende Rechnungsdaten einfügen

content image

Hinweis: Um mitzumachen, können Sie die erforderlichen Dateien hier herunterladen.

Tableau verbessert seine Produkte kontinuierlich. Dazu gehört die Erweiterung der Funktionen von Tableau Prep durch die Verwendung von R- oder Python-Skripten (Version 2019.3 und höher). Obwohl viele komplexe Aufgaben in Tableau Prep ausgeführt werden können, erfordern andere Szenarien möglicherweise die Verwendung von Alteryx oder ähnlichen ETL-Tools. Ein Skriptschritt in Ihrem Tableau Prep-Workflow hilft jedoch, diese Lücke zu schließen und neue Potenziale freizusetzen, die zuvor nicht möglich waren.  

Da Tableau nur Markierungen anzeigt, in denen Datenzeilen vorhanden sind, müssen wir unsere Daten möglicherweise um neue Zeilen erweitern, um sie in Tableau anzuzeigen. Dieser Prozess wird als Data-Scaffolding oder Data-Densification bezeichnet und kann mit dem Generate Rows Tool in Alteryx durchgeführt werden. Heute möchte ich jedoch zeigen, wie Sie fehlende Daten in Ihren Daten mit R ausfüllen können. 

Bevor wir fortfahren, müssen Sie das Rserve-Paket in R installieren und laden und später in Tableau Prep eine Verbindung zu Rserve herstellen. Sie können den Blog meines Kollegen über die ersten Schritte mit R-Skripten in Tableau Prep hier lesen. Verweisen Sie hier auch auf die Dokumentation von Tableau.

Wir können weitermachen. In diesem Beispiel werden Rechnungsdaten betrachtet, die folgendermaßen aussehen: 

content image

Oben sehen wir einen Datensatz mit einer Zeile pro Rechnung, einschließlich eines Start- und Enddatums der Rechnung sowie eines Gesamtwerts. Unser Ziel ist es jedoch, den monatlichen Wert pro Bestellung im Verlauf der Rechnungsdaten zu visualisieren. Dafür benötigen wir eine monatliche Zeile pro Rechnung und verteilen den Gesamtwert auf alle Monate. Dies kann leicht mit einem einfachen R-Skript erreicht werden. 

Zunächst möchten wir eine Verbindung zu unseren Daten in Prep herstellen und alle notwendige Vorbereitungsschritte vor dem Skriptschritt machen.  

content image

An diesem Punkt ist es sinnvoll, Ihre Daten in ihrem aktuellen Zustand zu exportieren, in R einzulesen und das Skript zu erstellen / testen, welches Sie verwenden möchten, bevor Sie das Skript in Prep ausführen. Dies ist insbesondere während der Entwicklung erforderlich, da die Fehlermeldung in Prep generisch und nicht sehr hilfreich ist. Da ich das bereits getan habe, werden wir diesen Schritt überspringen. 

Nachdem wir unser Skript in R getestet haben, können wir es jetzt in Prep speichern und eine Verbindung herstellen. Der nächste Schritt besteht darin, einen Skriptschritt in unseren Workflow einzufügen und dann eine Verbindung zu Rserve herzustellen. Auf diese Weise kann unser Workflow mit R kommunizieren und seine Funktionen nutzen. 

content image
content image

Sobald wir uns verbunden haben, können wir die Datei auswählen, zu der wir eine Verbindung herstellen möchten, den Funktionsnamen eingeben, die Eingabetaste drücken und Viola! Unser Skript hat uns jetzt die notwendigen Zeilen zur Verfügung gestellt, um unseren monatlichen Wert zu visualisieren: 

content image

Wir gingen von 6 Spalten und 10 Zeilen zu 7 Spalten (unser neues Montlhy_Invoice_Date wurde hinzugefügt) und 157 Zeilen (1 Zeile pro Rechnung und Monat). 

So sieht das Skript ohne Kommentare aus: 

content image

Oben sehen wir die drei Hauptkomponenten: 

1) Laden Sie alle erforderlichen Pakete (Zeile 1) 

2) Erstellen Sie die Funktion, die Sie in Prep ausführen möchten (Zeile 3). 

3) Identifizieren Sie das Ausgabeschema (Zeile 15). 

Nun zu einer detaillierteren Erklärung dessen, was getan wurde. Obwohl es viele Möglichkeiten gibt, dieselbe Aufgabe zu erfüllen, nutzt dieser Ansatz die Tools im tidyverse-Paket (es muss installiert werden, wenn es nicht bereits geschehen ist). Daher laden wir zunächst tidyverse: 

content image

 
Als Nächstes schreiben wir unsere Funktion. Ein entscheidender Hinweis hierbei ist, dass Daten aus Prep als Zeichenfolgen in R gelesen werden. Daher müssen alle Datumsspalten innerhalb unserer Funktion zu Datumstypen gezwungen werden. Dies ist eine Übersicht der unterstützten Datentypen: 

content image

Unten sehen wir, wie die Funktion zugewiesen wird (Zeile 5) und lesen unsere Daten als df (d.h. data frame). Dann zwingen wir Zeichenfolgendaten zu Datumstypen (Zeile 8). 

content image

Nachdem unsere Datumsspalten in Datumstypen konvertiert wurden, können wir mit unserer Funktion fortfahren. Wir nehmen unser ursprüngliches df (Zeile 13), gruppieren es nach allen erforderlichen Spalten (Zeile 14) und nutzen die Funktion expand() (Zeile 15), mit der alle erforderlichen monatlichen Zeilen erstellt werden, die wir pro Rechnung benötigen. Zuletzt werden wir unsere Datumsspalten auf Strings (Zeilen 19 – 21) zurücksetzen und df (Zeile 24) zurückgeben. 

content image

Für die dritte und letzte Komponente unseres Skripts müssen wir ein Ausgabeschema für Prep bereitstellen. Mit anderen Worten, wir müssen ihm sagen, was zu erwarten ist (d. h. Spaltennamen und Datentypen). Beachten Sie, dass unsere Datumsspalten Zeichenfolgen sind (Zeilen 37 – 39). 

content image

Zurück in Prep können wir sehen, dass die Datumsspalten derzeit Zeichenfolgen sind, aber wir können dies leicht mit ein paar Klicks ändern. 

content image

Als Nächstes verteilen wir den Rechnungswert auf jedes entsprechende monatliche Datum, und dies kann mit ein paar schnellen Berechnungen erreicht werden: 

content image
content image

Wir können jetzt monatliche Rechnungswerte in Tableau visualisieren! 

Welche anderen Verwendungsmöglichkeiten von R-Skripten können Sie sich vorstellen? 

Um zu sehen, wie dies mit einem Python-Skript erreicht werden kann, lesen Sie den Blog meines Kollegen hier.

[button URL=“https://www.theinformationlab.co.uk/2019/10/03/tableau-prep-generate-rows-with-tabpy/“ target=“_blank“]ZUM BLOG[/button]