• pexels-markus-spiske-2004161.
        • Software Solutions

          Wir helfen Ihnen bei der Auswahl 
          der richtigen Lösungen, um die 
          Kraft Ihrer Daten freizusetzen.
        • Tableau
        • Das weltweit leistungsstärkste Tool zur Datenvisualisierung und -analyse.

        • Alteryx
        • Die führende Plattform in der
          dynamischen Welt der Analytic
          Process Automation.

        • Amazon Web Services (AWS)
        • Führend bei Cloud-First-Datenlösungen.

        • Snowflake
        • Für Cloud-basierte Data-Warehouse-Lösungen der nächsten Stufe.

        • Celonis
        • Process Mining aus Deutschland. Verschaffen Sie sich ein objektives und datengetriebenes Bild Ihrer internen Prozesse. Ganz im Sinne der optimierten  Wertschöpfung.

  • The Data School
  • News
  • Data Events
        • LockScreen.
        • Über Uns

          Lernen Sie The Information Lab kennen, unser Team, unsere Kunden und erfahren Sie, wie auch Sie ein Teil davon werden können.

          Mehr erfahren

        • Use Cases
        • Wir bieten seit Jahren Datenlösungen für Unternehmen. Und so wie hinter allen Daten eine Geschichte steckt, steckt auch hinter jedem unserer Projekte eine Geschichte.

        • Centre of Excellence
        • Geteiltes Wissen ist Macht – vernetzen Sie sich mit unserer wachsenden Zahl von Beratern und Kunden in ganz Europa. Zusammenarbeit ist der beste Weg zu lernen.

        • Internationales Setup
        • The Information Lab ist an 8 europäischen Standorten mit über 300 Consultants aktiv. Unsere Data School gibt es bereits in London, Sydney und Hamburg.

        • Kunden
        • Wir unterstützen seit 2014 namhafte Unternehmen in der DACH-Region und im deutschen Mittelstand.

        • Team
        • Lernen Sie die Menschen hinter The Information Lab kennen.

        • Karriere
        • Join our team! Wir wachsen stetig und suchen insbesondere im Consulting und unserer Data School stets tolle Kollegen und Kolleginnen.

Banner background image - news

Dashboard Week – Tag 3

Webscraping mit Alteryx

Der dritte Tag der Dashboard Woche hielt viel für uns bereit. Die Aufgabe bestand darin, die Daten einer Website zu verarbeiten und anschaulich darzustellen. Hier findet Ihr die Website der Tagesschau, die ich dazu verwendet habe, das unten stehende Viz zu bauen. 

Alteryx bietet tolle Möglichkeiten, das sogenannte Webscraping durchzuführen. Über das Text Input Tool kann man die Website, die man sich ausgesucht hat, spezifizieren (1. Schritt).

calcwindow.

(2. Schritt) Als nächstes muss nun das Download Tool verwendet werden. Hierbei möchte Alteryx das Feld identifizieren, aus dem die Informationen gezogen werden sollen. Danach kann man sich entscheiden, ob man die Ausgabe als Felder haben möchte oder als ganz neue Datei.

  • Output – To a Field
  • Output – To a File
Joins - Tableau custom SQL and Alteryx.

(3. Schritt) Ein weiterer wichtiger Schritt ist die Eingabe der regulären Ausdrücke. Der Begriff reguläre Ausdrücke kommt aus der theoretischen Informatik und beschreibt eine Zeichenkette, die anhand von Regeln Mengen von Zeichenketten beschreibt. Kurz gesagt, bestimmte Buchstaben und Sonderzeichen werden verwendet um Informationen digital zu erreichen. 

Tipp: Über diese Website könnt ihr Regex üben.

Damit ihr ein Euch ein Bild davon machen könnt, wie mein regulärer Ausdruck aussieht, habe ich unten ein GIF eingefügt. Das Regex Tool bietet hierbei alle Möglichkeiten, das Wissen aus der Website zu ziehen.

Left join image.

Es geht bei diesen Ausdrücken darum, Informationen innerhalb einer Website herauszuziehen. Mein Beispiel „tagesschau </a> </h4>, ?>.*? </a> </p> “ bezieht sich darauf, nur die Informationen der Kurztexte von der Tagesschau über die Jahre zu ziehen.

Das finale Dashboard könnt Ihr hier unterhalb ansehen:

image.