• pexels-markus-spiske-2004161.
        • Software Solutions

          Wir helfen Ihnen bei der Auswahl 
          der richtigen Lösungen, um die 
          Kraft Ihrer Daten freizusetzen.
        • Tableau
        • Das weltweit leistungsstärkste Tool zur Datenvisualisierung und -analyse.

        • Alteryx
        • Die führende Plattform in der
          dynamischen Welt der Analytic
          Process Automation.

        • Amazon Web Services (AWS)
        • Führend bei Cloud-First-Datenlösungen.

        • Snowflake
        • Für Cloud-basierte Data-Warehouse-Lösungen der nächsten Stufe.

        • Celonis
        • Process Mining aus Deutschland. Verschaffen Sie sich ein objektives und datengetriebenes Bild Ihrer internen Prozesse. Ganz im Sinne der optimierten  Wertschöpfung.

  • The Data School
  • News
  • Data Events
        • LockScreen.
        • Über Uns

          Lernen Sie The Information Lab kennen, unser Team, unsere Kunden und erfahren Sie, wie auch Sie ein Teil davon werden können.

          Mehr erfahren

        • Use Cases
        • Wir bieten seit Jahren Datenlösungen für Unternehmen. Und so wie hinter allen Daten eine Geschichte steckt, steckt auch hinter jedem unserer Projekte eine Geschichte.

        • Centre of Excellence
        • Geteiltes Wissen ist Macht – vernetzen Sie sich mit unserer wachsenden Zahl von Beratern und Kunden in ganz Europa. Zusammenarbeit ist der beste Weg zu lernen.

        • Internationales Setup
        • The Information Lab ist an 8 europäischen Standorten mit über 300 Consultants aktiv. Unsere Data School gibt es bereits in London, Sydney und Hamburg.

        • Kunden
        • Wir unterstützen seit 2014 namhafte Unternehmen in der DACH-Region und im deutschen Mittelstand.

        • Team
        • Lernen Sie die Menschen hinter The Information Lab kennen.

        • Karriere
        • Join our team! Wir wachsen stetig und suchen insbesondere im Consulting und unserer Data School stets tolle Kollegen und Kolleginnen.

        • Frequently Asked Questions
        • Häufig gestellte Fragen über uns, unsere Produkte u.v.m.

Banner background image - news

Chroniken der Viz-Woche. Mittwoch : Textanalyse

Datensatzquelle (vorgefertigtes Web Scraping)

Textanalyse, RegEx und WebScapping waren meine Lieblingsthemen während der Schulung in der Analytics Academy. Deshalb war ich sehr froh, meine Kenntnisse in diesen Bereichen aufzufrischen und entsprechende ETL-Techniken zu wiederholen. Angesagt war wieder eine freie Aufgabenstellung, und so haben wir mit anderen Analysten versucht, verschiedene Aspekte unserer Daten zu beleuchten.

Ich habe mich entschieden, die Menge von Rohdaten zu reduzieren und nur Artikel der Kategorie „Wissenschaft“ zu betrachten. Außerdem wollte ich nicht komplette Artikel bezüglich Wortfrequenz analysieren, sondern nur Titel und Kurzfassungen.

content image
Alteryx workflow

ETL hat mich wieder fast 60% der Zeit gekostet. Ich habe mir aber dieses Mal schon von Anfang an ein Schema des Dashboards gezeichnet und nötige Daten definiert. Ich habe auch für jeden Kennwert (Anzahl der Artikel pro Zeitschritt / Frequenz der Wörter / Frequenz der Schlüsselwörter, die in der Suchleiste eingegeben werden) einen separaten Output aufgebaut. In Tableau habe ich mehrere Datensätze mittels Blendfunktion zusammengestellt. Ich habe schnell gemerkt, das meine Word Cloud zum Thema Coronavirus überwältigt ist. Deshalb habe ich zusätzliche Parameter hinzugefügt, um diese Wörter aus meiner Analyse herauszufiltern.

content image
Dashboard final Aussicht

Ich habe meine Zeit heute sehr gut organisiert und mein Dashboard bereits eine halbe Stunde vor dem Präsentationstermin fertig gehabt. Das einzige technische Problem, das ich an diesem Tag hatte, war das überlappende Einblenden von Arbeitsblättern auf dem Dashboard mittels parametrischer Filter, aber mithilfe von unserem Tutor habe ich das auch geschafft und bin nun mit dem Ergebnis sehr zufrieden.

Die interaktive Version des Dashboards ist hier.