• pexels-markus-spiske-2004161.
        • Software Solutions

          Wir helfen Ihnen bei der Auswahl 
          der richtigen Lösungen, um die 
          Kraft Ihrer Daten freizusetzen.
        • Tableau
        • Das weltweit leistungsstärkste Tool zur Datenvisualisierung und -analyse.

        • Alteryx
        • Die führende Plattform in der
          dynamischen Welt der Analytic
          Process Automation.

        • Amazon Web Services (AWS)
        • Führend bei Cloud-First-Datenlösungen.

        • Snowflake
        • Für Cloud-basierte Data-Warehouse-Lösungen der nächsten Stufe.

        • Celonis
        • Process Mining aus Deutschland. Verschaffen Sie sich ein objektives und datengetriebenes Bild Ihrer internen Prozesse. Ganz im Sinne der optimierten  Wertschöpfung.

  • The Data School
  • News
  • Data Events
        • LockScreen.
        • Über Uns

          Lernen Sie The Information Lab kennen, unser Team, unsere Kunden und erfahren Sie, wie auch Sie ein Teil davon werden können.

          Mehr erfahren

        • Use Cases
        • Wir bieten seit Jahren Datenlösungen für Unternehmen. Und so wie hinter allen Daten eine Geschichte steckt, steckt auch hinter jedem unserer Projekte eine Geschichte.

        • Centre of Excellence
        • Geteiltes Wissen ist Macht – vernetzen Sie sich mit unserer wachsenden Zahl von Beratern und Kunden in ganz Europa. Zusammenarbeit ist der beste Weg zu lernen.

        • Internationales Setup
        • The Information Lab ist an 8 europäischen Standorten mit über 300 Consultants aktiv. Unsere Data School gibt es bereits in London, Sydney und Hamburg.

        • Kunden
        • Wir unterstützen seit 2014 namhafte Unternehmen in der DACH-Region und im deutschen Mittelstand.

        • Team
        • Lernen Sie die Menschen hinter The Information Lab kennen.

        • Karriere
        • Join our team! Wir wachsen stetig und suchen insbesondere im Consulting und unserer Data School stets tolle Kollegen und Kolleginnen.

Banner background image - news

Verbindung zu Datenbanken mit Tableau und Alteryx: generelle Übersicht

In der zehnten Woche erhielten die Analysts der Analytics Academy eine umfassende Übersicht zu verschiedenen Datenbanken.

Datenbanken beinhalten teilweise mehrere Terrabyte an Daten, was es uns unmöglich macht, diese Daten zu extraieren oder auf einen lokalen Rechner herunterzuladen. Daher ist es sinnvoll, eine direkte Verbindung zur Datenbank zu schaffen. Diese Verbindung spielt eine große Rolle, denn diese muss in Übereinstimmung mit den rechtlichen Rahmenbedindungen und Datenschutzgrundsätzen in Einklang gebracht werden. Die Verbindung zu einer Datenbank ermöglicht zusätzlich die Initiierung mehrerer Aufgaben, die von mehreren Nutzern gleichzeitig an den gleichen Datensatz abgefragt werden können.

SQL ist eine Datenbanksprache. Jede Datenbank hat seinen eigenen „SQL-Dialekt“, Tableau stellt diese für die bekanntesten Datenbanken die entsprechenden Treiber zur Verfügung. Wir haben geübt, SQL Abfragen an Datenbanken selbst zu formulieren. Dieser Mechanismus läuft im Hintergrund von Tableau ab, wenn eine direkte Verbindung zur Datenbank hergestellt wird und beispielsweise ein Filter auf die Daten angewendet wird.

content image
Filtern in-DB, Tableau Desktop: SQL Abfrage an PostgreSQL Server, die im Hintergrund läuft.

Die Workflow-Verarbeitung kann länger dauern, wenn eine große Datenmenge in eine Datenbank und aus einer Datenbank gestreamt wird. Daher kann es sinnvoll sein, bestimmte Berechnungen und Transformationen der Daten direkt in der Datenbank durchzuführen, damit ein Workflow beschleunigt werden kann. Alteryx In-DB Tools erlauben es, einen ETL-Prozess direkt in der Datenbank durchzuführen und in dieser Weise auch die Daten vorbereiten. Das funktioniert auch über die Treiber und benötigt grundsätzlich keine bzw. sehr geringe SQL Kenntnisse der Nutzer.

content image
Ein Beispiel des Alteryx In-DB Workflow

Das Connect In-DB Tools (1) ist immer das erste Werkzeug, das in den Workflow gesetzt wird. Hier stellen Sie eine Verbindung zur Datenbank und zur entsprechenden Tabelle her. Aufgrund der Art der datenbankinternen Verarbeitung wird der Verbindungsstatus nicht angezeigt. Deshalb sind die Browse In-DB Tools (2) extrem nützlich, da diese Ziwschenschritte anzeigen und eine Kontrolle der Daten ermöglichen. Die anderen In-DB Tools (Join, Summarize, Select) funktionieren wie Standart-Workflow Tools.

Manchmal ist es dennoch nötig, ein Teil der Daten aus der Datenbank herunterzuladen. Bei den Tools Data Stream-In und Data Stream-Out wird ein In-DB-Anker verwendet, um eine Verbindung zu In-DB-Tools herzustellen. Der Standard-Workflow-Anker wird dann verwendet, um eine Verbindung zu Standard-Workflow-Tools herzustellen. 

content image
Ein Beispiel des Alteryx Hybrid Workflow

Ein weiteres nützliches Feature ist der datenbankinterne Cache. Dies bedeutet, dass eine Tabelle nicht erneut heruntergeladen werden muss, wenn ein Workflow erneut läuft. (Beispiel im Bild oben: Alles, was vor dem DB-Datastream Out Tool ohne Veränderung bleibt, wird nur 1x heruntergeladen [vor dem 1. roten Kasten]). Das macht den Alteryx-Workflow schneller und flexibler.

Ein detaillierte Beschreibung des Alteryx In-DB Tools finden Sie hier.