<< Back

Data Management

Ich habe eine Bibliothek gebaut. Eine Bibliothek ohne Katalogisierung, in der jedes Buch, jedes Medium einfach an einem Ort abgelegt wird. Zusätzlich ist diese Bibliothek in mehrere Unterräume, Etagen und Sicherheitsbereiche unterteilt. Es ist der Tag der Eröffnung, eine Besucherin steht mit erwartungsvollem Blick vor dem Informationsschalter und fragt nach dem aktualisierten Hardcover Sammelband von J.R.R. Tolkien’s „Herr der Ringe“. Der Mitarbeiter schaut sie nur verwundert an, deutet hastig auf alle Räume, die er auf dem Raumplan finden kann und antwortet mit einem langgezogenen „Hier.“. Auch wenn Sie mir aller Voraussicht nach nicht glauben werden, aber solche Bibliotheken existieren. Sie beinhalten wahrscheinlich keine Bücher und haben auch keine betretbaren Gebäude, vielmehr sind es die Datenansammlungen, die auf den vielen Festplatten und Servern, in Unternehmen oder im privaten Gebrauch, ihr nicht-katalogisiertes Dasein fristen.

Ähnlich wie bei der Suche nach einem Medium in der herkömmlichen öffentlichen Bibliothek haben Sie auch bei der Suche nach Daten oftmals das Ziel, neue Informationen und hilfreiche Erkenntnisse zu gewinnen. Nun würde ich behaupten, dass es Ihnen bei einer Datenansammlung mit Dateinamen wie „Microsoft Excel-Arbeitsblatt (neu) (12).xlsx“, „Neues Textdokument (3).txt“ oder „Sales_datenquelle-2019-version2-abgesegnet_12122019 KOPIE.csv“ eher schwierig fallen wird, die richtige Datenquelle zu finden. Im privaten Gebrauch ist dies sicher noch zu verschmerzen, da die Nutzeranzahl überschaubar ist. Die Datei, die Sie zuletzt gespeichert haben, ist häufig auch die Datei, die beim nächsten Öffnen als verlässliche Datenquelle gilt. In Unternehmen arbeiten jedoch oft mehrere Mitarbeiter abteilungsübergreifend mit oder an einer Datenquelle und Sie müssen sich die folgende Frage stellen: vertraue ich 100 Mitarbeitern, die möglicherweise 100 Versionen einer Datenquelle benutzen oder vertraue ich einer kuratierten und versionierten Datenquelle, deren Status jederzeit einsehbar ist?

Bei dieser großen Anzahl Menschen, die von einer Datenquelle abhängig sind, kommt es am Ende des Tages auf eine umfassende und entscheidende Frage an: Vertrauen Sie Ihren Daten?

Daten sind die Vergangenheit, Gegenwart und Zukunft eines Unternehmens

Als Unternehmen analysieren Sie historische Daten, vergleichen SEO-Maßnahmen oder die Auswirkung von Menüfarben auf eine Kaufentscheidung. Daten der Gegenwart, Tagesreports, Börsenentwicklungen oder Wetterdaten helfen dabei, fallweise die Entscheidungsrichtung für die Zukunft zu bestimmen. Solche Zukunftsentscheidungen versucht das Unternehmen wiederum so genau es geht durch Prognosen abzubilden – alles, um auf einem hoch-kompetitiven Markt den berühmten Schritt voraus zu sein. Diese drei Datentypen sind die Bestandteile jeder Entscheidung in Richtung Erfolg oder Misserfolg eines jeden Unternehmens. Aus dieser Verantwortung heraus entsteht die Notwendigkeit, Vertrauen in die Daten zu schaffen. Vertrauen schaffen wir vor allem mit einer klaren, transparenten und zentralisierten Daten- und Berechtigungsstruktur aber auch mit einer offenen Datenkommunikation.

Bei Firmen wie Amazon, Google oder Facebook basiert das Geschäftsmodell auf der Auswertung und Nutzung von Daten. Auch andere Unternehmen, von Druckerherstellern bis hin zu Versandhäusern, erkennen mehr und mehr ihre neue Rolle als Servicedienstleister an und schlagen die Brücke zu dem Wert der dabei erhobenen Daten. Egal ob Ihr Unternehmen produziert, verkauft oder berät, Daten sollten als wertvolles Kapital behandelt werden. Damit einher geht auch ein organisiertes Datensicherheitsmodell, denn Daten, wie zum Beispiel die Patentpläne eines neuen Sportschuhs oder die Budgetzahlen Ihrer Flugzeugflotte, besitzen nicht nur für Sie, sondern auch für Ihre Konkurrenz einen hohen Wert. Auch innerhalb Ihres Unternehmens schaffen Daten einen Wert. Richtig kommuniziert erleichtern sie den täglichen Arbeitsablauf und verbessern das Ergebnis und die Qualität von Entscheidungen.

Was ich hier beschrieben habe, nennen wir die drei Data Management Säulen:

Kapital, Vertrauen, Transparenz

Kapital – Daten haben einen Wert, für Sie und für Ihre Konkurrenz

Vertrauen – Sie müssen Ihren Daten vertrauen und Vertrauen für Ihre Daten schaffen

Transparenz – Vertrauen entsteht durch Datenkommunikation und Datenverwaltung

Analysekultur beschreibt den Wandel von einer Kultur, in der Daten nur als Zahlen und Beiwerk gesehen werden, hin zu einer Kultur, in der aktiv hinterfragt, erforscht, gelernt und letztendlich datenbasiert entschieden wird. Wollen Sie diese „Self-Service“ Umgebung erfolgreich in Ihrem Unternehmen etablieren, müssen Sie diese drei Säulen nicht nur erschaffen und verstehen, Sie müssen diese auch Instandhalten. Glücklicherweise gibt es Tools, wie das Tableau Data Management Add-on für den Tableau Server, die Ihnen bei dieser Arbeit das Leben etwas leichter machen können.

Tableau Data Management

Das Data Management Add-on besteht aus zwei Modulen, dem Tableau Catalog und dem Tableau Prep Conductor. Im Tableau Catalog finden Sie all Ihre Datenquellen, Datenbanken und Tabellen, die auf Ihrem Tableau Server benutzt werden. Außerdem verschafft er Ihnen einen Überblick über die Arbeitsmappen und Arbeitsblätter sowie deren Abhängigkeiten zu verschiedenen Datenquellen. Als Data Engineer können Sie so schnell identifizieren, wem eine Datenquelle gehört, welche Dashboards im Falle einer Änderung betroffen sind und wie oft diese Datenquelle benutzt wird. Im Tableau Catalog wird diese Übersicht als „Lineage“ oder Abstammung bezeichnet. Falls Ihnen auffällt, dass die Daten nicht im aktuellen Zustand vorhanden oder fehlerhaft sind, können Sie diese auch bequem mit einer Wartungsbenachrichtigung versehen – ganz im Sinne der transparenten Datenkommunikation. So kann jeder Nutzer zu jedem Zeitpunkt der Analyse nachvollziehen, in welchem Zustand sich die Datenquelle oder das Dashboard befindet. Dadurch erhöht sich auch die eigene Sicherheit bei der Erstellung und Präsentation aufschlussreicher Reports. Durch diese Möglichkeit, Daten direkt auf Ihrem Tableau Server zu pflegen und zu organisieren, setzen Sie mit dem Tableau Catalog den Grundstein für eine wirksame und vertrauenswürdige Datenumgebung.

Wenn es um visuelle Datenaufbereitung geht, haben Sie vielleicht schon von Tools wie Alteryx, Knime oder Talend gehört. Tableau versucht diesen Schmerzpunkt vieler Unternehmen mit dem Tableau Prep Builder (Teil der Desktop Lizenz) zu lösen. Die Wurzeln in der visuellen Datenanalyse merkt man dem Tableau Prep Builder sofort an – fast spielerisch lassen sich Daten aufbereiten, pivotieren, reinigen und im Datenformat Ihrer Wahl abspeichern. Diese visuelle Art der Datenaufbereitung in einem Workflow ist replizierbar und leicht zu verstehen. Im Vergleich zu einer mehrfach verschachtelten SQL-Abfrage lassen sich außerdem Fehler (beim JOIN, der Benennung von Feldern oder Berechnungen) schneller erkennen und beheben. Die visuelle Datenaufbereitung kann man als ersten Schritt auf einer erklärbaren und vertrauenswürdigen Strecke, von der Datengrundlage bis hin zum fertigen Report, betrachten. Mit dem Tableau Prep Conductor als Hilfsmittel können Sie außerdem automatisierte Zeitpläne und Aufgaben für diese visuellen Workflows online auf Ihrem Tableau Server verwalten. Dieses Feature stellt sicher, dass jeden Montag um 05:00 Uhr die Datenquelle X mit einem Auszug aus Ihrer Exasol Datenbank abgeglichen und aktualisiert wird und ersetzt so die manuelle Arbeit und das Risiko, ein Update der Daten zu übersehen.

Vertrauen, Transparenz und Kapital – drei wichtige Punkte, wenn es um Ihre Daten geht. Drei wichtige Punkte, die Sie mit dem Tableau Server und dem Tableau Data Management Tool verbessern können. So schaffen Sie nicht nur eine Kultur, in der Daten mehr sind als nur weitere Zahlen und lästige Exceldateien, Sie sichern auch die Vergangenheit, Gegenwart und Zukunft Ihres Unternehmens.  

Wenn Sie Ihre Datenkompetenz weiter ausbauen wollen, nehmen Sie doch an einem unserer Seminare teil.

Hier geht es zu den Seminaren

Tobias Mühlmeister

Business Intelligence Consultant