<< Back

Quo vadis, Big Data? (I)

Daten bilden immer die Vergangenheit ab, trotzdem erlaubt der Begriff „Big Data“ einen Blick in die Zukunft. Noch vor 25 Jahren galt eine Datei mit 100 MB als riesengroß und benötigte dutzende teurer Disketten, um gespeichert zu werden. Heute kostet eine mobile Festplatte, welche das 10.000-fache an Daten speichert 40 EUR. Selbst die Speicherkapazität von Blue-ray Discs mit 25 GB erscheint mittlerweile gar nicht mehr so beeindruckend, wenn man liest, dass Microsofts Flight Simulator 2020 so groß wie 20.000 Blue-rays werden soll. Zum Vergleich: MS Flight Simulator aus dem Jahr 2000 hätte über 50 Mal auf eine Blue-Ray gepasst.

Exponentielles Wachstum

„Big Data“ ist also ein Begriff, der zu unterschiedlichen Zeitpunkten Unterschiedliches bedeutete und dem auch in Zukunft ein nicht weniger dynamischer Wert beigemessen werden wird – dementsprechend auch den Fähigkeiten eines guten Datenanalysten. Schon 1965 sagte Gordon E. Moore, Mitgründer von Intel, voraus, dass sich die Transistoren auf Microchips alle zwei Jahre verdoppeln würden, während die Kosten für Computer halbiert würden – ein Theorem, das sich bewahrheitete und heute als „Moore’s Law“ bekannt ist.

Schon 1965 sagte Gordon E. Moore, Mitgründer von Intel, voraus, dass sich die Transistoren auf Microchips alle zwei Jahre verdoppeln würden, während die Kosten für Computer halbiert würden – ein Theorem, das sich bewahrheitete und heute als „Moore’s Law“ bekannt ist.

Datenmengen werden sogar immer größer, unterschiedlicher und in höherer Geschwindigkeit generiert. Daten sind überall, man kann nicht nicht Daten produzieren. Selbst der tägliche Weg in die Arbeit ohne (vermeintliche) Interaktion fließt in Form vom „Rush-hour“-Daten in Staustatistiken. Dazu bieten Apps die Möglichkeit diese Daten kostenlos und anschaulich visualisiert in Echtzeit abzurufen.

Ein Beispiel, wie durch Daten eindeutige Muster zum Vorschein bringen können, ist „Facebook’s map of the world created using friendship connections“. Zu sehen ist hier nicht die Weltkarte, sondern „nur“ die Verbindungen zwischen Facebook-Freunden sind zu sehen.

Man schätzt, dass 90 Prozent aller weltweiten Daten in den letzten zwei Jahren erhoben wurden. Kombiniert man diese Erkenntnisse, stellt sich die Frage „What’s next?“. Aber kann man die Antwort darauf überhaupt einschätzen, geschweige denn beantworten? Ein einfaches Gedankenexperiment zeigt auf, wie das menschliche Gehirn Schwierigkeiten damit hat, exponentiell zu denken: Wir nehmen an, ein Blatt Papier ist x-fach faltbar und wir möchten es sooft in der Hälfte knicken bis es den Mond erreicht – wie oft wäre das? Kurz überlegen; die Antwort findest du am Ende des nächsten Beitrags.

Marko Schweigerer

Analyst Analytics Academy