So bleibt Ihr Data Lake – Ihr Datensee – klar

Think-Progress-Team

12/02/2018

Nicht ohne Grund wird in Bezug auf unternehmensweite Datenverwaltungsplattformen häufig auf die Metapher des Wassers zurückgegriffen. Wenn es soweit ist, dass die Fülle der in Ihrem Unternehmen gesammelten und gespeicherten Informationen unermesslich wird, kommt der Datenfluss zum Stillstand. Und wenn Informationen stecken bleiben, wird der sogenannte „Datensee“ zum „Datensumpf“.

Dabei sind die Wahrscheinlichkeit und die Geschwindigkeit der Entstehung eines solchen Datensees Teil des Problems. In vielen Unternehmen bildet sich ein Data Lake fast unbemerkt und häufig gibt es keinen klaren Plan für dessen Pflege. Es gibt Unmengen von Daten, doch nur sehr wenige Personen, die damit umgehen können oder, die zumindest wissen, wie sie an diese herankommen können. Das Ergebnis? Eine weitere etwas abgestandene Metapher: stagnierende Datentümpel. Formlose Informationseinheiten, die nicht ohne Weiteres integriert oder interpretiert werden können.

Ken Tsai, Leiter der Abteilung für Cloud- und Datenverwaltung bei SAP, beschreibt es in TechRepublic so: „Wir bezeichnen dieses Phänomen als „Datendissonanz“, da es nicht möglich ist, die Daten nur durch Aufarbeitung in einen so harmonischen und kompatiblen Zustand gebracht werden können, dass sie auch gemeinsam mit anderen Datentypen nutzbar sind.“

Heutzutage werden so viele Daten unverarbeitet gesammelt, dass jegliche Verknüpfung mit praktischen Metadaten fehlt – etwa das Datum der letzten Änderung oder des letzten Zugriffs. Daher gestaltet sich die Nachverfolgung der Daten schwierig. Sie gleicht der berühmten Suche nach der Nadel im Heuhaufen.

Zudem haben wir es mit riesigen Mengen zu tun! Unternehmen neigen dazu, selbst die kleinsten Datenschnipsel aufzuheben – für den Fall, dass eine Überprüfung durchgeführt werden muss, oder falls sie einmal für eine Analyse gebraucht werden sollten. Ohne eine sinnvolle Integration verstopfen diese Massen jedoch die Server.

Wie können Sie dafür sorgen, dass der Datensee Ihres Unternehmens zu einer sprudelnden Quelle nützlicher Informationen wird?

1. Ziele setzen

Welches Problem möchten Sie in Ihrem Unternehmen lösen? Wenn Sie sich darüber im Klaren sind, wird es einfacher, den Fokus auf jene Daten zu legen, die tatsächlich gesammelt werden müssen und eine entsprechende Methode für deren Interpretation festzulegen. Mit diesem Ziel vor Augen können Sie die gesammelten Informationen in geeignete Kontexte setzen. Anschließend können Sie sich darauf beschränken, nur die gewünschten Informationen herauszufischen.

2. Weniger Daten sammeln

Da es heutzutage kaum etwas kostet, Daten zu sammeln, passiert es häufig, dass Unternehmen zu viele Daten anhäufen. Hinzukommt die Tendenz, sich zu sagen: „Das räume ich später weg“ – so sind wir nun einmal.

Indem Sie das zu lösende Problem gleich zu Anfang definieren, können Sie sich auf das Sammeln bestimmter Datensätze konzentrieren, sodass die überwältigende Flut zu einem nützlichen Rinnsal wird.

3. Automatisierte Fangnetze für Daten

Sobald feststeht, welche Daten in Ihrem Unternehmen benötigt werden, müssen Sie eine Strategie für deren Verarbeitung finden. An dieser Stelle bietet sich ein automatisiertes System an. Wenn Ihre Datensätze mit geeigneten Metadaten versehen sind, können Sie künstliche Intelligenz einsetzen, die Ihre Daten wie mit einem Fischnetz durchkämmt und den Fang sortiert. Insbesondere das maschinelle Lernen eignet sich dafür, Daten in Einheiten zu unterteilen, die Ihrem Team anschließend für Analysen und Interpretationen zur Verfügung stehen.

Es ist kein Problem, in Bezug auf das Sammeln von Informationen wählerisch zu sein. Ganz im Gegenteil: Es ist sogar unabdingbar, wenn Sie Ihre Sammlung auch nutzen möchten.

DAS KÖNNTE IHNEN AUCH GEFALLEN...

Büro 2020

Was Unternehmen im 21. Jahrhundert wissen müssen