Fachthemen
Governance für Data Lakes
Anforderungen und Erkenntnisse aus der Praxis zum Aufbau und Betrieb eines sicheren Big-Data-Service
Alexander Schätzle, Jan Hadenfeld, Robert Joseph
Abstract
Wo finde ich bestimmte Daten? Wie bekomme ich Zugriff darauf? Und wie lässt sich Datensatz A mit Datensatz B verknüpfen? – Wir alle kennen diese Fragen aus dem unternehmerischen Alltag. Gewachsene Unternehmensstrukturen basieren in der Regel auf einer Vielzahl an domänenspezifischen IT-Systemen, jedes spezialisiert auf den jeweiligen Anwendungsfall. In Zeiten von Industrie 4.0, IoT (Internet of Things), Digitalisierung und Big Data wird diese Datenorchestrierung immer komplexer und behindert eine effektive und effiziente Wertschöpfung. Data Lakes als zentraler Datenspeicher im Kontext einer "Single Point of Truth"-Strategie versprechen eine skalierbare Antwort auf aktuelle und zukünftige Herausforderungen in diesem Kontext. Dieser Artikel beleuchtet die Anforderungen an Data-(Lake-)Management und insbesondere Data Governance, die beim Aufbau eines Data-Lake-Konzepts oft nicht angemessen berücksichtigt werden.