Wie wird die Implementierung eines Data Mesh Architekturkonzepts mittels Domain-Driven Design in GCP BigQuery technisch realisiert?

Die technische Realisierung eines Data Mesh in GCP BigQuery basiert auf der Abbildung von DDD-Bounded Contexts auf physische und logische Isolationsgrenzen innerhalb der Google Cloud Platform. Wir implementieren dies durch die Zuweisung jeder Domäne zu einem eigenen GCP-Projekt oder dedizierten Datasets, um Ownership und Ressourcenabrechnung (Billing) klar zu trennen.

Innerhalb dieser Domänen-Projekte definieren wir Datenprodukte. Ein Datenprodukt besteht aus den zugrunde liegenden Tabellen und einer kontrollierten Zugriffsschicht. Wir nutzen Authorized Views oder Materialized Views, um nur die für den Konsum relevanten Daten freizugeben, ohne die Rohdaten-Tabellen direkt zu exponieren. Für den organisationsweiten Austausch setzen wir den BigQuery Analytics Hub ein, der die Veröffentlichung und den abonnement-basierten Zugriff auf Datenprodukte ermöglicht.

Die Steuerung erfolgt über Dataplex. Damit realisieren wir die föderierte Governance, indem wir logische Lakes definieren, die über verschiedene Projekte hinweg Datasets gruppieren. Dataplex ermöglicht uns die Definition von Qualitätsregeln und die automatisierte Katalogisierung der Metadaten, wodurch die Auffindbarkeit der Datenprodukte sichergestellt wird.

Die Pipeline-Orchestrierung erfolgt dezentral. Jede Domäne verantwortet ihre eigenen ETL/ELT-Strecken mittels Cloud Composer oder Dataflow, was die Kopplung zwischen den Teams minimiert. In diesem Prozess integrieren wir spezialisierte Data Engineering Praktiken, um die Datenqualität an der Quelle zu sichern.

DDD KonzeptGCP BigQuery UmsetzungFunktion
Bounded ContextGCP Project / DatasetIsolation & Ownership
Data ProductAuthorized View / Analytics HubKonsumierbare Schnittstelle
Domain GovernanceDataplexKatalogisierung & Qualität
Federated IdentityIAM RolesGranulare Zugriffskontrolle

Die Zugriffskontrolle erfolgt über IAM-Rollen auf Dataset-Ebene. Wir vermeiden zentrale Admin-Strukturen und übertragen die Berechtigungsverwaltung an die Domain-Owner, um die Agilität der Teams zu steigern.

Die strikte Trennung auf GCP-Projekt-Ebene ist der einzige Weg, um echte Domänen-Autonomie zu gewährleisten; wer lediglich mit Datasets in einem einzigen Projekt arbeitet, baut kein Data Mesh, sondern einen verteilten Monolithen.

Sergej Wiens

Sergej Wiens

Gründer & Software Architekt