Wie wird die Implementierung von Microsoft Purview zur automatisierten Klassifizierung von sensitiven Daten in einem heterogenen Cloud-Storage-Portfolio technisch orchestriert?

Q: Wie wird die Implementierung von Microsoft Purview zur automatisierten Klassifizierung von sensitiven Daten in einem heterogenen Cloud-Storage-Portfolio technisch orchestriert?

Die Orchestrierung erfolgt über die Purview Data Map, die mittels Scannern und einer Self-hosted Integration Runtime (SHIR) Metadaten aus Azure, AWS, GCP und On-Premises-Quellen extrahiert. Die Klassifizierung basiert auf System- und benutzerdefinierten Mustern, die mit Sensitivity Labels verknüpft werden.

Die technische Orchestrierung erfolgt über die zentrale Purview Data Map, die als Graph-basiertes Repository für alle Metadaten dient. Wir registrieren die heterogenen Speicherorte – etwa AWS S3, Google Cloud Storage oder Azure Blob Storage – als Datenquellen innerhalb des Purview-Accounts. Für den Zugriff auf Ressourcen außerhalb des Azure-Backbones implementieren wir eine Self-hosted Integration Runtime (SHIR), die als gesicherter Proxy zwischen der Cloud-Control-Plane und den Remote-Datenquellen fungiert.

Der Prozess der automatisierten Klassifizierung wird durch die Konfiguration von Scan-Zyklen gesteuert. Dabei extrahiert Purview Metadaten und analysiert Datenstichproben anhand von Klassifizierungsregeln. Wir unterscheiden hierbei zwischen System-Klassifizierungen (vordefinierte Muster wie Kreditkartennummern oder IBANs) und benutzerdefinierten Klassifizierungen, die wir über reguläre Ausdrücke (Regex) präzise definieren.

Komponente	Funktion	Technische Umsetzung
Data Map	Metadaten-Speicher	Graph-Struktur zur Abbildung von Assets und Lineage
Scanner	Datenextraktion	Zeitgesteuerte Scans via Managed Identity oder Service Principal
Classification Engine	Mustererkennung	Anwendung von Regex und ML-Modellen auf Sample-Daten
SHIR	Gateway	Konnektivität für Multi-Cloud- und On-Premises-Umgebungen

Im Rahmen unseres Data Engineering integrieren wir diese Klassifizierungen in den Data Lifecycle. Die Zuweisung von Sensitivity Labels erfolgt über die Verknüpfung mit Microsoft Information Protection (MIP). Die technische Kette sieht wie folgt aus:

Registrierung: Anbindung der Quelle via Konnektor und Authentifizierung.
Scanning: Ausführung des Scans zur Identifikation von Datentypen in den Files/Tabellen.
Klassifizierung: Abgleich der Datenmuster mit den definierten Klassifizierungsregeln.
Labeling: Automatisches Mapping der Klassifizierungen auf Sensitivity Labels.
Governance: Synchronisation der Labels mit den zugrunde liegenden Storage-Policies zur Durchsetzung von Zugriffsbeschränkungen.

Durch diese Architektur wird die Sichtbarkeit sensitiver Daten über Cloud-Grenzen hinweg zentralisiert, ohne dass die Daten physisch verschoben werden müssen.

Wir empfehlen, die Klassifizierung nicht allein auf System-Regeln zu verlassen, sondern ein hybrides Modell aus Regex-basierten Custom Classifications und einer strikten Governance-Policy zu implementieren, um False-Positives in heterogenen Datensätzen zu minimieren.

Andere Fragen in dieser Kategorie

Vorherige Frage

Wie wird die Implementierung von Microsoft Graph API für das automatisierte Lifecycle-Management von M365-Gruppen in einer Enterprise-Umgebung technisch skaliert?

Nächste Frage

Wie wird die Integration von CASB (Cloud Access Security Broker) zur Entdeckung von Shadow-IT technisch in den bestehenden Proxy-Traffic-Fluss integriert?

Andere Nutzer suchten auch nach:

Diese Fragen könnten Sie ebenfalls interessieren.

cloud-digital-workplace

Welche Auswirkungen hat die Aktivierung von TLS 1.3 auf die Latenzzeiten von Cloud-nativen Application Load Balancern im Vergleich zu TLS 1.2?

cloud-digital-workplace

Welche Konfigurationen von Intune App Protection Policies (MAM) gewährleisten die Datentrennung auf unmanaged Devices ohne vollständige MDM-Registrierung?

cloud-digital-workplace

Welche Konfigurationsoptimierungen für die JVM-Garbage-Collection sind für hochperformante Microservices in Kubernetes-Containern unter Berücksichtigung von Cgroup-Limits notwendig?

cloud-digital-workplace

Welche Konfigurationsparameter sind entscheidend für die Optimierung von FSLogix Cloud Cache in Azure Virtual Desktop bei global verteilten User-Profilen?

cloud-digital-workplace

Welche Konfigurationsparameter von Azure App Service Environment (ASE) v3 sind entscheidend für die Isolation von Netzwerkverkehr in hochregulierten Branchen?

Zurück zur FAQ-Übersicht