Deep Dive: Der DSGVO-Schutzschild

Unser DSGVO-Schutzschild ist eine vorgelagerte Middleware, die sensible Informationen erkennt, maskiert und kontrolliert wieder einfügt. Hier erklären wir Architektur, Funktionsweise und Integrationsmöglichkeiten.

Architektur-Überblick

Verarbeitungskette

Eingang: API, Formular oder Workflow sendet Daten an den Schutzschild.
Analyse: Mehrstufige Erkennung (Regex, ML-Modelle, Kontextregeln) identifiziert PII und sensible Inhalte.
Pseudonymisierung: Personenbezogene Daten werden durch reversible Platzhalter ersetzt.
Policy Engine: Entscheidet, ob die Anfrage erlaubt, blockiert oder zur manuellen Freigabe vorgelegt wird.
Prompting: Bereinigte Anfrage wird an das ausgewählte KI-Modell weitergegeben.
Reintegration: Nach erfolgreicher Antwort werden Originaldaten kontrolliert rehydriert.
Logging & Monitoring: Jede Aktion wird auditierbar gespeichert und kann gemeldet werden.

Pseudonymisierung in der Praxis

Wir kombinieren regelbasierte Erkennung (z. B. IBAN, Personalnummern) mit Kontextmodellen, um auch freie Texte zuverlässig zu bearbeiten. Platzhalter tragen Informationen über Datentyp, Hash und Herkunft, sodass sie nach der Verarbeitung korrekt zugeordnet werden können.

Maskierungslayer

Entity Detection: spaCy, Presidio, eigene Transformer-Modelle
Context Rules: Domain-spezifische Regelsätze (z. B. Personalwesen, Legal)
Checksummen: Validierung von IBAN, Steuer-ID, etc.

Platzhalter-Design

Format: <PII::Kategorie::Hash>
Hash: salted, optional HSM-gestützt
Gültigkeitsdauer: konfigurierbar je Prozess

Rückführung

Mapping via Secure-Store
4-Augen-Freigabe für kritische Kategorien
Rollback-Mechanismen bei Fehlern

Policy Engine & Governance

Die Policy Engine entscheidet in Echtzeit, wie eine Anfrage behandelt wird. Regeln lassen sich pro Use-Case oder Datenklasse definieren.

Block: Anfrage wird abgelehnt, z. B. bei Gesundheitsdaten ohne Rechtsgrundlage.
Mask: Platzhalter ersetzen PII, die Anfrage läuft weiter.
Local Only: Verarbeitung nur mit lokalem Modell; externe APIs werden ausgeschlossen.
Review: Manuelle Freigabe durch Datenschutz oder Prozessverantwortliche.

Integration in bestehende Landschaften

Der Schutzschild kann sowohl als eigenständiger Service (REST/gRPC) als auch als eingebettete Library genutzt werden. Typische Integrationspunkte:

Vor KI-Orchestrierungstools wie LangChain/Haystack
Als Middleware in M365/Google-Workflows
In Formularstrecken (z. B. ServiceNow, SAP Fiori)
In lokalen RAG-Pipelines als Preprocessing-Step

Monitoring & Reporting

Jede Aktion wird mit Zeitstempel, Nutzer:in, Datenklasse und Regelentscheidung gespeichert. Dashboards zeigen Erfolgsquoten, Blockierungen und Auffälligkeiten.

PII-Erkennungsquote: In Projekten > 98 % (Stand 2024)
False Positives: Werden im Regelwerk analysiert und iterativ reduziert
Alerting: Integration in SIEM oder Teams/Slack für Echtzeit-Benachrichtigungen

Grenzen & Verantwortung

Der Schutzschild minimiert Risiken, ersetzt aber keine rechtliche Prüfung. Verantwortliche müssen weiterhin sicherstellen, dass nur zulässige Daten verarbeitet werden. Wir unterstützen mit Workshops, Richtlinien und technischen Guardrails.

Fazit

Mit dem DSGVO-Schutzschild wird KI-Integration in regulierten Umgebungen planbar. Technische Tiefe, Auditierbarkeit und Anpassbarkeit machen ihn zur idealen Ergänzung für Ihren Open-Source-KI-Stack.