Deep Dive: Der DSGVO-Schutzschild
Unser DSGVO-Schutzschild ist eine vorgelagerte Middleware, die sensible Informationen erkennt, maskiert und kontrolliert wieder einfügt. Hier erklären wir Architektur, Funktionsweise und Integrationsmöglichkeiten.
Architektur-Überblick
Verarbeitungskette
- Eingang: API, Formular oder Workflow sendet Daten an den Schutzschild.
- Analyse: Mehrstufige Erkennung (Regex, ML-Modelle, Kontextregeln) identifiziert PII und sensible Inhalte.
- Pseudonymisierung: Personenbezogene Daten werden durch reversible Platzhalter ersetzt.
- Policy Engine: Entscheidet, ob die Anfrage erlaubt, blockiert oder zur manuellen Freigabe vorgelegt wird.
- Prompting: Bereinigte Anfrage wird an das ausgewählte KI-Modell weitergegeben.
- Reintegration: Nach erfolgreicher Antwort werden Originaldaten kontrolliert rehydriert.
- Logging & Monitoring: Jede Aktion wird auditierbar gespeichert und kann gemeldet werden.
Pseudonymisierung in der Praxis
Wir kombinieren regelbasierte Erkennung (z. B. IBAN, Personalnummern) mit Kontextmodellen, um auch freie Texte zuverlässig zu bearbeiten. Platzhalter tragen Informationen über Datentyp, Hash und Herkunft, sodass sie nach der Verarbeitung korrekt zugeordnet werden können.
Maskierungslayer
- Entity Detection: spaCy, Presidio, eigene Transformer-Modelle
- Context Rules: Domain-spezifische Regelsätze (z. B. Personalwesen, Legal)
- Checksummen: Validierung von IBAN, Steuer-ID, etc.
Platzhalter-Design
- Format:
<PII::Kategorie::Hash>
- Hash: salted, optional HSM-gestützt
- Gültigkeitsdauer: konfigurierbar je Prozess
Rückführung
- Mapping via Secure-Store
- 4-Augen-Freigabe für kritische Kategorien
- Rollback-Mechanismen bei Fehlern
Policy Engine & Governance
Die Policy Engine entscheidet in Echtzeit, wie eine Anfrage behandelt wird. Regeln lassen sich pro Use-Case oder Datenklasse definieren.
- Block: Anfrage wird abgelehnt, z. B. bei Gesundheitsdaten ohne Rechtsgrundlage.
- Mask: Platzhalter ersetzen PII, die Anfrage läuft weiter.
- Local Only: Verarbeitung nur mit lokalem Modell; externe APIs werden ausgeschlossen.
- Review: Manuelle Freigabe durch Datenschutz oder Prozessverantwortliche.
Integration in bestehende Landschaften
Der Schutzschild kann sowohl als eigenständiger Service (REST/gRPC) als auch als eingebettete Library genutzt werden. Typische Integrationspunkte:
- Vor KI-Orchestrierungstools wie LangChain/Haystack
- Als Middleware in M365/Google-Workflows
- In Formularstrecken (z. B. ServiceNow, SAP Fiori)
- In lokalen RAG-Pipelines als Preprocessing-Step
Monitoring & Reporting
Jede Aktion wird mit Zeitstempel, Nutzer:in, Datenklasse und Regelentscheidung gespeichert. Dashboards zeigen Erfolgsquoten, Blockierungen und Auffälligkeiten.
- PII-Erkennungsquote: In Projekten > 98 % (Stand 2024)
- False Positives: Werden im Regelwerk analysiert und iterativ reduziert
- Alerting: Integration in SIEM oder Teams/Slack für Echtzeit-Benachrichtigungen
Grenzen & Verantwortung
Der Schutzschild minimiert Risiken, ersetzt aber keine rechtliche Prüfung. Verantwortliche müssen weiterhin sicherstellen, dass nur zulässige Daten verarbeitet werden. Wir unterstützen mit Workshops, Richtlinien und technischen Guardrails.
Fazit
Mit dem DSGVO-Schutzschild wird KI-Integration in regulierten Umgebungen planbar. Technische Tiefe, Auditierbarkeit und Anpassbarkeit machen ihn zur idealen Ergänzung für Ihren Open-Source-KI-Stack.