Deep Dive: Der DSGVO-Schutzschild

Unser DSGVO-Schutzschild ist eine vorgelagerte Middleware, die sensible Informationen erkennt, maskiert und kontrolliert wieder einfügt. Hier erklären wir Architektur, Funktionsweise und Integrationsmöglichkeiten.

Architektur-Überblick

Verarbeitungskette

  1. Eingang: API, Formular oder Workflow sendet Daten an den Schutzschild.
  2. Analyse: Mehrstufige Erkennung (Regex, ML-Modelle, Kontextregeln) identifiziert PII und sensible Inhalte.
  3. Pseudonymisierung: Personenbezogene Daten werden durch reversible Platzhalter ersetzt.
  4. Policy Engine: Entscheidet, ob die Anfrage erlaubt, blockiert oder zur manuellen Freigabe vorgelegt wird.
  5. Prompting: Bereinigte Anfrage wird an das ausgewählte KI-Modell weitergegeben.
  6. Reintegration: Nach erfolgreicher Antwort werden Originaldaten kontrolliert rehydriert.
  7. Logging & Monitoring: Jede Aktion wird auditierbar gespeichert und kann gemeldet werden.

Pseudonymisierung in der Praxis

Wir kombinieren regelbasierte Erkennung (z. B. IBAN, Personalnummern) mit Kontextmodellen, um auch freie Texte zuverlässig zu bearbeiten. Platzhalter tragen Informationen über Datentyp, Hash und Herkunft, sodass sie nach der Verarbeitung korrekt zugeordnet werden können.

Maskierungslayer

  • Entity Detection: spaCy, Presidio, eigene Transformer-Modelle
  • Context Rules: Domain-spezifische Regelsätze (z. B. Personalwesen, Legal)
  • Checksummen: Validierung von IBAN, Steuer-ID, etc.

Platzhalter-Design

  • Format: <PII::Kategorie::Hash>
  • Hash: salted, optional HSM-gestützt
  • Gültigkeitsdauer: konfigurierbar je Prozess

Rückführung

  • Mapping via Secure-Store
  • 4-Augen-Freigabe für kritische Kategorien
  • Rollback-Mechanismen bei Fehlern

Policy Engine & Governance

Die Policy Engine entscheidet in Echtzeit, wie eine Anfrage behandelt wird. Regeln lassen sich pro Use-Case oder Datenklasse definieren.

Integration in bestehende Landschaften

Der Schutzschild kann sowohl als eigenständiger Service (REST/gRPC) als auch als eingebettete Library genutzt werden. Typische Integrationspunkte:

Monitoring & Reporting

Jede Aktion wird mit Zeitstempel, Nutzer:in, Datenklasse und Regelentscheidung gespeichert. Dashboards zeigen Erfolgsquoten, Blockierungen und Auffälligkeiten.

Grenzen & Verantwortung

Der Schutzschild minimiert Risiken, ersetzt aber keine rechtliche Prüfung. Verantwortliche müssen weiterhin sicherstellen, dass nur zulässige Daten verarbeitet werden. Wir unterstützen mit Workshops, Richtlinien und technischen Guardrails.

Fazit

Mit dem DSGVO-Schutzschild wird KI-Integration in regulierten Umgebungen planbar. Technische Tiefe, Auditierbarkeit und Anpassbarkeit machen ihn zur idealen Ergänzung für Ihren Open-Source-KI-Stack.