Datenmaskierung für KI

Bevor Daten an ein Sprachmodell gesendet werden, werden alle personenbezogenen Identifier maskiert. Namen, E-Mail-Adressen und andere Identifier werden durch anonymisierte Platzhalter ersetzt. Die Originaldaten werden erst nach der Verarbeitung in unserer eigenen sicheren Infrastruktur wiederhergestellt, sodass die KI selbst nie einen echten Namen oder eine E-Mail-Adresse sieht.

So funktioniert die Maskierungs-Pipeline

Erkennung

Eingehender Text wird nach personenbezogenen Daten durchsucht: Namen, E-Mails, Telefonnummern und andere Identifier.

Maskierung

Jeder Identifier wird durch einen anonymisierten Platzhalter ersetzt, z. B. Namen werden zu Tokens wie [PERSON_1].

LLM-Aufruf

Nur der maskierte Text wird an das Sprachmodell gesendet, das in Azure OpenAI in der EU-Region läuft.

Wiederherstellung

Die Original-Identifier werden aus dem Mapping in unserer eigenen sicheren Infrastruktur wiederhergestellt. Die Ausgabe des Modells wird dann an dich zurückgegeben.

Was das in der Praxis bedeutet

🔐

Keine personenbezogenen Daten in der LLM-Verarbeitung

Das LLM sieht niemals echte Namen, E-Mails oder andere Identifier.

🇪🇺

Ausschließlich Azure OpenAI in EU-Region

Die KI-Verarbeitung findet innerhalb der EU statt. Microsoft bestätigt vertraglich, dass übermittelte Daten nicht zum Training von OpenAI-Modellen verwendet werden.

🧠

Eigenes LLM einbinden

Du kannst Sally optional so konfigurieren, dass ausschließlich eure eigenen Sprachmodelle genutzt werden. Dann verlassen keine Daten eure Infrastruktur für die KI-Verarbeitung.

Geplant (Ende Juli 2026): Sally startet sein eigenes Large Language Model im Produktivbetrieb und ersetzt damit Azure OpenAI für die Standard-KI-Verarbeitung. Ab diesem Zeitpunkt findet jeder Inferenzschritt in Sallys eigener Infrastruktur statt — Sally ist dann vollständig unabhängig von externen KI-Anbietern.

Die oben beschriebene Maskierung gilt für Sallys eigene KI-Verarbeitung. Wenn deine Organisation Sally über MCP an externe KI-Tools anbindet (Claude, ChatGPT usw.), findet auf diesem Datenweg keine Maskierung statt — Details zur Verantwortungsverteilung unter Externe KI-Tools (MCP).

Siehe auch: Hosting & Subunternehmen für den Ort der KI-Verarbeitung und das TOMs-PDF als technische Kontroll-Referenz.

So funktioniert die Maskierungs-Pipeline​

Was das in der Praxis bedeutet​

So funktioniert die Maskierungs-Pipeline

Was das in der Praxis bedeutet