Zum Hauptinhalt springen

Datenmaskierung für KI

Bevor Daten an ein Sprachmodell gesendet werden, werden alle personenbezogenen Identifier maskiert. Namen, E-Mail-Adressen und andere Identifier werden durch anonymisierte Platzhalter ersetzt. Die Originaldaten werden erst nach der Verarbeitung in unserer eigenen sicheren Infrastruktur wiederhergestellt, sodass die KI selbst nie einen echten Namen oder eine E-Mail-Adresse sieht.

So funktioniert die Maskierungs-Pipeline

1
Erkennung

Eingehender Text wird nach personenbezogenen Daten durchsucht: Namen, E-Mails, Telefonnummern und andere Identifier.

2
Maskierung

Jeder Identifier wird durch einen anonymisierten Platzhalter ersetzt, z. B. Namen werden zu Tokens wie [PERSON_1].

3
LLM-Aufruf

Nur der maskierte Text wird an das Sprachmodell gesendet, das in Azure OpenAI in der EU-Region läuft.

4
Wiederherstellung

Die Original-Identifier werden aus dem Mapping in unserer eigenen sicheren Infrastruktur wiederhergestellt. Die Ausgabe des Modells wird dann an dich zurückgegeben.

Was das in der Praxis bedeutet

🔐
Keine personenbezogenen Daten in der LLM-Verarbeitung

Das LLM sieht niemals echte Namen, E-Mails oder andere Identifier.

🇪🇺
Ausschließlich Azure OpenAI in EU-Region

Die KI-Verarbeitung findet innerhalb der EU statt. Microsoft bestätigt vertraglich, dass übermittelte Daten nicht zum Training von OpenAI-Modellen verwendet werden.

🧠
Eigenes LLM einbinden

Du kannst Sally optional so konfigurieren, dass ausschließlich eure eigenen Sprachmodelle genutzt werden. Dann verlassen keine Daten eure Infrastruktur für die KI-Verarbeitung.


Siehe auch: Hosting & Subunternehmen für den Ort der KI-Verarbeitung und das TOMs-PDF als technische Kontroll-Referenz.