Datenmaskierung für KI
Bevor Daten an ein Sprachmodell gesendet werden, werden alle personenbezogenen Identifier maskiert. Namen, E-Mail-Adressen und andere Identifier werden durch anonymisierte Platzhalter ersetzt. Die Originaldaten werden erst nach der Verarbeitung in unserer eigenen sicheren Infrastruktur wiederhergestellt, sodass die KI selbst nie einen echten Namen oder eine E-Mail-Adresse sieht.
So funktioniert die Maskierungs-Pipeline
Eingehender Text wird nach personenbezogenen Daten durchsucht: Namen, E-Mails, Telefonnummern und andere Identifier.
Jeder Identifier wird durch einen anonymisierten Platzhalter ersetzt, z. B. Namen werden zu Tokens wie [PERSON_1].
Nur der maskierte Text wird an das Sprachmodell gesendet, das in Azure OpenAI in der EU-Region läuft.
Die Original-Identifier werden aus dem Mapping in unserer eigenen sicheren Infrastruktur wiederhergestellt. Die Ausgabe des Modells wird dann an dich zurückgegeben.
Was das in der Praxis bedeutet
Das LLM sieht niemals echte Namen, E-Mails oder andere Identifier.
Die KI-Verarbeitung findet innerhalb der EU statt. Microsoft bestätigt vertraglich, dass übermittelte Daten nicht zum Training von OpenAI-Modellen verwendet werden.
Du kannst Sally optional so konfigurieren, dass ausschließlich eure eigenen Sprachmodelle genutzt werden. Dann verlassen keine Daten eure Infrastruktur für die KI-Verarbeitung.
Siehe auch: Hosting & Subunternehmen für den Ort der KI-Verarbeitung und das TOMs-PDF als technische Kontroll-Referenz.