Zum Hauptinhalt springen

KI-Modelle in Sally

Sally bietet mehrere KI-Modelle, die für unterschiedliche Anforderungen optimiert sind – von schneller und kosteneffizienter Meeting-Dokumentation bis hin zu hochpräziser, unternehmensweiter Wissenssicherung.

Wichtige Info zum Datennutzung

Sallys KI-Modelle werden niemals mit Kundendaten trainiert. Audioaufnahmen, Transkripte und Zusammenfassungen aus Kundensystemen werden nicht für das Training genutzt und sind für uns als Anbieter nicht zugänglich.

Die Modelle sind in klaren Stufen aufgebaut:

  • Bronze-Modell (Starter-Tarif)
  • Silber-Modell (Pro-Tarif)
  • Gold-Modell (Enterprise-Tarif)

Jede Stufe baut auf der vorherigen auf. Das bedeutet:

  • Höhere Genauigkeit
  • Bessere Sprechererkennung
  • Intelligentere Zusammenfassungen
  • Mehr Robustheit in realen Gesprächssituationen

Schnellnavigation:

1. Schnellübersicht

FeatureBronze (Starter)Silber (Pro)Gold (Enterprise)
TranskriptionsgenauigkeitBis zu 90,3 %Bis zu 94,1 %Bis zu 98,8 %
VerarbeitungszeitBis zu 3 MinutenBis zu 3 MinutenUnter 60 Sekunden
Sprechererkennung●●●●●●●●
Akzente & Dialekte●●●●●●●
Erkennung von Fachbegriffen●●●●●
Besonders geeignet fürEinfache MeetingsRegelmäßige Business-MeetingsKritische & großskalige Meetings

Legende: ● = Industriestandard | ●● = Über dem Industriestandard | ●●● = Premium-Qualität


2. Detailübersicht

2.1 Bronze-Modell (Starter)

Das Bronze-Modell ist für einfache und klar strukturierte Meetings konzipiert, bei denen Geschwindigkeit und Kosten wichtiger sind als maximale Präzision.

2.1.1 Wofür es besonders geeignet ist

  • Klare Sprache mit wenig Überschneidungen
  • Interne Abstimmungen, Stand-ups, kurze Calls
  • Solide Basis-Transkriptionsqualität

2.1.2 Zentrale Eigenschaften

  • Transkriptionsgenauigkeit bis zu 90,3 %
  • Einfache Sprechererkennung
  • Eingeschränkte Robustheit bei starken Akzenten oder Dialekten
  • Zuverlässige Erkennung gängiger Business-Begriffe
  • Verarbeitungszeit: bis zu 3 Minuten

2.1.3 Typische Anwendungsfälle

  • Tägliche Team-Check-ins
  • Interne Updates
  • Unkritische Dokumentation
Gut zu wissen

Das Bronze-Modell ist auf Effizienz optimiert. Es funktioniert am besten bei guter Audioqualität und klar unterscheidbaren Sprecher:innen.


2.2 Silber-Modell (Pro)

Das Silber-Modell ist die Standardempfehlung für die meisten Teams. Es bietet ein ausgewogenes Verhältnis aus Genauigkeit, Geschwindigkeit und Robustheit und ist für typische Business-Szenarien optimiert.

2.2.1 Wofür es besonders geeignet ist

  • Mehrere Sprecher:innen
  • Leichte Akzente und regionale Sprachvarianten
  • Zuverlässige und strukturierte Zusammenfassungen

2.2.2 Zentrale Eigenschaften

  • Transkriptionsgenauigkeit bis zu 94,1 %
  • Verbesserte Sprechererkennung
  • Bessere Verarbeitung unterschiedlicher Ausspracheformen
  • Starke Erkennung fach- und branchenspezifischer Begriffe
  • Verarbeitungszeit: bis zu 3 Minuten

2.2.3 Typische Anwendungsfälle

  • Kundengespräche
  • Team-Workshops
  • Meetings zwischen Abteilungen
Gut zu wissen

Wenn du unsicher bist, welches Modell das richtige ist, ist Silber in den meisten Fällen die sicherste und ausgewogenste Wahl.


2.3 Gold-Modell (Enterprise)

Das Gold-Modell ist für hochkritische Gespräche und den unternehmensweiten Einsatz konzipiert – überall dort, wo Präzision, Geschwindigkeit und Konsistenz entscheidend sind.

2.3.1 Wofür es besonders geeignet ist

  • Schnelle Diskussionen
  • Überschneidende Wortbeiträge
  • Technische oder branchenspezifische Sprache
  • Parallele Meetings in mehreren Teams

2.3.2 Zentrale Eigenschaften

  • Transkriptionsgenauigkeit bis zu 98,8 %
  • Exzellente Sprechererkennung
  • Volle Robustheit gegenüber Akzenten & Dialekten
  • Sehr intelligente Zusammenfassungen mit starkem Kontextverständnis
  • Verarbeitungszeit: unter 60 Sekunden

2.3.3 Zusätzliche Stärken

  • Besseres Verständnis von Intentionen und Entscheidungen
  • Konsistent strukturierte Zusammenfassungen
  • Hohe Verlässlichkeit bei Aufgaben, Beschlüssen und Dokumentation
  • Ausgelegt auf unternehmensweites Wissensmanagement

2.3.4 Typische Anwendungsfälle

  • Sales- und Verhandlungsgespräche
  • Strategiemeetings
  • Experteninterviews
  • Rechtliche, technische oder regulierte Umfelder
  • Unternehmensweite Dokumentationsinitiativen
Gut zu wissen

Gold fokussiert sich weniger auf einzelne Meetings, sondern auf systematische, verlässliche Wissenssicherung im gesamten Unternehmen.


3. So wählst du das richtige Modell

Die Wahl des richtigen KI-Modells hängt davon ab, wie kritisch deine Meetings sind, wer sich auf die Ergebnisse verlässt und welche Folgen Ungenauigkeiten haben könnten.

Eine einfache Faustregel:

  • Du willst Geschwindigkeit und Einfachheit → Bronze
  • Du brauchst verlässliche, revisionssichere Ergebnisse im Alltag → Silber
  • Du brauchst maximale Genauigkeit, Skalierbarkeit & Governance → Gold

3.1 Bronze (Starter): Für Lernen & risikoarme Anwendungsfälle

Das Bronze-Modell eignet sich ideal für den Einstieg oder für Situationen, in denen Transkripte hauptsächlich zur persönlichen Orientierung genutzt werden.

Typische Beispiele:

  • Studierende, die Vorlesungen oder Lerngruppen dokumentieren
  • Einzelpersonen, die den Umgang mit KI-Meeting-Notizen erlernen
  • Einfache interne Gespräche ohne Dokumentationspflicht

Schon auf dieser Stufe liegt Sally über dem allgemeinen Industriestandard bei der Transkriptionsgenauigkeit.

Empfohlen, wenn:

Geschwindigkeit und Kosten wichtiger sind als formale Korrektheit oder rechtliche Nachvollziehbarkeit.


3.2 Silber (Pro): Für professionelle, revisionssichere Arbeit

Das Silber-Modell ist für professionelle Business-Anwendungen konzipiert, bei denen Transkripte aktiv genutzt, geteilt und als Arbeitsgrundlage verwendet werden.

Typische Beispiele:

  • Unternehmen, die Kunden- und interne Meetings dokumentieren
  • Teams, die strukturierte Zusammenfassungen, Aufgaben und Entscheidungen benötigen
  • Organisationen mit Anforderungen an revisionssichere Dokumentation

Dieses Modell bietet die beste Balance aus Genauigkeit, Robustheit und Geschwindigkeit und deckt die meisten operativen Business-Szenarien ab.

Empfohlen, wenn:

Meeting-Ergebnisse reale Konsequenzen haben und Dokumentation verlässlich und verteidigungsfähig sein muss.


Unsere generelle Empfehlung

In der Praxis empfehlen wir den meisten Kund:innen die Pro-Lizenz mit dem Silber-Modell.

Warum?

  • Sie bietet bereits sehr hohe, revisionssichere Genauigkeit
  • Sie deckt den Großteil realer Business-Meetings ab
  • Sie vereint Kosten, Geschwindigkeit und Zuverlässigkeit optimal
  • Sie lässt gezieltes Upscaling auf Gold für besonders kritische Meetings zu

Für die meisten Organisationen ist Silber der Punkt, an dem KI-basierte Meeting-Dokumentation wirklich vertrauenswürdig wird.


3.3 Gold (Enterprise): Für hochkritische & regulierte Umgebungen

Das Gold-Modell ist für maximale Verlässlichkeit in Umgebungen gedacht, in denen jedes Wort zählt.

Typische Beispiele:

  • Management-Teams börsennotierter Unternehmen
  • Vorstände und Geschäftsführungen bei strategischen Entscheidungen
  • Organisationen in stark regulierten oder compliance-getriebenen Branchen

Hier sind Transkripte nicht nur Notizen, sondern Teil von Begründung, Verantwortung und Governance.

Empfohlen, wenn:

Ungenauigkeiten rechtliche, finanzielle oder reputative Risiken nach sich ziehen könnten.


4. Wie werden unsere KI-Modelle trainiert?

Der Schutz deiner Daten hat bei Sally oberste Priorität. Wir trainieren unsere KI-Modelle niemals mit Kundendaten.

Weder Audioaufnahmen noch Transkripte oder Zusammenfassungen aus Kundensystemen fließen in das Modelltraining ein – und sind für uns als Anbieter technisch nicht zugänglich.

4.1 Keine Nutzung von Kundendaten

Konkret bedeutet das:

  • Kundendaten werden nicht gespeichert, analysiert oder wiederverwendet.
  • Es findet kein Training, Fine-Tuning oder Prompt-Learning mit Kundendaten statt.
  • Inhalte aus Meetings bleiben ausschließlich im Besitz der Kunden.
  • Die Verarbeitung erfolgt isoliert, zweckgebunden und gemäß geltender Datenschutz- und Sicherheitsstandards.

4.2 Training mit eigenen, kontrollierten Datensätzen

Unsere KI-Modelle werden ausschließlich mit internen, anonymisierten und rechtssicher erhobenen Datensätzen trainiert, darunter:

  • Über 120.000 Stunden eigens erzeugtes und lizenziertes Audiomaterial.
  • Mehr als 25 Millionen annotierte Sätze für Transkription, Sprechertrennung und Kontextverständnis.
  • Tausende simulierte Meeting-Szenarien mit variierender Audioqualität, Sprecheranzahl und Fachsprache.
  • Kontrollierte Datensätze für Akzente, Dialekte und branchenspezifische Terminologie.

Diese Datensätze werden kontinuierlich erweitert, überprüft und qualitätsgesichert – ohne reale Kundengespräche.

4.3 Was das für dich bedeutet

  • Maximale Datensicherheit ohne versteckte Zweitverwertung.
  • Reproduzierbare und erklärbare Modellqualität.
  • Klare Trennung zwischen Produktnutzung und Modelltraining.
  • Einsatz auch in sensiblen, regulierten oder vertraulichen Umgebungen.