Wie funktioniert die Sprachanalyse für Callcenter?
Sprachanalyselösungen für Kontakt- und Callcenter konzentrieren sich darauf, bestimmte Gesprächsaspekte während eines Anrufs zu erkennen und dazu Notizen zu machen oder Daten aufzuzeichnen. Es gibt zwei Hauptwege, auf denen die Computertechnologie dies erreicht.
Phonetik
Ein Ansatz, den Sprachanalysesoftware verfolgen kann, ist die Umwandlung Ihrer Wörter in Phoneme, d. h. kleine, wahrnehmungsmäßig unterscheidbare Einheiten von Lauten in der Sprache (wie p, b, t, oo in "food" und ea in "easy"). In der englischen Sprache gibt es 44 davon. Die Software analysiert diese Phoneme, um Wörter zu erkennen und Emotionen und Betonungen in den Stimmen der Sprecher zu ermitteln. Dies erfordert eine sehr ausgefeilte Technologie, da es innerhalb von Sprachen und sogar bei ein und demselben Sprecher große Unterschiede gibt. Homophone (Wörter, die gleich ausgesprochen werden, aber unterschiedliche Bedeutungen haben) können schwierig zu verarbeiten sein und erfordern ein Verständnis für den Kontext des Wortes. Und ein und dasselbe Wort, das mit verschiedenen Akzenten ausgesprochen wird, kann als aus verschiedenen Phonemen bestehend erkannt werden. Bei Software zur Umwandlung von Sprache in Text kann es zu Schwierigkeiten kommen, die manchmal sogar dazu führen, dass die Ausgabe unlesbar wird.
LVCSR
Ein neuerer Ansatz in der Sprachanalyse von Contact Centern ist die Large Vocabulary Conversational Speech Recognition (LVCSR), eine Technologie, die ganze Wörter und nicht nur Phoneme erkennt. Im Vergleich zur phonetischen Analyse ist dafür eine große Datenbank erforderlich. Der Grund dafür ist, dass LVCSR unterschiedliche Einträge für die verschiedenen Aussprachen der einzelnen Wörter verwendet (z. B. wird "Auto" in Maryland, New York und Boston ganz anders ausgesprochen). Die Datenverarbeitung ist also langsamer, aber das Ergebnis ist viel genauer.
Während bei der Phonetik die einzelnen Laute betrachtet werden, aus denen die Wörter bestehen, und diese zu Wörtern zusammengesetzt werden (wobei es zu Problemen kommen kann, wenn die Lautfolgen nicht erkannt werden), sucht das LVCSR nach direkten Wortübereinstimmungen und reiht sie zu einem Satz aneinander, indem es eine ausgewählte Anzahl von Wörtern auf einmal verarbeitet. Wenn alle Wörter zusammenpassen, erzeugt LVCSR einen vollständigen Satz, der auf seinen emotionalen Gehalt usw. hin analysiert werden kann.