Wie kann ich die Stimme meines Telefonassistenten individualisieren?

Erfahren Sie hier, wie Sie den Sprachstil Ihres Telefonassistenten mit Hilfe von SSML Codes ändern und welche Parameter angepasst werden können.

SSML, oder Speech Synthesis Markup Language, ist eine bedeutende Technologie im Bereich der Text-to-Speech (TTS), die es ermöglicht, geschriebenen Text in gesprochene Sprache umzuwandeln.

Damit ist SSML im Grunde genommen eine Art Anleitung, die dem Computer sagt, wie er einen Text vorlesen soll, um natürlicher zu klingen. Durch die Verwendung dieses Features können verschiedene Parameter wie die Betonung von Wörtern, die Setzung von Pausen zwischen Sätzen oder Abschnitten, die Anpassung der Sprechgeschwindigkeit und sogar die Änderung der Tonlage der Stimme festgelegt werden.

Durch den gezielten Einsatz dieser individualisierbaren Bausteine wird die Möglichkeit geschaffen, die Stimme des Assistenten ganz auf Ihre Bedürfnisse anzupassen und somit die Benutzererfahrung für die Anrufenden noch realistischer und ansprechender zu gestalten. Da jeder bearbeitbare Textbaustein individuell angepasst werden kann, kann die gesamte Interaktion mit dem Assistenten auf eine neue Ebene gehoben werden.

Die SSML-Codes können an beliebigen Stellen im Text eingefügt werden, um bestimmte Wörter oder Textbausteine anzupassen. Jeder entsprechende SSML-Code wird um das Wort oder den Abschnitt platziert, den Sie verändern möchten.

1. Anpassen der Sprechgeschwindigkeit

Durch die Anpassbarkeit der Sprechgeschwindigkeit können Texte oder einzelne Wörter nun sowohl langsamer als auch schneller vorgelesen werden.

Um die Wiedergabegeschwindigkeit anzupassen, können folgende Codes verwendet werden:

  • Verlangsamen der Sprechgeschwindigkeit

<prosody rate="slow">Sprechgeschwindigkeit</prosody>

Hier wird das Wort "Sprechgeschwindigkeit" langsamer ausgesprochen. In bestimmten Situationen kann es nützlich sein, die Sprechgeschwindigkeit anzupassen, um sicherzustellen, dass wichtige Informationen klar verstanden und möglicherweise notiert werden können. Ein Beispiel dafür wäre die Weitergabe einer E-Mail-Adresse, die auf der Plattform folgendermaßen dargestellt werden könnte:

Bild 11.07.24 um 08.51

  • Erhöhen der Sprechgeschwindigkeit

<prosody rate="fast">Sprechgeschwindigkeit</prosody>

In diesem Beispiel wird das Wort "Sprechgeschwindigkeit" im erhöhten Tempo wiedergegeben. Hiermit lässt sich beispielsweise die viel gewünschte Funktion unser Kund:innen umsetzen, den Datenschutzhinweis schneller vorlesen zu lassen. 

Bild 11.07.24 um 09.34

  • Individuelles Anpassen der Sprechgeschwindigkeit

<prosody rate="1.5">Sprechgeschwindigkeit</prosody>

In diesem Fall wird der Begriff "Sprechgeschwindigkeit" in 1.5-facher Geschwindigkeit ausgesprochen. Da die Zahl beliebig angepasst werden kann, bietet dieser Code eine flexible Möglichkeit, die Sprechgeschwindigkeit nach Ihren individuellen Bedürfnissen anzupassen. Texte werden mit Zahlen größer als 1 schneller vorgelesen, während die Sprechgeschwindigkeit bei Zahlen kleiner als 1 reduziert wird.

Tipp:  Als eine gute Geschwindigkeit für das schnellere Vorlesen des Textes, aber dennoch eine verständliche Wiedergabe des Inhalts, hat sich 1.3 gezeigt. Wenn Sie das Gesagte verlangsamen möchten, jedoch die Aussprache noch natürlich klingen lassen wollen, eignet sich ein Tempo von 0.7.

2. Einlegen von Pausen

Durch das Einfügen von Pausen mittels SSML können Sie beispielsweise nach einer wichtigen Information eine kurze Pause einlegen, um sicherzustellen, dass diese vom Zuhörer richtig wahrgenommen wird. Dies kann besonders hilfreich sein, wenn es um die Übermittlung von Anweisungen oder wichtigen Details geht. 

Verwenden Sie den folgenden Code, um Pausen einzufügen:

<break time="3s"/>

Hier steht "3s" für eine Pause von drei Sekunde. Je nach Bedarf können Sie die Länge der Pause anpassen, indem Sie die Zeit in Sekunden variieren. 

3. Einstellen englischer Aussprache

Der Telefonassistent ist zwar bereits darauf trainiert viele englische Begriffe richtig auszusprechen, dennoch kann es manchmal zu einer holprigen Aussprache kommen. In solchen Fällen bietet SSML die Möglichkeit, die Aussprache von englischen Wörtern anzupassen. Durch die Verwendung des folgenden SSML-Codes können Sie sicherstellen, dass selbst schwierige englische Begriffe korrekt und verständlich vom Telefonassistenten ausgesprochen werden:

<lang xml:lang="en-US">"Laptop and Washington"</lang>

4. Buchstabieren von Wörtern und Zahlen 

<say-as interpret-as="spell-out">VITAS</say-as>

Durch die Verwendung dieses Codes kann der Telefonassistent hier den Begriff "VITAS" Buchstabe für Buchstabe vorlesen, um eine klare und präzise Wiedergabe zu gewährleisten. Dies ist besonders hilfreich bei der Übermittlung von Namen, Adressen oder anderen wichtigen Informationen, die nicht falsch verstanden werden dürfen. Mit dem Einsatz dieses Codes kann der Telefonassistent nicht nur Wörter, sondern auch Zahlen buchstabieren, um eine klare und präzise Wiedergabe zu gewährleisten.

Auch das Buchstabieren eines Website Namens ist mit folgendem Code möglich:

<say-as interpret-as="characters">www.vitas.ai</say-as>

Tipp: Beim Einsatz von SSML-Codes besteht die Möglichkeit, diese flexibel miteinander zu kombinieren. Besonders beim Buchstabieren haben wir festgestellt, dass es hilfreich sein kann, zusätzlich den Code zur individuellen Anpassung der Sprechgeschwindigkeit zu verwenden. Dadurch wird sichergestellt, dass das Buchstabieren in einem angemessenen Tempo erfolgt und die Informationen klar und verständlich vermittelt werden. 

Auf der Plattform kann das so aussehen: 

Bild 16.07.24 um 16.16

<prosody rate="0.7"><say-as interpret-as="characters">www.vitas.ai</say-as></prosody>

5. Anpassen der Tonhöhe

Durch die Möglichkeit die Tonhöhe einzustellen, können Sie die Stimme des Telefonassistenten weiter personalisieren und an Ihre Bedürfnisse anpassen. Durch die Verwendung des folgenden SSML-Codes können Sie die Tonhöhe der Stimme variieren:

<prosody pitch="20%">Dieser Text klingt höher.</prosody>

<prosody pitch="-20%">Dieser Text klingt tiefer.</prosody>

Hier wird der Text einmal mit einer höheren Tonhöhe und einmal mit einer niedrigeren wiedergegeben. Auch hier kann die Anpassung ganz variabel durch das Verändern der Zahl vor dem % - Zeichen erfolgen. Während Werte größer 1 zu einer Erhöhung der Stimmlage führen, erzeugen Werte kleiner 1 einen tiefere Klangfarbe. Dies kann dazu beitragen, bestimmte Passagen des Textes hervorzuheben oder dem Gesprochenen eine gewisse Dynamik zu verleihen. Die Anpassung der Tonhöhe ermöglicht es, die Stimme des Telefonassistenten noch natürlicher und ansprechender zu gestalten, um die Benutzererfahrung zu optimieren. 

Sollten Sie noch weitere Fragen zum Thema SSML-Codes haben oder Unterstützung bei der Integration in die Plattform benötigen, dann melden Sie sich gerne bei unserem Customer Support Team unter support@telefonassistent.de