Als Text-to-Speech bezeichnet man die Erzeugung von gesprochener Sprache mit technischen Mitteln basierend auf Texteingaben.
Text-to-Speech (TTS) ist eine Technologie, die es Computern ermöglicht, geschriebenen Text in gesprochene Sprache umzuwandeln. TTS-Systeme verwenden Algorithmen und digitale Stimmen, um Text in natürlich klingende Sprache umzuwandeln.
In der VITAS Plattform wird diese Technologie angewandt, wenn der digitale Assistent beispielsweise Begrüßungssatz, Fragen oder den Abschlusssatz "vorliest". Damit stellt TTS die direkte Schnittstelle zum Kunden dar und trägt maßgeblich zur Qualität des Telefonassistenten bei.
Die Funktionalität der TTS wird durch künstliche Intelligenz unterstützt. Artikulatorische Sprachsynthese wird genutzt, um Texteingaben per Computergenerierung und ohne Nutzung von Audiosamples in akustische Sprache umzuwandeln.