Définition
TTS
Text-To-Speech — technologie qui convertit un texte écrit en voix audio.
TTS (Text-To-Speech) est la catégorie technologique qui regroupe tous les moteurs de synthèse vocale. Les premiers TTS robotiques (Microsoft Sam, années 2000) ont laissé place aux modèles neuronaux (Tacotron, WaveNet, puis transformer-based depuis 2022).
Pour les chaînes faceless FR, les TTS qui rendent le mieux : ElevenLabs (Multilingual v3), Cartesia Sonic, Microsoft Azure Neural Voices (gratuit jusqu'à 500k caractères/mois).
Pour aller plus loin : voice cloning (clone ta propre voix avec 5-30 min d'audio source), expression cloning (capture ton style narratif), multilingue inversé (parle dans une langue que tu ne maîtrises pas).