TTS — définition (glossaire faceless YouTube)

TTS (Text-To-Speech) est la catégorie technologique qui regroupe tous les moteurs de synthèse vocale. Les premiers TTS robotiques (Microsoft Sam, années 2000) ont laissé place aux modèles neuronaux (Tacotron, WaveNet, puis transformer-based depuis 2022).

Pour les chaînes faceless FR, les TTS qui rendent le mieux : ElevenLabs (Multilingual v3), Cartesia Sonic, Microsoft Azure Neural Voices (gratuit jusqu'à 500k caractères/mois).

Pour aller plus loin : voice cloning (clone ta propre voix avec 5-30 min d'audio source), expression cloning (capture ton style narratif), multilingue inversé (parle dans une langue que tu ne maîtrises pas).

Termes liés