
de qwen3_tts_rs219
Générez de l'audio à partir de texte ou clonez des voix à partir d'un audio de référence en utilisant les binaires et modèles Qwen3 TTS ; supporte plusieurs locuteurs nommés, l'anglais et le chinois.
Fournit les binaires et le flux de travail pour synthétiser la parole à partir de texte et cloner des voix en utilisant Qwen3 TTS. Inclut des modèles pré-packagés, de l'audio de référence pour des locuteurs nommés et des exemples de commandes clairs pour la TTS et le clonage de voix (ICL) avec les paramètres requis et les emplacements des fichiers de sortie.
Utilisez cette compétence lorsqu'un utilisateur demande de convertir du texte en parole, de générer des fichiers audio avec une voix nommée, ou d'effectuer un clonage de voix à partir d'un fichier WAV de référence et d'une transcription. Également utile pour la génération de TTS par lot et les flux d'inférence locale où un contrôle précis des chemins de modèles et des variables d'environnement est nécessaire.
Inférés : agents pouvant exécuter des binaires locaux et gérer des fichiers (assistants de codage capables d'utiliser le shell), et chaînes d'outils audio pour les tâches de TTS/clonage de voix.
Cette compétence n'a pas encore été examinée par notre pipeline d'audit automatisé.