Qwen3 TTS — Synthèse Vocale & Clonage de Voix

Générez de l'audio à partir de texte ou clonez des voix à partir d'un audio de référence en utilisant les binaires et modèles Qwen3 TTS ; supporte plusieurs locuteurs nommés, l'anglais et le chinois.

déclencheurs:text to speechttsvoice clonevoice cloninggenerate audioqwen3 tts

GitHub SKILL.md

Ce qu'il fait

Fournit les binaires et le flux de travail pour synthétiser la parole à partir de texte et cloner des voix en utilisant Qwen3 TTS. Inclut des modèles pré-packagés, de l'audio de référence pour des locuteurs nommés et des exemples de commandes clairs pour la TTS et le clonage de voix (ICL) avec les paramètres requis et les emplacements des fichiers de sortie.

Quand l'utiliser

Utilisez cette compétence lorsqu'un utilisateur demande de convertir du texte en parole, de générer des fichiers audio avec une voix nommée, ou d'effectuer un clonage de voix à partir d'un fichier WAV de référence et d'une transcription. Également utile pour la génération de TTS par lot et les flux d'inférence locale où un contrôle précis des chemins de modèles et des variables d'environnement est nécessaire.

Ce qui est inclus

Scripts : tts, voice_clone sous scripts/ (binaires référencés dans le SKILL.md) ; les chemins du répertoire models et les exemples reference_audio sont documentés.
Références : aucune déclarée comme references/ (has_references=false), mais la compétence documente les locuteurs et les noms de modèles disponibles.
Instructions : exemples CLI étape par étape pour tts et voice_clone, notes de configuration de l'environnement pour Linux (LD_LIBRARY_PATH), exigences pour l'audio de référence et exemples de conversion audio avec ffmpeg.

Agents compatibles

Inférés : agents pouvant exécuter des binaires locaux et gérer des fichiers (assistants de codage capables d'utiliser le shell), et chaînes d'outils audio pour les tâches de TTS/clonage de voix.

Étiquettes

#tts #speech #voice-cloning #audio #qwen3 #inference #rust #models

Pas encore audité

Cette compétence n'a pas encore été examinée par notre pipeline d'audit automatisé.

Informations

Dépôt: qwen3_tts_rs
Étoiles: 219

Compétences similaires

BluOS CLI (blu)

Control Bluesound and NAD speakers: discover devices, play/stop, group/ungroup, and set volume from the CLI.

Websocket Client Creator

Generates and guides websocket client integrations: configuration, code samples, best practices, and validation for production-ready websocket clients.

radar — Smart Contract AST & Security Analysis

Multi-framework AST generator and static analysis tool for smart contracts (Rust/Anchor/Stylus and Solidity/Foundry) with a template DSL for writing detection r

tgcli — Telegram CLI

Command-line Telegram client (pure Rust, no TDLib) for syncing, searching, sending messages, managing chats and running daemon mode; suitable for scripts and LL

Speak Security Basics

Security best practices for integrating Speak: API key management, audio data privacy, student data protection, and COPPA/FERPA compliance for production deploy

Makepad Event/Action

Event and action handling patterns for Makepad widgets — guides handling Mouse/Touch/Keyboard events, Hit detection, action emission and parent capture.

QwenCloud Model Selector

Advisory skill that recommends the best QwenCloud model and parameters for a task, balancing quality, speed, and cost.

Klever Blockchain Skill

LLM-optimized developer reference for building Klever smart contracts, transactions, and dApp integrations using klever_sc, ksc, and koperator.

Retour aux compétences