
de babysor
Convertissez du texte (ou des timelines SRT) en audio vocal via les backends locaux Kokoro ou cloud Noiz, avec clonage de voix et rendu aligné sur la timeline.
Convertissez n'importe quel texte en audio vocal. Supporte deux backends (Kokoro local, Noiz cloud), deux modes (simple ou précision temporelle), et un contrôle de la voix par segment.
La compétence speak fournit des fonctionnalités de synthèse vocale via les backends Kokoro (local) et Noiz (cloud), avec prise en charge d'un mode simple et du rendu SRT aligné sur la chronologie pour le doublage. Aucun script intégré n'était présent pour les tests. Le fichier SKILL.md est bien structuré avec des exemples clairs, des déclencheurs et un tableau comparatif, mais fait référence à des scripts (tts.sh) qui ne sont pas inclus dans le payload d'audit.
Aucun script groupé pour les tests d'exécution. SKILL.md fait référence à skills/speak/scripts/tts.sh qui semble être un script réel mais n'a pas été fourni dans le payload d'audit. Profil de sécurité propre sans motifs préoccupants.