Speak - Text-to-Speech (Kokoro / Noiz)

Name: Speak - Text-to-Speech (Kokoro / Noiz)
Rating: 82 (1 reviews)
Author: babysor

Score de confiance 82/100

Convertissez du texte (ou des timelines SRT) en audio vocal via les backends locaux Kokoro ou cloud Noiz, avec clonage de voix et rendu aligné sur la timeline.

déclencheurs:text to speechspeakttsvoice clonedubbingsrt to audioepub to audio

speak

Convertissez n'importe quel texte en audio vocal. Supporte deux backends (Kokoro local, Noiz cloud), deux modes (simple ou précision temporelle), et un contrôle de la voix par segment.

Fonctionnalités

Mode simple : texte/fichier -> audio (MP3/WAV) avec voix sélectionnables et contrôle de la durée.
Mode Timeline : rendu de SRT en audio aligné temporellement pour le doublage/sous-titrage.
Clonage de voix (Noiz) : fournissez un audio de référence pour cloner une voix.
Cartes de voix : contrôle de la voix/langue/vitesse/émotion par segment.

Exemples d'utilisation

TTS basique : bash skills/speak/scripts/tts.sh speak -t 'Bonjour le monde' -v af_sarah -o hello.wav
Rendu SRT : bash skills/speak/scripts/tts.sh render --srt input.srt --voice-map vm.json -o output.wav
Clonage de voix : bash skills/speak/scripts/tts.sh speak -t 'Bonjour' --ref-audio ./ref.wav -o clone.wav

Prérequis

ffmpeg dans le PATH pour le mode timeline.
Clé API Noiz pour le backend Noiz (optionnel pour Kokoro).

Quand l'utiliser

Générer des narrations, des livres audio ou de courtes lignes de dialogue.
Doubler ou générer de l'audio aligné temporellement pour des vidéos.
Prototyper rapidement le clonage de voix ou la parole contrôlée par les émotions.

Étiquettes

#tts #text-to-speech #audio #voice-cloning #srt #dubbing

Aucun script exécutéAudité le June 26, 2026

Résumé de l'audit

La compétence speak fournit des fonctionnalités de synthèse vocale via les backends Kokoro (local) et Noiz (cloud), avec prise en charge d'un mode simple et du rendu SRT aligné sur la chronologie pour le doublage. Aucun script intégré n'était présent pour les tests. Le fichier SKILL.md est bien structuré avec des exemples clairs, des déclencheurs et un tableau comparatif, mais fait référence à des scripts (tts.sh) qui ne sont pas inclus dans le payload d'audit.

Points d'attention

Nécessite ffmpeg dans le PATH pour le mode chronologie
Noiz nécessite une clé API de developers.noiz.ai
Kokoro doit être pré-installé séparément

Notes

Aucun script groupé pour les tests d'exécution. SKILL.md fait référence à skills/speak/scripts/tts.sh qui semble être un script réel mais n'a pas été fourni dans le payload d'audit. Profil de sécurité propre sans motifs préoccupants.

Informations

Dépôt: babysor

Score de confiance

Global82

Sécurité95

Qualité du code72

Architecture65

Utilité78

Compétences similaires

BluOS CLI (blu)

Control Bluesound and NAD speakers: discover devices, play/stop, group/ungroup, and set volume from the CLI.

Speak Security Basics

Security best practices for integrating Speak: API key management, audio data privacy, student data protection, and COPPA/FERPA compliance for production deploy

Voice Memo Organizer

Locate, transcribe (local whisper.cpp), summarize and index Apple Voice Memos into a searchable archive with titles, themes and key quotes.

FFmpeg Guide

Comprehensive FFmpeg reference for encoding, converting, streaming, filtering, and analyzing audio/video — command examples, common patterns, and troubleshootin

VoxClaw

A macOS menu-bar app that lets agents send text to a local Mac for speech (Apple TTS or OpenAI voices) over HTTP.

ListenHub — Podcast / TTS / Explainer

Create podcasts, explainer videos, TTS, and AI images using ListenHub scripts; run the provided shell scripts to generate, check status, and download outputs.

Kokoro TTS Server Management

Start, stop, and verify a local Kokoro TTS HTTP server (OpenAI-compatible /v1/audio/speech) with health checks and troubleshooting guidance.

Audiowaveform Helper

Generate PNG/SVG waveform images and JSON or binary peak data from audio files for web players and social previews, with batch processing tips and integration e

Retour aux compétences