
de video-podcast-maker501
Automatise la production de bout en bout de podcasts vidéo longs utilisant TTS, Remotion et FFmpeg — supporte la sortie multilingue et les flux de publication Bilibili/YouTube.
Automatise un pipeline de bout en bout qui transforme un sujet en un podcast vidéo prêt pour la production. La compétence gère la recherche, l'écriture du script, la génération audio TTS, la composition Remotion et la prévisualisation studio, la génération de miniatures et le rendu MP4 final avec musique de fond. Elle inclut un sous-système d'apprentissage du design qui extrait des motifs visuels à partir de vidéos ou d'images de référence et les applique comme profils de style aux nouvelles compositions. Le flux est optimisé pour les vidéos de connaissances horizontales style Bilibili, mais peut générer des extraits verticaux pour les shorts.
Utilisez cette compétence lorsque vous voulez qu'un agent de codage produise une vidéo complète à partir d'un prompt de sujet ('Fais un podcast vidéo sur X') avec un minimum d'étapes manuelles, ou lorsque vous avez besoin de modèles cohérents en termes de design appris à partir de vidéos de référence. C'est approprié pour : la production de contenu en série, la republication d'articles en vidéo, le prototypage rapide de styles visuels à partir de références et la génération de sorties 4K/1080p prêtes à être publiées.
Idéal pour les agents de codage et l'outillage style Claude Code capable d'exécuter Node/Remotion, Python/FFmpeg et des backends TTS. Fonctionne avec des agents pouvant appeler des outils shell, gérer des fichiers et lancer Remotion Studio pour revue utilisateur.
Video Podcast Maker est un pipeline complet de bout en bout pour produire des podcasts vidéo 4K à partir d'un sujet, couvrant la recherche, le scripting, le TTS, la composition Remotion, le rendu et la publication sur Bilibili/YouTube. Il dispose de 13 scripts avec un répartiteur CLI, une enveloppe de sortie JSON standardisée et un support TTS multi-backend (Edge/Azure/Doubao/ElevenLabs/OpenAI/Google). Les scripts sont bien écrits avec une gestion d'erreurs appropriée mais dépendent de modules locaux frères (tts/, cli_envelope.py) qui ne peuvent pas être résolus lors d'une exécution isolée. Aucun problème de sécurité — pas d'identifiants codés en dur, pas de commandes destructrices, et la vérification des mises à jour est basée sur le consentement.
tts (local module package)cli_envelope (local module, needed by most scripts)L'une des compétences auditées les plus abouties et complètes. Enveloppe CLI de qualité production avec codes d'erreur, identifiants de requête et suivi de la latence. La compétence suit parfaitement la spécification AgentSkill avec une divulgation progressive via references/, une déclaration de dépendances et un flux de travail clair en 15 étapes. La seule lacune notable est que la plupart des scripts ne peuvent pas être exécutés isolément en raison de dépendances de modules locaux, mais c'est le comportement attendu pour une compétence conçue pour fonctionner dans son contexte de répertoire.