
de video-expert-analyzer162
Analyse des vidéos, notation des scènes et extraction des meilleurs plans via un système de notation IA à cinq dimensions basé sur les règles de montage de Walter Murch. Compatible avec Bilibili.
Video Expert Analyzer applique une analyse visuelle pilotée par l'IA pour identifier, noter et extraire des scènes de haute qualité à partir de vidéos. Il exécute un pipeline pour télécharger la vidéo, détecter les scènes, extraire les images, puis noter chaque scène selon cinq dimensions (beauté esthétique, crédibilité, impact, mémorabilité, amusement/intérêt). L'outil peut fonctionner en mode Agent (le modèle multimodal visualise directement les images) ou en mode API (modèle de vision distant). Les résultats incluent un fichier scene_scores.json, des rapports par scène et un dossier best_shots contenant les clips sélectionnés.
Utilisez cette compétence pour une curation de niveau professionnel : reels de moments forts, clips pour les réseaux sociaux, analyse concurrentielle ou vérifications de qualité par lots. Déclenchez-le lorsque l'utilisateur demande une analyse vidéo, une notation de scènes, l'extraction de moments forts, ou mentionne des plateformes comme Bilibili/YouTube/Douyin/Xiaohongshu.
Compatible avec les agents et CLI capables de multimodalité : Gemini (visuel), Kimi, Claude (variantes visuelles). Le mode Agent fonctionne là où l'assistant hôte peut visualiser des images ; le mode API nécessite un point de terminaison de modèle visuel.
Video analysis skill using Walter Murch's editing rules and AI-powered five-dimension scoring. Has 8 scripts covering pipeline, AI scoring, Douyin/Xiaohongshu downloading, subtitle extraction, and environment checking. All scripts exited with error codes primarily due to missing arguments (expected under DRY_RUN), and check_environment.py correctly identified heavy dependency requirements (torch, funasr, scenedetect, ffmpeg). The skill is well-documented with bilingual Chinese/English content, but the heavy dependency chain makes it impractical for quick setup.
ffmpegyt-dlpscenedetect[opencv]torchfunasrmodelscopetorchaudioopenairapidocr-onnxruntimeWell-constructed skill for video scene analysis and scoring. No security red flags - no hardcoded credentials, no data exfiltration, no destructive commands. The Douyin/Xiaohongshu downloaders use web scraping techniques (User-Agent spoofing) but this is inherent to the skill's purpose. Heavy dependency chain is the main practicality concern.