Media Extract

Score de confiance 85/100

Extrait et analyse les médias (YouTube, articles web, audio/vidéo locaux, transcriptions). Produit des résumés structurés, des chapitres, des citations, des exemples de code et des analyses visuelles.

déclencheurs:summarizeclean this transcriptvisual analysisdownload thisgenerate chaptersextract commandsgolden nuggets

GitHub SKILL.md

Ce qu'il fait

Media Extract est une compétence utilitaire qui ingère du contenu provenant de YouTube, de pages web, de fichiers locaux (vidéo, audio, PDF, texte) ou de transcriptions collées et renvoie des sorties structurées et analysables : des résumés, des horodatages de chapitres, des pépites d'information, des citations, des exemples de commandes/codes et des analyses visuelles via Gemini. Il peut télécharger des vidéos via yt-dlp, nettoyer des transcriptions de réunions (supprimer les horodatages et les mots de remplissage) et enrichir les sorties avec des métadonnées (chaîne, date de publication, durée, vues, mentions j'aime, engagement). La compétence se concentre sur des formats cohérents et compatibles avec les machines afin que les compétences en aval puissent consommer les résultats par programmation.

Quand l'utiliser

Utilisez cette compétence lorsqu'un utilisateur partage un lien YouTube, poste l'URL d'un article, télécharge ou indique un fichier média local, colle une transcription, ou demande explicitement de "nettoyer cette transcription", de "supprimer les horodatages" ou d'"analyser cette vidéo/cet article". Utile également pour le traitement par lots de playlists ou de dossiers de vidéos et pour extraire du code affiché visuellement à l'écran.

Ce qui est inclus

Scripts : les références aux instructions incluent des scripts de récupération basés sur yt-dlp et un script d'extraction Python pour l'analyse visuelle de Gemini (nécessite google-genai).
Références : des fichiers de flux de travail pour les résumés, l'analyse visuelle, les chapitres, le nettoyage des transcriptions et le traitement par lots sont décrits.
Instructions : des règles de détection de source, l'enrichissement des métadonnées, le comportement de mise en cache pour les transcriptions et les conventions de nommage des sorties sont fournis dans le corps de la compétence.

Agents compatibles

Idéalement conçu pour les agents ayant un accès aux fichiers et au web ainsi qu'une intégration Gemini (par exemple, Claude avec fichiers+outils, des agents utilisant les modèles visuels Gemini, ou d'autres environnements d'assistants capables d'exécuter des scripts locaux et d'appeler des API externes).

Étiquettes

#media-processing #transcript-cleaning #youtube #visual-analysis #content-extraction #summarization #batch-processing #workflows #gemini

Scripts exécutés dans un bac à sableExécution échouéeAudité le June 24, 2026

Résumé de l'audit

Media-extract est une compétence universelle d'extraction de médias gérant YouTube, les articles Web, les fichiers vidéo/audio locaux et les transcriptions. Elle route l'entrée selon le type (URL, fichier, texte collé) vers les flux appropriés (résumé, analyse visuelle, nettoyage, etc.). Le script Python (extract.py) est bien structuré avec une gestion d'erreurs propre, mais nécessite google-genai qui n'était pas installé, provoquant sa sortie avec un message d'erreur utile. Aucune préoccupation de sécurité trouvée — le chargement du .env est sûr, pas d'identifiants codés en dur, pas de valeurs par défaut destructrices, pas de modèles d'exfiltration.

Points d'attention

Nécessite le package google-genai (pip install google-genai) pour l'analyse visuelle
Nécessite yt-dlp et jq pour la récupération des transcriptions YouTube
GEMINI_API_KEY doit être défini dans le fichier .env pour le script Python
Le flag --cleanup supprime définitivement les fichiers vidéo (optionnel, documenté)

Dépendances manquantes

google-genai

Notes

Compétence bien conçue avec un routage d'intention clair et une bonne divulgation progressive via references/workflows/. Le SKILL.md est complet avec des balises XML appropriées pour la structure. Le script a échoué uniquement en raison de la dépendance manquante google-genai, et non d'un bug de code. L'implémentation du chargement du .env est manuelle mais sécurisée (utilise os.environ.setdefault, ignore les commentaires). Légère déduction pour l'absence de type hints et l'utilisation de print pour les logs au lieu du module logging approprié.

Informations

Dépôt: media-extract-skill
Étoiles: 16

Score de confiance

Global85

Sécurité92

Qualité du code78

Architecture80

Utilité82

Compétences similaires

Markdrop

Convert PDFs to structured Markdown or interactive HTML and generate AI-powered descriptions for images and tables using multiple LLM providers.

Skyvern — AI Browser Automation

Cloud-first AI browser automation platform and SDKs for extracting data, filling forms, downloading files, and running multi-step web workflows from agents or c

hmem — Setup

Interactive installer and setup guide for hmem (persistent memory MCP server); automates .mcp.json config, memory dir, and adds agent hooks for Claude Code, Gem

Executing Plans

Execute a written implementation plan in safe, review-checked batches: load, review, run tasks in small batches with verification and checkpoints for feedback.

Task Delegation Assistant

Helps the agent clarify, break down, schedule, and track delegated tasks using memory and routines; creates plans with steps, due dates and monitoring routines.

Reflect Codex Sessions

Generate reflective summaries of past Codex session histories (summaries, patterns, open loops, decisions) via a CLI that scans cached ~/.codex/sessions and pro

XHS CLI (Xiaohongshu Terminal)

Command-line tool to search, read, and interact with Xiaohongshu (小红书) posts and profiles — supports search, reading, likes, favorites, comments, and posting fr

Avenir-Web

Run and improve Avenir-Web autonomous web tasks: choose run mode, validate and refine instructions, execute single or batch runs, and analyze outputs to propose

Retour aux compétences