
de media-extract-skill16
Extrait et analyse les médias (YouTube, articles web, audio/vidéo locaux, transcriptions). Produit des résumés structurés, des chapitres, des citations, des exemples de code et des analyses visuelles.
Media Extract est une compétence utilitaire qui ingère du contenu provenant de YouTube, de pages web, de fichiers locaux (vidéo, audio, PDF, texte) ou de transcriptions collées et renvoie des sorties structurées et analysables : des résumés, des horodatages de chapitres, des pépites d'information, des citations, des exemples de commandes/codes et des analyses visuelles via Gemini. Il peut télécharger des vidéos via yt-dlp, nettoyer des transcriptions de réunions (supprimer les horodatages et les mots de remplissage) et enrichir les sorties avec des métadonnées (chaîne, date de publication, durée, vues, mentions j'aime, engagement). La compétence se concentre sur des formats cohérents et compatibles avec les machines afin que les compétences en aval puissent consommer les résultats par programmation.
Utilisez cette compétence lorsqu'un utilisateur partage un lien YouTube, poste l'URL d'un article, télécharge ou indique un fichier média local, colle une transcription, ou demande explicitement de "nettoyer cette transcription", de "supprimer les horodatages" ou d'"analyser cette vidéo/cet article". Utile également pour le traitement par lots de playlists ou de dossiers de vidéos et pour extraire du code affiché visuellement à l'écran.
Idéalement conçu pour les agents ayant un accès aux fichiers et au web ainsi qu'une intégration Gemini (par exemple, Claude avec fichiers+outils, des agents utilisant les modèles visuels Gemini, ou d'autres environnements d'assistants capables d'exécuter des scripts locaux et d'appeler des API externes).
Cette compétence n'a pas encore été examinée par notre pipeline d'audit automatisé.