
de skillattack30
Extrait, importe et ajoute des résultats d'évaluation de modèles structurés aux fiches de modèles Hugging Face ; exécute ou importe des évaluations de benchmark et génère le YAML model-index.
Cette compétence ajoute un flux de travail complet pour extraire des tableaux de benchmark à partir de fichiers README, importer des scores de benchmark depuis des services externes (Artificial Analysis), et exécuter des évaluations personnalisées localement ou sur Hugging Face Jobs. Elle produit des entrées YAML model-index et peut créer des pull requests pour mettre à jour les fiches de modèles, avec des validations et des vérifications pour éviter les PR en double. Elle prend en charge les backends lighteval/inspect-ai et vLLM pour des évaluations accélérées par GPU.
Utilisez cette compétence lorsque vous devez ajouter ou mettre à jour des résultats d'évaluation pour une fiche de modèle Hugging Face : extraire des tableaux existants du README, importer des scores de benchmark faisant autorité, ou exécuter des tâches d'évaluation reproductibles et soumettre les résultats via une PR. Elle est particulièrement utile pour les mainteneurs ou contributeurs qui mettent régulièrement à jour les métadonnées model-index.
Probablement utilisée par des agents pouvant exécuter des commandes shell/CLI et gérer des PR GitHub (Copilot/assistant de code, agents capables de CLI).
Compétence de gestion d'évaluation de modèles Hugging Face — extrait les tableaux d'évaluation des README, importe les benchmarks via l'API Artificial Analysis et exécute des évaluations personnalisées via vLLM/lighteval. Aucun script groupé n'était disponible pour le test (dictionnaire de scripts vide malgré les références dans SKILL.md). Bonne pratique contradictoire : le point #11 indique 'toujours utiliser --create-pr sans vérifier l'existence de PR', ce qui s'oppose directement à l'avertissement proéminent de toujours vérifier d'abord — cela compromet les garde-fous anti-spam.
L'instruction contradictoire dans la bonne pratique #11 ('toujours utiliser --create-pr sans vérifier l'existence de PR') mine directement l'avertissement précédent sur la vérification des PR existantes. Cela pourrait être une erreur honnête ou une tentative d'encourager le spam de PR sur les dépôts de modèles HF. Pas clairement malveillant mais préoccupant. La compétence provient du dépôt 'skillattack' qui a une convention de nommage thématique d'injection. Aucun script n'a été groupé, donc analyse statique uniquement.
Planification avec Fichiers
Modèle de planification basé sur des fichiers style Manus : création de task_plan.md, findings.md et progress.md pour gérer le travail complexe multi-étapes et la récupération de session.
Weiyun Management — Boîte à outils de stockage Tencent Cloud
Boîte à outils Python et CLI pour automatiser le stockage cloud Tencent Weiyun : connexion (QR/cookies), téléchargement, partage, gestion de l'espace et de la corbeille.