
de claude-skill-registry299
Entraînez et affinez des modèles de langage sur Hugging Face Jobs en utilisant TRL (SFT, DPO, GRPO) avec surveillance Trackio et push Hub automatisé. Inclut des scripts et des estimations de coûts.
Fournit des conseils étape par étape et des modèles pour exécuter des flux de travail d'entraînement TRL (Transformer Reinforcement Learning) sur Hugging Face Jobs. Couvre l'ajustement supervisé (SFT), l'optimisation directe des préférences (DPO), le GRPO, la modélisation de la récompense et la conversion des modèles entraînés en GGUF pour le déploiement local. Inclut des exemples de scripts, l'utilisation des dépendances inline PEP 723 pour hf_jobs, des instructions de surveillance Trackio et la configuration du push Hub requise pour préserver les artefacts d'entraînement.
Utilisez cette compétence lorsque les utilisateurs souhaitent affiner ou entraîner des modèles de langage par RL sur des GPU cloud sans infrastructure locale, ont besoin d'aide pour sélectionner le matériel et les délais d'expiration, veulent valider les ensembles de données avant les exécutions GPU, ou ont besoin d'une conversion automatisée en GGUF pour l'inférence locale. Idéal pour les tâches d'entraînement planifiées, les estimations de coûts et la production de scripts d'entraînement prêts pour la production.
Principalement pour les agents capables de soumettre des jobs cloud ou de générer du code d'entraînement (assistants de style Claude Code/Claude-in-code). Utile également pour les CLI de développeurs qui interagissent avec Hugging Face Jobs et les systèmes CI.
Cette compétence n'a pas encore été examinée par notre pipeline d'audit automatisé.
Uloop: Exécuter du Code Dynamique
Exécute de petits extraits C# dans l'éditeur Unity via le CLI uloop pour des tâches d'automatisation de l'éditeur comme le câblage de prefabs, les flux AddComponent et les modifications de scène.
Création de Bookmarklets
Génère des bookmarklets JavaScript exécutables par le navigateur avec un formatage strict (enveloppe IIFE, commentaires de bloc) et fournit des liens prêts à installer ou des instructions d'installation.
Overnight — Codage Autonome de Longue Durée
Orchestre des objectifs de codage de longue durée : décompose les objectifs en tâches atomiques, déploie des travailleurs en worktrees isolés, vérifie les critères d'acceptation et fusionne.
Bexio API (CRM & Facturation Suisse)
Intégrez et gérez les contacts, devis, factures, commandes et produits Bexio via l'API Bexio. Utile pour les workflows de CRM et de documents commerciaux suisses.
Rédacteur de Recherche de Contenu
Une compétence de partenaire d'écriture qui aide à rechercher, structurer, rédiger, citer et améliorer itérativement des articles, des tutoriels et des billets d'opinion.
Diagramme de Hiérarchie d'Agents
Générez des diagrammes de hiérarchie visuels (ASCII, Mermaid, GraphML) montrant les rôles, les niveaux et la délégation des agents pour la documentation et l'onboarding.
Session Sync
Sauvegarde rapidement les fichiers de contexte de session et MEMORY.md comme un point de contrôle unique sans invite ; utile quand l'utilisateur demande de synchroniser la progression actuelle ou d'exécuter une capacité complète
Réviser la Pull Request
Réviseur de PR automatisé et structuré : rassemble les métadonnées, les diffs, les résultats de CI, les changements de dépendances et fournit un verdict concis avec des recommandations de tests et de documentation.
libagent
Bibliothèque d'orchestration d'agents pour l'IA conversationnelle — coordonne les complétions LLM, la mémoire, l'exécution d'outils et les flux multi-tours ; utile pour construire des agents de chat
Team Builder
Conçoit des structures d'équipe performantes et comble les lacunes de compétences en créant des compétences ciblées à la volée ; aide à la définition des rôles, à l'équilibre des personnalités et à la colla