Packages SKILL.md qui étendent Claude Code, Cursor, Copilot et autres agents IA.
Étiquettes
argentos-core
Guide complet pour le fine-tuning des LLM avec TRL, couvrant SFT, DPO, PPO et GRPO pour l'alignement des préférences humaines.