
de autostar38
Une boucle d'optimisation autonome généralisée (soft RLVR) pour améliorer itérativement tout artefact mesurable grâce à des expériences structurées.
Autostar implémente un cycle rigoureux d'« exploration-évaluation-réflexion ». Il permet à un agent de prendre un artefact (code, prompt, document) et de l'améliorer itérativement en définissant des objectifs, en effectuant des séries d'expériences et en mesurant les progrès par rapport à une grille d'évaluation multidimensionnelle.
Activez cette compétence lorsque vous devez optimiser une sortie spécifique pour laquelle il existe une métrique ou une grille d'évaluation claire. Idéal pour l'ingénierie de prompts (prompt engineering), le perfectionnement de blocs de code complexes ou l'amélioration de la qualité du contenu via une itération répétée et basée sur des preuves.
memory.md), les capacités d'exécution et les configurations d'adaptateurs.Conçu pour les environnements de chat basés sur le web (ex. Claude.ai) où l'accès aux sous-processus est limité, en utilisant des juges LLM et des validations humaines pour la vérification.
Cette compétence n'a pas encore été examinée par notre pipeline d'audit automatisé.