
de arize-skills19
Créez, exécutez et analysez des expériences Arize pour évaluer et comparer les performances des modèles via le CLI ax.
Fournit un guide CLI étape par étape pour créer, exporter, exécuter et comparer des expériences Arize. Il explique les concepts d'expérience, de run et de dataset, comment exporter des jeux de données et collecter des runs, ainsi que la manière d'effectuer des comparaisons statistiques et des exports pour analyse approfondie. Des flux de travail concrets et des exemples de commandes (CLI ax) sont inclus pour les tâches courantes telles que l'exportation de runs, la création d'expériences et l'envoi des sorties vers des outils d'analyse.
Utilisez cette compétence lorsque vous devez évaluer la performance d'un modèle, effectuer des comparaisons de modèles A/B, exporter des runs d'expériences pour analyse ou automatiser la création d'expériences à partir d'exports de datasets. Déclenchez-la lorsque l'utilisateur pose des questions sur la création d'expériences, l'exportation de runs, la comparaison de modèles, le benchmarking ou la mesure de la précision.
Idéal pour les agents disposant de capacités shell/CLI et ayant accès au CLI ax ainsi qu'aux SDK de fournisseurs de modèles en réseau (ex: Claude Code, Codex, agents compatibles Copilot/CLI).
Cette compétence n'a pas encore été examinée par notre pipeline d'audit automatisé.