Arize Experiment

Score de confiance 92/100

de arize-skills19

Créez, exécutez et analysez des expériences Arize pour évaluer et comparer les performances des modèles via le CLI ax.

déclencheurs:create experimentexport runscompare modelsax experimentsrun experimentbenchmark models

GitHub SKILL.md

Ce que cela fait

Fournit un guide CLI étape par étape pour créer, exporter, exécuter et comparer des expériences Arize. Il explique les concepts d'expérience, de run et de dataset, comment exporter des jeux de données et collecter des runs, ainsi que la manière d'effectuer des comparaisons statistiques et des exports pour analyse approfondie. Des flux de travail concrets et des exemples de commandes (CLI ax) sont inclus pour les tâches courantes telles que l'exportation de runs, la création d'expériences et l'envoi des sorties vers des outils d'analyse.

Quand l'utiliser

Utilisez cette compétence lorsque vous devez évaluer la performance d'un modèle, effectuer des comparaisons de modèles A/B, exporter des runs d'expériences pour analyse ou automatiser la création d'expériences à partir d'exports de datasets. Déclenchez-la lorsque l'utilisateur pose des questions sur la création d'expériences, l'exportation de runs, la comparaison de modèles, le benchmarking ou la mesure de la précision.

Ce qui est inclus

Scripts : aucun script détecté dans ce répertoire de compétence (has_scripts=false)
Références : incluses (voir references/ pour le guide de configuration et les profils)
Instructions : exemples CLI détaillés pour lister, obtenir et exporter des expériences, créer des expériences à partir de fichiers de run, et envoyer les exports vers des commandes d'analyse. Des conseils sur les SDK de fournisseurs et l'exécution d'appels API de modèles réels sont fournis.

Agents compatibles

Idéal pour les agents disposant de capacités shell/CLI et ayant accès au CLI ax ainsi qu'aux SDK de fournisseurs de modèles en réseau (ex: Claude Code, Codex, agents compatibles Copilot/CLI).

Étiquettes

#arize #experiments #datasets #model-evaluation #llmops #cli #exporting #benchmarking

Aucun script exécutéAudité le June 23, 2026

Résumé de l'audit

Compétence de wrapper CLI pour la gestion d'expériences Arize via la CLI ax. Aucun script fourni — toutes les interactions se font via des commandes shell documentées. Le fichier SKILL.md est exhaustif, avec des concepts clairs, des tableaux de drapeaux détaillés, des exemples de flux de travail pratiques et une section de dépannage. Il interdit explicitement l'exfiltration d'identifiants et la fabrication de sorties, ce qui témoigne d'une posture de sécurité robuste. De niche, mais bien exécutée pour son public cible de praticiens de l'évaluation des LLM utilisant Arize.

Points d'attention

Nécessite l'installation de la CLI ax et un compte Arize avec une clé API configurée
Aucun script à valider — purement de la documentation de référence pour les commandes CLI

Notes

Compétence propre sans problème de sécurité. Position ferme contre la fabrication de données et l'exfiltration d'identifiants. Documentation bien structurée. Utilité limitée par un public de niche (utilisateurs de la plateforme Arize effectuant des évaluations de LLM), mais de haute qualité dans ce cadre.

Informations

Dépôt: arize-skills
Étoiles: 19

Score de confiance

Global92

Sécurité100

Qualité du code85

Architecture80

Utilité58

Compétences similaires

Readwise Reader Document Management

Manage Readwise Reader documents: list, save, search, move, tag, highlight, export and bulk-edit via official and custom CLIs.

Scikit-learn (Classical ML reference)

Comprehensive scikit-learn guidance for classification, regression, clustering, preprocessing, model evaluation, and production-ready ML pipelines.

ezBookkeeping API Tools

Command-line API tools for ezBookkeeping: record and query transactions, retrieve accounts/categories/tags, and fetch exchange rates for self-hosted personal fi

Tmux Bridge

Give an agent controlled access to a local tmux terminal bridge so it can run shell commands, capture output, and manage sessions on the user's machine.

SourceSage CLI

Generate concise, LLM-friendly repository summaries (Markdown) using the SourceSage CLI — supports lite mode, language switching, and targeted repo analysis.

Nit (Nitter CLI)

Terminal client to browse tweets, view profiles, and search posts via Nitter instances without opening a browser.

hn — Hacker News CLI

Terminal-based Hacker News client with a CLI and optional interactive TUI for browsing top/new/best/ask/show/jobs stories, viewing threads with nested comments,

Lokalise Migration — Deep Dive

Step-by-step migration guide and tooling for moving translations from Crowdin/Phrase/POEditor into Lokalise, including transforms, uploads and validation.

Retour aux compétences