
de ai-infra-auto-driven-skills186
Guide manuel basé sur des PR pour l'audit, le débogage et l'extension du parseur d'outils Qwen3 Coder dans vLLM — se concentre sur les cas limites de schéma, les régressions du parseur et v
Cette compétence fournit un dossier d'optimisation précis et basé sur des preuves pour le parseur d'outils Qwen3 Coder dans le runtime vLLM. Elle documente les PR validées, les surfaces du runtime et un plan de validation afin qu'un agent (par exemple, Codex ou un assistant axé sur le code) puisse auditer, diagnostiquer et corriger les régressions liées aux cas limites de JSON-schema (anyOf/oneOf), aux paramètres nullables et aux appels d'outils de l'API Responses. Le contenu est construit à partir de diffs et de notes de PR pour garantir que les recommandations sont traçables.
Utilisez cette compétence lorsqu'un agent doit : reproduire ou enquêter sur une régression dans le parsing des outils Qwen3 de vLLM ; créer ou examiner des PR modifiant le comportement du parseur d'outils ; valider l'intégrité des appels d'outils sous décodage streaming/spéculatif ; ou préparer des pistes de test exerçant des combinaisons de schémas complexes. Elle est destinée aux flux de revue d'ingénierie, d'automatisation QA et de triage de PR.
references/ avec l'historique des PR et des notes de validation.references/pr-history.md, model-pr-optimization-history/...).Le mieux adapté aux agents capables de coder (famille Codex, assistants GPT-code, Claude Code) et à tout flux de travail capable de lire des diffs de PR et d'exécuter des pistes de test de validation.
Cette compétence n'a pas encore été examinée par notre pipeline d'audit automatisé.