
de cafekit52
CLI pour l'automatisation de navigateur optimisée pour le contexte : snapshots, actions DOM, enregistrement audio/vidéo et support des navigateurs cloud pour les sessions d'agents autonomes de longue durée.
agent-browser fournit une interface CLI d'automatisation de navigateur optimisée pour l'IA, utilisant un modèle compact de snapshots+références. Cela permet aux agents de naviguer sur des pages, d'identifier des éléments interactifs et d'effectuer des actions avec beaucoup moins de contexte que les traces Playwright complètes.
Utilisez agent-browser lorsqu'un agent doit piloter un navigateur réel pour des flux de bout en bout : soumission de formulaires, capture d'écran, tests automatisés ou débogage avec vidéo. Il est particulièrement utile pour les sessions autonomes prolongées où la réduction de la taille du contexte est cruciale.
Conçu pour les environnements d'exécution d'agents capables de lancer des CLI via des sous-processus ou d'appeler des outils shell (Claude Code et CLI d'agents similaires). Fonctionne efficacement là où l'optimisation des tokens est préférable aux traces de type Playwright.
Cette compétence n'a pas encore été examinée par notre pipeline d'audit automatisé.