agent-browser

CLI pour l'automatisation de navigateur optimisée pour le contexte : snapshots, actions DOM, enregistrement audio/vidéo et support des navigateurs cloud pour les sessions d'agents autonomes de longue durée.

déclencheurs:browser automationsnapshotscreenshotrecordingcloud browsernavigatefill formclick element

GitHub SKILL.md

Ce qu'il fait

agent-browser fournit une interface CLI d'automatisation de navigateur optimisée pour l'IA, utilisant un modèle compact de snapshots+références. Cela permet aux agents de naviguer sur des pages, d'identifier des éléments interactifs et d'effectuer des actions avec beaucoup moins de contexte que les traces Playwright complètes.

Quand l'utiliser

Utilisez agent-browser lorsqu'un agent doit piloter un navigateur réel pour des flux de bout en bout : soumission de formulaires, capture d'écran, tests automatisés ou débogage avec vidéo. Il est particulièrement utile pour les sessions autonomes prolongées où la réduction de la taille du contexte est cruciale.

Ce qui est inclus

Scripts : aucun script n'est regroupé dans ce répertoire de skill (has_scripts=false).
Références : contient un dossier references/ avec des notes d'intégration et des exemples (has_references=true).
Instructions : guide de démarrage rapide (installation, installation de Chromium), flux de travail central (ouvrir → snapshot → interagir → nouveau snapshot), et une référence complète des commandes couvrant la navigation, les snapshots, les interactions, les médias, le contrôle réseau et les opérations avancées sur les onglets/frames.

Agents compatibles

Conçu pour les environnements d'exécution d'agents capables de lancer des CLI via des sous-processus ou d'appeler des outils shell (Claude Code et CLI d'agents similaires). Fonctionne efficacement là où l'optimisation des tokens est préférable aux traces de type Playwright.

Étiquettes

#browser #automation #cli #testing #screenshots #video #dev-tools #snapshot #cloud-browsers

Pas encore audité

Cette compétence n'a pas encore été examinée par notre pipeline d'audit automatisé.

Informations

Dépôt: cafekit
Étoiles: 52
Installations: 0

Compétences similaires

Development Worktree

Create an isolated git worktree for feature work, auto-run project setup, and verify a clean test baseline before development.

Readwise Reader Document Management

Manage Readwise Reader documents: list, save, search, move, tag, highlight, export and bulk-edit via official and custom CLIs.

Bounty Hunter — Atlas

Persona skill: 'Atlas' — a profit-focused developer persona for discovering, evaluating and executing paid bounties or freelance tasks with ROI-aware workflows.

Junshi — Research Advisor

Daily strategic research advisor that scans arXiv/venues, digests papers, and proposes bold, ranked research ideas tailored to the user's profile.

Full Stack Builder

End-to-end builder that scaffolds, implements, tests, and optionally deploys web and API applications from a natural-language specification.

ezBookkeeping API Tools

Command-line API tools for ezBookkeeping: record and query transactions, retrieve accounts/categories/tags, and fetch exchange rates for self-hosted personal fi

Feishu Voice Sender

Convert MP3s and send them as native Feishu voice messages (playable voice clips) to users or groups.

Claw Bench

Benchmarking skill that guides an agent through a structured suite of capability tests and reporting steps for leaderboard submission.

Retour aux compétences