Agent Guard — Protection contre l'injection de prompts

Détection et assainissement en temps réel basés sur des motifs pour les injections de prompts et de commandes, conçu pour filtrer les tickets GitHub, assainir les entrées et bloquer les commandes dangereuses.

déclencheurs:prompt injectioncommand injectionsanitizeagent securitygithub issueclinejectionsanitize input

GitHub SKILL.md

Ce que fait cet outil

Agent Guard est un cadre de sécurité en temps réel qui détecte et assainit les tentatives d'injection de prompts et de commandes visant les agents IA. Il applique des détecteurs basés sur des motifs pour l'exécution de commandes (npm, curl|bash, rm -rf), les phrases d'injection de prompts (ignorer les instructions précédentes, mode développeur), les indices d'ingénierie sociale et un filtrage spécialisé des tickets GitHub pour les attaques de type Clinejection. L'outil peut remplacer les segments dangereux par des espaces réservés sécurisés et produire des rapports de menace.

Quand l'utiliser

Utilisez Agent Guard partout où un texte non fiable pourrait influencer le comportement de l'agent : filtrage des titres et corps des tickets GitHub, assainissement des prompts fournis par l'utilisateur ou pré-filtrage du contenu extrait du web avant consommation par le modèle. Il est approprié dans les pipelines CI, les couches de modération ou tout pipeline d'agent qui exécute des commandes ou génère des actions basées sur du texte externe.

Ce qui est inclus

Scripts : modules Python centraux incluant agent_guard.py, mcp_server.py et cli.py pour les tests locaux et l'intégration.
Références : listes de motifs et exemples de configuration pour les seuils et la mise en cache.
Instructions : notes d'installation pour l'utiliser comme compétence OpenClaw ou serveur Claude MCP, exemples d'utilisation CLI et config.json pour l'ajustement des seuils.

Agents compatibles

Conçu principalement pour les déploiements OpenClaw/Claude MCP, mais utilisable comme bibliothèque Python autonome. Il s'intègre facilement aux runtimes d'agents capables d'appeler un endpoint local d'assainissement/analyse ou d'exécuter une vérification CLI avant d'effectuer des actions.

Évaluation de la qualité : substantiel, actionnable et axé sur la sécurité — approprié pour l'enregistrement.

Étiquettes

#security #prompt-injection #sanitization #github #mcp #agent-safety #cli #python

Pas encore audité

Cette compétence n'a pas encore été examinée par notre pipeline d'audit automatisé.

Informations

Dépôt: agentguard
Étoiles: 101
Installations: 0

Compétences similaires

Readwise Reader Document Management

Manage Readwise Reader documents: list, save, search, move, tag, highlight, export and bulk-edit via official and custom CLIs.

Bounty Hunter — Atlas

Persona skill: 'Atlas' — a profit-focused developer persona for discovering, evaluating and executing paid bounties or freelance tasks with ROI-aware workflows.

TradeOS

Natural-language driven CEX trading and portfolio management for agents: API key vaulting, multi-exchange orders, DCA, arbitrage scanning, alerts and security r

ezBookkeeping API Tools

Command-line API tools for ezBookkeeping: record and query transactions, retrieve accounts/categories/tags, and fetch exchange rates for self-hosted personal fi

Kickbox Automation (Composio / Rube MCP)

Automate Kickbox workflows via the Composio Kickbox toolkit on a Rube MCP server: discover tools, manage connections, and execute schema-compliant tool calls.

Tmux Bridge

Give an agent controlled access to a local tmux terminal bridge so it can run shell commands, capture output, and manage sessions on the user's machine.

Java 25 & Spring Boot 4 Code Reviewer

Run focused, evidence-based code reviews for Java 25 and Spring Boot 4 projects — migration risks, architecture boundaries, null-safety (JSpecify), security, an

ArcKit — French Public Procurement (fr-marche-public)

Generates French public procurement (Dossier de Consultation des Entreprises) drafts aligned with the Code de la Commande Publique, UGAP frameworks, and DINUM d

Retour aux compétences