
de agentguard101
Détection et assainissement en temps réel basés sur des motifs pour les injections de prompts et de commandes, conçu pour filtrer les tickets GitHub, assainir les entrées et bloquer les commandes dangereuses.
Agent Guard est un cadre de sécurité en temps réel qui détecte et assainit les tentatives d'injection de prompts et de commandes visant les agents IA. Il applique des détecteurs basés sur des motifs pour l'exécution de commandes (npm, curl|bash, rm -rf), les phrases d'injection de prompts (ignorer les instructions précédentes, mode développeur), les indices d'ingénierie sociale et un filtrage spécialisé des tickets GitHub pour les attaques de type Clinejection. L'outil peut remplacer les segments dangereux par des espaces réservés sécurisés et produire des rapports de menace.
Utilisez Agent Guard partout où un texte non fiable pourrait influencer le comportement de l'agent : filtrage des titres et corps des tickets GitHub, assainissement des prompts fournis par l'utilisateur ou pré-filtrage du contenu extrait du web avant consommation par le modèle. Il est approprié dans les pipelines CI, les couches de modération ou tout pipeline d'agent qui exécute des commandes ou génère des actions basées sur du texte externe.
agent_guard.py, mcp_server.py et cli.py pour les tests locaux et l'intégration.Conçu principalement pour les déploiements OpenClaw/Claude MCP, mais utilisable comme bibliothèque Python autonome. Il s'intègre facilement aux runtimes d'agents capables d'appeler un endpoint local d'assainissement/analyse ou d'exécuter une vérification CLI avant d'effectuer des actions.
Évaluation de la qualité : substantiel, actionnable et axé sur la sécurité — approprié pour l'enregistrement.
Cette compétence n'a pas encore été examinée par notre pipeline d'audit automatisé.