
Gemini Skill
par WJZ-P
Automatisez Gemini AI pour la génération d'images, le chat multi-tours et l'extraction d'images via le CDP du navigateur.
Ce qu'il fait
Gemini Skill fournit un pont complet vers l'interface web de Gemini en utilisant le Chrome DevTools Protocol (CDP). Il permet aux agents IA de contourner les limitations de l'API en contrôlant directement une instance de navigateur pour effectuer des tâches complexes comme la génération d'images par IA et des conversations multimodales.
Outils
gemini_generate_image: Processus complet de génération d'images, incluant les téléchargements en haute résolution.gemini_send_message: Envoie des prompts textuels et récupère les réponses de conversations multi-tours.gemini_upload_images: Télécharge des images de référence pour des tâches image-to-image ou basées sur la vision.gemini_extract_image: Extrait des images spécifiques d'une session au format base64 ou fichiers pleine taille.gemini_switch_model: Bascule entre différents modèles Gemini (ex: Pro, Flash, Think).gemini_new_chat: Initialise une nouvelle session de conversation.
Installation
Pour utiliser ce serveur, vous devez avoir un navigateur Chrome/Edge installé et être connecté à votre compte Google.
{
"mcpServers": {
"gemini": {
"command": "node",
"args": ["/absolute/path/to/gemini-skill/src/mcp-server.js"]
}
}
}
Hôtes supportés
Confirmé pour une utilisation avec Claude Desktop et les agents OpenClaw.
Installation rapide
npm install -g gemini-skillInformations
- Tarification
- free
- Publié






