
de openakita1,766
Traitez les PDF : extraction de texte et de tableaux, fusion/division/rotation de pages, OCR de PDF scannés, manipulation de métadonnées, protection ou tatouage numérique, et génération programmatique de nouveaux PDF.
Ce skill permet à un agent de gérer les tâches PDF courantes à l'aide de bibliothèques Python et d'outils en ligne de commande : extraction de texte et de tableaux (pdfplumber, pypdf), fusion et division de PDF, rotation de pages, ajout de filigranes, exécution d'un OCR sur des documents scannés (pytesseract + pdf2image), extraction d'images, remplissage de formulaires et création de PDF (reportlab). Il documente également les utilitaires en ligne de commande (pdftotext, qpdf, pdftk) et fournit des extraits de code exécutables.
À utiliser lorsque l'utilisateur mentionne un fichier .pdf ou demande de lire, extraire, transformer ou produire des PDF — par exemple, convertir des documents scannés en texte recherchable, extraire des données tabulaires vers des feuilles de calcul, fusionner des rapports, ajouter des filigranes ou des mots de passe, et générer des rapports de manière programmatique.
Compatible avec les agents pouvant exécuter Python ou des outils en ligne de commande et ayant accès au système de fichiers pour lire/écrire des fichiers PDF.
Compétence complète de traitement PDF couvrant l'extraction de texte, la fusion, la division, l'OCR, le remplissage de formulaires et le tatouage numérique. 9 scripts fournis ; seuls les tests de bounding-box ont fonctionné — 6 scripts ont échoué en raison de dépendances Python manquantes (pypdf, pdfplumber, pdf2image, Pillow), 2 nécessitaient des arguments CLI. Le fichier SKILL.md est bien structuré avec des instructions claires et une divulgation progressive vers REFERENCE.md et FORMS.md.
pypdfpdf2imagepdfplumberPillowAucune préoccupation de sécurité. Le monkey-patching dans fill_fillable_fields.py est un contournement pour un problème de pypdf — fonctionnel mais fragile. La compétence est bien documentée avec des exemples pratiques. La licence propriétaire est à noter.
Automatisation Gmail via Rube MCP
Automatisez les actions Gmail (envoi, réponse, recherche, libellés, brouillons, pièces jointes) via la boîte à outils Gmail de Rube MCP avec des séquences d'outils optimisées.
Nano Banana 2 — Gemini 3.1 Flash Image Preview
Exécute Google Gemini 3.1 Flash Image Preview via l'interface CLI de inference.sh : texte-vers-image, édition d'image, entrée multi-image et ancrage via Google Search.
Compétence XLSX / Tableur
Gère la création, l'édition, le nettoyage et la conversion de fichiers de tableur (.xlsx, .xlsm, .csv, .tsv) avec des formules robustes, du formatage et des flux de recalcul
Baidu Search
Permet aux agents d'effectuer des recherches d'images et de pages web en temps réel sur le web chinois via l'API Baidu Qianfan, incluant le filtrage temporel et les signaux de pertinence/autorité.
PPTX — Compétence Présentation (.pptx)
Créez, lisez, éditez et contrôlez la qualité des présentations .pptx : extraction de texte, génération de miniatures, édition de modèles et conversion de diapositives pour le contrôle qualité visuel et les exports.