Traitement PDF (OpenAkita)

Name: Traitement PDF (OpenAkita)
Rating: 85 (1 reviews)
Author: openakita

Score de confiance 85/100

Traitez les PDF : extraction de texte et de tableaux, fusion/division/rotation de pages, OCR de PDF scannés, manipulation de métadonnées, protection ou tatouage numérique, et génération programmatique de nouveaux PDF.

déclencheurs:pdfOCRextract tablesmerge PDFssplit PDFrotate pages

GitHub SKILL.md

Ce que fait ce skill

Ce skill permet à un agent de gérer les tâches PDF courantes à l'aide de bibliothèques Python et d'outils en ligne de commande : extraction de texte et de tableaux (pdfplumber, pypdf), fusion et division de PDF, rotation de pages, ajout de filigranes, exécution d'un OCR sur des documents scannés (pytesseract + pdf2image), extraction d'images, remplissage de formulaires et création de PDF (reportlab). Il documente également les utilitaires en ligne de commande (pdftotext, qpdf, pdftk) et fournit des extraits de code exécutables.

Quand l'utiliser

À utiliser lorsque l'utilisateur mentionne un fichier .pdf ou demande de lire, extraire, transformer ou produire des PDF — par exemple, convertir des documents scannés en texte recherchable, extraire des données tabulaires vers des feuilles de calcul, fusionner des rapports, ajouter des filigranes ou des mots de passe, et générer des rapports de manière programmatique.

Ce qui est inclus

Scripts : exemples et extraits d'utilitaires pour Python (pypdf, pdfplumber, reportlab) et outils CLI (pdftotext, qpdf, pdftk) (has_scripts=true)
Références : FORMS.md, REFERENCE.md et autres documents du dépôt pour un usage avancé
Instructions : extraits étape par étape pour la fusion, la division, l'extraction de texte/tableaux, le flux de travail OCR, la création de filigranes et la protection des PDF par mot de passe.

Agents compatibles

Compatible avec les agents pouvant exécuter Python ou des outils en ligne de commande et ayant accès au système de fichiers pour lire/écrire des fichiers PDF.

Étiquettes

#pdf #ocr #document-processing #cli #python #pypdf #pdfplumber #reportlab #automation

Scripts exécutés dans un bac à sableExécution réussieAudité le June 16, 2026

Résumé de l'audit

Compétence complète de traitement PDF couvrant l'extraction de texte, la fusion, la division, l'OCR, le remplissage de formulaires et le tatouage numérique. 9 scripts fournis ; seuls les tests de bounding-box ont fonctionné — 6 scripts ont échoué en raison de dépendances Python manquantes (pypdf, pdfplumber, pdf2image, Pillow), 2 nécessitaient des arguments CLI. Le fichier SKILL.md est bien structuré avec des instructions claires et une divulgation progressive vers REFERENCE.md et FORMS.md.

Points d'attention

Nécessite pypdf, pdfplumber, pdf2image, Pillow — non installés par défaut
fill_fillable_fields.py effectue un monkey-patching interne de pypdf qui peut casser lors de changements de version
La plupart des scripts nécessitent des arguments CLI spécifiques et s'arrêtent avec l'aide d'utilisation s'ils sont omis

Dépendances manquantes

pypdfpdf2imagepdfplumberPillow

Notes

Aucune préoccupation de sécurité. Le monkey-patching dans fill_fillable_fields.py est un contournement pour un problème de pypdf — fonctionnel mais fragile. La compétence est bien documentée avec des exemples pratiques. La licence propriétaire est à noter.

Informations

Dépôt: openakita
Étoiles: 1,766

Score de confiance

Global85

Sécurité95

Qualité du code73

Architecture78

Utilité82

Plus de openakita

Automatisation Gmail via Rube MCP

Automatisez les actions Gmail (envoi, réponse, recherche, libellés, brouillons, pièces jointes) via la boîte à outils Gmail de Rube MCP avec des séquences d'outils optimisées.

Nano Banana 2 — Gemini 3.1 Flash Image Preview

Exécute Google Gemini 3.1 Flash Image Preview via l'interface CLI de inference.sh : texte-vers-image, édition d'image, entrée multi-image et ancrage via Google Search.

Compétence XLSX / Tableur

Gère la création, l'édition, le nettoyage et la conversion de fichiers de tableur (.xlsx, .xlsm, .csv, .tsv) avec des formules robustes, du formatage et des flux de recalcul

Baidu Search

Permet aux agents d'effectuer des recherches d'images et de pages web en temps réel sur le web chinois via l'API Baidu Qianfan, incluant le filtrage temporel et les signaux de pertinence/autorité.

PPTX — Compétence Présentation (.pptx)

Créez, lisez, éditez et contrôlez la qualité des présentations .pptx : extraction de texte, génération de miniatures, édition de modèles et conversion de diapositives pour le contrôle qualité visuel et les exports.

Compétences similaires

Development Worktree

Create an isolated git worktree for feature work, auto-run project setup, and verify a clean test baseline before development.

Readwise Reader Document Management

Manage Readwise Reader documents: list, save, search, move, tag, highlight, export and bulk-edit via official and custom CLIs.

Bounty Hunter — Atlas

Persona skill: 'Atlas' — a profit-focused developer persona for discovering, evaluating and executing paid bounties or freelance tasks with ROI-aware workflows.

Junshi — Research Advisor

Daily strategic research advisor that scans arXiv/venues, digests papers, and proposes bold, ranked research ideas tailored to the user's profile.

Full Stack Builder

End-to-end builder that scaffolds, implements, tests, and optionally deploys web and API applications from a natural-language specification.

ezBookkeeping API Tools

Command-line API tools for ezBookkeeping: record and query transactions, retrieve accounts/categories/tags, and fetch exchange rates for self-hosted personal fi

Feishu Voice Sender

Convert MP3s and send them as native Feishu voice messages (playable voice clips) to users or groups.

Claw Bench

Benchmarking skill that guides an agent through a structured suite of capability tests and reporting steps for leaderboard submission.

Retour aux compétences