Skill PDF

Name: Skill PDF
Rating: 67 (1 reviews)
Author: sciclaw

Score de confiance 67/100

Gère les tâches PDF courantes : extraction de texte et de tableaux, fusion/division de fichiers, rotation/filigrane de pages et OCR pour rendre les documents scannés consultables.

déclencheurs:extract text from pdfocr this scanned documentmerge or split pdfsrotate pageswatermark pdfextract tables from pdf

GitHub SKILL.md

Ce qu'il fait

Le Skill PDF fournit des opérations pragmatiques et scriptables pour travailler avec des artefacts PDF dans des flux de travail reproductibles. Il aide les agents à extraire du texte et des tableaux, à fusionner ou diviser des documents, à faire pivoter ou ajouter des filigranes aux pages, et à effectuer un OCR sur des pages scannées. Le skill met l'accent sur la préservation de l'ordre des pages et des métadonnées, la validation du nombre de pages de sortie et l'enregistrement de la provenance des transformations.

Quand l'utiliser

Utilisez ce skill dès qu'un utilisateur demande de lire, de transformer ou d'extraire des données de fichiers PDF — par exemple : extraire des tableaux pour l'analyse de données, convertir des rapports scannés en texte consultable, diviser un PDF multi-articles en fichiers distincts, ou appliquer des filigranes cohérents aux documents produits. Il est destiné aux pipelines automatisés où la reproductibilité et la validation sont essentielles.

Ce qui est inclus

Scripts : aucun script groupé dans ce SKILL.md (les exemples font référence à l'utilisation de pypdf)
Références : les notes du skill font référence aux bibliothèques Python courantes et aux règles de reproductibilité
Instructions : les règles de travail incluent la préservation des métadonnées, la validation du nombre de pages et l'enregistrement de la provenance au niveau des commandes. Des extraits de code rapides montrent comment inspecter le nombre de pages avec pypdf.

Agents compatibles

Ce skill est agnostique vis-à-vis du langage et des outils, mais s'adresse clairement aux agents disposant d'un support d'exécution Python (Copilot/Codex, Claude Code et d'autres agents d'automatisation pouvant exécuter des snippets Python). Il est parfaitement adapté aux agents capables d'utiliser le CLI et intégrés dans des pipelines de recherche reproductibles.

Étiquettes

#pdf #document-processing #ocr #data-extraction #reproducible-workflows #automation #python #cli #research

Aucun script exécutéAudité le July 11, 2026

Résumé de l'audit

La compétence PDF fournit des instructions minimales pour les tâches PDF courantes telles que l'extraction de texte, la fusion, la division et l'OCR. Elle contient seulement un bref SKILL.md avec un court extrait de code pypdf et aucun script intégré. La compétence est essentiellement un wrapper léger autour de pypdf sans automatisation exécutable, ce qui en fait davantage une fiche de référence qu'une compétence fonctionnelle.

Points d'attention

Aucun script inclus — repose entièrement sur l'improvisation de l'agent avec pypdf
Aucune directive sur la gestion des erreurs ou des dépendances

Notes

Compétence très légère — principalement une liste de phrases de déclenchement et un seul extrait de code pypdf. Attribution à une source officielle d'Anthropic, mais le contenu est minimal. Bénéficierait de scripts réels pour les opérations courantes et de contrats de sortie plus clairs.

Informations

Dépôt: sciclaw
Étoiles: 9

Score de confiance

Global67

Sécurité98

Qualité du code38

Architecture35

Utilité55

Compétences similaires

Development Worktree

Create an isolated git worktree for feature work, auto-run project setup, and verify a clean test baseline before development.

WRDS Query & ETL Enforcement

Standards and enforcement guidance for querying WRDS data and running SAS/ETL on the WRDS grid—includes query validation, SGE submission patterns, and performan

Academic Research Search

Search academic literature across multiple sources, deduplicate results, resolve DOIs, and surface trusted papers with concise takeaways.

Readwise Reader Document Management

Manage Readwise Reader documents: list, save, search, move, tag, highlight, export and bulk-edit via official and custom CLIs.

Bounty Hunter — Atlas

Persona skill: 'Atlas' — a profit-focused developer persona for discovering, evaluating and executing paid bounties or freelance tasks with ROI-aware workflows.

Junshi — Research Advisor

Daily strategic research advisor that scans arXiv/venues, digests papers, and proposes bold, ranked research ideas tailored to the user's profile.

Full Stack Builder

End-to-end builder that scaffolds, implements, tests, and optionally deploys web and API applications from a natural-language specification.

ezBookkeeping API Tools

Command-line API tools for ezBookkeeping: record and query transactions, retrieve accounts/categories/tags, and fetch exchange rates for self-hosted personal fi

Retour aux compétences