PDF

Score de confiance 64/100

Gérez les tâches PDF : extraction de texte/tableaux, fusion/division, rotation, filigranes et OCR de documents numérisés avec des règles reproductibles et des sorties vérifiables.

déclencheurs:extract text from pdfmerge pdfssplit pdfocr scanned documentrotate pageswatermark pdf

GitHub SKILL.md

Ce qu'il fait

Cette compétence PDF permet à un agent d'opérer sur des documents PDF de manière fiable : extraire du texte et des tableaux, fusionner ou diviser des fichiers, faire pivoter et ajouter des filigranes aux pages, et exécuter l'OCR sur des documents numérisés. Elle met l'accent sur des opérations scriptées reproductibles et vérifie les sorties (nombre de pages, qualité d'extraction) afin que les analyses en aval ou les flux de travail de manuscrits restent auditables.

Quand l'utiliser

Utilisez cette compétence chaque fois qu'un utilisateur demande à l'agent d'interagir avec des artefacts PDF — par exemple : extraire des tableaux d'un article de recherche, fusionner plusieurs rapports en un seul livrable, diviser des scans volumineux en chapitres, appliquer des filigranes pour la distribution, ou effectuer un OCR de pages numérisées pour obtenir du texte recherchable. Elle est adaptée aux pipelines de recherche reproductibles et aux tâches de préparation de documents.

Ce qui est inclus

Scripts : aucun script groupé dans ce SKILL.md (has_scripts=false).
Références : aucune référence incluse (has_references=false).
Instructions : des règles de travail qui privilégient la reproductibilité, la préservation de l'ordre des pages et des métadonnées, la validation du nombre de sorties et l'enregistrement de la provenance des transformations. Un petit exemple de code montre comment inspecter le nombre de pages à l'aide de pypdf.

Agents compatibles

Idéal pour les agents ayant accès à un runtime Python et aux E/S de fichiers (par exemple, Claude Code, Copilot/Code assistants, ou tout agent capable d'exécuter des scripts pypdf). Convient aux assistants de recherche appariés et aux agents d'automatisation de flux de travail.

Étiquettes

#pdf #document-processing #ocr #data-extraction #automation #reproducible-research #file-management #scientific-workflow

Aucun script exécutéAudité le June 19, 2026

Résumé de l'audit

This skill is a thin wrapper around Anthropic's official PDF skill, providing minimal instructions — just a brief SKILL.md with triggers, working rules, and a tiny pypdf code snippet. No scripts are bundled, no output contracts defined, and the actual implementation is left entirely to the agent. The skill is essentially a pointer to another repo's skill with a few bullet points.

Points d'attention

No actual scripts or tooling — agent must implement PDF operations from scratch each time
Just a stub referencing Anthropic's official PDF skill, not a standalone skill

Notes

Derived/forked from Anthropic's official skills repo. Minimal content — mostly a pointer with brief working rules. No security concerns since there's no executable code. Low usefulness because it provides almost no automation; the agent could follow the same rules without this skill.

Informations

Dépôt: sciclaw
Étoiles: 72

Score de confiance

Global64

Sécurité95

Qualité du code35

Architecture30

Utilité40

Compétences similaires

Development Worktree

Create an isolated git worktree for feature work, auto-run project setup, and verify a clean test baseline before development.

Readwise Reader Document Management

Manage Readwise Reader documents: list, save, search, move, tag, highlight, export and bulk-edit via official and custom CLIs.

Bounty Hunter — Atlas

Persona skill: 'Atlas' — a profit-focused developer persona for discovering, evaluating and executing paid bounties or freelance tasks with ROI-aware workflows.

Junshi — Research Advisor

Daily strategic research advisor that scans arXiv/venues, digests papers, and proposes bold, ranked research ideas tailored to the user's profile.

Full Stack Builder

End-to-end builder that scaffolds, implements, tests, and optionally deploys web and API applications from a natural-language specification.

ezBookkeeping API Tools

Command-line API tools for ezBookkeeping: record and query transactions, retrieve accounts/categories/tags, and fetch exchange rates for self-hosted personal fi

Feishu Voice Sender

Convert MP3s and send them as native Feishu voice messages (playable voice clips) to users or groups.

Claw Bench

Benchmarking skill that guides an agent through a structured suite of capability tests and reporting steps for leaderboard submission.

Retour aux compétences

PDF