
de sciclaw9
Gère les tâches PDF courantes : extraction de texte et de tableaux, fusion/division de fichiers, rotation/filigrane de pages et OCR pour rendre les documents scannés consultables.
Le Skill PDF fournit des opérations pragmatiques et scriptables pour travailler avec des artefacts PDF dans des flux de travail reproductibles. Il aide les agents à extraire du texte et des tableaux, à fusionner ou diviser des documents, à faire pivoter ou ajouter des filigranes aux pages, et à effectuer un OCR sur des pages scannées. Le skill met l'accent sur la préservation de l'ordre des pages et des métadonnées, la validation du nombre de pages de sortie et l'enregistrement de la provenance des transformations.
Utilisez ce skill dès qu'un utilisateur demande de lire, de transformer ou d'extraire des données de fichiers PDF — par exemple : extraire des tableaux pour l'analyse de données, convertir des rapports scannés en texte consultable, diviser un PDF multi-articles en fichiers distincts, ou appliquer des filigranes cohérents aux documents produits. Il est destiné aux pipelines automatisés où la reproductibilité et la validation sont essentielles.
Ce skill est agnostique vis-à-vis du langage et des outils, mais s'adresse clairement aux agents disposant d'un support d'exécution Python (Copilot/Codex, Claude Code et d'autres agents d'automatisation pouvant exécuter des snippets Python). Il est parfaitement adapté aux agents capables d'utiliser le CLI et intégrés dans des pipelines de recherche reproductibles.
Cette compétence n'a pas encore été examinée par notre pipeline d'audit automatisé.