
de sciclaw72
Gérez les tâches PDF : extraction de texte/tableaux, fusion/division, rotation, filigranes et OCR de documents numérisés avec des règles reproductibles et des sorties vérifiables.
Cette compétence PDF permet à un agent d'opérer sur des documents PDF de manière fiable : extraire du texte et des tableaux, fusionner ou diviser des fichiers, faire pivoter et ajouter des filigranes aux pages, et exécuter l'OCR sur des documents numérisés. Elle met l'accent sur des opérations scriptées reproductibles et vérifie les sorties (nombre de pages, qualité d'extraction) afin que les analyses en aval ou les flux de travail de manuscrits restent auditables.
Utilisez cette compétence chaque fois qu'un utilisateur demande à l'agent d'interagir avec des artefacts PDF — par exemple : extraire des tableaux d'un article de recherche, fusionner plusieurs rapports en un seul livrable, diviser des scans volumineux en chapitres, appliquer des filigranes pour la distribution, ou effectuer un OCR de pages numérisées pour obtenir du texte recherchable. Elle est adaptée aux pipelines de recherche reproductibles et aux tâches de préparation de documents.
Idéal pour les agents ayant accès à un runtime Python et aux E/S de fichiers (par exemple, Claude Code, Copilot/Code assistants, ou tout agent capable d'exécuter des scripts pypdf). Convient aux assistants de recherche appariés et aux agents d'automatisation de flux de travail.
Cette compétence n'a pas encore été examinée par notre pipeline d'audit automatisé.