
de literature-harvest60
Flux de travail local reproductible pour rechercher dans PubMed/Crossref/OpenAlex, construire des tables de candidats, télécharger des PDF/HTML légalement accessibles et dédoublonner la littérature récoltée
Ce skill encapsule un pipeline de récolte de littérature reproductible pour la recherche basée sur des mots-clés. Il automatise la recherche via des API savantes (PubMed/PMC, Europe PMC, Crossref, OpenAlex), compile une liste de candidats, télécharge les textes intégraux légalement accessibles (en privilégiant les PDF, et en sauvegardant le HTML/XML si nécessaire), effectue une seconde passe de récupération HTML vers PDF, et dédoublonne les résultats dans un dossier de run propre avec un manifeste.
Utilisez-le lorsqu'un chercheur ou un agent a besoin de rassembler un large ensemble d'articles spécifiques à un domaine pour une revue, des recherches systématiques ou une analyse en aval (text-mining, cartographie des citations). Il est utile pour les projets reproductibles où la provenance, le dédoublonnage et le manifestage sont requis.
literature_harvest/scripts/ groupée (outils de recherche et de téléchargement, scripts d'exécution/continuation).references/ selon les instructions du skill.Idéalement utilisé par des flux de travail d'agents capables d'exécuter des scripts locaux et de gérer des sorties de système de fichiers (agents assistants de recherche, assistants d'ingénierie de données ou agents capables d'utiliser le CLI).
Cette compétence n'a pas encore été examinée par notre pipeline d'audit automatisé.