Cette compétence orchestre un pipeline sécurisé pour extraire des données tabulaires structurées à partir de sources non-CSV (images, PDF, Word, Excel), mapper les champs par rapport à un réseau de connaissances (ontologie), produire un CSV validé et importer les lignes via le point de terminaison d'importation du flux de données de la plateforme. Elle impose des règles de sécurité strictes : pas de connexions directes à la DB, uniquement des INSERT via ontology ds import-csv, et une confirmation explicite de l'utilisateur avant les écritures.
À utiliser lorsque vous devez convertir des formulaires scannés, des documents ou des feuilles de calcul en lignes structurées et les charger dans les tables de données de la plateforme tout en préservant la sémantique des champs et l'audit de la plateforme. Les déclencheurs incluent des phrases comme '数据采集', '从文档提取数据', '图片转数据', '数据导入'.
Conçu pour l'outillage d'ontologie basé sur CLI et les environnements d'exécution d'agents capables d'appeler des compétences externes et des aides shell (ontology CLI / ontology-core).
Cette compétence n'a pas encore été examinée par notre pipeline d'audit automatisé.