
de autoskill383
Corrige le mappage entité-boîte englobante OCR pour les factures afin d'éviter les boîtes partagées pour les valeurs identiques, inverse la recherche des sections de montants et assure l'unicité des coordonnées
Ajoute une logique concrète aux flux de mappage d'entités de factures OCR pour gérer les valeurs d'entités en double en toute sécurité : lorsque la même valeur d'entité apparaît plusieurs fois, l'algorithme assigne des boîtes englobantes distinctes (pas de réutilisation), utilise la mémoïsation pour suivre les boîtes occupées et se rabat sur la meilleure correspondance suivante en cas de chevauchement. Pour les sections amounts_and_tax, il inverse l'ordre de recherche (de bas en haut) pour mieux correspondre aux mises en page des factures. Les entités multi-jetons bénéficient d'une correspondance sensible à la séquence et de vérifications de chevauchement pour que les jetons ne revendiquent pas les mêmes coordonnées.
Utilisez ceci lors de l'extraction de champs structurés à partir de factures ou de reçus numérisés où la même valeur textuelle peut apparaître plusieurs fois (ex: montants répétés, noms d'articles). C'est utile lors du post-traitement OCR pour augmenter la précision du mappage et éviter d'attribuer incorrectement des coordonnées.
Pertinent pour les assistants de codage capables de Python (Codex, Copilot, assistants de code de type GPT) et les pipelines OCR qui exécutent des scripts de post-traitement. Recommandé pour les équipes travaillant avec Tesseract/ocr-dataframes ou des pipelines d'extraction assistés par CV.
Une compétence basée uniquement sur un prompt qui instruit un LLM de modifier le code de mappage entité-boîte englobante (bounding-box) pour les factures OCR afin de gérer les doublons. Aucun script inclus — purement un modèle de prompt structuré avec des règles opérationnelles pour la programmation dynamique, la recherche inversée de dataframe et l'unicité des coordonnées. Contraintes bien définies mais aucun code exécutable, exemple ou guide de gestion d'erreurs.
Compétence basée uniquement sur un prompt provenant du projet de recherche AutoSkill (ecnu-icalk/autoskill). Propre d'un point de vue sécurité car il n'y a pas de scripts ou de code exécutable. Valeur pratique limitée en tant que compétence autonome car elle ne fournit que des instructions pour modifier un code qui doit déjà exister ailleurs.