
de opendatalab
Exécutez, validez et analysez les évaluations de parsing de documents OmniDocBench avec des flux Docker/conda et l'analyse des résultats.
python pdf_validation.py --config ... à l'intérieur de l'image Docker recommandée ghcr.io/zeng-weijun/omnidocbench-eval:repro-ubuntu2204.\n- Analyse et résume les fichiers *_metric_result.json, *_run_summary.json, *_stage_execution.json et *_runtime_environment.json.\n- Dépannage : accès Docker, erreurs OOM de CDM, problèmes de politique ImageMagick, capitalisation GT et imbrication des dossiers de prédiction.\n\n## Prompts / Usage recommandés\n- "Comment exécuter l'évaluation end2end OmniDocBench sur mes JSON GT et mes prédictions markdown ?"\n- "Aidez-moi à analyser un répertoire de résultats OmniDocBench et à extraire les scores globaux, texte, formule et tableau."\n- "Je rencontre des erreurs OOM avec CDM — comment régler cdm_workers sur un nœud 4CPU/8GB ?"\n\n## Installation / Scripts\nLe skill inclut les scripts : scripts/generate_end2end_config.py et scripts/parse_results.py pour la génération de configurations et l'analyse des résultats. Suivez le flux Docker indiqué dans le skill pour éviter les problèmes de dépendances locales.\nCette compétence n'a pas encore été examinée par notre pipeline d'audit automatisé.