
de far9
Génère des fichiers sidecar .meta persistants pour les documents binaires (PDF, images, feuilles de calcul, médias) afin que les agents de codage puissent lire et analyser des fichiers non textuels.
FAR (File-Augmented Retrieval) génère des fichiers sidecar .meta persistants à côté des fichiers binaires (PDF, DOCX, XLSX, PPTX, images, audio, vidéo, archives, et plus encore). Chaque fichier .meta contient un frontmatter YAML avec les métadonnées de la source et un corps Markdown avec le contenu extrait, lisible par l'humain et la machine. Cela rend les fichiers précédemment opaques découvrables et utilisables par les agents de codage : les agents peuvent lire les fichiers .meta au lieu d'avoir besoin de bases de données vectorielles ou de services de récupération externes. FAR inclut l'extraction spécifique au format (OCR pour les images/PDF, conversion de tableaux pour les feuilles de calcul, métadonnées FFprobe et transcription pour les médias, extraction Jupyter/EPUB), une mise en cache efficace (mtime+SHA256) et des résumés de répertoire (.dir.meta) pour une navigation rapide.
Utilisez FAR lorsque votre dépôt ou projet contient des contextes importants dans des formats binaires auxquels les agents doivent accéder (maquettes de design, spécifications, feuilles financières, contrats, médias). Il est utile dans les bases de code, les projets de science des données, les dépôts de documentation et les archives où les agents doivent raisonner sur des actifs non textuels. Préférez FAR lorsque vous souhaitez des métadonnées sur disque et versionnables sans déployer d'infrastructure RAG externe.
Conçu pour les agents de codage généraux qui opèrent sur des dépôts et le système de fichiers (OpenClaw, Cursor, agents de type GitHub Copilot). Il s'intègre bien avec l'outillage sur appareil (Tesseract, FFprobe) et les services IA optionnels pour une extraction plus riche.
Cette compétence n'a pas encore été examinée par notre pipeline d'audit automatisé.