FAR — File-Augmented Retrieval

Score de confiance 88/100

Génère des fichiers sidecar .meta persistants pour les documents binaires (PDF, images, feuilles de calcul, médias) afin que les agents de codage puissent lire et analyser des fichiers non textuels.

déclencheurs:file-augmented retrieval.meta sidecarextract pdfocr imagesexcel to markdowndirectory summary

GitHub SKILL.md

Ce que fait cet outil

FAR (File-Augmented Retrieval) génère des fichiers sidecar .meta persistants à côté des fichiers binaires (PDF, DOCX, XLSX, PPTX, images, audio, vidéo, archives, et plus encore). Chaque fichier .meta contient un frontmatter YAML avec les métadonnées de la source et un corps Markdown avec le contenu extrait, lisible par l'humain et la machine. Cela rend les fichiers précédemment opaques découvrables et utilisables par les agents de codage : les agents peuvent lire les fichiers .meta au lieu d'avoir besoin de bases de données vectorielles ou de services de récupération externes. FAR inclut l'extraction spécifique au format (OCR pour les images/PDF, conversion de tableaux pour les feuilles de calcul, métadonnées FFprobe et transcription pour les médias, extraction Jupyter/EPUB), une mise en cache efficace (mtime+SHA256) et des résumés de répertoire (.dir.meta) pour une navigation rapide.

Quand l'utiliser

Utilisez FAR lorsque votre dépôt ou projet contient des contextes importants dans des formats binaires auxquels les agents doivent accéder (maquettes de design, spécifications, feuilles financières, contrats, médias). Il est utile dans les bases de code, les projets de science des données, les dépôts de documentation et les archives où les agents doivent raisonner sur des actifs non textuels. Préférez FAR lorsque vous souhaitez des métadonnées sur disque et versionnables sans déployer d'infrastructure RAG externe.

Ce qui est inclus

Scripts : outillage pré-installé (far_gen.py) et un lien symbolique CLI pour l'extraction locale. (has_scripts: false dans le dépôt, mais les artefacts CLI sont présents dans les fichiers frères)
Références : aucune non groupée, mais la compétence inclut une spécification de protocole et des notes de configuration dans le corps du SKILL.md.
Instructions : comment exécuter la CLI (analyse de répertoires, traitement de fichier unique, régénération forcée), configuration via .env pour les fonctionnalités IA optionnelles (transcription, Apple Vision).

Agents compatibles

Conçu pour les agents de codage généraux qui opèrent sur des dépôts et le système de fichiers (OpenClaw, Cursor, agents de type GitHub Copilot). Il s'intègre bien avec l'outillage sur appareil (Tesseract, FFprobe) et les services IA optionnels pour une extraction plus riche.

Étiquettes

#files #rtr #retrieval #ocr #metadata #pdf #images #spreadsheets #media

Aucun script exécutéAudité le July 9, 2026

Résumé de l'audit

FAR (File-Augmented Retrieval) generates persistent .meta sidecar files for binary documents (PDFs, images, spreadsheets, media), making them readable to AI coding agents. No bundled scripts — the skill references a pre-installed Python tool. SKILL.md is comprehensive with clear usage, configuration, and protocol specification. Solves a real and common problem with broad developer appeal.

Points d'attention

Requires pre-installed far_gen.py tool
AI features (Whisper, GPT-4o) need OPENAI_API_KEY
Apple Vision features macOS-only

Notes

Well-documented skill with no security concerns. No scripts bundled — relies on pre-installed tool. The OPENAI_API_KEY mention is only in a .env.example template, not hardcoded.

Informations

Dépôt: far
Étoiles: 9

Score de confiance

Global88

Sécurité100

Qualité du code78

Architecture72

Utilité85

Compétences similaires

Markdrop

Convert PDFs to structured Markdown or interactive HTML and generate AI-powered descriptions for images and tables using multiple LLM providers.

Chinese Software Copyright Application

Generate complete Chinese software copyright application materials (application form, code documentation, user manual, design docs) and export them to PDF from

Doc Cleaner

Convert PDF, DOCX, XLSX and text files into clean, structured Markdown with CJK and table support; supports offline or AI-enhanced modes.

Office & Design Toolkit

Comprehensive toolkit for processing and producing DOCX, PPTX, XLSX and PDF files plus design guidance and quality checks for professional office documents and

arXiv Paper Search & Download

Search arXiv, fetch paper metadata, download PDFs, and produce concise summaries for academic papers (ID or query).

Request My EHI Export

Guides patients through requesting their complete Electronic Health Information (EHI) export: identifies vendor, finds forms, fills requests, and builds a ready

Filtrix Video Gen (MCP)

Submit and manage text- or image-to-video generation jobs via Filtrix's Remote MCP API, including polling and downloading completed videos.

Heptabase CLI — Terminal access to Heptabase MCP

Command-line interface for interacting with a Heptabase knowledge base: search notes, read cards/journals, append entries, and search/read PDFs — useful for ter

Retour aux compétences