
de graphmemory149
GraphRAG embarqué : stockage hybride graphe + vecteur basé sur DuckDB pour l'extraction, le stockage, la déduplication et l'interrogation de graphes d'entités/relations avec BM25 et vecteurs HNSW,
GraphMemory fournit un moteur GraphRAG embarqué basé sur DuckDB qui combine la recherche vectorielle (HNSW), la recherche plein texte (BM25) et la récupération hybride avec un constructeur de requêtes fluide et un parcours multi-sauts. Il ajoute des outils d'extraction (DSPy) pour convertir le texte en nœuds et arêtes, des stratégies de déduplication floue et de fusion, des algorithmes de graphe basés sur NetworkX (PageRank, centralité), et un visualiseur D3.js léger. La bibliothèque est contenue dans un seul package et s'appuie sur des fichiers, conçue pour des déploiements locaux ou des prototypes où un graphe sans serveur à écriture unique est souhaitable.
Utilisez GraphMemory lorsque vos besoins de récupération dépassent les simples vecteurs ou les bases de données de graphes pures — par exemple, des flux de travail RAG nécessitant des traversées entre entités, ou lorsque vous souhaitez extraire des connaissances structurées (entités et relations) à partir de documents tout en les gardant dédupliquées et interrogeables. Il est adapté au prototypage, aux ensembles de données de petite et moyenne taille, et aux applications où les longueurs de vecteurs des modèles d'embedding sont fixes. À éviter si vous avez besoin de bases de données de graphes distribuées multi-écrivains à échelle massive (centaines de millions de nœuds).
examples/ couvrant les modèles d'extraction et d'ingestion.ask(), utilisation de l'extraction DSPy, meilleures pratiques de déduplication en deux passes et pièges pour l'utilisation en production.Probablement compatible avec les agents capables d'exécuter des outils Python et d'appeler des LLM pour l'extraction (flux de travail de style Copilot/Codex/Gemini CLI).
GraphMemory est une bibliothèque GraphRAG embarquée basée sur DuckDB offrant une recherche hybride vectorielle+BM25, l'extraction d'entités/relations via DSPy et une déduplication floue. Le fichier SKILL.md est complet avec des tables de décision claires, des extraits de code canoniques et des points de vigilance bien documentés. Aucun script n'a été groupé pour l'exécution. Aucune préoccupation de sécurité trouvée — pas de modèles d'exécution de code à distance, pas d'identifiants codés en dur, pas de risques d'exfiltration. La compétence est bien structurée et serait utile pour les développeurs construisant des applications de graphes de connaissances sans vouloir gérer de bases de données externes.
Compétence propre, bien documentée et avec une excellente structure. Aucun script groupé à auditer. Le SKILL.md lui-même est exemplaire — déclencheurs clairs, table de décision, section points de vigilance, table des modèles de données. Légère déduction pour la qualité du code en raison de l'absence de scripts exécutables pour vérification, mais la qualité de la documentation est élevée. L'utilité est bonne mais de niche — GraphRAG est un cas d'utilisation spécifique, pas universellement applicable.