
de graphmemory149
GraphRAG embarqué : stockage hybride graphe + vecteur basé sur DuckDB pour l'extraction, le stockage, la déduplication et l'interrogation de graphes d'entités/relations avec BM25 et vecteurs HNSW,
GraphMemory fournit un moteur GraphRAG embarqué basé sur DuckDB qui combine la recherche vectorielle (HNSW), la recherche plein texte (BM25) et la récupération hybride avec un constructeur de requêtes fluide et un parcours multi-sauts. Il ajoute des outils d'extraction (DSPy) pour convertir le texte en nœuds et arêtes, des stratégies de déduplication floue et de fusion, des algorithmes de graphe basés sur NetworkX (PageRank, centralité), et un visualiseur D3.js léger. La bibliothèque est contenue dans un seul package et s'appuie sur des fichiers, conçue pour des déploiements locaux ou des prototypes où un graphe sans serveur à écriture unique est souhaitable.
Utilisez GraphMemory lorsque vos besoins de récupération dépassent les simples vecteurs ou les bases de données de graphes pures — par exemple, des flux de travail RAG nécessitant des traversées entre entités, ou lorsque vous souhaitez extraire des connaissances structurées (entités et relations) à partir de documents tout en les gardant dédupliquées et interrogeables. Il est adapté au prototypage, aux ensembles de données de petite et moyenne taille, et aux applications où les longueurs de vecteurs des modèles d'embedding sont fixes. À éviter si vous avez besoin de bases de données de graphes distribuées multi-écrivains à échelle massive (centaines de millions de nœuds).
examples/ couvrant les modèles d'extraction et d'ingestion.ask(), utilisation de l'extraction DSPy, meilleures pratiques de déduplication en deux passes et pièges pour l'utilisation en production.Probablement compatible avec les agents capables d'exécuter des outils Python et d'appeler des LLM pour l'extraction (flux de travail de style Copilot/Codex/Gemini CLI).
Cette compétence n'a pas encore été examinée par notre pipeline d'audit automatisé.