Modèles d'Implémentation RAG

Name: Modèles d'Implémentation RAG
Rating: 84 (1 reviews)
Author: applied-artificial-intelligence

Score de confiance 84/100

Guide pratique pour construire des systèmes de Génération Augmentée par la Récupération (RAG) de production : sélection de DB vectorielles, stratégies de chunking, choix de modèles d'embedding et optimisation de la récupération.

déclencheurs:ragretrieval-augmented generationvector databasechunkingembeddingshybrid searchreranking

GitHub SKILL.md

Ce que cela fait

Fournit un blueprint concret et axé sur la production pour construire des systèmes de Génération Augmentée par la Récupération (RAG). Couvre la sélection et la configuration des bases de données vectorielles (Qdrant, Pinecone, Chroma, Weaviate, Milvus), les stratégies de chunking (fixe, sémantique, hiérarchique, fenêtre glissante), les compromis des modèles d'embedding (OpenAI, Sentence Transformers, Cohere), les optimisations de récupération (recherche hybride, reranking, filtrage par métadonnées) et les pratiques de production telles que la mise en cache, l'ingestion asynchrone et la surveillance. Inclut des extraits de code et des arbres de décision pour guider l'implémentation et le déploiement pratiques.

Quand l'utiliser

Utilisez cette compétence lorsque vous concevez ou déboguez un pipeline de recherche sémantique / RAG : choisir une DB vectorielle, décider des stratégies de chunking et d'embedding, optimiser la qualité de la récupération, implémenter une recherche hybride dense+sparse, ou construire une ingestion et une surveillance de production. Elle s'adresse aux ingénieurs construisant des systèmes de recherche, de Q&A ou des assistants nécessitant une récupération fiable et évolutive.

Ce qui est inclus

Scripts : aucun dans le package du dépôt (has_scripts=false) mais des exemples de code et des extraits de recettes sont inclus dans le fichier SKILL.md.
Références : références intégrées aux outils et documents recommandés ; pas de répertoire references/ séparé.
Instructions : modèles étape par étape pour la sélection de la DB, les méthodes de chunking, les appels d'embedding, la recherche hybride, le reranking, le filtrage par métadonnées et des exemples de pipelines.

Agents compatibles

Idéalement adapté aux environnements d'exécution d'agents axés sur le code et l'ingénierie capables d'exécuter des extraits Python et d'interagir avec des DB vectorielles (Claude Code, agents de type Copilot/Codex, autres assistants capables de coder).

Étiquettes

#rag #semantic-search #vector-databases #embeddings #retrieval #production #chunking #mlops

Aucun script exécutéAudité le May 15, 2026

Résumé de l'audit

Comprehensive RAG implementation reference guide covering vector DB selection, chunking strategies, embedding models, retrieval optimization, and production patterns. No bundled scripts to test. SKILL.md is well-written with practical code examples and decision trees, though everything is in a single monolithic file with no scripts/ or references/ separation.

Points d'attention

API key placeholders like 'your-key' in Pinecone examples could be copy-pasted without replacement
No scripts directory — purely reference content, no automation
Monolithic SKILL.md (~500 lines) could benefit from splitting into references/

Notes

Clean reference skill with no security concerns. Well-written content covering the full RAG stack. Main architectural weakness is monolithic structure — everything inline with no scripts/ or references/ directories. Code examples are practical and include good docstrings.

Informations

Dépôt: claude-code-toolkit
Étoiles: 60

Score de confiance

Global84

Sécurité97

Qualité du code82

Architecture55

Utilité72

Compétences similaires

DSPy — Declarative LM Programming

Use DSPy to build declarative, modular LM pipelines, optimize prompts automatically, and assemble reliable RAG/agent systems with structured signatures and opti

Runway Prod Checklist

Production checklist and SDK patterns for integrating Runway (AI video/image generation) into production workflows.

Datadog Live Debugger (dd-debugger)

Place live log probes on running services to capture runtime arguments and variables without redeploying (Datadog Live Debugger).

Microsoft Foundry Classic — Expert Guidance

Comprehensive guidance for building, configuring, troubleshooting, and deploying Microsoft Foundry Classic agents and integrations.

OpenViking Memory Plugin

Provides automatic long-term memory capture and recall for OpenClaw agents: auto-capture, auto-recall, and memory management tools for more context-aware conver

Synalinks Framework

Keras-inspired framework for building structured, neuro-symbolic LLM programs with DataModel schemas, modular Programs, and training/optimization tools.

Terradev — Cross‑Cloud GPU Provisioning

Provision and manage GPUs across clouds, create GPU Kubernetes clusters, deploy inference endpoints, and burst local compute to cloud with BYOAPI credential saf

Recall

Fan-out retrieval pattern that searches all memory sources when a vague reference to past context appears, preventing guesswork and ensuring accurate context be

Retour aux compétences