
de claude-code-toolkit60
Guide pratique pour construire des systèmes de Génération Augmentée par la Récupération (RAG) de production : sélection de DB vectorielles, stratégies de chunking, choix de modèles d'embedding et optimisation de la récupération.
Fournit un blueprint concret et axé sur la production pour construire des systèmes de Génération Augmentée par la Récupération (RAG). Couvre la sélection et la configuration des bases de données vectorielles (Qdrant, Pinecone, Chroma, Weaviate, Milvus), les stratégies de chunking (fixe, sémantique, hiérarchique, fenêtre glissante), les compromis des modèles d'embedding (OpenAI, Sentence Transformers, Cohere), les optimisations de récupération (recherche hybride, reranking, filtrage par métadonnées) et les pratiques de production telles que la mise en cache, l'ingestion asynchrone et la surveillance. Inclut des extraits de code et des arbres de décision pour guider l'implémentation et le déploiement pratiques.
Utilisez cette compétence lorsque vous concevez ou déboguez un pipeline de recherche sémantique / RAG : choisir une DB vectorielle, décider des stratégies de chunking et d'embedding, optimiser la qualité de la récupération, implémenter une recherche hybride dense+sparse, ou construire une ingestion et une surveillance de production. Elle s'adresse aux ingénieurs construisant des systèmes de recherche, de Q&A ou des assistants nécessitant une récupération fiable et évolutive.
Idéalement adapté aux environnements d'exécution d'agents axés sur le code et l'ingénierie capables d'exécuter des extraits Python et d'interagir avec des DB vectorielles (Claude Code, agents de type Copilot/Codex, autres assistants capables de coder).
Cette compétence n'a pas encore été examinée par notre pipeline d'audit automatisé.