Ce qu'il fait

Ce skill documente des modèles pratiques pour implémenter le prompt caching lors du développement avec les API Anthropic (Claude). Il explique la mécanique du cache, les TTL recommandés, la manière de structurer les blocs mis en cache et les breakpoints, les anti-modèles provoquant des échecs de cache (cache misses), et les méthodes pour mesurer le taux de succès du cache (hit rate). Des exemples de code concrets en Python et TypeScript montrent comment marquer le contenu mis en cache et maintenir les données dynamiques en dehors des préfixes cachés.

Quand l'utiliser

Utilisez ce skill lorsque vous devez réduire drastiquement les coûts des tokens d'entrée de l'API ou diminuer la latence en mettant en cache les parties stables des prompts. Il est utile lors de l'intégration en production, de l'optimisation des performances, ou pour tout cycle à volume élevé où des préfixes stables se répètent (prompts système, définitions d'outils, documents de référence volumineux). À éviter pour les appels uniques ou les prompts très courts.

Ce qui est inclus

Scripts : aucun script fourni (has_scripts=false) — les exemples sont intégrés dans le corps du SKILL.md
Références : aucune référence fournie (has_references=false) — les liens vers la documentation Anthropic sont cités dans le texte
Instructions : directives procédurales claires sur la sélection du TTL, l'ordre des breakpoints, la taille minimale des blocs de cache, la correction des anti-modèles et les métriques à mesurer (cache_read vs tokens d'entrée). Inclut des extraits Python et TypeScript démontrant comment marquer les blocs de cache.

Agents compatibles

Probablement utilisé par des agents et des outils appelant les API Anthropic/Claude (Claude-opus/Haiku), et par des outils destinés aux développeurs (Claude Code, Cursor, intégrations Copilot) nécessitant des optimisations de coûts de tokens.

Prompt Caching Patterns

Ce qu'il fait

Quand l'utiliser

Ce qui est inclus

Agents compatibles

Étiquettes

Compétences similaires

Pas encore audité

Informations

Plus de ai-toolkit