
de ai-toolkit155
Directives et modèles pour implémenter le prompt caching avec les API Anthropic afin de réduire les coûts de tokens d'entrée et la latence, incluant les TTL, les breakpoints et la mesure du taux de succès.
Ce skill documente des modèles pratiques pour implémenter le prompt caching lors du développement avec les API Anthropic (Claude). Il explique la mécanique du cache, les TTL recommandés, la manière de structurer les blocs mis en cache et les breakpoints, les anti-modèles provoquant des échecs de cache (cache misses), et les méthodes pour mesurer le taux de succès du cache (hit rate). Des exemples de code concrets en Python et TypeScript montrent comment marquer le contenu mis en cache et maintenir les données dynamiques en dehors des préfixes cachés.
Utilisez ce skill lorsque vous devez réduire drastiquement les coûts des tokens d'entrée de l'API ou diminuer la latence en mettant en cache les parties stables des prompts. Il est utile lors de l'intégration en production, de l'optimisation des performances, ou pour tout cycle à volume élevé où des préfixes stables se répètent (prompts système, définitions d'outils, documents de référence volumineux). À éviter pour les appels uniques ou les prompts très courts.
Probablement utilisé par des agents et des outils appelant les API Anthropic/Claude (Claude-opus/Haiku), et par des outils destinés aux développeurs (Claude Code, Cursor, intégrations Copilot) nécessitant des optimisations de coûts de tokens.
Compétence pure de connaissances/documentation sans scripts. Couvre les mécanismes de mise en cache des prompts d'Anthropic, les modèles de couches, les anti-patterns et la mesure du taux de réussite avec des exemples de code en Python et TypeScript. Contenu de référence bien structuré — tableaux clairs, conseils pratiques et chiffres de seuil spécifiques (cible de taux de réussite de 0,7, minimum de 1024/2048 jetons). Aucune préoccupation de sécurité.
Compétence propre, limitée aux connaissances. Bénéficierait d'un répertoire references/ liant vers la documentation officielle d'Anthropic et les compétences connexes. Le corps de SKILL.md référence déjà l'URL des docs en ligne, ce qui est positif. L'option user-invocable est désactivée, elle est donc conçue comme une compétence de référence passive déclenchée par des mots-clés tels que 'prompt caching' et 'cache_control'.
Glossaire du Langage Ubiquitaire
Extrait un glossaire du langage ubiquitaire de style DDD à partir d'une conversation : identifie les termes du domaine, signale les ambiguïtés, propose des termes canoniques et écrit le résultat dans UB
Recherche de Mémoire
Recherchez les sessions de codage passées et les observations à l'aide de requêtes en langage naturel pour récupérer des décisions, des notes et du contexte.
Générateur de Documentation
Génère et met à jour les fichiers README, la documentation API, les notes d'architecture, les journaux de modifications et les entrées de base de connaissances à partir d'un codebase, avec des modèles et des guides de révision.
Design Engineering
Directives et modèles pour l'animation d'interface utilisateur, les micro-interactions et le peaufinage des composants afin de créer des interfaces performantes, accessibles et agréables.
Règles Kotlin
Normes de codage Kotlin spécifiques au projet couvrant la nomenclature, la sécurité des nuls (null-safety), les coroutines, les tests, les frameworks (Ktor, Spring) et les meilleures pratiques de sécurité.