| Claude | Opus 4.1, Opus 4, Sonnet 4.5, Sonnet 4, Sonnet 3.7, Haiku 4.5, Haiku 3.5, Haiku 3 | | OpenAI | gpt-4o, gpt-4o-mini, o1, o1-mini (automatic caching) |
| Min prefix size | 1,024 tokens (Claude) | | Breakpoint count | 2-4 per request | | Content order | Stable prefix first | | Default TTL | 5m for most cases | | Extended TTL | 1h if >10 reads/hour |
anthropic-caching Keywords: anthropic, claude, cachecontrol, ephemeral Solves:
Memorizzazione nella cache dei prompt nativa del provider per Claude e OpenAI. Da utilizzare per ottimizzare i costi LLM con punti di interruzione della cache, memorizzare nella cache i prompt del sistema o ridurre i costi dei token per prefissi ripetuti. Fonte: yonatangross/orchestkit.