llm-caching

Name: llm-caching
Author: rshvr

✓

通过 KV 缓存和提示缓存优化 LLM 成本和延迟。在以下情况下使用：(1) 构造缓存命中的提示，(2) 为 Anthropic/Cohere/OpenAI/Gemini 配置 API cache_control，(3) 使用 vLLM/SGLang/Ollama 设置自托管推理，(4) 构建具有前缀重用的代理工作流程，(5) 设计批处理管道，或 (6) 了解缓存定价和权衡。

rshvr·llm·caching

2安装·0热度·@rshvr

安装

$npx skills add https://github.com/rshvr/llm-caching --skill llm-caching

详情

分类: </>开发工具
来源: skills.sh
收录时间: 2026-02-05

llm-caching

安装

SKILL.md

可引用信息

快速解答

什么是 llm-caching？

如何安装 llm-caching？

这个 Skill 的源码在哪？

详情

相关 Skills