Prompt-caching – 自动注入 Anthropic 缓存断点(节省 90% token)
Source: Hacker News
MCP Plugin · Open Source · MIT
Built with Claude, for Claude.
Prompt‑缓存工作原理
Anthropic 的缓存 API 将稳定内容在服务器端保存 5 分钟。缓存读取费用为 0.1×,而非 1×。此插件会自动放置断点。
🐛 BugFix 模式
检测消息中的堆栈跟踪。缓存出错的文件 + 错误上下文一次。之后的每一次跟进只为新问题付费。
♻️ Refactor 模式
检测重构关键字 + 文件列表。缓存前置模式、风格指南和类型定义。仅重新发送每个文件的指令。
📂 文件追踪
跟踪每个文件的读取次数。第二次读取时,插入缓存断点。此后所有读取费用为 0.1× 而非 1×。(始终开启 — 所有模式)
🧊 对话冻结
在第 N 轮后,将第 (N − 3) 轮之前的所有消息冻结为缓存前缀。仅发送最近的 3 轮。节省效果会叠加。
基准测试
在使用 Sonnet 的真实 Claude Code 会话中测量。第 2 轮即达到盈亏平衡。
| 会话类型 | 轮数 | 未使用缓存 | 使用缓存 | 节省率 |
|---|---|---|---|---|
| Bug fix(单文件) | 20 | 184 000 令牌 | 28 400 令牌 | 85 % |
| Refactor(5 文件) | 15 | 310 000 令牌 | 61 200 令牌 | 80 % |
| General coding(通用编码) | 40 | 890 000 令牌 | 71 200 令牌 | 92 % |
| Repeated file reads(5 × 5) | — | 50 000 令牌 | 5 100 令牌 | 90 % |
缓存创建费用为普通的 1.25×。缓存读取费用为 0.1×。第一轮之后的每一轮都是纯粹的节省。
安装 prompt‑caching
Claude Code(推荐)
⏳ 正在官方 Claude Code 插件市场等待批准。期间可直接从 GitHub 安装:
/plugin marketplace add https://github.com/flightlesstux/prompt-caching
/plugin install prompt-caching@ercan-ermisClaude Code 的插件系统会自动处理所有事务。安装后即可立即使用 get_cache_stats 工具。
通过 npm 全局安装
npm install -g prompt-caching-mcp将其添加到客户端的 MCP 配置
{
"mcpServers": {
"prompt-caching-mcp": {
"command": "prompt-caching-mcp"
}
}
}支持的 MCP 兼容客户端包括 Cursor、Windsurf、ChatGPT、Perplexity、Zed、Continue.dev,以及其他任何 MCP 客户端。
开源 · MIT · 零锁定
准备好将你的 Claude Code 令牌成本降低 90% 吗?