Prompt-caching – 自动注入 Anthropic 缓存断点(节省 90% token)

发布: (2026年3月13日 GMT+8 19:38)
3 分钟阅读
原文: Hacker News

Source: Hacker News

MCP Plugin · Open Source · MIT
Built with Claude, for Claude.

Prompt‑缓存工作原理

Anthropic 的缓存 API 将稳定内容在服务器端保存 5 分钟。缓存读取费用为 0.1×,而非 1×。此插件会自动放置断点。

🐛 BugFix 模式

检测消息中的堆栈跟踪。缓存出错的文件 + 错误上下文一次。之后的每一次跟进只为新问题付费。

♻️ Refactor 模式

检测重构关键字 + 文件列表。缓存前置模式、风格指南和类型定义。仅重新发送每个文件的指令。

📂 文件追踪

跟踪每个文件的读取次数。第二次读取时,插入缓存断点。此后所有读取费用为 0.1× 而非 1×。(始终开启 — 所有模式

🧊 对话冻结

在第 N 轮后,将第 (N − 3) 轮之前的所有消息冻结为缓存前缀。仅发送最近的 3 轮。节省效果会叠加。

基准测试

在使用 Sonnet 的真实 Claude Code 会话中测量。第 2 轮即达到盈亏平衡。

会话类型轮数未使用缓存使用缓存节省率
Bug fix(单文件)20184 000 令牌28 400 令牌85 %
Refactor(5 文件)15310 000 令牌61 200 令牌80 %
General coding(通用编码)40890 000 令牌71 200 令牌92 %
Repeated file reads(5 × 5)50 000 令牌5 100 令牌90 %

缓存创建费用为普通的 1.25×。缓存读取费用为 0.1×。第一轮之后的每一轮都是纯粹的节省。

安装 prompt‑caching

Claude Code(推荐)

⏳ 正在官方 Claude Code 插件市场等待批准。期间可直接从 GitHub 安装:

/plugin marketplace add https://github.com/flightlesstux/prompt-caching
/plugin install prompt-caching@ercan-ermis

Claude Code 的插件系统会自动处理所有事务。安装后即可立即使用 get_cache_stats 工具。

通过 npm 全局安装

npm install -g prompt-caching-mcp

将其添加到客户端的 MCP 配置

{
  "mcpServers": {
    "prompt-caching-mcp": {
      "command": "prompt-caching-mcp"
    }
  }
}

支持的 MCP 兼容客户端包括 Cursor、Windsurf、ChatGPT、Perplexity、Zed、Continue.dev,以及其他任何 MCP 客户端。


开源 · MIT · 零锁定

准备好将你的 Claude Code 令牌成本降低 90% 吗?

0 浏览
Back to Blog

相关文章

阅读更多 »

Claude 2026年3月使用推广

我们提供限时促销,将 Claude 用户在美国东部时间上午 8 点至下午 2 点 / 太平洋时间上午 5 点至 11 点之外的使用限制翻倍。此促销适用于 Free、Pro……

LLMs 可能会让人感到疲惫

有些日子,我在与 Claude 或 Codex 进行了一场痛苦的 4‑5 小时会话后上床,想知道到底发生了什么。很容易把责任归咎于模型——有些……