Profling Claude 对话
Source: Dev.to

概览
它是终极的流程杀手。你坐下来,打开 IDE,可能只进行三四次良好的复杂重构,然后——砰。
“您已达到消息上限,直至下午 4:00 。”
这感觉像是崩溃了。你才刚开始!怎么油箱已经空了?我经常遇到这种情况——每天燃烧 $50 的代币——以至于我意识到自己完全盲目飞行。我根本不知道对话背后到底发生了什么。
于是我构建了 Intern。它是一个用于追踪 Claude 交互并提供基于启发式的资源消耗概况的工具。
Intern 充当透明代理。你把 Claude 的代码流量指向它,它会持久保存每一次对话的历史。这让你可以回溯并分析导致额度被耗尽的会话细节。
启发式概况:现实检查
项目的核心是 profile 命令。它读取原始对话追踪并进行启发式分析,以对“工作”进行分类。
当我对一次“短”会话(却花了 $18)进行概况分析时,Intern 显示了以下内容:
=== Cost Report ===
MODEL MSGS INPUT OUTPUT CACHE READ TOTAL
claude-opus-4-6 233 $0.0400 $1.9850 $11.2288 $17.8246
=== Complexity Breakdown ===
COMPLEXITY COUNT %
mechanical 196 70.0%
reasoning 69 24.6%
trivial 15 5.4%
=== Tool Usage (322 total calls) ===
TOOL COUNT % BAR
---- ----- - ---
Bash 110 34.2% █████████████████
Read 67 20.8% ██████████
Edit 49 15.2% ███████
Intern 实际展示的内容
- 机械 vs. 推理 – 我的 70 % 消息纯粹是机械操作(文件 I/O、bash 命令)。我在进行砌砖任务时却使用了高阶推理额度。
- 缓存税 – $11.22 仅用于 Claude 重新读取上下文。中途更改系统提示或大文件会立即触发财务和速率限制的激增。
- 追踪持久化 – Intern 将所有内容保存为
.jsonl文件,让你能够跨周分析模式,识别“代币大户”。 - 卸载候选 – 分析器标记出“琐碎”或“工具续写”消息,提示这些可以交给更轻量的模型而不牺牲质量。
如何为自己的工作流生成概况
设置过程不侵入且不干扰你的工作。
安装 Intern CLI 工具
brew tap abhishekjha17/intern
brew install intern
对于非 macOS 平台,请参考仓库中的安装指南。
启动代理
intern proxy
# Example output:
# 2026/04/17 13:29:08 intern proxy listening on :11411 → https://api.anthropic.com (traces → /Users/abhi17/.intern/traces/traces.jsonl)
通过 Intern 启动 Claude
export ANTHROPIC_BASE_URL=http://localhost:11411
claude
Intern 将在你工作时悄悄记录每一次请求和响应。
运行启发式报告
当你触发速率限制时,执行分析:
intern profile .intern/traces/traces.jsonl
选择
追踪你的对话不仅关乎成本,更是重新掌控工作流路径的手段。一旦看到会话中哪些部分是纯机械的,你就可以有意识地将这些分支转移到更便宜或本地的模型上。这样,你不必被迫走唯一、昂贵且受速率限制的道路,而是可以自行决定哪种模型值得你的上下文以及何时使用。