Profling Claude 对话

发布: (2026年4月17日 GMT+8 16:11)
4 分钟阅读
原文: Dev.to

Source: Dev.to

Profling Claude 对话的封面图片

概览

它是终极的流程杀手。你坐下来,打开 IDE,可能只进行三四次良好的复杂重构,然后——砰。

“您已达到消息上限,直至下午 4:00 。”

这感觉像是崩溃了。你才刚开始!怎么油箱已经空了?我经常遇到这种情况——每天燃烧 $50 的代币——以至于我意识到自己完全盲目飞行。我根本不知道对话背后到底发生了什么。

于是我构建了 Intern。它是一个用于追踪 Claude 交互并提供基于启发式的资源消耗概况的工具。

Intern 充当透明代理。你把 Claude 的代码流量指向它,它会持久保存每一次对话的历史。这让你可以回溯并分析导致额度被耗尽的会话细节。

启发式概况:现实检查

项目的核心是 profile 命令。它读取原始对话追踪并进行启发式分析,以对“工作”进行分类。

当我对一次“短”会话(却花了 $18)进行概况分析时,Intern 显示了以下内容:

=== Cost Report ===
MODEL                      MSGS   INPUT     OUTPUT    CACHE READ   TOTAL
claude-opus-4-6            233    $0.0400   $1.9850   $11.2288     $17.8246

=== Complexity Breakdown ===
COMPLEXITY  COUNT  %
mechanical  196    70.0%
reasoning   69     24.6%
trivial     15     5.4%

=== Tool Usage (322 total calls) ===
TOOL            COUNT   %      BAR
----            -----   -      ---
Bash            110     34.2%  █████████████████
Read            67      20.8%  ██████████
Edit            49      15.2%  ███████

Intern 实际展示的内容

  • 机械 vs. 推理 – 我的 70 % 消息纯粹是机械操作(文件 I/O、bash 命令)。我在进行砌砖任务时却使用了高阶推理额度。
  • 缓存税 – $11.22 仅用于 Claude 重新读取上下文。中途更改系统提示或大文件会立即触发财务和速率限制的激增。
  • 追踪持久化 – Intern 将所有内容保存为 .jsonl 文件,让你能够跨周分析模式,识别“代币大户”。
  • 卸载候选 – 分析器标记出“琐碎”或“工具续写”消息,提示这些可以交给更轻量的模型而不牺牲质量。

如何为自己的工作流生成概况

设置过程不侵入且不干扰你的工作。

安装 Intern CLI 工具

brew tap abhishekjha17/intern
brew install intern

对于非 macOS 平台,请参考仓库中的安装指南。

启动代理

intern proxy
# Example output:
# 2026/04/17 13:29:08 intern proxy listening on :11411 → https://api.anthropic.com (traces → /Users/abhi17/.intern/traces/traces.jsonl)

通过 Intern 启动 Claude

export ANTHROPIC_BASE_URL=http://localhost:11411
claude

Intern 将在你工作时悄悄记录每一次请求和响应。

运行启发式报告

当你触发速率限制时,执行分析:

intern profile .intern/traces/traces.jsonl

选择

追踪你的对话不仅关乎成本,更是重新掌控工作流路径的手段。一旦看到会话中哪些部分是纯机械的,你就可以有意识地将这些分支转移到更便宜或本地的模型上。这样,你不必被迫走唯一、昂贵且受速率限制的道路,而是可以自行决定哪种模型值得你的上下文以及何时使用。

项目

abhishekjha17/intern

0 浏览
Back to Blog

相关文章

阅读更多 »