Profling Claude 对话

发布: 3周前 (2026年4月17日 GMT+8 16:11)

4 分钟阅读

原文: Dev.to

Source: Dev.to

Profling Claude 对话的封面图片

概览

它是终极的流程杀手。你坐下来，打开 IDE，可能只进行三四次良好的复杂重构，然后——砰。

“您已达到消息上限，直至下午 4:00 。”

这感觉像是崩溃了。你才刚开始！怎么油箱已经空了？我经常遇到这种情况——每天燃烧 $50 的代币——以至于我意识到自己完全盲目飞行。我根本不知道对话背后到底发生了什么。

于是我构建了 Intern。它是一个用于追踪 Claude 交互并提供基于启发式的资源消耗概况的工具。

Intern 充当透明代理。你把 Claude 的代码流量指向它，它会持久保存每一次对话的历史。这让你可以回溯并分析导致额度被耗尽的会话细节。

启发式概况：现实检查

项目的核心是 profile 命令。它读取原始对话追踪并进行启发式分析，以对“工作”进行分类。

当我对一次“短”会话（却花了 $18）进行概况分析时，Intern 显示了以下内容：

=== Cost Report ===
MODEL                      MSGS   INPUT     OUTPUT    CACHE READ   TOTAL
claude-opus-4-6            233    $0.0400   $1.9850   $11.2288     $17.8246

=== Complexity Breakdown ===
COMPLEXITY  COUNT  %
mechanical  196    70.0%
reasoning   69     24.6%
trivial     15     5.4%

=== Tool Usage (322 total calls) ===
TOOL            COUNT   %      BAR
----            -----   -      ---
Bash            110     34.2%  █████████████████
Read            67      20.8%  ██████████
Edit            49      15.2%  ███████

Intern 实际展示的内容

机械 vs. 推理 – 我的 70 % 消息纯粹是机械操作（文件 I/O、bash 命令）。我在进行砌砖任务时却使用了高阶推理额度。
缓存税 – $11.22 仅用于 Claude 重新读取上下文。中途更改系统提示或大文件会立即触发财务和速率限制的激增。
追踪持久化 – Intern 将所有内容保存为 .jsonl 文件，让你能够跨周分析模式，识别“代币大户”。
卸载候选 – 分析器标记出“琐碎”或“工具续写”消息，提示这些可以交给更轻量的模型而不牺牲质量。

如何为自己的工作流生成概况

设置过程不侵入且不干扰你的工作。

安装 Intern CLI 工具

brew tap abhishekjha17/intern
brew install intern

对于非 macOS 平台，请参考仓库中的安装指南。

启动代理

intern proxy
# Example output:
# 2026/04/17 13:29:08 intern proxy listening on :11411 → https://api.anthropic.com (traces → /Users/abhi17/.intern/traces/traces.jsonl)

通过 Intern 启动 Claude

export ANTHROPIC_BASE_URL=http://localhost:11411
claude

Intern 将在你工作时悄悄记录每一次请求和响应。

运行启发式报告

当你触发速率限制时，执行分析：

intern profile .intern/traces/traces.jsonl

选择

追踪你的对话不仅关乎成本，更是重新掌控工作流路径的手段。一旦看到会话中哪些部分是纯机械的，你就可以有意识地将这些分支转移到更便宜或本地的模型上。这样，你不必被迫走唯一、昂贵且受速率限制的道路，而是可以自行决定哪种模型值得你的上下文以及何时使用。

项目

abhishekjha17/intern

Profling Claude 对话

概览

启发式概况：现实检查

Intern 实际展示的内容

如何为自己的工作流生成概况

安装 Intern CLI 工具

启动代理

通过 Intern 启动 Claude

运行启发式报告

选择

项目

相关文章

我构建了一个 Claude Code 插件，它拒绝同意我的观点

270秒法则：如何通过 Smart 将 Claude Code API 成本降低 90%

Codex（几乎）适用于所有

Qwen3.6-Max-Preview：更智能、更锐利，仍在进化