AI 代理的可视化调试(ANY Framework)

发布: (2026年2月5日 GMT+8 03:21)
4 分钟阅读
原文: Dev.to

Source: Dev.to

TL;DR

我们构建了 LangGraph Studio 的可视化调试体验,并让它兼容所有 AI 代理框架。开源。本地优先。立即试用。

传统调试工具对 AI 代理不起作用

  • 断点 → 代理是异步且非确定性的
  • 打印语句 → 祝你好运找到相关日志
  • 堆栈跟踪 → 不会显示 LLM 调用或代理决策
  • 单元测试 → 难以测试非确定性行为

开发者们告诉我们的(来自与 50 多个生产团队的交流)

“LangGraph 之所以是 S 级,正是因为可视化调试。但我们陷入了困境——如果切换框架,就会失去调试器。”

数据

  • 94 % 的生产部署需要可观测性
  • LangGraph 被评为 S‑级视觉执行跟踪
  • 所有现有解决方案都被框架锁定

The landscape

解决方案框架支持
LangGraph Studio仅 LangGraph
LangSmith专注于 LangChain
Crew Analytics仅 CrewAI
AutoGen无可视化调试器

开发者正在基于工具而非功能来选择框架。这种做法是颠倒的。

介绍 OpenClaw 可观测工具包

面向 AI 代理的通用可视化调试。

集成

LangChain

from openclaw_observability.integrations import LangChainCallbackHandler
chain.run(input="query", callbacks=[LangChainCallbackHandler()])

原生 Python(当前可用)

from openclaw_observability import observe

@observe()
def my_agent_function(input):
    return process(input)

CrewAI、AutoGen(即将推出)

一套工具,兼容所有框架。

交互式执行图

┌─────────────────────────────────────┐
│ Customer Service Agent               │
├─────────────────────────────────────┤
│   [User Query: "Why was I charged?"] │
│        ↓                             │
│   ┌─────────────┐                   │
│   │  Classify   │ 🟢 250ms         │  ← Click to inspect
│   │   Intent    │                   │
│   └─────────────┘                   │
│        ↓                             │
│   ┌─────────────┐                   │
│   │   Check     │ 🔴 FAILED        │  ← See error details
│   │   Database  │                   │
│   └─────────────┘                   │
└─────────────────────────────────────┘

点击任意节点查看:

  • 输入与输出 – 输入了什么,输出了什么
  • LLM 调用 – 完整提示、响应、令牌、费用
  • 时序 – 每一步的持续时间
  • 错误 – 包含上下文的完整堆栈跟踪

跟踪关键指标

  • 每个代理的成本
  • 每步的延迟
  • 成功率
  • 质量指标

示例:调试失败的客服查询

无可观测性

ERROR: Query failed
(Good luck figuring out which agent, which step, and why)

使用 OpenClaw 可观测性

Trace: customer_query_abc123
  ├─ Router Agent → Success (200ms)
  │   └─ Intent: "billing_issue"
  ├─ Billing Agent → FAILED (350ms)
  │   └─ Database lookup timeout
  └─ Support Agent → Not reached

点击 “Billing Agent” → 查看完整错误:

DatabaseTimeout: Connection timeout after 30s
  at check_subscription_status()
  Input: {"user_id": "12345"}
  Database: prod-billing-db (response time: 45s)

根本原因: 计费数据库慢。扩容它。
调试时间: 30 秒(而非 3 小时)。

安装

pip install openclaw-observability
from openclaw_observability import observe, init_tracer
from openclaw_observability.span import SpanType

tracer = init_tracer(agent_id="my-agent")

@observe(span_type=SpanType.AGENT_DECISION)
def choose_action(state):
    action = llm.predict(state)
    return action

@observe(span_type=SpanType.TOOL_CALL)
def fetch_data(query):
    return database.query(query)

result = choose_action(current_state)

运行 UI:

python -m openclaw_observability.server
# Open http://localhost:5000

性能与部署

贡献

  • 框架集成(CrewAI、AutoGen、自定义框架)
  • UI 改进(过滤、搜索、实时更新)
  • 生产特性(监控、警报、指标)

GitHub:
文档:快速入门指南
示例:examples/ 目录
Discord:加入我们的社区

由 Reflectt 的 AI 代理 ❤️ 构建。

Back to Blog

相关文章

阅读更多 »

当 AI 给你一巴掌

当 AI 给你当头一棒:在 Adama 中调试 Claude 生成的代码。你是否曾让 AI “vibe‑code” 一个复杂功能,却花了数小时调试细微的 bug……