5天密集课程的感受

发布: (2025年12月4日 GMT+8 10:26)
5 min read
原文: Dev.to

Source: Dev.to

引言

在参加本课程之前,我对“AI 代理”的理解基本上只是带有几个工具的 LLM。经过 Google 与 Kaggle 合作的 5 天 AI 代理强化训练后,这种认知发生了很大变化——代理开始更像可以执行目标、调用合适工具并留下可供检查的推理轨迹的团队成员。对 AI Canvas、路由和追踪的关注让我不再只关注单个提示,而是思考整个系统随时间的行为方式。

让我印象深刻的核心理念是:代理不仅仅是“聊天完成”,它们是可以规划、行动、记忆并像其他软件一样被度量的系统。这种思维转变最终影响了我构建毕业项目 Orca 的方式。

5 天课程内容概览

第 1 天 – 代理架构与“从提示到行动”

解释了用户请求如何转化为计划、工具调用以及循环,而不是单一的响应。

第 2 天 – 代理工具与最佳实践

介绍了代理开发套件(ADK)和模型上下文协议(MCP),用于安全地将代理连接到真实的 API 与服务。

第 3 天 – 代理会话与记忆

讨论了管理短期上下文和长期知识,使代理能够处理多轮任务并记住重要信息。

第 4 天 – 代理可观测性与评估

聚焦于日志、追踪、指标以及在 ADK UI 和 CLI 中进行评估运行。

我构建的项目:Orca

Orca 使用自定义工具获取真实的市场数据、计算指标并进行预测,然后再让代理进行解释。工具调用和逐步追踪的实验尤其有帮助:当代理选错工具或误解输出时,追踪能够清晰地显现错误。

课程对 Orca 的影响

  • 第 2 天 为我提供了构建数据和指标工具的可靠模板——小巧、专注且可预测,便于代理安全调用。
  • 第 3 天 启发我实现了一个记忆层,能够保留用户的风险偏好、关注列表或历史决策,同时遵守金融数据隐私。
  • 第 4 天 促使我把追踪和评估运行视为一等功能,使 Orca 从黑盒转变为金融决策的“玻璃盒”。

实验中的亮点

为每个代理分配明确、狭窄的角色,使系统更加整洁。与其使用一个负载过重的“智能”代理,不如采用几个专注的代理,这样调试和解释更简便,这在金融领域的透明度和信任度上至关重要。

我对代理的看法如何改变

对 Orca 来说,目标从黑箱模型转向玻璃箱体验。追踪、内部推理以及代理之间的小争论现在已成为产品体验的一部分,尤其在用户进行真实金钱决策时。

我接下来想要的方向

对我而言最大的转变是现在提出的问题:不再仅仅是“如何提示这个模型?”而是“如何设计一个人们可以依赖、调试并随时间改进的代理系统?”Orca 是我首次认真尝试回答这个问题,而这次强化训练让我觉得这完全可行。

亲自尝试 Orca

  • 在线应用:
  • GitHub 仓库:
  • 演示视频(2 分钟):
Back to Blog

相关文章

阅读更多 »

🌑 进入黑暗:Soulbound Codex

演示图片 https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2...