5天密集课程的感受
Source: Dev.to
引言
在参加本课程之前,我对“AI 代理”的理解基本上只是带有几个工具的 LLM。经过 Google 与 Kaggle 合作的 5 天 AI 代理强化训练后,这种认知发生了很大变化——代理开始更像可以执行目标、调用合适工具并留下可供检查的推理轨迹的团队成员。对 AI Canvas、路由和追踪的关注让我不再只关注单个提示,而是思考整个系统随时间的行为方式。
让我印象深刻的核心理念是:代理不仅仅是“聊天完成”,它们是可以规划、行动、记忆并像其他软件一样被度量的系统。这种思维转变最终影响了我构建毕业项目 Orca 的方式。
5 天课程内容概览
第 1 天 – 代理架构与“从提示到行动”
解释了用户请求如何转化为计划、工具调用以及循环,而不是单一的响应。
第 2 天 – 代理工具与最佳实践
介绍了代理开发套件(ADK)和模型上下文协议(MCP),用于安全地将代理连接到真实的 API 与服务。
第 3 天 – 代理会话与记忆
讨论了管理短期上下文和长期知识,使代理能够处理多轮任务并记住重要信息。
第 4 天 – 代理可观测性与评估
聚焦于日志、追踪、指标以及在 ADK UI 和 CLI 中进行评估运行。
我构建的项目:Orca
Orca 使用自定义工具获取真实的市场数据、计算指标并进行预测,然后再让代理进行解释。工具调用和逐步追踪的实验尤其有帮助:当代理选错工具或误解输出时,追踪能够清晰地显现错误。
课程对 Orca 的影响
- 第 2 天 为我提供了构建数据和指标工具的可靠模板——小巧、专注且可预测,便于代理安全调用。
- 第 3 天 启发我实现了一个记忆层,能够保留用户的风险偏好、关注列表或历史决策,同时遵守金融数据隐私。
- 第 4 天 促使我把追踪和评估运行视为一等功能,使 Orca 从黑盒转变为金融决策的“玻璃盒”。
实验中的亮点
为每个代理分配明确、狭窄的角色,使系统更加整洁。与其使用一个负载过重的“智能”代理,不如采用几个专注的代理,这样调试和解释更简便,这在金融领域的透明度和信任度上至关重要。
我对代理的看法如何改变
对 Orca 来说,目标从黑箱模型转向玻璃箱体验。追踪、内部推理以及代理之间的小争论现在已成为产品体验的一部分,尤其在用户进行真实金钱决策时。
我接下来想要的方向
对我而言最大的转变是现在提出的问题:不再仅仅是“如何提示这个模型?”而是“如何设计一个人们可以依赖、调试并随时间改进的代理系统?”Orca 是我首次认真尝试回答这个问题,而这次强化训练让我觉得这完全可行。
亲自尝试 Orca
- 在线应用:
- GitHub 仓库:
- 演示视频(2 分钟):