5天密集课程的感受

发布: 1天前 (2025年12月4日 GMT+8 10:26)

5 min read

Source: Dev.to

引言

在参加本课程之前，我对“AI 代理”的理解基本上只是带有几个工具的 LLM。经过 Google 与 Kaggle 合作的 5 天 AI 代理强化训练后，这种认知发生了很大变化——代理开始更像可以执行目标、调用合适工具并留下可供检查的推理轨迹的团队成员。对 AI Canvas、路由和追踪的关注让我不再只关注单个提示，而是思考整个系统随时间的行为方式。

让我印象深刻的核心理念是：代理不仅仅是“聊天完成”，它们是可以规划、行动、记忆并像其他软件一样被度量的系统。这种思维转变最终影响了我构建毕业项目 Orca 的方式。

5 天课程内容概览

第 1 天 – 代理架构与“从提示到行动”

解释了用户请求如何转化为计划、工具调用以及循环，而不是单一的响应。

第 2 天 – 代理工具与最佳实践

介绍了代理开发套件（ADK）和模型上下文协议（MCP），用于安全地将代理连接到真实的 API 与服务。

第 3 天 – 代理会话与记忆

讨论了管理短期上下文和长期知识，使代理能够处理多轮任务并记住重要信息。

第 4 天 – 代理可观测性与评估

聚焦于日志、追踪、指标以及在 ADK UI 和 CLI 中进行评估运行。

我构建的项目：Orca

Orca 使用自定义工具获取真实的市场数据、计算指标并进行预测，然后再让代理进行解释。工具调用和逐步追踪的实验尤其有帮助：当代理选错工具或误解输出时，追踪能够清晰地显现错误。

课程对 Orca 的影响

第 2 天 为我提供了构建数据和指标工具的可靠模板——小巧、专注且可预测，便于代理安全调用。
第 3 天 启发我实现了一个记忆层，能够保留用户的风险偏好、关注列表或历史决策，同时遵守金融数据隐私。
第 4 天 促使我把追踪和评估运行视为一等功能，使 Orca 从黑盒转变为金融决策的“玻璃盒”。

实验中的亮点

为每个代理分配明确、狭窄的角色，使系统更加整洁。与其使用一个负载过重的“智能”代理，不如采用几个专注的代理，这样调试和解释更简便，这在金融领域的透明度和信任度上至关重要。

我对代理的看法如何改变

对 Orca 来说，目标从黑箱模型转向玻璃箱体验。追踪、内部推理以及代理之间的小争论现在已成为产品体验的一部分，尤其在用户进行真实金钱决策时。

我接下来想要的方向

对我而言最大的转变是现在提出的问题：不再仅仅是“如何提示这个模型？”而是“如何设计一个人们可以依赖、调试并随时间改进的代理系统？”Orca 是我首次认真尝试回答这个问题，而这次强化训练让我觉得这完全可行。

亲自尝试 Orca

在线应用：
GitHub 仓库：
演示视频（2 分钟）：

5天密集课程的感受

引言

5 天课程内容概览

第 1 天 – 代理架构与“从提示到行动”

第 2 天 – 代理工具与最佳实践

第 3 天 – 代理会话与记忆

第 4 天 – 代理可观测性与评估

我构建的项目：Orca

课程对 Orca 的影响

实验中的亮点

我对代理的看法如何改变

我接下来想要的方向

亲自尝试 Orca

相关文章

从零到 Gemini Multi-Agint：我如何在 5 天内构建 Cognitive Firewall

🌑 进入黑暗：Soulbound Codex

我在 7 天内使用 Kiro 的 Spec-Driven AI Development 构建了 Yahoo Pipes 2.0

🧟 我把 Task Manager 改造成僵尸射击游戏，以节省 RAM（使用 Kiro 构建）

引言

5 天课程内容概览

第 1 天 – 代理架构与“从提示到行动”

第 2 天 – 代理工具与最佳实践

第 3 天 – 代理会话与记忆

第 4 天 – 代理可观测性与评估

我构建的项目：Orca

课程对 Orca 的影响

实验中的亮点

我对代理的看法如何改变

我接下来想要的方向

亲自尝试 Orca

相关文章

从零到 Gemini Multi-Agint：我如何在 5 天内构建 Cognitive Firewall

🌑 进入黑暗：Soulbound Codex

我在 7 天内使用 Kiro 的 Spec-Driven AI Development 构建了 Yahoo Pipes 2.0

🧟 我把 Task Manager 改造成僵尸射击游戏，以节省 RAM（使用 Kiro 构建）

第 1 天 – 代理架构与“从提示到行动”

第 2 天 – 代理工具与最佳实践

第 3 天 – 代理会话与记忆

第 4 天 – 代理可观测性与评估