掌握 AI Agents:来自 Google x Kaggle Intensive 与我的 Capstone 的经验教训
Source: Dev.to
Introduction
在参加 Google 与 Kaggle 合作的 5 天 AI 代理强化课程之前,我把大型语言模型(LLM)主要视为知识引擎——能够编写代码或回答问题的高级聊天机器人。课程结束时,我的视角彻底改变了。我意识到,当你为 LLM 提供工具 并加入 推理循环 时,它不再只是文本生成器,而是成为了一个 代理:一个能够感知、推理并采取行动的系统。
在我的毕业项目中,我把这些学习应用于构建一个 市场情绪监测与警报代理,该系统旨在自动化繁琐的金融新闻追踪和市场健康评估任务。下面是对整个过程的回顾、关键概念的体会以及代理的构建方式。
The “Aha!” Moment: Tools & Reasoning
课程中最让人印象深刻的概念是从 Zero‑Shot Prompting 向 ReAct(Reasoning + Acting)循环的转变。
之前:
我会问 LLM:“市场情绪如何?”它会产生幻觉或基于旧的训练数据给出通用答案。
之后:
我学会了构建一个会思考的代理:
Thought: "I need to check the latest news for specific tickers."
Action: Calls a Search Tool or News API.
Observation: Reads the headlines.
Reasoning: "These headlines look bearish. I should calculate a sentiment score."
Final Response: Sends an alert.
给 AI “手”(工具)和 “脑”(Gemini 2.0 Flash)后,我能够构建出动态的系统。
My Capstone: Market Sentiment Monitoring and Alert Agent
What it Does
- 监控一组股票代码的实时金融新闻。
- 提取带有情绪的关键词并分配数值情绪分数。
- 当聚合分数超过可配置阈值时发送警报。
Under the Hood
大脑: Google Gemini(通过 Vertex AI 或 Gemini API)。
工具: 集成的 Python 库用于获取实时数据(如 yfinance、网页抓取工具)以及搜索功能。
逻辑:
- 看涨关键词检测 —— 识别积极词汇。
- 上下文感知 —— 区分“利润损失”与“数据丢失”等不同语境。
你可以在这里查看完整代码和项目说明:Link to my Project。
Challenges & Key Takeaways
- 幻觉 vs. 现实: 基础性(grounding)至关重要。使用 Google Search 作为工具确保代理引用真实 URL,而不是编造新闻。
- 上下文窗口: 管理代理记忆的历史长度非常关键。你不希望它在决定今天的警报时分析 2020 年的新闻。
- 评估: 正如第 4 天课程所强调的,“感觉”不足以评判。我手动将代理的情绪分数与自己的直觉进行比较,以微调提示词。
Conclusion
Google 与 Kaggle 的强化课程虽短,却为长期发展奠定了基础。接下来,我计划升级我的市场情绪代理,使其不仅能发出警报,还能在纸上交易环境中(当然仅作模拟)提出投资组合调整建议!
如果你对进入代理式 AI 仍犹豫不决,现在就开始吧。 “与 AI 对话” 与 “让 AI 为你工作” 之间的差距正在快速缩小。