灵动的 Oracle:由 Gemini 驱动的多智能体吉卜力公寓猎人
发布: (2026年2月26日 GMT+8 11:03)
4 分钟阅读
原文: Dev.to
Source: Dev.to
概览
此作品是 Built with Google Gemini: Writing Challenge 的参赛作品,旨在应对混乱的校外住房市场。传统房源往往隐藏真实费用——水电、停车、租客保险、健身房会员等费用会把每月 $1,400 的租金推高至 $1,850。为了解除信息噪声,我的团队打造了 The Spirited Oracle,一款以宫崎骏工作室(Studio Ghibli)电影风格重新构想的找房工具。
系统采用 Google Gemini 2.5 Flash 驱动的多代理 AI 架构,并通过 ElevenLabs 让深受喜爱的宫崎骏角色配音。用户不再阅读枯燥的规格表,而是收到角色化的洞察,揭示租房的真实成本。
多代理架构
代理
| Emoji | 代理(角色) | 角色描述 |
|---|---|---|
| 🚂 | The Conductor(《千与千寻》) | 通过 OSRM 路由计算真实通勤时间。 |
| 💸 | Lin(《千与千寻》) | 提取隐藏费用并计算真实的月度总成本。 |
| ⚖️ | The Baron(《猫的报恩》) | 计算确定性的 ZORI 市场公平性百分位。 |
| 🌿 | Kiki(《魔女宅急便》) | 使用实时 OpenStreetMap 数据计算步行评分和安全指标。 |
| 🖤 | The Soot Sprites | 挖掘细则中的埋藏费用。 |
| 🔧 | Kamaji | 将各代理的发现汇总为最终的 “Spirit Match” 分数和叙述,使用 Gemini 完成。 |
Gemini 接收来自 API(如 Overpass、OSRM)的原始 JSON,并将其转化为角色化的洞察。由 Gemini 驱动的聊天界面让用户在拥有完整房源上下文的情况下提出后续问题。
流水线
系统采用 双流水线架构:
- 批处理流水线 – 在后台拉取并处理大规模数据集(例如全市场的 ZORI 数据)。
- 单条流水线 – 实时处理单个房源查询,确保面向用户的 UI 低延迟。
实现细节
- 让 LLM 接地气 – 与其让 LLM 判断租金公平性(容易产生幻觉),我们使用 Zillow 的 ZORI/ZORDI 数据计算出确定性的公平性指标,再让 LLM 进行叙述。
- 跨代理状态管理 – Gemini 2.5 Flash 的高速让六个代理并行运行。为强制纯 JSON 输出,我们加入了激进的回退处理器并细化系统提示,减轻了诸如 stray text (
"Here is your JSON:") 之类的解析错误。
总体而言,一旦设立了防护栏,Gemini 在代理工作流中表现出强大的能力。
经验教训
让 LLM 接地气
- 确定性数据(如 ZORI)应驱动量化决策;LLM 的优势在于讲故事和提供上下文。
跨代理状态管理
- 快速的模型响应降低了延迟,但严格的输出格式仍是关键。未来的改进可以包括原生 JSON‑mode 强制。