超越 Chatbot:可信 AI 的蓝图

发布: (2026年1月31日 GMT+8 08:42)
7 min read

Source: Google Developers Blog

请提供您希望翻译成简体中文的具体文本内容,我将为您进行翻译。

Ajeet Mirwani

美洲项目负责人,Google 开发者专家

“在 100 mph 的速度下,AI 的‘幻觉’没有容身之地。”

当赛车在加利福尼亚州威洛斯的 Thunderhill Raceway 接近高速弯道时,完美线路与危险打滑之间的差距以毫秒计。传统的性能遥测依赖于静态代码,只能在事后告诉你发生了什么。一支由 Google 开发者专家(GDE)组成的小团队想要看看 AI 能否实时进入驾驶员的耳中,将原始数据转化为可靠的瞬间指导。

Thunderhill Raceway

Source:

使用统一旅程的代理驱动开发

本次测试最令人惊讶的并非结果本身,而是开发速度。团队利用 Antigravity (AGY)——Google 用于编排有状态代理系统的新框架,通过自然语言驱动的编排,将原本需要三个月的开发周期压缩至仅两周。

  • AGY Agent Manager 通过处理大规模冷路径数据和模板化物理逻辑,加速了工作流,使 GDE 能够通过“氛围编码”专注于高层系统行为的设计。
  • 该项目是对 Google Unified Developer Journey 的一次压力测试。GDE 先在 Google AI Studio 中快速原型化,然后使用该蓝图迁移到 Vertex AI——面向生产级系统的“专业版”路径。
  • 与其编写成千上万行的模板化物理代码,GDE 只需用自然语言描述期望的代理行为,系统即可通过 Firebase 为大规模处理和实时状态管理提供架构支撑。

Architecture diagram

“Split‑Brain” 架构

该框架的基础是 “Split‑Brain” 架构,将 反射(reflexes)与 策略(strategy)分离。为管理这一复杂部署,GDE 们组成了专门的突击小组:

团队成员角色
情报团队Jigyasa GroverLinkedIn
Vikram TiwariLinkedIn
实现了多层系统。Gemini Nano 在边缘运行以处理反射;Gemini 3.0 负责更高层次的推理和战略圈速分析。
Margaret Maynard‑ReidLinkedIn主持每日站会。
边缘团队Sebastian GomezLinkedIn将 Gemini Nano 通过 Web API 集成到 Chrome,实现约 15 ms 的响应时间。
Austin Bennett管理硬件配置,确保 “Data Crucible” 节点以高速运行。
感知团队Hemanth HMLinkedIn
Vikram Tiwari(同上)
在应用层面实现赛道的可视化。使用 Maps MCP 让系统 “看到” 赛道布局,并以 60 FPS 渲染实时 3D 遥测,实现对比驾驶员线路与 AI 推荐的 “幽灵分析”。

Team at the track

Antigravity 充当 Gemini Nano 的边缘反射(约 15 ms)与 Gemini 3.0 的战略推理之间的编排层。通过自动化模型之间的交接,框架在超过 100 mph 的速度下仍能保持实时状态管理。

可数学验证的教练

信任建立在验证之上。Rabimba KaranjaiLinkedIn 实施了 Neuro‑Symbolic Training 方法,以确保 AI 的建议基于物理学。

  • 这些模型在使用 QLoRA 的 “Golden Lap” 基准上进行微调,使系统能够对自己的教练进行数学验证。
  • 当 AI 建议 “稍后刹车” 时,这一建议背后有物理学验证步骤作为支撑。

团队采用 Draft → Verify → Refine 的代理循环进行实时分流:

  1. Draft – AGY Agent Manager 在出现数据摩擦(例如在维修区)时提出代码修复方案。
  2. Verify – 自动化浏览器测试将新逻辑与遥测基准进行比对。
  3. Refine – 通过验证的更新在圈间被推送到车辆的 “Data Crucible”。

这种自我纠正的工作流保证了教练建议——例如 “刹车延后 20 英尺”——始终基于物理学并预先验证,以确保安全。

“Gemini Squad”:以教学法为基础

为了弥合数据与人类理解之间的鸿沟,Lynn LangitLinkedIn 引入了基于 Human Pedagogypersona‑based routing。该框架使用一支“Gemini Squad”代理团队——例如 AJ the Crew ChiefRoss the Telemetry Engineer——来提供情境感知的指导。通过注入教学角色,系统能够根据驾驶员的专业水平定制解释,确保 AI 推荐既可操作又易于理解。

基础事实:下一次现场测试

Thunderhill 现场测试证明,使用 AI Trust Gap 可以通过分脑架构和 Google 的统一开发者旅程来弥合。审阅系统输出后,Thunderhill CEO Matt Busby 评价道:

“你们一天所做的,比整个行业40年来的成就还要多。该系统通过将直觉与客观逻辑相结合,使赛车数据可重复且精准——它远远领先于当今市场上已有的任何产品。”

准备好构建了吗?

正如这群 GDE 所展示的,从实验原型到生产系统的跨越是复杂的,但可驾驭。如果你准备好超越 “vibe coding”,并开始在 Vertex AI 的 pro‑tier 上构建,请使用我们的 ADK Crash Course 开始,并构建能够推理、规划并使用工具完成复杂任务的高级自主系统。

Deep Dives from Our GDEs

Back to Blog

相关文章

阅读更多 »

FunctionGemma 微调指南

2026年1月16日 在Agentic AI的世界中,调用工具的能力是将自然语言转化为可执行的软件操作的关键。上个月……

Chatbot 精神病

请提供您希望翻译的具体摘录或摘要文本,我才能为您进行简体中文翻译。

FunctionGemma 微调指南

markdown 2026年1月16日 在Agentic AI的世界中,调用工具的能力将自然语言转换为可执行的软件操作。上个月我们发布了…