Agentic AI的北极星:超越炒作,走向以人为本的实施
发布: (2025年12月22日 GMT+8 11:01)
8 min read
原文: Dev.to
Source: Dev.to
(请提供需要翻译的正文内容,我才能为您完成简体中文翻译。)
Overview
令人不安的事实十分明显:超过 80 % 的 AI 实施在前六个月内失败,而具备代理性的 AI 项目面临更高的失败概率——MIT 研究表明,95 % 的企业 AI 试点 未能实现预期回报。
从“以代理为中心”到“以工作流为中心”
- 构建与真实业务工作流不匹配的“智能”代理是导致失败的主要原因。
- 成功的团队在部署代理之前会重新构想端到端工作流——包括人员、流程和技术。
- 优先考虑复用而非全新构建:投资经过验证的可复用组件(例如抽取、分类、分流),可将非必要工作削减至 ~50 %,并降低脆弱的单次实现。
- 示例:一个语音驱动的下单试点因适配性和可靠性问题被终止。应先以人为中心重新设计下单流程并规划回退路径,然后再将代理嵌入这些重新设计的流程中。
持续关怀不可协商
- 2023年12月,NHTSA(美国国家公路交通安全管理局)强制对特斯拉的FSD Beta进行空中召回,凸显了生命周期治理、性能监控和人工监督的必要性。
- 具备主动性的系统需要像新员工一样持续的指导和监督。
从小开始,智慧扩展
- 亚马逊逐步引入了 Proteus 和 Sparrow 等机器人,先从狭窄的任务(物品搬运、分拣)做起。复杂的判断仍由人工负责,而机器人承担重复的子任务。
- 这种分阶段的做法降低了冲击,建立了信任,并展示了 增量自动化 与明确的人机边界如何防止系统脆弱并提升采纳率。
- 从定义明确的子任务开始,设计清晰的交接点,并逐步迭代实现自主——避免“一刀切”式的大规模上线。
信任始于清晰
- Zillow 在其定价算法提出过于激进的报价后关闭了购房业务,导致 $500 M+ 损失、25 % 的裁员以及品牌受损。
- 公司承认在波动的市场中无法完全解释或控制模型的行为。
- 缺乏可解释性和情景测试,使原本的算法优势变成了负债。
- 没有可解释性,故障排除变成黑箱挑战,采用停滞,合规风险飙升。
从概念验证到影响验证
- UPS 部署了其 ORION AI 路由系统,设定了明确的关键绩效指标(KPI):燃料节省、里程减少和排放降低。
- 结果:每年 4 亿美元的节省以及显著的可持续性提升。
- 成功源于将项目锚定在可衡量的业务成果上,而非技术新颖性。
- 对比:Zillow 的失败是由于技术至上思维,而 UPS 则通过 KPI 对齐取得成功。
Culture Eats AI Strategy for Breakfast
- Netflix的演进是颠覆性创新的典范,源于其在竞争对手之前主动蚕食自有成功模式的意愿。
- 到2025年,智能自动化和预测数据通过 agent‑driven architecture(代理驱动架构)将Netflix从“被动的图书管理员”转变为“主动的礼宾服务”。
- AI代理现在能够降低数十亿美元内容投资的风险,在数小时内实现全球本地化,并优化用户界面中的每一个像素(个性化缩略图、互动广告),以最大化用户留存。
- 数据与敏捷性的这种协同使Netflix能够从实体DVD转型为全球制片厂,最近又发展为涵盖游戏、广告和现场体育的多垂直平台。
- 将实验和学习循环常态化的组织,表现优于仍停留在僵化瀑布式开发的组织。
以人为本的 AI 从人声开始
- SKYWISE,一个用于航空预测性维护的数据驱动平台,从一开始就由空客与航空公司、维修团队以及 OEM 合作伙伴共同创建。
- 通过联合研讨会收集前线洞察,并根据真实的运营痛点迭代功能。
- 早期让终端用户和主题专家参与可加速采纳;忽视他们则会导致失败。
为你的代理人做好未来准备 – 主动合规
- 印度的 RBI账户聚合器(AA) 生态系统是一个全国范围、基于同意的数据共享框架,使金融“代理人”(个人理财副驾驶、承保助理)能够通过标准同意文档安全地从银行、财富、税务等来源提取用户数据。
- 代理式 AI 的成功取决于预见监管变化、提前嵌入合规以及与法律团队合作——而不是事后慌乱。
- 自动化代理处理敏感数据并可能做出重要决策。必须建立严格的安全协议、隐私保护和伦理指南。明确代理自主性的边界,并确保有人类监督和干预的机制。
代理人是合作伙伴,而非替代品
代理式人工智能可以做惊人的事情,但其真正的力量在于与人类携手合作时显现。通过将人类的洞察力和创造力置于中心,并构建支持协作的流程,我们创建了能够放大——而非取代——人类能力的系统。这将 AI 从一个流行词转变为可信赖的合作伙伴,帮助人们蓬勃发展,带来真实的商业影响,并塑造一个技术与人类共同成长的未来。