95%的公司正把 AI 预算点燃

发布: (2026年1月7日 GMT+8 05:59)
8 min read
原文: Dev.to

Source: Dev.to

AI支出激增

  • $30 billion – $40 billion 在过去两年中已投入企业AI。
  • CEO们在财报电话会议上屡次承诺“变革性的AI能力”。
  • LinkedIn上充斥着关于提示工程和“AI‑first cultures”的帖子。
  • 每家科技供应商现在都将其产品标榜为 “AI‑powered”。

回报(或缺失)

根据最近的 State‑of‑AI 报告:

  • ≈ 95 % 的组织在投资生成式 AI 后 没有任何可衡量的回报
  • 剩余的 5 %——包括一些企业、中型市场玩家以及少数灵活的初创公司——正在获取 数百万的实际价值

GenAI Divide

两个群体之间的差距被称为 GenAI Divide
如果你站在错误的一方,无论进行多少“prompt‑optimization workshops”都无法弥合。

聊天机器人墓地

大多数生成式 AI 部署都是 寻找问题的解决方案。不同意这种评估?

  • 公司构建了没人使用的聊天机器人。
  • 他们创建了内部知识助理,员工却绕过它,直接向同事提问。
  • 他们自动化内容生成,却仍需要大量人工编辑,以至于从头写更快。

技术是可行的。用例却不行。

那 5 % 成功的并不更聪明或更走运。他们找到了 AI 能解决真正运营瓶颈的工作流——那些成本高、耗时长且不需要细腻人类判断的任务,这类任务往往导致 AI 实施失败。他们发现了那种不光鲜、工作量大、流程繁重、真正能产生影响的工作。

Source:

语音 AI:具备价值的基础设施层

当商业世界沉迷于基于文本的 AI 时,语音 AI 代理已经经历了一场许多人完全错过的变革。

如果你对自动电话系统的认知仍是“按 1 销售,按 2 支持”,那你已经落后大约三年。现代语音 AI 堆栈已经远远超越了 IVR 2.0,以至于把它们归为同一类别几乎是误导。我们谈论的是完全自主的对话端点,它们能够在无需人工干预的情况下处理复杂的、多阶段的客户交互。

过去六个月,我测试了多个语音 AI 代理平台,技术已经悄然达到临界点。改进不是渐进的——它们是范畴性的

  • 超越 TTS 与转录——真正的突破不仅在于文字转语音的质量或转录的准确度(尽管两者都已显著提升)。
  • 编排层——现代语音 AI 代理能够通过并行 LLM 链实时解析多意图查询。

“我需要更新地址,查询订单状态,另外,你能取消我上个月设置的订阅吗?”

系统可以轻松处理这三项,而不会出现卡顿或失去对话上下文。

  • 在长时间通话中保持对话状态,不会出现上下文崩溃。
  • 在对话进行时触发 API 工作流——更新 CRM、创建工单、验证线索、执行 OTP 检查——同时仍在与客户交谈。
  • 通过设备端缓存和流式推理动态调整延迟,旧系统那种尴尬的停顿正逐渐消失。

没有人谈论的秘密酱料

大多数人低估了这一点:真正的全双工音频

人类对话并非轮流进行。我们会重叠、打断,边说“嗯”“对”,边让对方继续说。当我们已经明白对方的意思时会直接切入。传统语音系统无法处理这种情况——它们会等到沉默后才响应。于是显得机械,因为它本身就是机械的。

同时进行聆听和说话的能力让现代语音 AI 真正具有人类级别的体验。更重要的是,它将平均通话时长降低 20 %–40 %。这不仅是用户体验的提升,更是直接的成本下降,在首月的损益表上即可体现。

自适应打断处理

  • 自适应打断处理是自然对话 UX 的秘密酱料。
  • 当客户在句子中途打断时,AI 必须:
    1. 识别出打断。
    2. 优雅地放弃当前的响应。
    3. 转向处理客户真正想讨论的内容。

处理不当会导致用户沮丧。处理得当则让客户忘记自己并非在与真人交谈。

实际案例

Sloane 这样的公司已经围绕此能力构建了完整模型——AI 电话助理能够为企业处理进线和出线通话,且没有早期语音自动化所带来的“恐怖谷”问题。这正是那种聚焦于工作流、能够真正产生回报的 AI 部署方式。

发展方向

Voice‑AI 代理正逐渐成为 基础设施层,而不仅仅是一个功能。在接下来的 18 个月内,问题不再是 是否 你的企业使用 AI 电话系统——而是 使用哪种 技术。采用 第一代解决方案 的公司很快会被部署能够 自主处理约 80 % 通话量 的代理的竞争对手超越。

GenAI 分水岭

分水岭并不在于谁投入了更多资金或拥有最强的数据科学团队,而在于谁:

  1. 识别出真实的运营问题 并部署 AI 来解决它们。
  2. 盲目追随 hype,打造看似炫目的演示,却未能推动业务指标。

文本生成式 AI 的未来

  • 用例将趋于成熟。
  • 实现方式将不断改进。

目前,技术仍在寻找自己的定位。(为简洁起见,省略了进一步细节。)

结论

,如果你在寻找真正体现在财务报表中的 AI,语音是聪明资金流向的方向。

  • 95 % 的组织在追逐聊天机器人时耗尽了预算。
  • 剩余的 5 % 自动化了他们的电话——已经开始获得可衡量的投资回报率。
Back to Blog

相关文章

阅读更多 »

AI 迷惑了?‘슬롭 游戏’该怎么看?

“最近AI人工智能生成游戏是个问题”,一位开发公司负责人在新年问候并想聊点别的时,通话却偏离了方向。他表示,使用生成AI制作的“slop·低质量游戏”越来越多,感到担忧。独立游戏从业者和开发公司们把“retouching”作为判断是否为slop游戏的标准……

Nano Banana 是如何得名的

你已经因为它的病毒式编辑功能而熟知 https://blog.google/products/gemini/nano-banana-tips/。但是,Google DeepMind 最受欢迎的模型之一是如何…