印度的全球系统集成商利用 NVIDIA AI 构建下一波企业代理,转型后台和客户支持
Source: NVIDIA AI Blog
代理式 AI 正在改变印度的科技格局
印度的科技行业正利用 NVIDIA AI Enterprise 和 NVIDIA Nemotron 模型,在呼叫中心、电信、医疗等众多行业提升生产力和效率。
关键企业
- Infosys
- Persistent
- Tech Mahindra
- Wipro
这些公司通过整合基于 NVIDIA AI Enterprise 的代理式 AI 平台,推动业务转型,提升后台运营和客户服务体验。
印度 AI 影响峰会亮点
- 2024 印度 AI 影响峰会 展示了由代理式和生成式 AI 驱动的下一代商业服务。
- 演示重点展示了真实场景的使用案例以及 AI 自动化带来的切实收益。
市场展望
- 根据 印度品牌资产基金会 (IBEF) 的数据,印度科技行业预计到 2030 年收入将达到 5,000 亿美元,相比 2023 年的约 2,500 亿美元 实现翻倍增长。
- 这一增长得益于 AI 采纳的激增,仅在 9 月份就采购了 38,000 块 GPU。
欲了解更多峰会信息:
- 访问官方网站: India AI Impact Summit
Wipro WEGA 平台 – 使用 NVIDIA AI Enterprise 提升呼叫中心效率
概览
Wipro 基于 WEGA 平台和 NVIDIA AI Enterprise 的 AI 代理辅助解决方案,正在改变一家美国大型健康保险提供商为其会员服务的方式。通过将实时 AI 辅助与集中式数据中心相结合,该系统使坐席能够处理更复杂的请求,缩短解决时间,并提供个性化的 24/7 支持。
业务挑战
| 问题 | 为什么重要 |
|---|---|
| 季节性招聘与漫长的培训周期 | 在高峰注册期难以快速扩展。 |
| 呼叫量上升与数据碎片化 | 增加等待时间,给人工坐席带来压力。 |
| 繁重的行政工作负担 | 消耗本可用于更高价值互动的资源。 |
| 监管合规要求 | 需要严格的治理和数据隐私保护。 |
解决方案架构
- 核心平台: Wipro WEGA(企业级联络中心平台)。
- AI 技术栈: NVIDIA AI Enterprise 套件,包含:
- NVIDIA NIM 微服务 – 生产级、横向可扩展的推理服务。
- NVIDIA NeMo Guardrails – 为受监管领域提供内置的安全与合规控制。
- 关键能力:
- AI 代理辅助 – 实时提示、知识检索和对话式自助服务。
- 集中式数据中心 – 汇聚会员数据,呈现个性化洞察。
- 自动化数字化 – 消除下游流程中的人工步骤。
注意: 所有组件的延迟均低于 200 ms,支持最高 900 条并发通话 和 每秒 164 次请求。
成果
- 42 % 的入站通话现已完全由 AI 代理处理。
- 在 900 条并发通话 场景下实现近乎即时的响应。
- 吞吐量达到 每秒 164 次请求。
- NVIDIA NeMo Guardrails 确保合规性和安全性。
Wipro 的 AI 代理辅助解决方案展示了将强大的联络中心平台与 NVIDIA 的 AI Enterprise 结合,能够提供更快、更精准且合规的客户体验,为行业树立了新标杆。
Source: …
Tech Mahindra 部署大型电信模型(LTM)以利用 NVIDIA NIM 实现自主网络运营
Tech Mahindra 正在通过与 NVIDIA 合作构建的新平台,加速 AI 辅助的网络运营。平台核心是 大型电信模型(Large Telco Model,LTM),它为现场技术人员生成优先级明确、基于数据的建议,并根据历史成功率对每个修复方案进行排名。结果是:更快、更准确的故障解决——往往一次访问即可完成——并为实现 Level‑4‑plus 运营成熟度 指明了清晰路径。
关键收益
- 更高的一次性修复率 → 减少重复访问。
- 改进的服务层问题解决 → 更快恢复服务。
- 提升客户体验 → 降低流失率并提高满意度评分。
- 后台效率提升 → 更高质量的工单和更少的升级。
平台工作原理
| 组件 | 角色 | NVIDIA 技术 |
|---|---|---|
| 语义搜索 | 索引并检索相关遥测、日志和文档。 | NVIDIA Nemotron 嵌入模型 |
| 重新排序 | 精炼搜索结果,呈现最具可操作性的洞察。 | Nemotron 重新排序模型 |
| 推理引擎 | 以低延迟大规模提供模型服务。 | NVIDIA NIM 微服务 |
| 工作流编排 | 协调网络域内的代理操作。 | NVIDIA NeMo Agent Toolkit |
部署亮点
- 使用 NVIDIA NIM 的 微服务架构 实现快速、可靠的 AI 推理。
- 代理式运营 由 NeMo Agent Toolkit 编排,支持跨多个网络域的自主决策。
- 可扩展性:面向年收入超过 1.5 万亿美元 的全球电信运营商设计,即使是轻微的正常运行时间提升也能产生巨大的经济效益。
行业影响
通过拥抱自主网络运营,Tech Mahindra 展示了 AI 如何改变电信行业——实现可衡量的正常运行时间提升、运营成本下降,以及在年价值 超过 1.5 万亿美元 的市场中获得竞争优势。
Source: …
Infosys 构建企业级编码小型语言模型,基于 NVIDIA AI Enterprise
Infosys 推出了 25 亿参数的小型语言模型(SLM),用于软件开发。该模型基于 NVIDIA NeMo 框架——属于 NVIDIA AI Enterprise——并已集成到 Infosys Topaz Fabric 中。它在保持前沿性能的同时,足够轻量,可部署于:
- 本地企业数据中心
- 公有云环境
- 标准桌面机器
关键能力
| 能力 | 描述 |
|---|---|
| Agent 开发 | 支持创建 AI 驱动的编码助手和多代理流水线。 |
| 代码生成 | 能生成符合语法的代码片段,支持多种编程语言。 |
| 重构 | 为现有代码库提供结构改进和优化建议。 |
| 端到端软件工程工作流 | 覆盖完整生命周期——从设计、实现到测试和调试。 |
训练数据与性能
- 数据组合: 精选高质量代码仓库、合成代码、数学推理数据集以及自然语言输入。
- 基准测试结果: 在 MBPP、MBPP+ 和 BFCL 基准上达到前沿模型水平。
安全、可信与安全编码
- 安全对齐训练: 融入负责任的 AI 实践,降低有害或偏见输出,同时保持流畅性。
- 安全编码验证: 通过 Stanford AIR‑Bench 和 Meta’s CyberSecEval 等行业基准测试,为企业提供对安全聚焦代码建议的信心。
典型使用场景
- 为日常任务自动生成代码
- 智能调试与错误解决辅助
- 使用 AI 驱动的建议对遗留代码库进行重构
- 为复杂软件项目构建多代理开发流水线
Infosys 的编码 SLM 展示了企业级 AI 如何在不牺牲安全性和可信度的前提下,加速软件交付。
Source: …
Persistent 加速 AI 驱动的分子发现,使用 NVIDIA BioNeMo 与 NeMo Agent Toolkit
Persistent Systems 正在与 NVIDIA 合作,将早期药物发现推向一个全新的速度与科学可信度时代。通过将 Persistent 深厚的生命科学工程专长与 NVIDIA 完整堆栈的加速计算平台相结合,研究人员获得了一条从 AI 实验到生产级发现工作流的强大路径。
交付内容
- GenMoIVS(生成分子与虚拟筛选) – 基于 NVIDIA BioNeMo 平台和 NeMo Agent Toolkit 构建的解决方案。
- 领域特定的大模型,能够高精度模拟分子行为,在化合物进入湿实验室之前生成并评估候选分子。
- 代理工作流,持续在虚拟筛选、优先级排序和实验计划之间进行推理,帮助团队降低早期发现风险并缩短开发周期。
技术基础
- 运行于 NVIDIA 的加速计算堆栈,包括 NVIDIA AI Enterprise 软件和 NIM 微服务。
- 在受监管环境中实现高通量仿真和实时科学决策。
- 可扩展的基础设施配合生产就绪的代理 AI。
为什么重要
- 更快的化合物空间探索 – AI 驱动的生成与筛选显著缩短识别有前景候选者的时间。
- 成本效益高的发现 – 减少所需的湿实验次数,降低整体研发支出。
- 更高的后期成功率 – 更准确的早期预测提升后期成功的可能性。
通过融合可扩展的硬件、先进的 AI 模型和生产级工具,Persistent 与 NVIDIA 为生命科学组织提供了一种更快、更可靠的发现新疗法的方式。