这些前30名AI代理提供功能与自主性的混合
Source: ZDNet

ZDNET 的关键要点
- 麻省理工学院发布了顶级 AI 代理及其功能列表。
- 最大的部分聚焦于企业工作流。
- 研究和信息合成是最主要的使用场景。
哪些自主或半自主的代理正在当今对世界——以及可能对你的工作——产生最大影响?某些代理占据头条,但开发者和用户可以使用各种功能特定的代理。
研究人员发现,界面是最为丰富的,其次是企业工作流平台。他们还发现这些代理共同面临的风险,正如 Tiernan Ray 在相关 ZDNet 文章中所探讨的那样。
MIT指数中列出的代理
- Anthropic Claude / Claude Code
- Google Gemini / Gemini CLI
- Manus AI
- OpenAI ChatGPT / ChatGPT Agent / Codex / AgentKit
- Perplexity
- Alibaba MobileAgent
- ByteDance Agent TARS
- Perplexity Comet
- IBM watsonx Orchestrate
- Microsoft 365 Copilot
- SAP Joule Studio
- Salesforce Agentforce
- ServiceNow AI Agents
研究人员识别的代理类别
企业工作流代理(30个系统中的13个)
具备代理功能以自动化业务任务的平台。
示例: Microsoft 365 Copilot,ServiceNow Agent。
具备代理工具的聊天应用(12个系统)
主要是具有广泛工具访问的聊天界面。
示例: Claude Code,Manus AI,ChatGPT Agent。
基于浏览器的代理(5个代理)
其主要界面为浏览器或计算机,并配备广泛的交互工具的代理。
示例: Perplexity Comet,ChatGPT Atlas,ByteDance Agent TARS。
“基于浏览器的代理通过后台执行、事件触发和直接交易带来更高风险。”——MIT 研究
Chrome’s AI agent shop, research, and email for me – here’s how it went
什么是 AI 代理最流行的用途?
主要用例,跨类别包括:
- 研究与信息合成 – 在 30 个代理中的 12 个出现,涵盖消费者聊天助手和企业平台。
- 工作流自动化 – 出现在 11 个代理中,主要是企业产品,涉及人力资源、销售、支持和 IT 功能。
- GUI 或浏览器功能 – 用于表单、订单和预订等任务,在七个模型中出现。
6 reasons why autonomous enterprises are still more a vision than reality
自主性层级
- Chat‑first assistants (lowest autonomy):基于回合的交互方式,只执行一套动作后等待用户的下一次提示。示例: Anthropic Claude、Google Gemini、OpenAI ChatGPT。
- Browser agents (higher autonomy):在执行过程中可供用户干预的机会有限;一旦发送查询,代理会自行运行至完成,用户难以进行实时引导。示例: Perplexity 的 Comet。
- Enterprise platforms (variable autonomy):用户在设计阶段配置触发器、动作和安全护栏;部署后,许多平台能够自主运行,触发条件包括新邮件或数据库变更等事件。示例: Glean、Google Gemini Enterprise、IBM watsonx、Microsoft 365 Copilot、n8n、OpenAI AgentKit。
Google Workspace now lets you create AI agents to automate your work – how to get started
开发者 / CLI 代理
一些产品在执行敏感操作(例如文件编辑、命令执行)时需要明确确认。某些产品提供“监视模式”,以实时监督关键操作,例如 ChatGPT Agent/Atlas 和 Opera Neon。
研究还指出,代理开发者主要集中在美国和中国,其他地区的代表性有限。