[Paper] AI 代理的采用与使用:来自 Perplexity 的早期证据
发布: (2025年12月9日 GMT+8 02:56)
8 min read
原文: arXiv
Source: arXiv - 2512.07828v1
概览
本文首次在大规模、真实世界环境中研究人们如何在网页浏览器中采用和使用通用 AI 代理。通过分析数亿条匿名的 Comet(Perplexity 的 AI 驱动浏览器)及其内置 “Comet Assistant” 的交互日志,作者揭示了使用这些代理的用户群体、使用强度以及所执行的任务类型。研究结果为开发者、产品团队和政策制定者提供了关于 AI 代理消费新兴模式的早期洞察。
主要贡献
- 实证现场研究:在网络规模上(数亿次查询)考察 AI 代理的采纳情况。
- 用户细分分析:将采纳强度与人口统计特征(人均 GDP、教育水平)及职业领域(技术、学术、金融、营销、创业)关联。
- 层级分类法(主题 → 子主题 → 任务),系统地对 90 种不同的代理任务进行归类,揭示少数任务主导了使用量。
- 时间动态:展示早期使用案例的“黏性”,以及随时间逐渐转向更高认知需求的主题。
- 开放世界使用洞察:区分个人、职业和教育场景(55 % 个人,30 % 职业,16 % 教育)。
方法论
- 数据收集 – 作者获取了 Comet 后端的匿名日志,覆盖 数亿 次用户‑代理交互,时间跨度为数月。
- 用户细分 – 根据地理区域、人均 GDP、教育水平以及行业(从推断的职业信号中得出)对用户进行分组。
- 查询解析与标注 – 将每次交互解析为自然语言意图,并使用规则启发式与微调语言模型的组合,自动映射到三层分类法(主题 → 子主题 → 任务)。
- 统计分析 – 测量采纳率、使用强度(每用户查询数)和任务分布,并检视纵向趋势以捕捉行为演变。
- 验证 – 对 5 % 的标注查询进行人工审查,确保分类法精度(> 90 % 一致性)。
该流水线专为拥有大规模交互日志的团队设计,可复现,无需深厚计量经济学或高级 NLP 专业知识。
结果与发现
| 维度 | 关键发现 |
|---|---|
| 采纳 | 早期采纳者集中在高 GDP、高教育水平的国家;数字/知识密集型行业的专业人士采纳率是基线的 2–3 倍。 |
| 使用强度 | 重度用户(前 5 %)产生 > 30 % 的全部查询,日均约 45 次查询。 |
| 热门主题 | 生产力与工作流 与 学习与研究 合计占 57 % 的查询。 |
| 主导子主题 | 课程(在线学习)和 商品购物 各约占 11 % 的查询,合计 22 %。 |
| 任务集中度 | 10 个最常见任务(如“摘要文章”“比较产品”“生成代码片段”)覆盖 55 % 的查询,尽管分类法包含 90 项任务。 |
| 情境划分 | 个人使用占主导(55 %),其后是职业(30 %)和教育(16 %)。 |
| 时间转变 | 随着周数增加,用户从简单检索(如“搜索商品”)转向更高阶推理任务(如“起草研究提案”)。 |
| 黏性 | 在第一周与代理互动的用户,在一个月后保持活跃的概率是其他用户的 1.8 倍。 |
实践意义
- 产品路线图 – 开发 AI 助手功能的团队应优先考虑 与生产力相关的工作流(任务自动化、摘要、代码生成)和 学习工具(课程辅助、研究支持),因为它们在真实使用中占据主导。
- 用户引导 – 早期采纳者的人口特征表明,有针对性的引导(如在科技中心、大学、金融公司)可加速扩散。针对高价值职业使用案例的演示能提升长期留存率。
- 变现策略 – 由于少数任务占据大多数交互,分层定价(基础查询免费,高级推理或批处理付费)可在不疏远普通用户的前提下捕获价值。
- API 设计 – 将 层级分类法(主题 → 子主题 → 任务)作为 API 的一部分公开,便于开发者构建上下文感知的扩展(如特定行业的插件)。
- 隐私与合规 – 本研究依赖匿名日志,强调在大规模测量代理使用时需要 隐私保护的遥测。
- 教育与培训 – 教育机构可利用 AI 代理实现 自助学习 与 研究辅助,但必须设计课程以教授对 AI 生成内容的批判性评估。
局限性与未来工作
- 平台特异性 – 所有数据均来自单一 AI 驱动浏览器(Comet),在移动端或原生应用代理上的使用模式可能不同。
- 自选偏差 – 安装 AI 助手的用户本身更具技术倾向,可能导致相较于整体人群的采纳率被高估。
- 分类粒度 – 虽然三层分类法覆盖了 90 项任务,但新兴能力(如多模态推理)可能需要新增类别。
- 长期行为 – 本研究时间窗口相对较短,未来工作应追踪 多年采纳曲线 以及 代理能力升级 的影响。
- 因果影响 – 已建立用户人口特征与采纳之间的相关性,但因果机制(如定价、营销)仍待进一步探讨。
作者呼吁开展更广泛的跨平台研究、深入的因果分析,并与政策制定者合作,以塑造日益强大的 AI 代理的负责任扩散。
作者
- Jeremy Yang
- Noah Yonack
- Kate Zyskowski
- Denis Yarats
- Johnny Ho
- Jerry Ma
论文信息
- arXiv ID: 2512.07828v1
- 分类: cs.LG, econ.GN
- 发表时间: 2025 年 12 月 8 日
- PDF: Download PDF