[Paper] 我希望我们不要去信任广告对爱情所做的事

发布: 4天前 (2026年5月1日 GMT+8 01:04)

7 分钟阅读

原文: arXiv

Source: arXiv - 2604.28113v1

概述

Jade Alglave 的论文提出了一个挑衅性的问题：当“信任”一词已经被广告中廉价的“爱”所滥用、被拉得稀薄时，真正信任一个 AI 系统意味着什么？ 通过将信任重新定义为一套具体、可衡量的“支柱”，并提出可以通过代理系统界面公开的“信任向量”，该工作旨在激发跨学科的讨论，关于构建超越营销炒作的可信 AI。

关键贡献

“信任支柱”的概念分类 – 一套结构化的维度（例如可靠性、透明度、一致性、问责制），可用于 AI 系统的操作化。
“信任向量”设计模式 – 通过代理系统的 UI/API 将每个支柱具体呈现，将抽象的信任转化为可操作的信号。
对广告对“信任”和“爱”语义影响的批判性分析，强调语言漂移如何削弱公众对 AI 的信心。
号召开展跨学科的共享对话，包括计算机科学家、伦理学家、监管机构和民间社会组织。
使用现有指标（如模型鲁棒性测试、可解释性得分）和以用户为中心的调查，对信任支柱进行初步测量的指南。

方法论

Alglave 采用 混合方法：

文献综述 – 回顾在 AI 安全、人机交互（HCI）和广告研究中“信任”的框架。
概念建模 – 将反复出现的主题提炼为一套信任支柱，每个支柱都有可观察的指标（例如，通过扰动下输出方差衡量的“可预测性”）。
设计草图 – 提出 “信任向量” UI 模式，系统以仪表盘形式展示支柱得分、置信区间和可操作的解释。
利益相关者映射 – 勾勒出谁（开发者、终端用户、监管机构）会使用每个支柱，以及如何将其整合到现有开发流程中。

该方法论刻意保持轻量，以保持讨论的开放性并鼓励社区完善。

结果与发现

Trust is multi‑dimensional. 没有单一指标能够捕捉“可信度”；这些支柱共同解释了用户为何会接受或拒绝 AI 的推荐。
Advertising’s linguistic co‑optation dilutes trust. 当“love”被用作销售噱头时，公众对信任的心理模型变得模糊，使得传达技术保证更加困难。
Trust vectors are feasible. 一个原型仪表盘（论文中示意）展示了现有的模型评估工具可以映射到支柱得分，并实时显示。
Early user feedback (informal surveys) 表明，开发者认为基于支柱的检查清单比模糊的“trust”声明更具可操作性，而终端用户则欣赏可视化的置信指示器。

Practical Implications

For developers: 将支柱检查清单集成到 CI/CD 流水线中（例如，自动化鲁棒性测试 → “Reliability” 评分）。信任向量 UI 可以根据这些评分自动生成，为产品团队提供即用的信任报告。
For product managers: 将支柱评分用作 风险管理 KPI，从而实现基于数据的功能发布或合规性决策。
For regulators & auditors: 支柱框架提供了一套 标准化的证据集（例如，透明度日志、对齐审计），可在合规审查期间提出请求。
For end‑users: 信任向量可以嵌入面向消费者的应用中（例如，聊天机器人显示 “Alignment: 85 % – see why”），以帮助解释 AI 决策，降低过度依赖或不合理的怀疑。
For advertisers: 论文的批评鼓励从 “love‑selling” 向 透明价值主张 转变，可能为依赖 AI 个性化的品牌恢复信誉。

限制与未来工作

经验验证有限。 论文仅提供了非正式的用户反馈；需要大规模用户研究来确认信任向量在真实世界中提升信任的效果。
支柱加权依赖上下文。 当前的分类法将各支柱视为等权，但不同领域（如医疗与娱乐）可能需要自定义加权方案。
工具缺口。 虽然已有许多支柱度量指标，但仍缺少一个统一的库能够自动计算并可视化完整的信任向量。
未来方向 包括：
1. 构建开源工具用于支柱测量。
2. 开展纵向研究，探讨信任向量如何影响用户行为。
3. 将框架扩展到多代理生态系统，在其中信任必须在交互的 AI 组件之间协商。

作者

Jade Alglave

论文信息

arXiv ID: 2604.28113v1
分类: cs.CY, cs.AR, cs.SE
发表时间: 2026年4月30日
PDF: Download PDF

[Paper] 我希望我们不要去信任广告对爱情所做的事

概述

关键贡献

方法论

结果与发现

Practical Implications

限制与未来工作

作者

论文信息

相关文章

[Paper] 从研究到实践：行业中自动驾驶系统测试的交互式快速综述

[Paper] Q-ARE：基于查询的 API 推荐评估数据集

[Paper] 更深入思考，别忽视你的选项：重新审视 Issue-Commit 链接与 LLM 辅助检索

[Paper] 不安全且未使用？成熟开源项目中的 Utility Code 历史