为什么缺乏稳定的术语会导致 AI治理 失败
Source: Dev.to

系统不遵循意图,而是遵循累积的行为。
大多数关于 AI 治理的讨论都聚焦于模型、安全技术或监管。
但治理失败往往更早出现——它们始于语言。
当团队缺乏稳定的术语时,就难以一致地描述系统行为。不同的组织会用相同的词表达不同的含义。像 alignment(对齐)、oversight(监督)或 control(控制)之类的术语常被宽泛使用,却没有操作性的定义。
结果是可预见的:
- 政策变得模糊
- 审计缺乏一致性
- 责任变得不清晰
在复杂系统中,语言不清最终会导致治理不清。
Governance Requires Vocabulary Infrastructure
在行为 AI 治理中,术语被视为治理基础设施的一部分。如果治理系统需要在工程团队、组织和监管环境之间运行,它们就需要一个共享的词汇层,用来描述:
- 行为动态
- 权威结构
- 治理失败模式
- 长期系统风险
没有这一层,治理框架无法随时间积累知识。同样的治理失败会被反复发现,因为该领域缺乏稳定的概念锚点。
AI治理词汇表
AI治理词汇表提供了一个用于分析 AI 中介的社会技术系统中行为动态的规范术语登记册。它目前定义了 41 个描述治理模式的规范术语,例如:
- Behavioral Drift – 渐进的偏离,指预期的治理行为与实际观察到的运行行为之间的差异。
- Governance Drift – 治理政策与实际系统行为之间的不匹配。
- Authority Structures – 决定最终谁掌控决策的机制。
- Longitudinal Risk – 随时间通过重复行为逐渐累积的风险。
这些概念支持在多个治理领域的分析:
- 行为 AI 治理
- 执行时治理
- 人类–AI 交互
- 治理基础设施设计
其目标不是引入行话,而是建立稳定的概念工具,用于描述治理在真实系统中的表现方式。
执行时治理
- Policies are written.
- Processes are defined.
- Compliance frameworks are established.
但是系统的行为取决于执行期间发生的事情,而不是文档中所写的内容。执行时治理关注系统运行时所采用的机制。监控诸如 governance telemetry、authority alignment 和 behavioral drift 等信号,使组织能够在治理问题演变为故障之前予以发现。
简单的治理漂移模型
在许多社会技术系统中,治理失效往往遵循一个可预测的序列:
Sociotechnical System
↓
Human–AI Interaction
↓
Behavioral Accumulation
↓
Behavioral Drift
↓
Governance Drift
↓
Governance Failure早期阶段通常看起来并不危险。小的变通办法提升了效率,对系统输出的信心增强,升级路径也变得不常使用。随着时间的推移,这些微小的变化会累积成结构性的漂移。当治理失效显现时,系统已经围绕新的行为模式重新组织。
治理即行为基础设施
理解治理系统的一个有用原则:
- 系统不遵循意图。
- 系统遵循累积的行为。
重复的行动逐渐塑造决策发生的环境。该环境成为系统的运行现实。因此,治理充当决定行为随时间累积方式的基础设施。理解这种动态对于设计能够在复杂 AI 环境中运行的治理系统至关重要。
AI治理词汇表 v1.3.0
规范术语注册表:
- 行为 AI 治理
- 执行时治理
- 治理基础设施研究
代码库: