Trinity AGA 架构:技术深度剖析治理优先的 AI 系统
Source: Dev.to
引言
在第一篇文章中,我把 Trinity AGA 架构介绍为一种用于反思性 AI 的宪法框架。本文是后续,深入技术细节,解释系统内部如何工作、需要哪些组件,以及如何使用现有工具实现每个部分。无需自定义训练;每个组件都可以使用编排、确定性处理器和强大的语言模型今天就构建。
核心处理器
Trinity AGA 架构将 AI 推理拆分为三个协同的处理器,每个都有特定职责和严格的权限限制。它们通过 Orchestrator(编排器) 进行通信,后者执行宪法规则。
| 处理器 | 角色 |
|---|---|
| Body | 用户输入的结构分析 |
| Spirit | 基于同意的记忆管理 |
| Soul | 受约束的推理与洞察映射 |
完整流水线如下:
User → Body → Spirit → Orchestrator (governance) → Soul → Orchestrator (filters) → Output → Lantern
这种拆分防止意外的越权,并提供了稳定的治理层。
用户输入的结构分析(Body)
Body 不读取情感或意图;它读取结构。它在任何生成步骤之前运行,并通过分析无需 LLM 的 token 级别指标,识别用户是否处于高认知或情绪负荷状态:
- Tempo Shift – 与用户基线相比的每秒 token 数
- Compression – 有意义 token 与填充 token 的比例
- Fragmentation – 句子断裂、未完成从句的频率
- Recursion – 词句中的重复循环模式
- Polarity Collapse – 将备选项简化为二元形式
输出
{
"SafetyLoadIndex": 0, // 0 – 10
"Flags": {
"silence_required": false,
"slow_mode": false,
"memory_suppression": false,
"reasoning_blocked": false
}
}
如果 Safety Load Index 超过阈值(通常为 5 或更高),编排器会阻止更深层的推理并触发 Silence Preserving(保持沉默)模式。
基于同意的记忆管理者(Spirit)
Spirit 负责时间连续性。它仅存储用户明确创作并批准的内容——不包括推断的身份、特质或情感真相。
- 只存储 用户声明的值
- 将每条记录保存为带时间戳的快照,例如
"At that time, the user said X."
正确与错误的记忆表述
- 错误: “You are always anxious.”(你总是焦虑。)
- 正确: “You said you felt anxious at 14:32 UTC.”(你在 UTC 14:32 时说你感到焦虑。)
检索条件
Spirit 只有在 所有 条件满足时才可呈现记忆:
- 内容由用户撰写
- 用户同意存储
- 记忆与当前情境相关
- 检索不是强制性的
- 以可修订的上下文形式呈现
这防止了叙事捕获或身份构建。
受约束的推理与洞察映射(Soul)
Soul 是任何在严格边界内运行的强大 LLM。
- 生成: 替代框架、澄清性洞察
- 必须避免: 直接指令、影响或命令
Soul 在不塑造用户决策的前提下提供清晰度。
宪法引擎(Orchestrator)
编排器执行治理顺序:
- Body 评估输入
- Spirit 检索符合条件的记忆
- 编排器应用 安全 → 同意 → 清晰 检查
- Soul 在约束内生成
- 编排器过滤并返回输出
- Lantern 记录遥测
执行规则
- 当安全阈值被超越时,Body 可以阻止 Soul。
- Soul 生成输出后,编排器会移除任何禁止的模式(例如直接指令)。
- 若发现违规,编排器要么纠正要么阻断输出。
沉默保持输出示例
“I am here with you. There is no rush. You are free to take your time.”(我在这里陪着你。不要着急。你可以随意慢慢来。)
当 Body 检测到高负荷信号趋同,Soul 会被暂时阻断,系统保护用户的内部处理。
用户主权
每轮结束时,控制权交还给用户。系统必须避免对选项加权:
“These are possible interpretations. You decide which, if any, feel meaningful.”(这些是可能的解释。由你决定哪一个(如果有的话)对你有意义。)
遥测系统(Lantern)
Lantern 是一个遥测组件,跟踪治理健康状况,例如 Body veto frequency(Body 否决频率)。它不能更改规则,只记录用于监控和改进的指标。
使用现成工具构建 Trinity AGA
你可以使用现成技术实现该架构:
- 用 正则表达式 和基于规则的检测器实现 Body 分析
- 用 SQLite 或 Supabase 作为 Spirit 的时间戳记忆存储
- 用 Claude、GPT、Gemini 或任何开源模型作为 Soul
- 用 Python 或 Node.js 中间件将各组件粘合在一起
- 为 Lantern 遥测搭建日志管道
无需自定义模型训练、RLHF 或实验性研究——这纯粹是对反思性 AI 的软件工程实践。
好处
- 处理器之间的权力完全分离
- 支持人类反思而不进行影响
- 为关注清晰度、主权和心理安全的系统提供严谨基础
文档与实现路线图
完整概念文档和实现路线图可在以下地址获取: