Trinity AGA 架构:技术深度剖析治理优先的 AI 系统

发布: (2025年12月7日 GMT+8 08:41)
7 min read
原文: Dev.to

Source: Dev.to

引言

在第一篇文章中,我把 Trinity AGA 架构介绍为一种用于反思性 AI 的宪法框架。本文是后续,深入技术细节,解释系统内部如何工作、需要哪些组件,以及如何使用现有工具实现每个部分。无需自定义训练;每个组件都可以使用编排、确定性处理器和强大的语言模型今天就构建。

核心处理器

Trinity AGA 架构将 AI 推理拆分为三个协同的处理器,每个都有特定职责和严格的权限限制。它们通过 Orchestrator(编排器) 进行通信,后者执行宪法规则。

处理器角色
Body用户输入的结构分析
Spirit基于同意的记忆管理
Soul受约束的推理与洞察映射

完整流水线如下:

User → Body → Spirit → Orchestrator (governance) → Soul → Orchestrator (filters) → Output → Lantern

这种拆分防止意外的越权,并提供了稳定的治理层。

用户输入的结构分析(Body)

Body 不读取情感或意图;它读取结构。它在任何生成步骤之前运行,并通过分析无需 LLM 的 token 级别指标,识别用户是否处于高认知或情绪负荷状态:

  • Tempo Shift – 与用户基线相比的每秒 token 数
  • Compression – 有意义 token 与填充 token 的比例
  • Fragmentation – 句子断裂、未完成从句的频率
  • Recursion – 词句中的重复循环模式
  • Polarity Collapse – 将备选项简化为二元形式

输出

{
  "SafetyLoadIndex": 0,   // 0 – 10
  "Flags": {
    "silence_required": false,
    "slow_mode": false,
    "memory_suppression": false,
    "reasoning_blocked": false
  }
}

如果 Safety Load Index 超过阈值(通常为 5 或更高),编排器会阻止更深层的推理并触发 Silence Preserving(保持沉默)模式。

基于同意的记忆管理者(Spirit)

Spirit 负责时间连续性。它仅存储用户明确创作并批准的内容——不包括推断的身份、特质或情感真相。

  • 只存储 用户声明的值
  • 将每条记录保存为带时间戳的快照,例如 "At that time, the user said X."

正确与错误的记忆表述

  • 错误: “You are always anxious.”(你总是焦虑。)
  • 正确: “You said you felt anxious at 14:32 UTC.”(你在 UTC 14:32 时说你感到焦虑。)

检索条件

Spirit 只有在 所有 条件满足时才可呈现记忆:

  1. 内容由用户撰写
  2. 用户同意存储
  3. 记忆与当前情境相关
  4. 检索不是强制性的
  5. 以可修订的上下文形式呈现

这防止了叙事捕获或身份构建。

受约束的推理与洞察映射(Soul)

Soul 是任何在严格边界内运行的强大 LLM。

  • 生成: 替代框架、澄清性洞察
  • 必须避免: 直接指令、影响或命令

Soul 在不塑造用户决策的前提下提供清晰度。

宪法引擎(Orchestrator)

编排器执行治理顺序:

  1. Body 评估输入
  2. Spirit 检索符合条件的记忆
  3. 编排器应用 安全 → 同意 → 清晰 检查
  4. Soul 在约束内生成
  5. 编排器过滤并返回输出
  6. Lantern 记录遥测

执行规则

  • 当安全阈值被超越时,Body 可以阻止 Soul
  • Soul 生成输出后,编排器会移除任何禁止的模式(例如直接指令)。
  • 若发现违规,编排器要么纠正要么阻断输出。

沉默保持输出示例

“I am here with you. There is no rush. You are free to take your time.”(我在这里陪着你。不要着急。你可以随意慢慢来。)

当 Body 检测到高负荷信号趋同,Soul 会被暂时阻断,系统保护用户的内部处理。

用户主权

每轮结束时,控制权交还给用户。系统必须避免对选项加权:

“These are possible interpretations. You decide which, if any, feel meaningful.”(这些是可能的解释。由你决定哪一个(如果有的话)对你有意义。)

遥测系统(Lantern)

Lantern 是一个遥测组件,跟踪治理健康状况,例如 Body veto frequency(Body 否决频率)。它不能更改规则,只记录用于监控和改进的指标。

使用现成工具构建 Trinity AGA

你可以使用现成技术实现该架构:

  • 正则表达式 和基于规则的检测器实现 Body 分析
  • SQLiteSupabase 作为 Spirit 的时间戳记忆存储
  • Claude、GPT、Gemini 或任何开源模型作为 Soul
  • PythonNode.js 中间件将各组件粘合在一起
  • 为 Lantern 遥测搭建日志管道

无需自定义模型训练、RLHF 或实验性研究——这纯粹是对反思性 AI 的软件工程实践。

好处

  • 处理器之间的权力完全分离
  • 支持人类反思而不进行影响
  • 为关注清晰度、主权和心理安全的系统提供严谨基础

文档与实现路线图

完整概念文档和实现路线图可在以下地址获取:

https://github.com/GodsIMiJ1/Trinity-AGA-Architecture

Back to Blog

相关文章

阅读更多 »

LLM 不是生成式 AI

LLM的封面图不是Gen AI。https://media2.dev.to/dynamic/image/width=1000,height=420,fit=cover,gravity=auto,format=auto/https%3A%2F%2Fdev-to-uploads.s3....