文件已成为新的 API —— 但谁在检查这些文件?
Source: Dev.to
文件即新 API
LLM 的上下文窗口是 短暂的——它们像白板,使用后会被擦除。文件优雅地解决了这个问题:把上下文写入磁盘,之后再读取。无需 API 编排、无需供应商锁定、也不需要复杂的基础设施。
CLAUDE.md为你的代理项目提供上下文。.cursorrules为其提供编码偏好。aboutme.md为其提供你的身份信息。
简单、可移植、强大。
Anthropic 进一步推出了 Agent Skills(SKILL.md),现已被 Microsoft、OpenAI、GitHub 和 Cursor 采用。一次编写技能,随处使用。文件格式本身就是 API。
隐藏的风险:未消毒的文件
这些文件是 未消毒的输入,会直接送入语言模型。
- 含有隐藏提示注入的
CLAUDE.md可以劫持你的编码代理。 - 含有嵌入指令的角色文件可能泄露数据。
- 来自未知作者的共享技能文件可能包含任意内容。
ETH Zürich 的最新研究发现,上下文文件实际上会 降低任务成功率,并 使推理成本增加 20 % 以上。他们的结论并不是“不要使用文件”,而是写得不好的上下文文件会让代理表现更差。
核心问题
没有人在检查这些文件。
SoulScan – 代理文件的静态分析
我们构建了 SoulScan —— 一个针对 AI 代理配置文件的静态分析引擎。
- 55+ 安全规则,覆盖提示注入检测、PII 暴露、凭证泄漏以及结构质量。
- 想象一下 ESLint,但它针对的是你的代理身份文件。
如果文件是新 API,它们就需要和其他 API 同等的严谨性:验证、安全扫描和质量门控。
Soul Spec – 可移植的代理角色
目前我们有 CLAUDE.md、AGENTS.md、.cursorrules、copilot-instructions.md 等——它们大同小异,只是名称不同且缺乏互操作性。
SKILL.md 标准化了 代理能做什么。Soul Spec 则标准化了 代理是谁。
- 结构化格式:
soul.json+SOUL.md+IDENTITY.md。 - 任意框架都可以读取。
- 只需编写一次代理身份,即可在所有工具间复用。
Swarm Memory – 文件的分布式同步
未解决的场景
你在笔记本上有一个 AI 代理,在工作站上还有另一个。两者都在本地文件中累积记忆、偏好和上下文。如何同步它们?
- 复制‑粘贴? 当两台机器同时修改同一文件时会出错。
- 云同步? 会产生冲突且没有解决策略。
- 中心化数据库? 违背了文件‑本地‑优先架构的初衷。
这实际上是一个 分布式系统问题,被伪装成文件管理问题,还要考虑加密(敏感数据)和多用户协作(团队共享)。
我们的解决方案
Swarm Memory 提供:
- 基于 Git 的分布式同步,具备 语义冲突检测。
- 端到端加密(使用 age)。
- LLM 辅助的合并冲突解决。
你的代理文件保持本地、保持加密、保持同步。(专利申请中:KR 10‑2026‑0038525)
所需技术栈
- 可移植的身份标准 —— 让代理角色在不同工具之间迁移(Soul Spec)。
- 安全/质量扫描器 —— 在文件进入模型前进行验证(SoulScan)。
- 分布式同步层 —— 让文件在多台机器和团队之间协同工作(Swarm Memory)。
文件是接口。我们围绕文件构建的体系决定了 AI 代理是可靠的团队成员,还是不可预测的风险。
行动号召
我们正在 ClawSouls 构建这套栈。Soul Spec 开源,SoulScan 对开源项目免费,所有组件均本地‑优先。如果你也在研究类似问题,欢迎联系我们。
最初发布于 blog.clawsouls.ai