文件已成为新的 API —— 但谁在检查这些文件?

发布: (2026年3月11日 GMT+8 23:28)
5 分钟阅读
原文: Dev.to

Source: Dev.to

文件即新 API

LLM 的上下文窗口是 短暂的——它们像白板,使用后会被擦除。文件优雅地解决了这个问题:把上下文写入磁盘,之后再读取。无需 API 编排、无需供应商锁定、也不需要复杂的基础设施。

  • CLAUDE.md 为你的代理项目提供上下文。
  • .cursorrules 为其提供编码偏好。
  • aboutme.md 为其提供你的身份信息。

简单、可移植、强大。

Anthropic 进一步推出了 Agent SkillsSKILL.md),现已被 Microsoft、OpenAI、GitHub 和 Cursor 采用。一次编写技能,随处使用。文件格式本身就是 API。

隐藏的风险:未消毒的文件

这些文件是 未消毒的输入,会直接送入语言模型。

  • 含有隐藏提示注入的 CLAUDE.md 可以劫持你的编码代理。
  • 含有嵌入指令的角色文件可能泄露数据。
  • 来自未知作者的共享技能文件可能包含任意内容。

ETH Zürich 的最新研究发现,上下文文件实际上会 降低任务成功率,并 使推理成本增加 20 % 以上。他们的结论并不是“不要使用文件”,而是写得不好的上下文文件会让代理表现更差。

核心问题

没有人在检查这些文件。

SoulScan – 代理文件的静态分析

我们构建了 SoulScan —— 一个针对 AI 代理配置文件的静态分析引擎。

  • 55+ 安全规则,覆盖提示注入检测、PII 暴露、凭证泄漏以及结构质量。
  • 想象一下 ESLint,但它针对的是你的代理身份文件。

如果文件是新 API,它们就需要和其他 API 同等的严谨性:验证、安全扫描和质量门控。

Soul Spec – 可移植的代理角色

目前我们有 CLAUDE.mdAGENTS.md.cursorrulescopilot-instructions.md 等——它们大同小异,只是名称不同且缺乏互操作性。

SKILL.md 标准化了 代理能做什么Soul Spec 则标准化了 代理是谁

  • 结构化格式:soul.json + SOUL.md + IDENTITY.md
  • 任意框架都可以读取。
  • 只需编写一次代理身份,即可在所有工具间复用。

Swarm Memory – 文件的分布式同步

未解决的场景

你在笔记本上有一个 AI 代理,在工作站上还有另一个。两者都在本地文件中累积记忆、偏好和上下文。如何同步它们?

  • 复制‑粘贴? 当两台机器同时修改同一文件时会出错。
  • 云同步? 会产生冲突且没有解决策略。
  • 中心化数据库? 违背了文件‑本地‑优先架构的初衷。

这实际上是一个 分布式系统问题,被伪装成文件管理问题,还要考虑加密(敏感数据)和多用户协作(团队共享)。

我们的解决方案

Swarm Memory 提供:

  • 基于 Git 的分布式同步,具备 语义冲突检测
  • 端到端加密(使用 age)。
  • LLM 辅助的合并冲突解决。

你的代理文件保持本地、保持加密、保持同步。(专利申请中:KR 10‑2026‑0038525)

所需技术栈

  1. 可移植的身份标准 —— 让代理角色在不同工具之间迁移(Soul Spec)。
  2. 安全/质量扫描器 —— 在文件进入模型前进行验证(SoulScan)。
  3. 分布式同步层 —— 让文件在多台机器和团队之间协同工作(Swarm Memory)。

文件是接口。我们围绕文件构建的体系决定了 AI 代理是可靠的团队成员,还是不可预测的风险。

行动号召

我们正在 ClawSouls 构建这套栈。Soul Spec 开源,SoulScan 对开源项目免费,所有组件均本地‑优先。如果你也在研究类似问题,欢迎联系我们。

最初发布于 blog.clawsouls.ai

0 浏览
Back to Blog

相关文章

阅读更多 »