开放、供应商中立的权威域名数据,被 AI 系统、搜索及其他自动化代理使用
Source: Dev.to
AI 系统不知道你的域名代表谁
AI 助手正日益成为用户与网站之间的第一层交互。人们会向聊天机器人询问一个站点是什么、谁在运营、如何联系,或者它是否是某事的“官方”来源。
如今,AI 系统是间接地从以下信息推断这些内容的:
- 部分抓取
- 不一致的元数据
- 第三方聚合器
- 通常有效但有时失效的启发式规则
这导致了常见的失效模式:
- 错误归属(错误的组织、产品或联系人)
- 将名称相似的域混为一体
- 从恰好被抓取的页面推断身份
这些并不是排名问题,而是域名声明问题。
缺失的东西
目前没有一个简单的、第一方的、面向域级的地方让域名能够说明:
- “此域名代表 X。”
- “这是官方站点。”
- “这是我们的联系方式。”
目前我们有:
schema.org(页面级语义)robots.txt(爬虫策略)security.txt(安全联系)ai.txt(使用政策)
但没有以下特性的方案:
- 域级别
- 身份聚焦
- 机器可读
- 自托管
- 乏味且可预测
引入 AI 域数据标准 (AIDD)
AIDD 是一个小型、开放的规范,用于发布面向 AI 系统和自动化代理的域级身份声明。它是由域本身托管的单个 JSON 文档:
https://example.com/.well-known/domain-profile.json
最小示例
{
"spec": "https://ai-domain-data.org/spec/v0.1",
"name": "Example Corp",
"description": "Open-source infrastructure for X",
"website": "https://example.com",
"contact": "https://example.com/contact"
}
可选字段
entity_type(与 schema.org 类型对齐)logo- 用于互操作性的嵌入式 JSON‑LD
还有一个可选的 DNS TXT 回退,用于无法获取 HTTPS 的解析器。
这是什么
- 第一方且受域控制
- 自托管
- 供应商中立
- 版本化并通过模式验证
- 可与现有身份与信任系统组合使用
这 不是
- 身份提供者
- 验证或信任系统
- 排名信号
- 爬取的替代方案
可以把它想象成 security.txt,但针对的是域身份而非安全报告。
为什么这很重要
实体解析文献表明:当信号是部分的、间接的或嘈杂时,身份推断会退化。AIDD 并不“修复 AI”,但它为 AI 系统提供了一个干净的锚点信号,说明域名声称自己代表谁。使用者可以:
- 权衡它
- 与其他信息相互印证
- 或者忽略它
关键在于归属,而不是强制真相。
工具(让它不只是一个规范)
- 用于初始化 / 验证 / 生成记录的 CLI
- 模式验证测试
- 解析器 SDK
集成
- Next.js:
- WordPress:
- Jekyll:
在线工具
- 生成器:
- 检查器:
所有内容均为开源,采用 MIT 许可证。
- 代码库:
- 规范:
适用对象
如果你:
- 运营一个站点、项目或组织
- 构建爬虫、代理或 AI 数据摄取管道
- 维护 CMS 或托管工具
- 关注干净的网络元数据
这可能对你有用。若不是,也可以忽略——它本意就是保持小巧。
接下来
当前版本刻意保持最小。未来工作可能会探索可选层,例如:
- 加密签名
- 注册商或注册局信号
- 更高保证的身份声明
核心目标不变:提供一个简单、通用、由域托管的声明界面,任何人都可以发布。
非常欢迎反馈;更期待实际采纳。