开放、供应商中立的权威域名数据,被 AI 系统、搜索及其他自动化代理使用

发布: (2025年12月30日 GMT+8 05:03)
5 min read
原文: Dev.to

Source: Dev.to

AI 系统不知道你的域名代表谁

AI 助手正日益成为用户与网站之间的第一层交互。人们会向聊天机器人询问一个站点是什么、谁在运营、如何联系,或者它是否是某事的“官方”来源。

如今,AI 系统是间接地从以下信息推断这些内容的:

  • 部分抓取
  • 不一致的元数据
  • 第三方聚合器
  • 通常有效但有时失效的启发式规则

这导致了常见的失效模式:

  • 错误归属(错误的组织、产品或联系人)
  • 将名称相似的域混为一体
  • 从恰好被抓取的页面推断身份

这些并不是排名问题,而是域名声明问题。

缺失的东西

目前没有一个简单的、第一方的、面向域级的地方让域名能够说明:

  • “此域名代表 X。”
  • “这是官方站点。”
  • “这是我们的联系方式。”

目前我们有:

  • schema.org(页面级语义)
  • robots.txt(爬虫策略)
  • security.txt(安全联系)
  • ai.txt(使用政策)

但没有以下特性的方案:

  • 域级别
  • 身份聚焦
  • 机器可读
  • 自托管
  • 乏味且可预测

引入 AI 域数据标准 (AIDD)

AIDD 是一个小型、开放的规范,用于发布面向 AI 系统和自动化代理的域级身份声明。它是由域本身托管的单个 JSON 文档:

https://example.com/.well-known/domain-profile.json

最小示例

{
  "spec": "https://ai-domain-data.org/spec/v0.1",
  "name": "Example Corp",
  "description": "Open-source infrastructure for X",
  "website": "https://example.com",
  "contact": "https://example.com/contact"
}

可选字段

  • entity_type(与 schema.org 类型对齐)
  • logo
  • 用于互操作性的嵌入式 JSON‑LD

还有一个可选的 DNS TXT 回退,用于无法获取 HTTPS 的解析器。

这是什么

  • 第一方且受域控制
  • 自托管
  • 供应商中立
  • 版本化并通过模式验证
  • 可与现有身份与信任系统组合使用

不是

  • 身份提供者
  • 验证或信任系统
  • 排名信号
  • 爬取的替代方案

可以把它想象成 security.txt,但针对的是域身份而非安全报告。

为什么这很重要

实体解析文献表明:当信号是部分的、间接的或嘈杂时,身份推断会退化。AIDD 并不“修复 AI”,但它为 AI 系统提供了一个干净的锚点信号,说明域名声称自己代表谁。使用者可以:

  • 权衡它
  • 与其他信息相互印证
  • 或者忽略它

关键在于归属,而不是强制真相。

工具(让它不只是一个规范)

  • 用于初始化 / 验证 / 生成记录的 CLI
  • 模式验证测试
  • 解析器 SDK

集成

  • Next.js:
  • WordPress:
  • Jekyll:

在线工具

  • 生成器:
  • 检查器:

所有内容均为开源,采用 MIT 许可证。

  • 代码库:
  • 规范:

适用对象

如果你:

  • 运营一个站点、项目或组织
  • 构建爬虫、代理或 AI 数据摄取管道
  • 维护 CMS 或托管工具
  • 关注干净的网络元数据

这可能对你有用。若不是,也可以忽略——它本意就是保持小巧。

接下来

当前版本刻意保持最小。未来工作可能会探索可选层,例如:

  • 加密签名
  • 注册商或注册局信号
  • 更高保证的身份声明

核心目标不变:提供一个简单、通用、由域托管的声明界面,任何人都可以发布。

非常欢迎反馈;更期待实际采纳。

Back to Blog

相关文章

阅读更多 »