AI 시스템·검색·기타 자동화 에이전트가 활용하는 오픈·벤더 중립 권위 도메인 데이터
Source: Dev.to
AI 시스템은 도메인이 누구를 대표하는지 모른다
AI 어시스턴트가 점점 더 사용자와 웹사이트 사이의 첫 번째 층이 되고 있다. 사람들은 챗봇에게 사이트가 무엇인지, 누가 운영하는지, 어떻게 연락할 수 있는지, 혹은 그 사이트가 어떤 것에 대한 “공식” 출처인지 물어본다.
오늘날 AI 시스템은 다음과 같은 간접적인 정보로 이를 추론한다:
- 부분적인 크롤링
- 일관되지 않은 메타데이터
- 제3자 집계 서비스
- 보통은 작동하지만 때때로 실패하는 휴리스틱
이로 인해 흔히 발생하는 실패 유형은 다음과 같다:
- 잘못된 조직, 제품, 혹은 연락처에 대한 오인
- 이름이 비슷한 도메인 간의 혼동
- 크롤링된 페이지에 따라 정체성을 추정
이는 순위 문제라기보다 도메인 주장 문제이다.
무엇이 부족한가
도메인이 스스로 다음과 같이 말할 수 있는 간단하고, 첫 번째 파티이며, 도메인 수준의 장소가 없다:
- “이 도메인은 X를 대표합니다.”
- “이 사이트가 공식 사이트입니다.”
- “이렇게 연락하면 됩니다.”
현재 우리는 다음과 같은 것들을 가지고 있다:
schema.org(페이지 수준 의미론)robots.txt(크롤러 정책)security.txt(보안 연락처)ai.txt(사용 정책)
하지만 아래 조건을 만족하는 것은 없다:
- 도메인 수준
- 정체성 중심
- 기계가 읽을 수 있음
- 자체 호스팅
- 지루하고 예측 가능함
AI Domain Data Standard (AIDD) 소개
AIDD는 AI 시스템 및 자동화된 에이전트를 위해 도메인 수준의 정체성 주장을 게시하기 위한 작고, 개방된 사양이다. 도메인 자체가 호스팅하는 단일 JSON 문서 형태이다:
https://example.com/.well-known/domain-profile.json
최소 예시
{
"spec": "https://ai-domain-data.org/spec/v0.1",
"name": "Example Corp",
"description": "Open-source infrastructure for X",
"website": "https://example.com",
"contact": "https://example.com/contact"
}
선택 필드
entity_type(schema.org 타입과 정렬)logo- 상호 운용성을 위한 내장 JSON‑LD
HTTPS를 가져올 수 없는 리졸버를 위한 선택적 DNS TXT 폴백도 제공한다.
이것이 무엇인가
- 첫 번째 파티이며 도메인에서 제어
- 자체 호스팅
- 벤더 중립
- 버전 관리 및 스키마 검증
- 기존 정체성·신뢰 시스템과 조합 가능
이것이 아닌 것
- 정체성 제공자
- 검증 또는 신뢰 시스템
- 순위 신호
- 크롤링을 대체하는 것
security.txt가 보안 보고용이라면, 이것은 도메인 정체성용이라고 생각하면 된다.
왜 중요한가
엔터티 해석 문헌은 명확히 말한다: 신호가 부분적이거나 간접적이거나 잡음이 많을 때 정체성 추론은 악화된다. AIDD는 “AI를 고치는” 것이 아니라, AI 시스템에게 도메인이 주장하는 정체성을 위한 깨끗한 앵커 신호를 제공한다. 소비자는 이를:
- 가중치로 활용하고
- 교차 검증하고
- 혹은 무시할 수 있다
핵심은 귀속이며, 진실 강제가 아니다.
도구 (단순 사양이 아니게)
- 초기화 / 검증 / 레코드 생성 CLI
- 스키마 검증 테스트
- 리졸버 SDK
통합 예시
- Next.js:
- WordPress:
- Jekyll:
온라인 유틸리티
- 생성기:
- 검사기:
모든 것이 오픈 소스이며 MIT 라이선스를 따른다.
- 저장소:
- 사양:
대상 독자
당신이 다음 중 하나라면:
- 사이트, 프로젝트, 혹은 조직을 운영하고 있다
- 크롤러, 에이전트, AI 수집 파이프라인을 구축한다
- CMS 혹은 호스팅 툴링을 관리한다
- 깔끔한 웹 메타데이터에 관심이 있다
이 사양이 유용할 수 있다. 그렇지 않다면 무시해도 된다— 의도적으로 작게 설계되었다.
앞으로의 계획
현재 버전은 의도적으로 최소화되어 있다. 향후 작업으로는 다음과 같은 선택적 레이어를 탐색할 수 있다:
- 암호화 서명
- 레지스트라·레지스트리 신호
- 고신뢰 정체성 주장
핵심 목표는 변함없이 같다: 누구든지 게시할 수 있는 간단하고 보편적인, 도메인 호스팅 선언 표면을 제공하는 것.
피드백은 언제든 환영한다; 채택은 그보다 더 환영한다.