AI 시스템·검색·기타 자동화 에이전트가 활용하는 오픈·벤더 중립 권위 도메인 데이터

발행: (2025년 12월 30일 오전 06:03 GMT+9)
6 min read
원문: Dev.to

Source: Dev.to

AI 시스템은 도메인이 누구를 대표하는지 모른다

AI 어시스턴트가 점점 더 사용자와 웹사이트 사이의 첫 번째 층이 되고 있다. 사람들은 챗봇에게 사이트가 무엇인지, 누가 운영하는지, 어떻게 연락할 수 있는지, 혹은 그 사이트가 어떤 것에 대한 “공식” 출처인지 물어본다.

오늘날 AI 시스템은 다음과 같은 간접적인 정보로 이를 추론한다:

  • 부분적인 크롤링
  • 일관되지 않은 메타데이터
  • 제3자 집계 서비스
  • 보통은 작동하지만 때때로 실패하는 휴리스틱

이로 인해 흔히 발생하는 실패 유형은 다음과 같다:

  • 잘못된 조직, 제품, 혹은 연락처에 대한 오인
  • 이름이 비슷한 도메인 간의 혼동
  • 크롤링된 페이지에 따라 정체성을 추정

이는 순위 문제라기보다 도메인 주장 문제이다.

무엇이 부족한가

도메인이 스스로 다음과 같이 말할 수 있는 간단하고, 첫 번째 파티이며, 도메인 수준의 장소가 없다:

  • “이 도메인은 X를 대표합니다.”
  • “이 사이트가 공식 사이트입니다.”
  • “이렇게 연락하면 됩니다.”

현재 우리는 다음과 같은 것들을 가지고 있다:

  • schema.org (페이지 수준 의미론)
  • robots.txt (크롤러 정책)
  • security.txt (보안 연락처)
  • ai.txt (사용 정책)

하지만 아래 조건을 만족하는 것은 없다:

  • 도메인 수준
  • 정체성 중심
  • 기계가 읽을 수 있음
  • 자체 호스팅
  • 지루하고 예측 가능함

AI Domain Data Standard (AIDD) 소개

AIDD는 AI 시스템 및 자동화된 에이전트를 위해 도메인 수준의 정체성 주장을 게시하기 위한 작고, 개방된 사양이다. 도메인 자체가 호스팅하는 단일 JSON 문서 형태이다:

https://example.com/.well-known/domain-profile.json

최소 예시

{
  "spec": "https://ai-domain-data.org/spec/v0.1",
  "name": "Example Corp",
  "description": "Open-source infrastructure for X",
  "website": "https://example.com",
  "contact": "https://example.com/contact"
}

선택 필드

  • entity_type (schema.org 타입과 정렬)
  • logo
  • 상호 운용성을 위한 내장 JSON‑LD

HTTPS를 가져올 수 없는 리졸버를 위한 선택적 DNS TXT 폴백도 제공한다.

이것이 무엇인가

  • 첫 번째 파티이며 도메인에서 제어
  • 자체 호스팅
  • 벤더 중립
  • 버전 관리 및 스키마 검증
  • 기존 정체성·신뢰 시스템과 조합 가능

이것이 아닌

  • 정체성 제공자
  • 검증 또는 신뢰 시스템
  • 순위 신호
  • 크롤링을 대체하는 것

security.txt가 보안 보고용이라면, 이것은 도메인 정체성용이라고 생각하면 된다.

왜 중요한가

엔터티 해석 문헌은 명확히 말한다: 신호가 부분적이거나 간접적이거나 잡음이 많을 때 정체성 추론은 악화된다. AIDD는 “AI를 고치는” 것이 아니라, AI 시스템에게 도메인이 주장하는 정체성을 위한 깨끗한 앵커 신호를 제공한다. 소비자는 이를:

  • 가중치로 활용하고
  • 교차 검증하고
  • 혹은 무시할 수 있다

핵심은 귀속이며, 진실 강제가 아니다.

도구 (단순 사양이 아니게)

  • 초기화 / 검증 / 레코드 생성 CLI
  • 스키마 검증 테스트
  • 리졸버 SDK

통합 예시

  • Next.js:
  • WordPress:
  • Jekyll:

온라인 유틸리티

  • 생성기:
  • 검사기:

모든 것이 오픈 소스이며 MIT 라이선스를 따른다.

  • 저장소:
  • 사양:

대상 독자

당신이 다음 중 하나라면:

  • 사이트, 프로젝트, 혹은 조직을 운영하고 있다
  • 크롤러, 에이전트, AI 수집 파이프라인을 구축한다
  • CMS 혹은 호스팅 툴링을 관리한다
  • 깔끔한 웹 메타데이터에 관심이 있다

이 사양이 유용할 수 있다. 그렇지 않다면 무시해도 된다— 의도적으로 작게 설계되었다.

앞으로의 계획

현재 버전은 의도적으로 최소화되어 있다. 향후 작업으로는 다음과 같은 선택적 레이어를 탐색할 수 있다:

  • 암호화 서명
  • 레지스트라·레지스트리 신호
  • 고신뢰 정체성 주장

핵심 목표는 변함없이 같다: 누구든지 게시할 수 있는 간단하고 보편적인, 도메인 호스팅 선언 표면을 제공하는 것.

피드백은 언제든 환영한다; 채택은 그보다 더 환영한다.

Back to Blog

관련 글

더 보기 »