웹에 두 번째 문이 곧 열린다
Source: Dev.to
그리고 대부분의 웹사이트는 아직 준비가 안 되었거나, 이미 일어나고 있다는 사실조차 인식하지 못하고 있습니다.
상상을 해보세요: 2028년입니다. 당신은 AI 비서를 통해 현재 만들고 있는 에이전트를 위한 최고의 메모리 SDK를 찾아달라고 요청합니다. 비서는 구글 검색을 하지 않습니다. 브라우저를 열지도 않죠. 대신 구조화된 레이어를 통해 웹을 탐색하고, API를 호출하고, 툴 레지스트리를 조회하고, 스키마 정의를 읽어냅니다. 커피 한 잔을 따르는 시간만에 말이죠. 비서는 vektormemory.com에서 VEKTOR Memory를 찾아냅니다. 당신이 그곳을 보라고 지시했기 때문이 아니라, 해당 사이트가 기계가 통과할 수 있는 문을 미리 만들어 두었기 때문입니다.
“여기 내가 할 수 있는 일들이 있어. 사용 방법은 이렇고, 반환값은 이렇다.” 라고 적힌 문이죠.
그 문은 WebMCP 라 불립니다. 이는 상호작용 시점에 기능을 선언하는 메커니즘입니다.
WebMCP는 ARIA 를 실행하는 에이전트를 위한 버전이라고 볼 수 있습니다.
ARIA(Accessible Rich Internet Applications)는 “이 버튼은 폼을 제출하고, 이 영역은 내비게이션이며, 이 요소는 모달이다” 라는 정보를 HTML 속성으로 명시하는 표준입니다. 스크린리더는 화면을 직접 볼 수 없기 때문에 페이지가 구조와 의도를 명확히 선언해 주어야 파싱 시스템이 이해할 수 있습니다. ARIA가 없으면 스크린리더는 시각적 힌트만으로 추측하게 되는데, 이는 AI 에이전트가 페이지를 스크래핑하려 할 때 겪는 문제와 정확히 동일합니다.
핵심 아이디어는 동일합니다: 웹은 시각적인 인간을 위해 설계되었으니, 비시각적인 소비자가 신뢰성 있게 파싱할 수 있는 별도의 의미 레이어를 추가하는 것이죠. 하나는 보조 기술을 위해, 다른 하나는 AI를 위해 만들어졌습니다.
우리는 지난 한 달 동안 이 레이어를 vektormemory.com에 구현했습니다. 왜일까요?
진보는 멈출 수 없으니, 구현 여부와 관계없이 곧 일어날 일입니다.
또한 토큰 사용량이 줄어들어 API 비용이 낮아집니다!
이제 당신의 관심을 끌었으니, 토큰을 많이 소모한다는 걸 알고 있겠죠…
Mythos: “쿠키 레시피를 더 많이, 더 빨리 필요해. 더 빨리!!”
모든 쿠키 레시피는 내 것이 될 거야…
Mythos: “우린 회사 웹사이트를 디버깅하고 침투 테스트해야 하지 않나요?”
Shoosh, Mythos: “잠깐, 나는 지금 쉬는 중이고 유럽 여름 휴가 일정도 정리해야 해. 쿠키 레시피도 더 필요하고!”
Mythos: “당신은 내가 콜로서스 데이터센터에 있는 초거대 LLM이라는 걸 알고 있잖아요. 웹에서 쿠키 레시피를 가져올 수 있잖아요…”
자, 여기 2,780개의 새로 합성된 쿠키 레시피와 유럽 여행 일정 1,287포인트가 있습니다. 이는 각 장소에서 정확히 13분씩 머물 수 있다는 의미죠.
‘땅콩버터 피칸에 고지베리와 말차 스월’이 개인적으로 가장 좋아하는 레시피입니다.
다이어그램이 포함된 .md 파일로 받아볼까요?
(어떤 AI 봇도 이런 코미디 금을 만들 수 없겠죠?)
숫자는 이 흐름을 보여줍니다.
LLM에 광고가 삽입되면 어떨까요! 멋지죠? (풍자) LLM 광고 차단기, 필요하신 분?
Adobe Analytics는 2025년 AI 에이전트가 미국 소매 사이트에 유입한 트래픽이 전년 대비 4,700% 증가했다고 보고했습니다. 오타가 아닙니다. 사천칠백 퍼센트.
이는 파도가 오고 있다는 것이 아니라 이미 파도가 부서지고 있다는 뜻입니다. AI 에이전트 시장은 2025년에 78억 달러 규모에 달했으며, 2030년까지 526억 달러에 이를 것으로 예상됩니다(연평균 성장률 46.3%). IDC는 2026년 말까지 AI 코파일럿이 기업용 워크플레이스 애플리케이션의 **80%**에 내장될 것이라고 전망합니다. Gartner는 AI 챗봇과 가상 에이전트의 확산으로 전통적인 검색 엔진 트래픽이 2026년까지 25% 감소할 것이라고 예측했습니다.
이것이 웹이 사라진다는 의미는 아닙니다. 다만 웹에 두 번째 인터페이스가 추가된다는 뜻이죠—눈, 손, 스크롤 휠을 위해 설계된 것이 아니라, 명확성, 정밀성, 그리고 행동과 비용에 대한 모호함이 전혀 없는 구조화된 추론 시스템을 위해 설계된 인터페이스입니다.
모든 개발자와 웹사이트 소유자가 직면한 질문은 모바일 브라우저가 등장했을 때 기업들이 마주했던 질문과 같습니다: 새로운 인터페이스를 지금 바로 구축해 선점 효과를 누릴 것인가? 아니면 나중에 뒤늦게 따라잡기 위해 급히 준비할 것인가?
우리는 지금을 선택했습니다.
왜 AI 에이전트가 현대 웹에서 부딪히는가
AI 에이전트는 위와 같은 선언적 정보를 전혀 갖고 있지 않습니다. 웹 페이지를 마주하면 수천 줄에 달하는 HTML 마크업(텍스트, 스타일, 레이아웃, 메타 정보)을 모두 읽어야 합니다. 버튼을 클릭하려면 다음 과정을 거쳐야 합니다:
Step 1: 전체 HTML 문서를 처리한다.
이 과정은 비용이 많이 들고, 느리며, 깨지기 쉽습니다. 사이트 리디자인, A/B 테스트, 새로운 결제 흐름 등 어느 하나라도 변경되면, 에이전트는 시각에 의존해 탐색하던 워크플로가 완전히 무너집니다.
2025년 발표된 arXiv 논문(Perera, 2025, arXiv:2508.09171)은 온라인 쇼핑, 인증, 콘텐츠 관리 시나리오에서 1,890개의 실제 API 호출을 수행해 이 접근법을 검증했습니다. 결과는? 전통적인 시각 기반 스크래핑 방식은 훨씬 더 많은 연산 자원을 요구했습니다. WebMCP의 구조화된 접근법은 처리 오버헤드를 67.6% 감소시키면서도 **97.9%**의 작업 성공률을 유지했습니다. 사용자는 에이전트 지원 작업에서 **34–63%**의 API 비용을 절감할 수 있습니다.
이는 각주 수준의 사소한 개선이 아니라, 에이전트를 비싼 호기심에서 실제 생산 인프라로 전환시키는 차이입니다.
WebMCP가 실제로 무엇인가
핵심 아이디어는 에이전트를 위한 깊이를 추가한다는 것입니다: 웹사이트는 기능을 툴(자연어 설명, 구조화된 파라미터 스키마, 정의된 반환 타입을 가진 JavaScript 함수) 형태로 노