웹은 기계가 읽을 수 있어야 합니다. 간단한 방법을 소개합니다.

발행: (2026년 2월 17일 오후 10:23 GMT+9)
8 분 소요
원문: Dev.to

I’m happy to translate the article for you, but I’ll need the full text you’d like translated. Could you please paste the content (excluding the source line you already provided) here? Once I have it, I’ll translate it into Korean while preserving the original formatting, markdown, and any code blocks or URLs.

문제는 간단합니다

인터넷상의 모든 AI 에이전트는 같은 일을 하고 있습니다: HTML을 가져오고, 내용이 무엇인지 추측하며, 틀리게 됩니다.

AI 도구가 귀하의 웹사이트를 사용하려고 할 때, 이것을 보게 됩니다:

![](/avatars/sarah.jpg)
Sarah Chen

AI Agents Need Structure

The web was built for...

BUY NOW

“Sarah Chen”이 저자인가요, 댓글 작성자인가요? 기사 끝과 광고 시작은 어디인가요? 기계는 추측해야 하며, 종종 틀리게 추측합니다.

우리는 robots.txt를 사용해 기계에게 피해야 할 것을 알려줍니다. 우리는 그들에게 우리가 보유하고 있는 것을 알려줄 방법이 없습니다.


내가 믿는 것

  • 웹은 기계가 읽을 수 있어야 합니다 — 인간만이 아니라.
    AI 에이전트가 사람들이 정보를 찾는 방식이 되고 있습니다. 콘텐츠가 그들을 위해 구조화되지 않으면 점점 보이지 않게 됩니다.

  • 구조화된 데이터는 맞춤형 API를 필요로 하면 안 됩니다.
    오늘날 모든 통합은 맞춤형이며, 모든 스크래퍼는 해킹입니다. 어디서든 작동하는 하나의 간단한 규칙이 있어야 합니다.

  • 출처 표기는 선택 사항이 되어서는 안 됩니다.
    기계가 당신의 콘텐츠를 읽는다면, 누가 만들었는지와 어떻게 크레딧을 줘야 하는지를 알아야 합니다. 이는 사후 고려가 아니라 프로토콜의 일부여야 합니다.

  • 오픈이 독점보다 낫습니다.
    우리가 이를 위한 오픈 표준을 만들지 않으면, 모든 AI 기업이 자체 폐쇄 파이프라인을 구축하게 됩니다. 이는 모두에게 더 나쁜 상황입니다.

그래서 뭔가 만들었습니다

FlyWeb/.well-known/flyweb.json에 위치한 JSON 파일입니다. 이는 모든 웹사이트가 기계가 이해할 수 있는 방식으로 자신의 콘텐츠를 설명할 수 있게 합니다.

{
  "flyweb": "1.0",
  "entity": "My Tech Blog",
  "type": "blog",
  "attribution": {
    "required": true,
    "must_link": true
  },
  "resources": {
    "posts": {
      "path": "/.flyweb/posts",
      "format": "jsonl",
      "fields": ["title", "author", "date", "tags", "content", "url"],
      "access": "free",
      "query": "?tag={tag}&limit={n}"
    }
  }
}

한 파일. 이를 찾은 AI 에이전트는 당신이 어떤 콘텐츠를 가지고 있는지, 깨끗한 데이터로 어떻게 가져올 수 있는지, 어떻게 쿼리할 수 있는지, 그리고 어떻게 크레딧을 줄지 알게 됩니다. SDK도, API 키도, OAuth도 필요 없습니다—파일 하나와 규칙만 있으면 됩니다.


작동 방식

Discovery – AI 에이전트는 /.well-known/flyweb.json을 확인합니다. 이는 크롤러가 robots.txt를 확인하는 방식과 같습니다.

Structure – 콘텐츠는 정의한 경로에서 깔끔한 JSON 또는 JSONL 형태로 제공됩니다.

GET /.flyweb/posts
{"title": "Why AI Needs Structure", "author": "Sarah Chen", "date": "2026-02-15", "content": "..."}
{"title": "The Future of Web Protocols", "author": "Sarah Chen", "date": "2026-02-10", "content": "..."}

Query – 표준 URL 매개변수를 사용합니다. 별다른 복잡함은 없습니다.

GET /.flyweb/posts?tag=ai&limit=5

전과 후

Without FlyWeb – AI가 추측합니다. Tailwind 클래스를 파싱하고, 올바른 요소를 찾기를 바라며, 전혀 크레딧을 주지 않습니다.

With FlyWeb – AI가 이렇게 받습니다:

{
  "title": "AI Agents Need Structure",
  "author": "Sarah Chen",
  "date": "2026-02-15",
  "tags": ["ai", "web"],
  "content": "The web was built for...",
  "url": "https://example.com/posts/42"
}

추측 없음. 스크래핑 없음. 허위 메타데이터 없음.


귀속은 선택 사항이 아닙니다

이것이 제가 가장 중요하게 생각하는 부분입니다.

{
  "attribution": {
    "required": true,
    "license": "CC-BY-4.0",
    "must_link": true
  }
}

콘텐츠를 무료로 제공할 수 있습니다. 크레딧을 포기해야 할 필요는 없습니다. FlyWeb에서는 귀속이 프로토콜의 일부이며—제안이 아니라, “최선의 실천”도 아니라, 명세상의 요구 사항입니다.

몇 분이면 추가 가능

CLI

npx flyweb init

프레임워크 플러그인

npm i next-flyweb      # Next.js
npm i astro-flyweb     # Astro
npm i sveltekit-flyweb # SvelteKit
npm i nuxt-flyweb      # Nuxt
npm i express-flyweb   # Express

WordPress

게시물과 페이지에서 자동으로 구성을 생성하는 플러그인이 있습니다.

Validate

npx flyweb check https://your-site.com

AI 개발자를 위한

FlyWeb 데이터 소비용 클라이언트 SDK

import { discover, fetchResource } from 'flyweb/client';

const site = await discover('https://techcrunch.com');
const articles = await fetchResource(
  'https://techcrunch.com',
  site.config.resources.articles,
  { params: { tag: 'ai' }, limit: 10 }
);
// Clean JSON. No scraping.

Claude Code, Cursor 등 유사 도구용 MCP 서버

{
  "mcpServers": {
    "flyweb": {
      "command": "npx",
      "args": ["-y", "flyweb-mcp"]
    }
  }
}

이게 성공할지 모르겠어요

성공이 보장된다고 가장하지 않을 겁니다. 프로토콜은 어렵고, 채택은 더 어렵습니다.

하지만 문제는 실제입니다. AI 에이전트가 웹을 눈에 보이지 않게 스크래핑하고, 콘텐츠 제작자는 적절한 크레딧이나 구조 없이 남겨집니다. FlyWeb은 양쪽 모두에게 명확하고, 개방적이며 구현하기 쉬운 솔루션을 제공하는 것을 목표로 합니다.

제로 크레딧 얻기

오픈 표준이 없는 채로 한 달이 지나면, 그만큼 독점 파이프라인이 더욱 굳어갑니다.

FlyWeb은 간단하고 개방된 관행이 이를 너무 늦기 전에 해결할 수 있다는 작은 기대입니다.


프로토콜은 오픈입니다

  • GitHub
  • Spec
  • Website
  • Docs
  • npm
  • MCP Server

MIT 라이선스. 벤더 락인 없음. 비용 없음. 웹이 기계에 의해 읽히길 원한다면 직접 사용해 보세요. 아이디어가 있다면 PR을 환영합니다.

웹은 인간의 눈을 위해 만들어졌습니다. 그렇게만 있어서는 안 됩니다.

0 조회
Back to Blog

관련 글

더 보기 »

Java (Jsoup)로 초간단 웹 스크래핑

Jsoup xml org.jsoup jsoup 1.17.2 추가 최소 스크래퍼 만들기 이 예제에서는 페이지의 모든 링크 텍스트와 URL을 출력합니다: java import org.jsoup.Jsoup; im...