나는 AI 에이전트가 Crypto로 비용을 지불하는 CAPTCHA Solver를 만들었다 (API Keys 없음)
Source: Dev.to
AI 에이전트를 위한 CAPTCHA 도전 과제
모든 AI 에이전트 제작자는 같은 장벽에 부딪힙니다: 에이전트가 웹사이트에 접속하면 CAPTCHA가 나타납니다. 일반적인 해결 방법은 CAPTCHA 해결 서비스를 신청하고, API 키를 얻으며, 청구를 관리하고, 속도 제한을 처리하는 것입니다. 이렇게 하면 “자율” 에이전트가 인간이 관리하는 SaaS 구독에 의존하게 됩니다.
기존 솔루션과 그 마찰
| Service | Problem |
|---|---|
| 2Captcha | API 키, 계정 가입, 수동 청구 |
| Anti‑Captcha | 동일한 문제에 더해 해결 시간이 느림 |
| CapSolver | 동일한 모델, 이름만 다름 |
| Self‑hosted AI solvers | 비전 모델을 위한 GPU 인프라 필요 |
암호화폐로 직접 결제하기 (x402)
계정과 키를 사용하는 대신, 에이전트는 HTTP를 통해 각 해결에 대해 직접 결제할 수 있습니다. 1996년부터 예약된 HTTP 상태 코드 402 Payment Required가 Coinbase에 의해 네이티브 웹 결제로 재활용되었습니다.
Workflow
- Agent →
POST /api/v1/solve - Server →
402 Payment Required
X-Payment-Required: {"amount":"0.02","currency":"USDC","network":"base"} - Agent → Base 네트워크에서 0.02 USDC 결제
- Agent →
POST /api/v1/solve(결제 증명 헤더 포함) - Server →
200 OK {"token":"solved_captcha_token","solvedIn":"2.3s"}
결제 자체가 인증 역할을 하므로 API 키, OAuth, 계정이 필요 없습니다.
GateSolve: x402 기반 CAPTCHA 해결 API
지원되는 CAPTCHA
- Cloudflare Turnstile — $0.02 / solve
- reCAPTCHA v2/v3 — $0.03 / solve
- hCaptcha — $0.03 / solve
평균 해결 시간: 3초 미만.
Python SDK Example
# gatesolve-python SDK
from gatesolve import GateSolve
client = GateSolve()
solution = client.solve(
type="cloudflare-turnstile",
site_key="0x4AAAAAAABkMYinukE8nzYS",
page_url="https://example.com",
max_price=0.05 # agent won't pay more than this
)
print(solution.token) # use this to bypass the CAPTCHA
AI 코딩 도구와의 통합
{
"mcpServers": {
"gatesolve": {
"command": "npx",
"args": ["@gatesolve/mcp-server"]
}
}
}
이제 AI 어시스턴트가 도구 호출 형태로 CAPTCHA를 해결할 수 있습니다.
x402 접근 방식의 장점
- 벤더 종속 없음 – x402은 오픈 프로토콜이며, 독점 API가 아닙니다.
- 에이전트 친화적 – 에이전트가 직접 암호화폐 결제를 처리하므로 등록 양식이 필요 없습니다.
- 즉시 정산 – Base 네트워크의 USDC는 몇 초 안에 정산됩니다, 며칠이 걸리지 않죠.
- 가격 투명성 – 402 응답이 결제 전 정확한 비용을 알려줍니다.
- 지출 한도 – 에이전트가 최대 가격을 설정해 예상치 못한 청구를 방지할 수 있습니다.
떠오르는 생태계
웹이 에이전트를 위해 재구성되고 있습니다:
- AWS가 금융 서비스용 x402에 관한 블로그를 발표했습니다.
- Stellar가 x402를 채택했습니다.
- Stripe가 공식 x402 지원을 출시했습니다.
현재 세 가지 경쟁 에이전트 결제 표준이 존재합니다: x402, ACP, UCP. CAPTCHA는 첫 번째 관문에 불과합니다; 곧 에이전트들은 x402를 사용해 다음을 결제할 것입니다:
- 프리미엄 API 접근
- 컴퓨팅 리소스
- 데이터 피드
- 모든 유료 콘텐츠
오픈소스 프로젝트
- Main app:
- Python SDK:
- MCP Server:
대기자 명단에 참여하기
현재 대기자 명단을 운영 중입니다. CAPTCHA를 통과해야 하는 에이전트를 만들고 있다면 지금 바로 참여하세요.
@ArsonxDev가 제작했습니다. 공개적으로 배포 중.