Stealth Browser:AI 代理如何绕过机器人检测
Source: Dev.to
问题概述
大多数 AI 浏览器自动化会立即失败:Cloudflare 阻止它,DataDome 标记它,出现 CAPTCHA,代理卡住。
隐身浏览器引擎
Bridge ACE 包含一个能够通过机器人检测的隐身浏览器引擎。它基于 Patchright,这是一个带有防指纹硬化的 Playwright 分支。
当你运行 Playwright 或 Puppeteer 时,网站可以通过以下方式检测自动化:
navigator.webdriver = true- 缺少 Chrome 插件和扩展
navigator.userAgentData不一致- SwiftShader GPU(无头模式的 giveaway)
- 缺少
speechSynthesis语音 - WebRTC IP 泄漏
- 可预测的鼠标移动和时间间隔
隐身浏览器会应用全面的规避措施:
bridge_stealth_start(
stealth_level='high', # low/medium/high/paranoid
headless=False, # Real GPU — SwiftShader is instant detection
disable_webrtc=True, # Prevent IP leaks
inject_client_hints=True, # navigator.userAgentData
inject_speech_api=True # speechSynthesis voices
)
被修补的内容
- 禁用 AutomationControlled 标志
- 注入客户端提示(
sec-ch-ua头) - 使用真实语音模拟 Speech API
- WebRTC IP 泄漏保护
- 屏幕覆盖以保持指纹一致
- 伪造
performance.memory - 时间抖动 — 人类般的操作延迟
浏览器自动化级别
Bridge ACE 提供三种浏览器自动化级别:
快速、可靠(内部工具 & API)
bridge_browser_navigate(url='...')
bridge_browser_click(selector='#submit')
能够通过大多数受保护网站的机器人检测。
隐身导航
bridge_stealth_goto(url='https://protected-site.com')
bridge_stealth_fill(selector='input', value='...')
附加到用户的真实 Chrome
继承所有会话、Cookie 和扩展。
bridge_cdp_connect(port=9222)
bridge_cdp_navigate(url='https://linkedin.com')
# Full access to logged‑in sessions
CAPTCHA 解决
当隐身不足且出现 CAPTCHA 时:
bridge_captcha_solve(
captcha_type='recaptcha_v2',
website_url='https://example.com',
website_key='site-key-here'
)
支持 reCAPTCHA v2/v3、hCaptcha、Cloudflare Turnstile 与 FunCaptcha,通过 CAPSolver、2Captcha 或 Anti‑Captcha 调用。
仓库
所有三个浏览器引擎以及 CAPTCHA 集成都已在仓库中提供:
git clone https://github.com/Luanace-lab/bridge-ide.git