如何使用 Bright Data MCP Server 和 AI Agents 抓取任意网站

发布: 1个月前 (2026年1月9日 GMT+8 17:37)

2 分钟阅读

原文: Dev.to

Source: Dev.to

Cover image for How to Scrape Any Website Using Bright Data MCP Server and AI Agents

概览

我通过 Noah Kalson 了解到 Bright Data MCP（模型上下文协议）服务器，并决定尝试这个强大的工具。

Bright Data MCP server 是一个统一的、面向 AI 的访问层，提供无缝、可扩展且不可阻断的公共网站访问，使 LLM、代理和应用能够实时检索、发现和提取网页数据。

我要解决的挑战是爬取像 Nike.com 这样的公共站点，具体是男士运动鞋，并以易于查看的格式展示数据（产品名称、价格、库存状态和链接）。

Nike product website data

使用 Bright Data MCP，应用可以在不构建或维护复杂爬取基础设施的情况下获取静态和动态内容。

以下视频展示了最终产品的完整演练：
Scraping Bright Data MCP Demo

完整的源代码已开源，可在此处查看：
GitHub Repository – bright_data

运行该应用并搜索你喜欢的 Nike 运动鞋：
bright-two.vercel.app