如何使用 Bright Data MCP Server 和 AI Agents 抓取任意网站

发布: (2026年1月9日 GMT+8 17:37)
2 分钟阅读
原文: Dev.to

Source: Dev.to

Cover image for How to Scrape Any Website Using Bright Data MCP Server and AI Agents

概览

我通过 Noah Kalson 了解到 Bright Data MCP(模型上下文协议)服务器,并决定尝试这个强大的工具。

Bright Data MCP server 是一个统一的、面向 AI 的访问层,提供无缝、可扩展且不可阻断的公共网站访问,使 LLM、代理和应用能够实时检索、发现和提取网页数据。

我要解决的挑战是爬取像 Nike.com 这样的公共站点,具体是男士运动鞋,并以易于查看的格式展示数据(产品名称、价格、库存状态和链接)。

Nike product website data

使用 Bright Data MCP,应用可以在不构建或维护复杂爬取基础设施的情况下获取静态和动态内容。

使用的技术

  • LangChain – 同时连接多个服务器或 LLM 提供商。
  • LangGraph – 将请求点(节点)链接在一起形成工作流。
  • Next.js – 用于构建可扩展、用户友好 UI 的 React 框架。
  • Python (FastAPI) – 处理 API 请求的后端服务器。
  • Claude (Anthropic API) – 在工作流中编排多个操作。

演示

以下视频展示了最终产品的完整演练:
Scraping Bright Data MCP Demo

源代码

完整的源代码已开源,可在此处查看:
GitHub Repository – bright_data

亲自尝试

运行该应用并搜索你喜欢的 Nike 运动鞋:
bright-two.vercel.app

Back to Blog

相关文章

阅读更多 »

你好,我是新人。

嗨!我又回到 STEM 的领域了。我也喜欢学习能源系统、科学、技术、工程和数学。其中一个项目是…